Zoeken in collecties van Openbare Bibliotheken
Upcoming SlideShare
Loading in...5
×
 

Zoeken in collecties van Openbare Bibliotheken

on

  • 1,141 views

 

Statistics

Views

Total Views
1,141
Views on SlideShare
1,126
Embed Views
15

Actions

Likes
0
Downloads
4
Comments
0

2 Embeds 15

http://www.slideshare.net 14
http://www.lmodules.com 1

Accessibility

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • Jeugd non-fictie Minder gebruik van gelede trefwoorden Aangespast woordgebruik Eerder postcoördinatie
  • 10 bestanden/indexen met verwijzingsstructuren
  • 58.000 tags
  • http://en.wikipedia.org/wiki/Query_expansion
  • http://en.wikipedia.org/wiki/Stemming Hoe bepaal je de stam van een werkwoord? De stam van een werkwoord vind je door van het hele werkwoord -en af te halen; wat je overhoudt, is de stam. De stam van worden is word, de stam van leiden is leid, de stam van houden is houd, enz. Bij sommige werkwoorden lijkt dit mis te gaan: de stam van beloven (belov) ziet er raar uit. Toch is belov echt de stam van beloven. Als er werkwoordsvormen mee gevormd worden, moet deze stam wel wat aangepast worden. Om bijvoorbeeld de juiste ik-vorm ik beloof te krijgen, moet de o verdubbeld worden (ik belof wordt verkeerd uitgesproken). Ook moet de v een f worden. Ooit is namelijk de afspraak gemaakt dat de v nooit aan het einde van een lettergreep in een Nederlands woord kan voorkomen. Daarom is het ik beloof en ik beloofde (f aan het eind van een lettergreep), naast zij beloven (de lettergreepgrens ligt nu na de o: be-lo-ven). Nog een voorbeeld: de stam van reizen is reiz; de ik-vorm wordt ik reis. Ook de z kan niet aan het einde van een lettergreep in een Nederlands woord voorkomen . Het is ook zij reisden (s aan het einde van een lettergreep), naast zij reizen met een z (lettergreepgrens na de ei: rei-zen). Sommige stammen wijken iets af: de stam van staan (en bestaan, weerstaan, enz.) is sta; de stam van zien (en herzien, omzien, enz.) is zie; de stam van doen (en omdoen, uitdoen, enz.) is doe
  • Er wordt niets gevonden -> fuzzy termsuggestie is niet de enige die er op lijkt -> zie ook wolk. Termsuggestie is wel diegene die het meest voorkomt in de index
  • Zoek de “juiste” spellingsvariant. Waar zijn de thesaurustermen?

Zoeken in collecties van Openbare Bibliotheken Zoeken in collecties van Openbare Bibliotheken Presentation Transcript

  • zoeken in collecties van openbare bibliotheken onder de loep Rosemie Callewaert, Metadata Architectuur bij Bibnet Bibliotheekschool Gent , 1 juni 2010 Gastles
    • Metadata en indexering
      • Impliciete en expliciete metadata
      • Herkomst metadata zoeken.bibliotheek.be
      • Doel zoeken.bibliotheek.be
    • Manuele indexering
      • Bibliografische records
      • Authority records
    • Machine indexering
      • Relevantie sortering
      • Query expansion
      • Stemming en compound
      • Fuzzy search
      • Recommendations
    • data
    • metadata
    over object
  • data metadata object
  • Data en metadata objecten
  • Impliciet en expliciet object
  • Doel van indexering terugvindbaar maken ordening Doel van metadata data terugvinden mogelijk maken ordening mogelijk maken informeren over data etaleren van data
  • Herkomst metadata zoeken.bibliotheek.be
    • Open Vlacc
      • Fysieke collectie 6 grote openbare bibliotheken
      • Muziekcollectie Centrale Discotheek Rotterdam
      • Selectie van websites
    • Vakorganisaties
      • Boekbesprekingen Leeswolf en Leeswelp
      • Covers van Bowker en de Centrale Discotheek van Rotterdam (CDR)
      • Meer Over Media van NBD/Biblion
    • Uitgevers
      • Aankondigingen van uitgevers via Boekbank
      • Flapteksten en covers
      • Metadata bij krantenartikelen
    • Internet
      • Leestips LibraryThing
      • Luistertips Last.fm
    • Publiek
      • Tags
      • Besprekingen
      • Lijstjes
    gecontroleerd niet gecontroleerd
  • data en metadata impliciet en expliciet
  • Doel zoeken.bibliotheek.be
    • Voorbeeld publiekscatalogus voor openbare bibliotheken
      • Model zal uitgebreid worden naar de Provinciale en VGC Bibliotheeksystemen (PBS)
      • Elke Openbare bibliotheek aangesloten op het PBS een publiekscatalogus geënt op zoeken.bibliotheek.be
    • Integratie fysieke en digitale bibliotheekcollectie
    • Verdeelplatform data en metadata
      • Persmappen Mediargus
      • Boekbesprekingen
      • Digileen
      • Digitale Bibliotheek voor de Nederlandse Letteren (DBNL)
    • Zoeken in collecties van verschillende bibliotheken
  • Metadata Open Vlacc
    • Titelbeschrijving, explicite metadata, manuele indexering
    • Beschrijving van formele en inhoudelijke kenmerken
    • Open Vlacc invoerregelgeving
      • verschillende soorten en materialen
        • tekst, beeld, klank, boek, bladmuziek, cd, dvd, tijdchrift, artikel, …
      • verschillende doelgroepen en inhoudelijke types
        • volwassenen, jeugd, fictie, non-fictie
      • verschillende bibliografische types
        • monografie, onderdelen, meerdelig, serieel, koepel, deel
      • uniforme ingangen
        • auteurs, titels, onderwerpen
      • inhoudelijke ontsluiting
        • trefwoorden, thema’s, genres
      • classificaties
        • SISO, ZIZO, Vlaamse muziekclassificatie, NBLC
    Bibliografisch record
  •  
  •  
  •  
  • Authority Record
    • Gebruik van consequente terminologie bij het toevoegen van nieuwe gegevens
    • Mogelijkheid om items van dezelfde auteur, hetzelfde onderwerp, hetzelfde werk, …. te groeperen
    = databankrecord waarin een term vastgelegd wordt voor het uniek benoemen van een concept, onderwerp, auteur, … Waarom? Hoe?
    • Zie verwijzingen (see references): een term die hetzelfde impliceert en verwijst naar de vastgelegde term
    • Zie ook verwijzingen (see also references): een term die verwant is aan de vastgelegde term en ook als term kan gebruikt worden in de databank
  • Voor catalogusbouw
  • Authority Bestanden
    • Auteurs
      • Persoonsnamen
      • Organisaties en instellingen (corportaties)
    • Onderwerpen
      • Trefwoorden volwassenen
      • Trefwoorden jeugd
      • Thema’s jeugd
      • Thema’s volwassenen
    • Genres
      • Muziek
      • Volwassenen (film, literatuur)
      • Jeugd (film, muziek, literatuur)
    • Titels
      • Uniforme titels en reekstitels
  • Verwijzing van Nicci French naar 2 andere namen
  • jaargetijden = seizoenen zie ook verwijzingen naar afzonderlijke seizoenen
  • Metadata van het publiek T ags B espreking W aardering
  • bibliotheek publiek Andere organistaties
  • 25.000 getagde titels 2,5% van alle titels
  • 1.500 besproken titels 0,15% van alle titels
  • 11.O00 titels met steraanduidingen 1,1% van alle titels
  •  
  • Machine indexeringen
      • Relevance ranking
      • Query expansion
      • Stemming en compound
      • Fuzzy search
      • Recommendations
  • Relevantie sortering
    • Exacte match
    • Frequentie zoekwoord(en) in geïndexeerde gegevens van een publicatie *
    • Locatie van zoekwoord(en) in geïndexeerde gegevens van een publicatie *
    • Aantal edities van een publicatie/werk
    • Aantal bibliotheken met publicatie/werk in bezit
    • Materiaaltype
    • Niet exacte match
    • * gewicht per soort informatie: titel, auteur, onderwerp, fulltext, …
    = relatie tussen zoekwoord(en) en volgorde van titels in het zoekresultaat
  • Relevantiesortering Zichtbare invloed van aantal edities en bezit
  • Relevantiesortering Zichtbare invloed van aantal voorkomens van de zoekterm
  • Query expansion = De zoekvraag (query) achter de schermen uitgebreiden (expanding) met andere zoektermen http://en.wikipedia.org/wiki/Query_expansion
    • Op zoeken.bibliotheek.be
    • machine uitbreidingen
    • uitbreidingen op basis van Authority Records
  • Seizoenen = Seizoenen OR Jaargetijden Zoekterm heeft meer gewicht in relevantiesortering
  • Luc Zeebroek = Luc Zeebroek OR Kamagurka Luc Zeebroek komt niet voor
  • Authority Records hebben ruimere werking dan enkel het zoeken in bibliografische records ondersteunen. Ook relevant voor full text!
  • Stemming = Gebruik van computeralgoritmes die gebouwd zijn op de taalkundige morfologie die bepaalt dat een werkwoord voor vervoeging herleid moet worden tot de stam. De computer zou hierdoor mits voldoende interpretatiemogelijkheden woorden kunnen vervoegen. De algoritmes die dit doen worden “stemmers” genoemd. Eerste stemmer °1970: Porter Stemmer http://en.wikipedia.org/wiki/Stemming
  • Enkelvoud zoeken, meervoud vinden
  •  
  • Compound = Compound is een samengesteld begrip waarvan de stam een onderdeel is. De samenstelling wordt gebouwd door het gebruik van bestaande woorden. Door het hersamenstellen van woorden kan een begrip een afgeleide betekenis of een bijna niet meer verwante betekenis hebben. http://en.wikipedia.org/wiki/Compound_%28linguistics%29
  • “ Fietsen” wordt herleid tot “fiets” (stemming) “ Techniek” wordt gecombineerd met “fiets” (compound)
  • Fuzzy search
  • In de woordenwolk worden spellingsverianten getoond Het woord dat meest voorkomt wordt gesuggereerd
  • Zoek de “juiste” spellingsvariant. Waar zijn de thesaurustermen? http://zoeken.bibliotheek.be/?q=dostoyevsky
  • Authority Bestanden van Nationale Bibliotheken Verzameld virtueel internationale Authority Records
  • Recommendations
  • Leestips
  • Luistertips