Zin en onzin van metadata

990 views

Published on

Lezing op DEN studiedag "Baas over eigen metadata?" (28-06-2012)

Published in: Technology
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
990
On SlideShare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
9
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide
  • 20% van totale UB bezit komt in LT voor, maar 75% van de opgevraagde boeken bevat LT informatie. Vooral oudere boeken, die nog geen isbn hebben worden niet gematched. Menno was echter plezierig verrast door het hoge percentage van boeken dat opgevraagd wordt en LT informatie bevat.
  • Zin en onzin van metadata

    1. 1. photo by Shira Golding ? ata tad g: e da n m die ige stu r e N- ove 12 DE as i 20 Ba jun 28
    2. 2. eric sieverts• docent zoeken, vinden, ontsluiten [bij HVA, GO, VOGIN]• [voorheen] innovatie & ontwikkeling [bij UB Utrecht] Eric Sieverts, DEN, 28 juni 2012
    3. 3. agenda• metadata in de bibliotheek• zin en onzin van metadata om te zoeken – de catalogus – faceted search• zin en onzin van standaarden voor metadata – OAI repositories – semantiek op het web• noodzaak voor metadata maar eerst een quizje .... Eric Sieverts, DEN, 28 juni 2012
    4. 4. op welke zoekvraagwas dit het antwoordvan Google ?filename: thesaurus.jpgmetadata waren hiernuttig geweest
    5. 5. metadata in de bibliotheek• ik kijk vooral naar metadata als zoekhulpmiddel• metadata in catalogus normaliter veel te beknopt om zinnig zoekhulpmiddel te zijn de mythe van de catalogus >> onderwerps- zoeken in de catalogus ? Eric Sieverts, DEN, 28 juni 2012
    6. 6. voorbeeld: een boek van 480 bladzijdenmet een onderwerpsindex van 14 dichtbedrukte bladzijdenmet een inhoudsopgave van 5 bladzijden met 21 hoofdstukken en 117 paragrafen in een catalogus beschreven met 1 onderwerpscategorie en 1 (daaraan identiek!) trefwoord Eric Sieverts, DEN, 28 juni 2012
    7. 7. voorbeeld: een boek van 480 bladzijdenmet een onderwerpsindex van 14 dichtbedrukte bladzijdenmet een inhoudsopgave van 5 bladzijden met 21 hoofdstukken en 117 paragrafen zelfs user-tags in Librarything bieden maar weinig meer zinvolle ingangen vergeleken met die inhoudsopgave Eric Sieverts, DEN, 28 juni 2012
    8. 8. de 21 hoofdstukken op de bijbehorende website een paar van de 117 paragrafen uit de TOC
    9. 9. metadata in de bibliotheek • (non-fictie) boeken gaan vaak over veel dingen / onderwerpen / deelonderwerpen • andere situatie dan bij erfgoed-objecten .... hmmm .... hoewel .... how about videos?
    10. 10. metadata in de bibliotheek• ik kijk vooral naar metadata als zoekhulpmiddel• metadata in catalogus normaliter veel te beknopt om zinnig zoekhulpmiddel te zijn – daardoor niet zo gek dat gebruik van GOO trefwoorden niet wordt voortgezet Eric Sieverts, DEN, 28 juni 2012
    11. 11. metadata in de bibliotheek• ik kijk vooral naar metadata als zoekhulpmiddel• metadata in catalogus normaliter veel te beknopt om zinnig zoekhulpmiddel te zijn• digitaal meegeleverde verrijking die meer zoekingangen oplevert? zelfs bij e-books (studieboeken, wetenschap) vaak nog geen (of heel summiere) inhouds- opgave, samenvatting o.i.d. [ook als metadata beschouwd !] Eric Sieverts, DEN, 28 juni 2012
    12. 12. ooks et G oogle B dat eens m heden!v ergelijk ekmogelijk t zo full-tex
    13. 13. metadata in de bibliotheek• ik kijk vooral naar metadata als zoekhulpmiddel• metadata in catalogus normaliter veel te beknopt om zinnig zoekhulpmiddel te zijn• zelfs bij e-books (studieboeken, wetenschap) vaak nog geen (of heel summiere) inhouds- opgave, samenvatting o.i.d.• formele metadata: goed hulpmiddel voor facetzoeken = uitsplitsen/filteren van verkregen zoekresultaat, zoals in de nieuwe "webscale discovery systems" Eric Sieverts, DEN, 28 juni 2012
    14. 14. 2011year of the webscale discovery tools Eric Sieverts, NVBA, Deventer, 10 mei 2012
    15. 15. 2011year of the webscale discovery tools Eric Sieverts, NVBA, Deventer, 10 mei 2012
    16. 16. metadata in de bibliotheek• ik kijk vooral naar metadata als zoekhulpmiddel• metadata in catalogus normaliter veel te beknopt om zinnig zoekhulpmiddel te zijn• zelfs bij e-books (studieboeken, wetenschap) vaak nog geen (of summiere) inhoudsopgave, samenvatting o.i.d. meegeleverd• formele metadata: goed hulpmiddel voor facetzoeken – maar dat vereist wel dat ze consistent en consequent zijn toegekend (om geen resultaten kwijt te raken) Eric Sieverts, DEN, 28 juni 2012
    17. 17. metadata in de bibliotheekstandaardisatie+ bijna iedereen gebruikt MARC format- toch geen echte standaard wat betreft toepassing en interpretatieuitwisseling van metadata+ ja, want iedereen wil kunnen ontlenen (immers weinig unica)- vaak doet men het zelf toch nog weer dunnetjes over, vanwege lokale idiosyncrasies Eric Sieverts, DEN, 28 juni 2012
    18. 18. metadata in de bibliotheekwat mag je met die metadata uit GGC /PICA / Worldcat? disclaimer: ik ben geen expert op dit gebied• vroeger alleen intern je eigen metadata gebruiken, maar ze waren niet zo echt van jezelf, dat je ze ook aan anderen mocht geven• nu zijn metadata uit GGC en WorldCat "open data" volgens de Open Data Commons Attribution License  (her)gebruiker moet dus wel vermelden dat ze (eigenlijk?) van OCLC zijn Eric Sieverts, DEN, 28 juni 2012
    19. 19. metadata in de bibliotheeknoodzaak voor metadata?• nog altijd veel materiaal(soorten) waar niet automatisch computerleesbare tekst bij zit en dus alleen middels metadata vindbaar (en herkenbaar) te maken is: – gedigitaliseerd erfgoed – videos (weblectures) – datasets – .....• formele metadata voor (o.a.) facetzoeken (filteren) Eric Sieverts, DEN, 28 juni 2012
    20. 20. standaardisatie van metadataOAI in institutionele repositories (IRs)• metadata schema = Dublin Core• standaard harvesting protocol (OAI PMH)maar in OAIster (zoekmachine met metadata uit >1100lokale IRs) zeer veel variatie in – aan-/afwezigheid van DC-velden – mate van vulling van die velden – wijze van vulling van die velden geen echte standaardisatie nogal onvolledige zoekresultaten Eric Sieverts, DEN, 28 juni 2012
    21. 21. standaardisatie van metadatasemantisch web• gebaseerd op standaarden• maar dat is veelheid aan verschillende gestandaardiseerde metadata-modellen en semantische standaarden• vereist dus extra kennis van de wereld – ontologieën – concordanties Eric Sieverts, DEN, 28 juni 2012
    22. 22. in semantisch webwordt van "alles"betekenis vastgelegd(als metadata,computerleesbaar) Eric Sieverts, DEN, 28 juni 2012
    23. 23. door standaard semantiek kan Google een receptenzoekmachine maken "embedded metadata" standaardisatie van eigenschappen/kenmerken in beschrijving van recepten met"microformats"/"rich snippets markup"
    24. 24. beschrijving van metadata in RDFa; weergave van RDFa in (X)HTML
    25. 25. semantische metadatatoevoegen van semantiek:• helemaal handmatig (oeps …)• automatisch als informatie toch al uit een database of cms komt• door geautomatiseerde herkenning van "entiteiten" in de tekst >>• welke standaard(en)? Eric Sieverts, DEN, 28 juni 2012
    26. 26. example:article from NYTimesanalysed by….. >>
    27. 27. example:article from NYTimesanalysed by"Open Calais"
    28. 28. example:article from NYTimesanalysed by "Zemanta"
    29. 29. the "linked open data cloud" - september 2011 - 31 billion data online by standardisation of dataformats and metadata, computers can "understand" (look-up) the meaning of these data & use them
    30. 30. metadata zin of onzin? soms onzinnigvaak zinnigmits:• rijk• consistent• (semi)automatisch - inclusief TOCs, OCR, spraakherkenning, ...• standaarden• open metadata• …

    ×