Missen is menselijk

708 views

Published on

Published in: Education
 • Be the first to comment

 • Be the first to like this

Missen is menselijk

 1. 1. Missen is menselijk,en de verspreiding van fouten in metadata Regine Dedecker
 2. 2. A. Wat kan er mis lopen bij het beschrijven- Omschrijving specifieke fouten- Impact op de vindbaarheid voor de gebruiker- Mogelijke remedies- Nadelen/tijdsinvestering van de remediesB. Kwaliteit verbeterenC. De globalisering van metadata- Voordelen- Nadelen- Google books- Anderen
 3. 3. A. Wat kan er mis lopen bij het beschrijven
 4. 4. Brazil / Terry Gilliam
 5. 5. 1. TIKFOUTEN- Zelfs de beste catalografen maken ze- Gotisch of civilité lettertypes- Elektronische catalogus : zoeken via woordenImpact- Ernstig indien in significante woorden (titel- of auteurvermelding) Remedies- Overlezen? Een net gemaakte fout wordt dikwijls niet opgemerkt- Je ziet fouten beter als je later opnieuw kijkt- Je ziet beter de fouten van een ander- Metadata spelling checkerNadelen- Grote tijdsinvestering
 6. 6. 2. WAT OP HET TITELBLAD STAAT IS ONVOLLEDIGE, OF ZELFS MISLEIDENDEINFORMATIE- Oude drukken: politieke of religieuze redenen- De informatie die je hebt is verouderd- M. F. P. kan een afgekorte voornaam zijn, maar ook frère, père, monsieurImpact- Enkel groot als je op het ontbrekende element zoekt Remedies- Via het internet is correcte/volledige informatie beschikbaar- Nieuw onderzoek brengt nieuw dingen aan het lichtNadelen- Extern informatie zoeken kost tijd
 7. 7. 3. VERTROUWEN OP 1 BRON- Niet alles wat je vind is correct of volledigImpact- Enkel groot als je op het ontbrekende/foute element zoektRemedies- Verschillende bronnen, kunnen verschillende info bevatten- Een bron met bronvermelding is betrouwbaarder- Recenter onderzoek kan nieuwe informatie bovenbrengenNadelen- Extern informatie zoeken kost tijd
 8. 8. 4. ENKEL HET TITELBLAD BEKIJKEN- Een facsimile kan enkel het titelblad tonen van de oorspronkelijke druk- De taal van een publicaties kan anders zijn dan de titel- Meerdelige werken kunnen tezamen ingebonden zijn- De band kan meerdere werken bevatten (convoluut)Impact- variabel, gaande van ernstig (convoluut), tot minder (andere taal of druk),- Afhankelijk van de zoekopdracht en verfijning (specifieke druk, of taal)Remedies- Altijd de volledige band doorbladeren bij het primair beschrijvenNadelen- Geen (want het kost niet veel tijd)
 9. 9. 5. HET TITELBLAD GEDEELTELIJK of ONOPLETEND LEZEN- Niet opmerken dat het een andere druk is- Niet opnemen van een hoofdauteur die in de titel staat- Niet opmerken dat er een 2e werk voorafgekondigdwordt- Niet opmerken dat een opgenomen auteur geboren isna het jaar van uitgave- enz.Impact- Afhankelijk van de zoekopdracht Remedies- Het titelblad altijd volledig en begrijpend lezen bij hetprimair beschrijvenNadelen- Geen (want het kost niet veel tijd)
 10. 10. 6. VERSTROOIDHEID / DAGDROMEN- Bv. stukken titel zijn verdwenen, er staan andere woorden- Er zijn velden vergeten- De juiste info staat in een verkeerd veldImpact- Kan groot zijn als men het ontbrekende element zoektRemedie- Beschrijven vraagt concentratie- Foutmeldingen bij ontbrekende elementen bij primaire invoer- Browse mogelijkheid op afzonderlijke velden- Foutlijsten van ‘vreemde’ inhoud bij specifieke veldenNadelen- Concentratie is moeilijk urenlang vol te houden
 11. 11. 7. COPYCATALOGINGVoordelen- Het gaat veel sneller,- De kwaliteit kan beter zijn dan bij het primaire beschrijvenNadelen- Niet alle mogelijke copy bronnen zijn goed- Niet alle beschrijvingen bij een goede copy bron zijn goed- Niet alle informatie is relevant voor elke catalogus- Te snel werken (verkeerde editie … komt meer voor)- Catalografie wordt minder aangeleerd- Correcties of aanvullingen worden niet doorgeven aan de bronImpact van fouten- Variabel, afhankelijk van de fout en zoekopdrachtRemedies- Grondig, kritisch en begrijpend het boek/titelblad en de mogelijke copy bekijken- Catalografen goed opleidenNadelen- Kritisch overnemen gaat trager
 12. 12. 8. DIACRIETENGeen menselijke foutInternationaal verschillende coderingenCopycatalogingConversies van bibliotheeksoftwareImpact- Groot indien in significante woordenRemedies- Corrigeren kan soms geautomatiseerd, soms enkel manueelNadelen- Manueel verbeteren kost veel tijd
 13. 13. 9. HET MOET SNEL GAAN- Geen begrip meer dat nog niet alles beschreven is- Alles on-line is belangrijker dan kwaliteitVoordelen- Het merendeel is goed- Hoe meer er aangeboden wordt, hoe meer er gevonden kan wordenNadelen- Nogal wat beschrijvingen met onvolledige, en/of foute informatie- Meer tijd nodig voor catalogusonderhoud
 14. 14. Wat te doen voor meer kwaliteit- Feiten aanvaarden: Missen is menselijk Concentratie wordt geen uren volgehouden- Catalogusonderhoud bvb. – facets regelmatig nakijken - steekproeven- Elk werk de tijd geven die het nodig heeft- Kritische blik, gezond verstand- Goede opleiding- 2e of andere blik vb. bij het ontlenen of terugbrengen- Invoeren in een netwerk/datapool; met doorspelen van correcties en aanvulling naar alle partners- Laat het publiek meehelpen- Later kan het ook nog
 15. 15. B. De globalisering van metadata
 16. 16. De digitalisering is een kantelmoment in de boekgeschiedenisMassa boeken worden toegankelijkMetadata worden uitgewisseld via copycatalogingCentrale catalogi en boekportalen spelen steeds grotere rolVoordelenHet merendeel van de metadata is goed genoegWat on-line wordt aangeboden, kan gevonden wordenNadelenFouten of onvolledige metadata worden verspreidDoor fouten wordt het gezochte boek niet altijd (gemakkelijk) gevondenEen ruim verspreide fout krijgt autoriteitEen ruim verspreide fout is moeilijk overal recht te zettenRemediesZoveel mogelijk werken binnen netwerken en metadatapoolsDoorspelen naar alle partners van correcties en aanvullingen
 17. 17. GOOGLE BOOKSGoogle books :a metadata train wreck / Geoffrey Nunberg 2009http://languagelog.ldc.upenn.edu/nll/?p=17012 reacties van Jon Orwant van Metadata Google books“we recently received a large number of Brazilian records from a metadata provider.This provider seemingly used 1899 as a placeholder for "no date", which is why we have250,000 books incorrectly identified as being published in 1899. Our providers havemillions of errors like these, and we do what we can to eliminate them.”Google exposes book metadata privates at ALA forum / Eric Hellmanhttp://go-to-hellman.blogspot.com/2010/01/google-exposes-book-metadata-privates.htmlMost of these errors come from garbage records, and when one of these isfound, almost always, the same problems can be found in other metadata sources
 18. 18. Oversien en ghebetert van vele honderde grove fouten

×