Hochschule der Medien                              Resource Discovery                                  Systeme            ...
Hoffnung RDSHochschule der Medien                        „The challenge for academic libraries (...) is to offer an       ...
Drei große RDS-ProdukteHochschule der Medien                        • Summon (Serial Solutions)                          h...
ImplementierungsvariantenHochschule der Medien                        Suchoberfläche:                        • Index und S...
UB Konstanz (Summon-Komplettsystem):             eigentlich nur übergreifende Suche möglich             (Einschränken auf ...
HU Berlin (Primo-Komplettsystem):             übergreifende Suche als Default, Einschrän-             kung auf Katalogdate...
UB Freiburg (Eigenentwicklung + EDS):             bewusst getrennte Recherche von Katalog             und RDS-Index in par...
DatenbasisHochschule der Medien                        derzeitige Situation:                        • gewaltige Größenordn...
Hochschule der Medien                        Normierung                        RDS-Index:                        • häufig ...
UB MannheimHochschule der MedienHeidrun Wiesenmüller                                     Heterogenität in Schlagwortfacett...
UB Freiburg                                         FU BerlinHochschule der Medien                                        ...
UB FreiburgHochschule der MedienHeidrun Wiesenmüller                                     fehlende Verweisungen im RDS-Inde...
UB MannheimHochschule der Medien                                                                Beispiel für eine         ...
Hochschule der Medien                                                    Des Rätsels Lösung: Autor                        ...
Indexierung deutscher Katalogdaten:                    Recherche „bertram inhaltserschließung“ findetUB Konstanz         d...
Recherche „bertram sacherschließung“UB Konstanz                    findet gewünschten Treffer nicht (Verweisung)       01....
hauseigene Systematik und RVKUB Konstanz                           bisher nicht indexiert       01.08.2012   Jahrestagung ...
FU Berlin             Indexierung deutscher Katalogdaten:             in Primo kann Klassifikation ausgewertet werden;    ...
TreffermengenHochschule der Medien                        können enorme Größen erreichen:                        • Datenpo...
Größenordnungen:             162 Treffer in HEIDI (Katalogdaten)             19.888 Treffer in BASE             121.519 Tr...
... 366.133 Treffer aus Summon                          (web-scale)01.08.2012   Jahrestagung der Gesellschaft für Klassifi...
Known-item search (Sachtitel und               Nachname) nach einem im Index nicht               vorhandenen Werk01.08.201...
Rezension des gesuchten Werkes                    (andere Rezensionen auf Plätzen 8,                    13, 17, 21, 25 und...
Feststellen, dass etwas nicht                        vorhanden ist: geht verlässlich                        nur über die e...
Beispiele für rätselhafte Treffer                          (Treffer 21 und 22)01.08.2012   Jahrestagung der Gesellschaft f...
Hurra, doch noch gefunden!             Treffer (web scale) führt zur Titelaufnahme             im Katalog der australische...
Titel zur sprachwissen-schaftlichen Semantik(ab Treffer 33)                     Besondere Suchmethoden 1:                 ...
„Hütter“ ergibt auch                                               „Hüttl“, „Hütten“,                                     ...
Probleme bei FacettenHochschule der Medien                        • Materialfacette meist wenig hilfreich                 ...
Recherche „owl“ (u.a. Eule vs. OWL):                     73 Treffer in Katalogdaten                     (diese Menge könnt...
brauchbare SchlagwortfacetteHochschule der Medien                                                    (beruht auf allen Tre...
Recherche „owl“:   17.342 Treffer in übergreifender Suche   (kann man nicht mehr durchsehen;   Formalfacetten bringen weni...
• keine Fachfacette oder KlassifikationHochschule der Medien                                       schnelle Differenzierun...
Hochschule der Medien                                                          einzige Möglichkeit:                       ...
Paradigmenwechsel?Hochschule der Medien                        • herkömmlicher OPAC:                          Benutzer wir...
Bibliotheksdaten im RDSHochschule der Medien                        besondere Stärken von Bibliotheksdaten u.a.:          ...
Hochschule der Medien                        Strategische Überlegungen                        • getrenntes Anbieten der Ka...
Erste Ideen:                        1. erweiterter Einsatz unserer NormdatenHochschule der Medien                         ...
Hochschule der Medien                                        Vielen Dank für                                     Ihre Aufm...
Upcoming SlideShare
Loading in...5
×

GfKl-Tagung 2012 LIS Wiesenmueller RDS

886

Published on

Vortrag von Heidrun Wiesenmüller auf dem LIS-Workshop im Rahmen der GfKl-Tagung 2012 in Hildesheim. Titel: "Resource Discovery Systeme - Chance oder Verhängnis für die bibliothekarische Erschließung?"

Published in: Education
0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
886
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
22
Comments
0
Likes
3
Embeds 0
No embeds

No notes for slide

GfKl-Tagung 2012 LIS Wiesenmueller RDS

  1. 1. Hochschule der Medien Resource Discovery Systeme Chance oder Verhängnis für die bibliothekarischeHeidrun Wiesenmüller Erschließung? 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 1
  2. 2. Hoffnung RDSHochschule der Medien „The challenge for academic libraries (...) is to offer an experience that has the simplicity of Google – which users expect – while searching the library’s rich digital and print collections – which users need. (...) Enter discovery, which is modeled on the Google-style approach of building and then searching a unified index of available resources, instead of searching each database individually. While Google’s general index focuses onHeidrun Wiesenmüller publicly available web content, these new discovery tools (...) provide unified indexes of the licensed scholarly publications combined with locally held content (like the catalog).“ Judy Luther / Maureen C. Kelly: Web scale discovery services. In: Library journal 15.03.2011 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 2
  3. 3. Drei große RDS-ProdukteHochschule der Medien • Summon (Serial Solutions) http://www.serialssolutions.com/en/services/summon • Primo Central (ExLibris) http://www.exlibrisgroup.com/de/category/Primo_CentralHeidrun Wiesenmüller • EBSCO Discovery Service, EDS (EBSCO) http://www.ebscohost.com/discovery/ 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 3
  4. 4. ImplementierungsvariantenHochschule der Medien Suchoberfläche: • Index und Suchoberfläche vom Anbieter z.B. Konstanz (Summon); Saarbrücken (EDS); Mannheim, FU und HU Berlin (Primo); z.T. auch Indexierung der Katalogdaten durch Anbieter • Index vom Anbieter, aber eigene Suchoberfläche z.B. Freiburg (Eigenentwicklung + EDS); Heidelberg (Eigenentwicklung + Summon)Heidrun Wiesenmüller Katalogdaten vs. RDS-Index: • verschiedene Umsetzungen - übergreifende vs. getrennte Suche - was ist primär, was ist sekundär? 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 4
  5. 5. UB Konstanz (Summon-Komplettsystem): eigentlich nur übergreifende Suche möglich (Einschränken auf „nur lokal vorhanden“ mög- lich, ergibt aber deutlich andere Ergebnisse als klassische OPAC-Recherche, dort 44 Treffer)01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 5
  6. 6. HU Berlin (Primo-Komplettsystem): übergreifende Suche als Default, Einschrän- kung auf Katalogdaten (plus edoc-Server) möglich01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 6
  7. 7. UB Freiburg (Eigenentwicklung + EDS): bewusst getrennte Recherche von Katalog und RDS-Index in parallelen Reitern01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 7
  8. 8. DatenbasisHochschule der Medien derzeitige Situation: • gewaltige Größenordnungen mehrere 100 Mio. bis 1 Mrd. Datensätze; nicht nur Metadaten, sondern vielfach auch Volltexte • sehr heterogene Herkunft insbesondere Verlage und Datenbankproduzenten • Schwerpunkt: E-Zeitschriftenaufsätze aber auch z.B. E-Books, Zeitungsartikel, Rezensionen,Heidrun Wiesenmüller Repositories, OA-Quellen • deutscher Content bisher stark unterrepräsentiert z.B. fehlen bisher auch die deutschen Verbundkataloge (Ausnahme: Summon hat Vertrag mit GBV geschlossen) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 8
  9. 9. Hochschule der Medien Normierung RDS-Index: • häufig gar keine Normierung z.B. vielfach freie Schlagwörter von Autoren • Nebeneinander verschiedener Systeme Heterogenität selbst bei Materialarten • i.d.R. kein Einbezug von Verweisungsformen bei normiertem Vokabular nur Ansetzungsform indexiert Indexierung deutscher Katalogdaten:Heidrun Wiesenmüller • deutsche Sacherschließung teilweise unvollständig z.B. Saarbrücken, Konstanz • Anbieter haben noch keine Lösung für Verweisungen Verweisungsformen derzeit nur in Primo-Systemen (Anreicherung erfolgt lokal) sowie in Kombi-Systemen 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 9
  10. 10. UB MannheimHochschule der MedienHeidrun Wiesenmüller Heterogenität in Schlagwortfacette: Recherche nach „financial crisis“: Synonyme, englisch vs. deutsch, Notationen aus DDC und JEL-Klassifikation (Journal of economic literature) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 10
  11. 11. UB Freiburg FU BerlinHochschule der Medien Formfacetten:Heidrun Wiesenmüller Recherche nach „collection develop- ment“: z.T. unplausibel oder unklar; unterschiedliche Begriffe, die z.T. dasselbe meinen 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 11
  12. 12. UB FreiburgHochschule der MedienHeidrun Wiesenmüller fehlende Verweisungen im RDS-Index: dramatisch unterschiedliche Ergebnisse im RDS-Reiter bei „gorbatschow“ vs. „gorbatschev“ (Unterschiede im Katalog-Reiter ergeben sich aufgrund Nationallizenzen und OA-Quellen) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 12
  13. 13. UB MannheimHochschule der Medien Beispiel für eine gescheiterte Suche: gewünschter Nature-Heidrun Wiesenmüller Aufsatz wird nicht gefunden 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 13
  14. 14. Hochschule der Medien Des Rätsels Lösung: Autor mit abgekürztem Vornamen erfasst (Weglassen vonHeidrun Wiesenmüller „Horst“ führt zum Ziel) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 14
  15. 15. Indexierung deutscher Katalogdaten: Recherche „bertram inhaltserschließung“ findetUB Konstanz den gewünschten Treffer (Ansetzungsform) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 15
  16. 16. Recherche „bertram sacherschließung“UB Konstanz findet gewünschten Treffer nicht (Verweisung) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 16
  17. 17. hauseigene Systematik und RVKUB Konstanz bisher nicht indexiert 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 17
  18. 18. FU Berlin Indexierung deutscher Katalogdaten: in Primo kann Klassifikation ausgewertet werden; Problem: minimale Abdeckung (Recherche „semantic web“: 75 von 45.058 Treffern mit RVK)01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 18
  19. 19. TreffermengenHochschule der Medien können enorme Größen erreichen: • Datenpool erheblich größer als traditioneller Katalog u.a. durch Einbezug von Aufsatzdaten • „web-scale discovery“ auch Suche über den Bibliotheksbestand hinaus möglich • Recherche häufig auch in Volltexten nicht bei jedem Anbieter ausschaltbar; Volltext-Treffer tauchen im Ranking oft erstaunlich weit vorne aufHeidrun Wiesenmüller • z.T. zusätzliche Suchmethoden z.B. linguistische Methoden (Summon); Titel, die nicht alle Suchbegriffe enthalten (Summon); „SmartText“-Suche (EDS) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 19
  20. 20. Größenordnungen: 162 Treffer in HEIDI (Katalogdaten) 19.888 Treffer in BASE 121.519 Treffer aus Summon (lokal verfügbar) ...01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 20
  21. 21. ... 366.133 Treffer aus Summon (web-scale)01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 21
  22. 22. Known-item search (Sachtitel und Nachname) nach einem im Index nicht vorhandenen Werk01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 22
  23. 23. Rezension des gesuchten Werkes (andere Rezensionen auf Plätzen 8, 13, 17, 21, 25 und 26) „metadata“: Titelwort „digital“, „collection“: Haupttext „Miller“: Literaturverzeichnis01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 23
  24. 24. Feststellen, dass etwas nicht vorhanden ist: geht verlässlich nur über die erweiterte Suche01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 24
  25. 25. Beispiele für rätselhafte Treffer (Treffer 21 und 22)01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 25
  26. 26. Hurra, doch noch gefunden! Treffer (web scale) führt zur Titelaufnahme im Katalog der australischen Parlaments- bibliothek (Hinweis: es gibt auch Aufnahmen im BVB, GBV und HBZ)01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 26
  27. 27. Titel zur sprachwissen-schaftlichen Semantik(ab Treffer 33) Besondere Suchmethoden 1: bei Suche „semantic web“ (lokal): auch Treffer mit nur einem Suchwort 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 27
  28. 28. „Hütter“ ergibt auch „Hüttl“, „Hütten“, „Schmelzhütte“ etc. Besondere Suchmethoden 2: linguistische Methoden01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 28
  29. 29. Probleme bei FacettenHochschule der Medien • Materialfacette meist wenig hilfreich z.B. Filtern auf Aufsätze: immer noch riesige Treffermenge • Fehlende Optionen zur fachlichen Grobgliederung Fachfacette existiert derzeit nur bei Summon (wegen geringer Abdeckung nur eingeschränkt angeboten); Klassifikationsfacetten fehlen oder nur bedingt brauchbar • Schlagwortfacetten - HeterogenitätsproblemHeidrun Wiesenmüller - beruhen bei EDS und Primo nur auf kleiner Stichprobe (nur Summon wertet die gesamte Treffermenge aus) - zeigen zwangsläufig nur einen kleinen Ausschnitt • Ländercode und ähnlich komplexe Facetten lassen sich nur mit Bibliotheksdaten realisieren 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 29
  30. 30. Recherche „owl“ (u.a. Eule vs. OWL): 73 Treffer in Katalogdaten (diese Menge könnte man noch durchsehen)UB Mannheim 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 30
  31. 31. brauchbare SchlagwortfacetteHochschule der Medien (beruht auf allen Treffern, homogen, kontrolliert) brauchbare Fachfacette (beruht auf unterschiedlicher klassifikatorischer Information, vgl. Vortrag Frick von 2011)Heidrun Wiesenmüller Geofacette (beruht auf SWD- Ländercodes) als Beispiel für komplexere Auswertung von Sacherschließungsdaten 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 31
  32. 32. Recherche „owl“: 17.342 Treffer in übergreifender Suche (kann man nicht mehr durchsehen; Formalfacetten bringen wenig)01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 32
  33. 33. • keine Fachfacette oder KlassifikationHochschule der Medien schnelle Differenzierung zwischen EDV und Biologie nicht möglich • Facetten „Sammlung“ und „Zeit- schrift“ allenfalls bedingter Ersatz für Fach- facette • beruht jeweils nur auf Stichprobe Basis: Auswertung einiger hundert Treffer (zum Vergleich: bei EDS werdenHeidrun Wiesenmüller nur 125 Treffer ausgewertet und die 10 häufigsten Schlagwörter angezeigt) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 33
  34. 34. Hochschule der Medien einzige Möglichkeit: nacheinander alle einschlägi- gen Schlagwörter anklicken und hoffen, damit tatsächlich das Gros der relevanten Treffer abgedeckt zu habenHeidrun Wiesenmüller 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 34
  35. 35. Paradigmenwechsel?Hochschule der Medien • herkömmlicher OPAC: Benutzer wird mit Null-Treffer-Ergebnis alleine gelassen • Resource Discovery System: Benutzer wird mit riesiger Treffermenge alleine gelassen; ist dem vorgegebenen Ranking vollständig ausgeliefert Zwingend nötig: • prominent angebotene „Ausschalt-Optionen“ für Erweiterungsfunktionen wie Suche in Volltexten,Heidrun Wiesenmüller linguistische Methoden, nicht alle Suchbegriffe • dynamisches, beeinflussbares Ranking und Filtern z.B. Markieren von „guten“ oder „schlechten“ Treffern; dann Umsortieren bzw. Ausfiltern 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 35
  36. 36. Bibliotheksdaten im RDSHochschule der Medien besondere Stärken von Bibliotheksdaten u.a.: • überregionale, langfristig gültige Regeln großer und homogener Datenbestand • Verlässlichkeit man weiß, was man erwarten kann (z.B. welche Daten- elemente sind erfasst), ermöglicht zuverlässige known- item search • Zusammenführen und UnterscheidenHeidrun Wiesenmüller nicht nur etwas Passendes finden, sondern alles Passende finden (z.B. alle Werke eines Verfassers) verlieren sich, wenn Bibliotheksdaten in einen riesigen Datenpool gesteckt werden, die diesen Prinzipien nicht folgen 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 36
  37. 37. Hochschule der Medien Strategische Überlegungen • getrenntes Anbieten der Katalogdaten sinnvoll, aber als Strategie nicht ausreichend ist eher eine Defensiv- als eine Offensivstrategie Fragen, die wir uns stellen müssen: • Können Bibliotheksdaten dazu verwendet werden, um RDS-Daten zu verbessern? Können wir mit unserer Datenqualität andere Daten „anstecken“?Heidrun Wiesenmüller • Können wir die Heterogenität beherrschbar machen? Zumindest eine Homogenität auf grober Ebene müsste erreicht werden (z.B. brauchbare Materialfacetten, Grob- Klassifikation für alle Materialien) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 37
  38. 38. Erste Ideen: 1. erweiterter Einsatz unserer NormdatenHochschule der Medien Synonyme zuspielen entweder bereits bei Indexierung oder erst bei Recherche (query expansion); vgl. Über- legungen im Projekt „BSZ One Stop Search (BOSS)“ 2. maschinelle Homogenisierung in großem Umfang - große Datenmengen bieten auch große Chancen für maschinelle Auswertungen (z.B. „Dubletten“ aus ver- schiedenen Quellen) - Bilden von Sacherschließungs-Clustern aus hetero-Heidrun Wiesenmüller gener verbaler und klassifikatorischer Erschließung 3. Bibliothekare verstärkt als „Metadatenmanager“ nicht mehr nur selbst erschließen, sondern Daten ande- rer Hersteller für den RDS-Einsatz optimieren (Voraus- setzung: Produzenten müssen uns an ihre Daten lassen) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 38
  39. 39. Hochschule der Medien Vielen Dank für Ihre Aufmerksamkeit! Ich hoffe auf Ihre guten Ideen!Heidrun Wiesenmüller 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 39
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×