Suchmaschinen vs. OPAC
Prof. Dr. Dirk Lewandowski
dirk.lewandowski@haw-hamburg.de
Arbeitstagung der Fraunhofer-Bibliotheken 2009
Bremen, 14.10.2009
Gliederung
Einführung
Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?
Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?
Wie kann die Suchmaschine praktisch in den Bibliotheksalltag integriert werden?
Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?
Web search: „Always different, always the same“
AltaVista 1996
2 | http://web.archive.org/web/19961023234631/http://altavista.digital.com/
Gliederung
Einführung
Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?
Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?
Wie kann die Suchmaschine praktisch in den Bibliotheksalltag integriert werden?
Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?
Herausforderungen für Bibliotheken
• Nutzer verwenden Suchmaschinen zur Suche nach „Bibliotheksinhalten“
• Suchmaschinen „erziehen“ Nutzer zu „schlechtem“ Rechercheverhalten.
• Suchmaschinen zielen auf Kernbereiche der Bibliotheken
– Buchsuche
– Wissenschaftliche Inhalte
„Die meisten Nutzer sind nicht willens, bei der Formulierung ihres
Suchziels allzu viel kognitive und zeitliche Energie aufzuwenden.“
(Machill et al. 2003)
• Suchanfragen
– Durchschnittliche Länge: 1,7 Wörter
– Ca. 50% Einwort-Anfragen
– kaum Verwendung von Operatoren und erweiterter Suche
• Ergebnisseiten
– 80% der Nutzer gehen nicht über die erste Ergebnisseite hinaus.
– Nutzer betrachten bevorzugt die ersten Ergebnisse (“über dem Knick”).
– Pro Session werden bis etwa fünf Dokumente angesehen.
– Sessions dauern i.d.R. weniger als 15 Minuten.
• Nutzer sind meist mit ihren Suchergebnissen zufrieden.
• Nutzer erwarten, dass alle Systeme so leicht zu bedienen sind wie Google.
„Most people are looking for quick wins.“
(Nicholas 2008)
• Beispiele aus der wissenschaftlichen Suche
• Nutzer kommen über Suchmaschinen, schauen herum und nehmen das mit, was
sie brauchen können.
• Es wird eine Vielzahl von Quellen benutzt.
• Die Hälfte der Nutzer betrachtet nur 1-3 Seiten.
• 40% der Nutzer kommen innerhalb von sechs Monaten nicht mehr auf die Website
zurück.
• Nutzer sehen sich Artikel online nur ein paar Minuten lang an, vor allem kurze
Artikel werden gelesen.
• Nutzer sammeln zwar Artikel (als Ausdrucke oder Downloads), lesen sie dann aber
nicht.
Was wäre, wenn Ihre Nutzer auch so suchen?
10 | (Nicholas 2008)
Wissenschaftliche Inhalte
• Recherche kostenlos - Inhalte kostenlos
– Forschungsportal
– Alle Open-Access-Suchmaschinen
• Recherche kostenlos - Inhalte kostenlos/kostenpflichtig
– Google Scholar
– Scirus
• Zugang zur Recherche kostenpflichtig
– Thomson Scientific Web Plus
Google ist in der Lage, wissenschaftliche Inhalte in die reguläre Websuche
einzubinden.
Google Scholar: Inhalte
Inhalte von Google Scholar
• Wissenschaftliche Literatur aus dem Web
– Zeitschriftenaufsätze (peer review), Konferenzbeiträge
– Bücher
– Preprints, Postprints
– Reports
– Seminararbeiten
– ...
• Quellen
– freies Web
– Verlage und Fachgesellschaften (Crawling; keine Feeds!)
– Open-Access-Archive und -Zeitschriften
– Kein Quellenverzeichnis; Umfang der Quellen unklar
Bücher
• Microsoft hat sein Engagement in der Buchsuche eingestellt.
• Google Book Search könnte durch die Einigung mit (US-)Verlegern/Autoren
zum wichtigsten Anbieter von E-Books werden.
• Direkter Verkauf und Lizenzierung (z.B. an Bibliotheken).
• Die Buchsuche wird in die regulären Trefferlisten eingebunden.
Fazit Teil 1
Nutzer suchen heute schon mit unterschiedlichen Werkzeugen
• Universalsuchmaschinen
• Spezialsuchmaschinen
• Social Bookmarking / Empfehlungssysteme
• Spezialdatenbanken
• OPACs
OPACs müssen ihren Platz finden zwischen den anderen Diensten
Gliederung
Einführung
Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?
Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?
Wie kann die Suchmaschine praktisch in den Bibliotheksalltag integriert werden?
Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?
Welche Bedeutung hat heute eigentlich ein lokaler Bestand?
• OPAC verfolgt das Konzept des lokalen Bestandsnachweises.
Sucheinstieg „von oben“ vs. „von unten“
• Erst alle Literatur zum Thema recherchieren, dann ggf. nach Verfügbarkeit
auswählen?
• Wann ist eigentlich eine Recherche nur im lokalen Bestand nötig?
Irgendein Werk zum Thema (--> Überblick)
Known Item
• Für welche Art von Suche ist der OPAC heute eigentlich geeignet?
Wo liegen eigentlich die Stärken der OPACs?
OPAC Suchmaschine
Einfache Suche schwach, da Anordnung der stark, da gutes Ranking
Treffer nach Datum
Erweiterte Suche Guter Funktionsumfang Geringer Funktionsumfang,
fehlerhafte Funktionen (!)
Trefferanordnung / schlecht, da nur Anordnung gut, da durchdachtes Ranking
Ranking nach Datum und Durchmischung der
Trefferlisten
Trefferpräsentation wenig flexibel durch Autor/ Trefferbeschreibung mit
Titel/Jahr statischen und
kontextabhängigen Elementen
Datenbestand nur ein Teilbestand des Einbindung aller von der SM
Bibliotheksangebots aufgebauterer Kolllektionen
Metadaten Mit hohem Aufwand erstellte Kaum Ausnutzung von
Qualitätsdaten Metadaten; keine eigene
Erstellung
Wo liegen eigentlich die Stärken der OPACs?
OPAC Suchmaschine
Einfache Suche schwach, da Anordnung der stark, da gutes Ranking
Treffer nach Datum
Erweiterte Suche Guter Funktionsumfang Geringer Funktionsumfang,
fehlerhafte Funktionen (!)
Trefferanordnung / schlecht, da nur Anordnung gut, da durchdachtes Ranking
Ranking nach Datum und Durchmischung der
Trefferlisten
Trefferpräsentation wenig flexibel durch Autor/ Trefferbeschreibung mit
Titel/Jahr statischen und
kontextabhängigen Elementen
Datenbestand nur ein Teilbestand des Einbindung aller von der SM
Bibliotheksangebots aufgebauterer Kolllektionen
Metadaten Mit hohem Aufwand erstellte Kaum Ausnutzung von
Qualitätsdaten Metadaten; keine eigene
Erstellung
Probleme der OPACs
• Unvollständiger Datenbestand
– Aufsätze, Literaturdatenbanken fehlen (weitgehend)
• “Elektronischer Zettelkatalog”?
• Das Nutzerverhalten hat sich geändert
– Kurze Suchanfragen, schnelle Ergebnisse, ein Ergebnisset
– Nutzererwartungen werden stark von den Web-Suchmaschinen beeinflusst.
• Known-Item-Suche vs. thematische Suche
– OPACs müssen mit beidem klarkommen.
Fazit Teil 2
• OPAC als „echtes Rechercheinstrument“ erscheint nicht mehr
zeitgemäß.
• Der Ansatz „erst Suche, dann lokale Beschränkung“ erscheint
vielversprechender.
• Heutige OPACs setzten auf einen überholten Ansatz (Profirecherche).
23 |
Gliederung
Einführung
Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?
Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?
Wie kann die Suchmaschine in den Bibliotheksalltag integriert werden?
Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?
Wie der OPAC verbessert werden soll (“Katalog 2.0”)
• Nutzerpartizipation
– Rezensionen
– Bewertungen
• Anreicherung der bibliographischen Daten
– Rezensionen
– Inhaltsverzeichnisse
• Verbesserung der Navigation
– Auswahlmenüs auf den Trefferseiten (Kombination von Suche und Browsing)
• Erweiterung der Datenbasis
– Federated search
Kern aller Suchanwendungen: Relevanzranking
• Web 2.0 Anwendungen verbessern den Katalog, berühren aber den Kern (die
Suche) nur am Rand.
• “Search must work”
• Nutzererwartungen
– Schneller Weg zu den Ergebnissen.
– Kein allzu großes Nachdenken über die Formulierung der Suchanfrage.
– Keine Suche nach der passenden Datenbank vor der Suche.
– Nachdem ein paar Ergebnisse auf der ersten Trefferseite angesehen wurden,
wird entschieden, wie/ob die Recherche fortgeführt wird.
Gemischte Trefferlisten
• Ranking-Algorithmen bevorzugen „das immer gleiche“. Nutzer verlangen aber
nach einer gewissen Vielfalt in der Trefferliste.
• Beispiel: Allgemeine Anfrage
– Nachschlagewerk
– Lehrbuch
– Einschlägige Datenbank
– Aktuelle Literatur
– Einschlägige Zeitschriften
Integration von/in Suchmaschinen
1) Suchmaschine als „zweite Meinung“ zum OPAC
• „Probieren Sie Ihre Suche auch bei...“ - Google, Google Scholar, Google
Buchsuche, ...
• Basis: Man erkennt, dass Nutzer in mehreren Systemen suchen (müssen).
• Bedingung: OPAC liefert initial gute Ergebnisse.
2) Suchmaschinen als „Traffic-Lieferanten“
• Auslesen von OPAC-Treffern bzw. Trefferlisten in HTML
• Basis: Man erkennt, dass wissenschaftliche Suche in Suchmaschinen stattfindet.
• Bedingung: Suchmaschinen ranken die erstellten Seiten hoch; Konkurrenz nicht allzu
hoch.
28 |
Integration von/in Suchmaschinen
3) Aufbau eigener Wissenschaftssuchmaschinen
• Basis: Man erkennt, dass Qualitätsinhalte aus dem Web mit den „eigenen“
Qualitätsinhalten kombiniert werden müssen.
• Bedingung: Ranking muss funktionieren, Dienst muss eine echte Alternative
zu den allgemeinen Suchmaschinen sein.
4) Erweiterung des eigenen Systems durch Hinzunahme von Daten aus
den Universalsuchmaschinen
• Basis: Man erkennt, dass man nicht alles selbst machen kann.
• Ausnutzung der Suchmaschinen-APIs
• Bedingung: Geeignete APIs stehen zur Verfügung
29 |
Gliederung
Einführung
Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?
Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?
Wie kann die Suchmaschine praktisch in den Bibliotheksalltag integriert werden?
Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?
OPACs waren einmal die Spitzenanwendung des Information Retrieval
- sie sollten es wieder werden.
31 |
Vielen Dank für Ihre
Aufmerksamkeit.
www.bui.haw-hamburg.de/lewandowski.html
Aktuelles Buch:
Handbuch Internet-Suchmaschinen
(Akademische Verlagsgesellschaft Aka, 2009)
E-Mail:
dirk.lewandowski@haw-hamburg.de