Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern

Dirk Lewandowski
Dirk LewandowskiProfessor at Hamburg University of Applied Sciences
Wie Suchmaschinen (immer noch) die
Bibliotheken herausfordern
Prof. Dr. Dirk Lewandowski
dirk.lewandowski@haw-hamburg.de
Gliederung



Einführung: Wo stehen Suchmaschinen heute?

Spezialangebote der Suchmaschinen

Bündelung von Inhalten

Ranking

Fazit
Gliederung



Einführung: Wo stehen Suchmaschinen heute?

Spezialangebote der Suchmaschinen

Bündelung von Inhalten

Ranking

Fazit
Web search: „Always different, always the same“

      AltaVista 1996




3 |                           http://web.archive.org/web/19961023234631/http://altavista.digital.com/
Wo stehen Suchmaschinen heute?

 •  Große Web-Datenbanken sind vorhanden
    •  Google, Yahoo, MSN/Live.com, Ask, Cuil
    •  Betrieb dieser Datenbanken technisch möglich.

 •  Navigationsanfragen können zuverlässig beantwortet werden.

 •  Informationsorientierte Anfragen können meist zufriedenstellend beantwortet
    werden.
    •  Großer Unterschied zwischen den Anfragen.
    •  Keine Suchmaschine kann alle Anfragen am besten beantworten.

 •  Integration zusätzlicher Quellen
    •  Spezialisierte Web-Datenbanken: News, Blogs, Video, Bücher, wissenschaftliche
       Inhalte, usw.
    •  Shortcuts: Wetter, Reise, Patente, usw.
    •  Zukunft: Faktenextraktion

 •  Einbindung kostenpflichtiger Dokumente

4 |
Universal Search




•  x
Additional databases




Universal Search
                    News
                   results



                                                ads
•  x



                      organic results




                      image results


                      video results


                     organic results (contd.)
Herausforderungen für Bibliotheken




•  Nutzer verwenden Suchmaschinen zur Suche nach „Bibliotheksinhalten“

•  Suchmaschinen „erziehen“ Nutzer zu „schlechtem“ Rechercheverhalten.

•  Suchmaschinen zielen auf Kernbereiche der Bibliotheken
    –  Buchsuche
    –  Wissenschaftliche Inhalte
„Die meisten Nutzer sind nicht willens, bei der Formulierung ihres
Suchziels allzu viel kognitive und zeitliche Energie aufzuwenden.“
                                                                         (Machill et al. 2003)




•  Suchanfragen
    –  Durchschnittliche Länge: 1,7 Wörter
    –  Ca. 50% Einwort-Anfragen
    –  kaum Verwendung von Operatoren und erweiterter Suche

•  Ergebnisseiten
    –  80% der Nutzer gehen nicht über die erste Ergebnisseite hinaus.
    –  Nutzer betrachten bevorzugt die ersten Ergebnisse (“über dem Knick”).
    –  Pro Session werden bis etwa fünf Dokumente angesehen.
    –  Sessions dauern i.d.R. weniger als 15 Minuten.

•  Nutzer sind meist mit ihren Suchergebnissen zufrieden.

•  Nutzer erwarten, dass alle Systeme so leicht zu bedienen sind wie Google.
Selektionsverhalten (Top11 Treffer)




                                       (Granka et al. 2004)



9 |
„Most people are looking for quick wins.“
                                                                              (Nicholas 2008)




 •  Beispiele aus der wissenschaftlichen Suche
    •  Nutzer kommen über Suchmaschinen, schauen herum und nehmen das mit, was
       sie brauchen können.
    •  Es wird eine Vielzahl von Quellen benutzt.
    •  Die Hälfte der Nutzer betrachtet nur 1-3 Seiten.
    •  40% der Nutzer kommen innerhalb von sechs Monaten nicht mehr auf die Website
       zurück.
    •  Nutzer sehen sich Artikel online nur ein paar Minuten lang an, vor allem kurze
       Artikel werden gelesen.
    •  Nutzer sammeln zwar Artikel (als Ausdrucke oder Downloads), lesen sie dann aber
       nicht.

        Was wäre, wenn Ihre Nutzer auch so suchen?

10 |                                                                          (Nicholas 2008)
Gliederung



Einführung: Wo stehen Suchmaschinen heute?

Spezialangebote der Suchmaschinen

Bündelung von Inhalten

Ranking

Fazit
Bücher




•  Microsoft hat sein Engagement in der Buchsuche eingestellt.

•  Google Book Search könnte durch die Einigung mit (US-)Verlegern/Autoren
   zum wichtigsten Anbieter von E-Books werden.

•  Direkter Verkauf und Lizenzierung (z.B. an Bibliotheken).

•  Die Buchsuche wird in die regulären Trefferlisten eingebunden.
Bücher
Wissenschaftliche Inhalte




•  Recherche kostenlos - Inhalte kostenlos
    –  Forschungsportal
    –  Alle Open-Access-Suchmaschinen

•  Recherche kostenlos - Inhalte kostenlos/kostenpflichtig
    –  Google Scholar
    –  Scirus

•  Zugang zur Recherche kostenpflichtig
    –  Thomson Scientific Web Plus


Google ist in der Lage, wissenschaftliche Inhalte in die reguläre Websuche
 einzubinden.
Microsoft hat seine Wissenschaftssuchmaschine eingestellt.
Google Scholar: Inhalte

Inhalte von Google Scholar



•  Wissenschaftliche Literatur aus dem Web
    –  Zeitschriftenaufsätze (peer review), Konferenzbeiträge
    –  Bücher
    –  Preprints, Postprints
    –  Reports
    –  Seminararbeiten
    –  ...
•  Quellen
    –  freies Web
    –  Verlage und Fachgesellschaften (Crawling; keine Feeds!)
    –  Open-Access-Archive und -Zeitschriften
    –  Kein Quellenverzeichnis; Umfang der Quellen unklar
Gliederung



Einführung: Wo stehen Suchmaschinen heute?

Spezialangebote der Suchmaschinen

Bündelung von Inhalten

Ranking

Fazit
Rankingfaktoren



 •  Textspezifische Faktoren
     –  „Wie gut passen Anfrage und Dokument zusammen?“
     –  Worthäufigkeiten, Position der Suchbegriffe im Dokument, ...

 •  Popularität
     –  „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses
        Dokument treffen würde?“
     –  Linkpopularität, Klickpopularität.

 •  Aktualität
     –  „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“
     –  Datumsangaben, Linkstruktur, ...

 •  Lokalität
     –  „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“
     –  Länderinterfaces

17 |                                                        Im Detail: Lewandowski 2005, Kap. 6
Qualität der Inhalte im Web vs. der Treffer in Suchmaschinen




 •  Suchmaschinen bewerten mehr als nur den Dokumententext

 •  Ergebnisse werden an die Anfrage angepasst
     –  Allgemeine Anfragen werden mit allgemeinen Dokumenten beantwortet,
        spezifische Anfragen mit spezifischen.
     –  Durchmischung der Trefferliste.
     –  Für viele Anfragen gibt es Seiten, die in den Ergebnissen auftauchen “müssen”.

 •  Qualitätsbestimmung nur aufgrund formaler Merkmale
     –  Ungeklärte Frage der Verlässlichkeit der Dokumente.
     –  Keine Quellenkontrolle.
     –  Relevanzuntersuchungen messen nur die empfundene Qualität der Ergebnisse.


18 | Dirk Lewandowski
Additional databases




Universal Search
                    News
                   results



                                                ads
•  x



                      organic results




                      image results


                      video results


                     organic results (contd.)
Probleme der OPACs




•  Unvollständiger Datenbestand
    –  Aufsätze, Literaturdatenbanken fehlen (weitgehend)

•  “Elektronischer Zettelkatalog”?

•  Das Nutzerverhalten hat sich geändert
    –  Kurze Suchanfragen, schnelle Ergebnisse, ein Ergebnisset
    –  Nutzererwartungen werden stark von den Web-Suchmaschinen beeinflusst.

•  Known-Item-Suche vs. thematische Suche
    –  OPACs müssen mit beidem klarkommen.
Wie der OPAC verbessert werden soll (“Katalog 2.0”)




•  Nutzerpartizipation
    –  Rezensionen
    –  Bewertungen

•  Anreicherung der bibliographischen Daten
    –  Rezensionen
    –  Inhaltsverzeichnisse

•  Verbesserung der Navigation
    –  Auswahlmenüs auf den Trefferseiten (Kombination von Suche und Browsing)

•  Erweiterung der Datenbasis
    –  Federated search
Kern aller Suchanwendungen: Relevanzranking




•  Web 2.0 Anwendungen verbessern den Katalog, berühren aber den Kern (die
   Suche) nur am Rand.

•  “Search must work”

•  Nutzererwartungen
    –  Schneller Weg zu den Ergebnissen.
    –  Kein allzu großes Nachdenken über die Formulierung der Suchanfrage.
    –  Keine Suche nach der passenden Datenbank vor der Suche.
    –  Nachdem ein paar Ergebnisse auf der ersten Trefferseite angesehen wurden,
       wird entschieden, wie/ob die Recherche fortgeführt wird.
Ranking: Mißverständnisse




•  Ein klares Sortierkriterium ist besser als ein Ranking nach Relevanz.
     –  Ranking verändert nicht die Anzahl der Ergebnisse, sondern nur die Reihenfolge.
     –  Andere Sortieroptionen können angeboten werden.

•  Bibliothekskataloge arbeiten ohne Ranking
     –  Konventionelle OPACs sortieren nach dem Erscheinungsjahr.

•  Ranking ist nutzlos: Es funktioniert einfach nicht.
    –  Es ist schwer, “Relevanz” zu bestimmen. Relevanz ist sowohl vom Kontext
       abhängig als auch vom individuellen Nutzer. Trotzdem kann Ranking wenigstens
       eine befriedigende Trefferliste ergeben.

•  Ranking ist gar nicht so kompliziert. Man muss doch nur ein paar
   Standardmaße (TF/IDF) anwenden.
    –  Text matching reicht für ein gutes Ranking bei weitem nicht aus!
Gemischte Trefferlisten




•  Ranking-Algorithmen bevorzugen „das immer gleiche“. Nutzer verlangen aber
   nach einer gewissen Vielfalt in der Trefferliste.

•  Beispiel: Allgemeine Anfrage
    –  Nachschlagewerk
    –  Lehrbuch
    –  Einschlägige Datenbank
    –  Aktuelle Literatur
    –  Einschlägige Zeitschriften
Additional databases




Universal Search
                    News
                   results



                                                ads
•  x



                      organic results




                      image results


                      video results


                     organic results (contd.)
Gliederung



Einführung: Wo stehen Suchmaschinen heute?

Spezialangebote der Suchmaschinen

Bündelung von Inhalten

Ranking

Fazit
Suchmaschinen entwickeln sich beständig

       #1   weiter. Sie verbessern das Ranking und
            erweitern ihre Datenbestände.




27 |
Suchmaschinen konkurrieren mit

       #2   Bibliotheken auch hinsichtlich der
            angebotenen Inhalte.




28 |
Suche ist ein Kern der Bibliotheksangebote

       #3   und sollte entsprechend behandelt werden.
            Der OPAC muss der zentrale Zugang zu
            allen Bibliotheksangeboten sein.




29 |
Ranking ist essentiell. Bibliotheken müssen

       #4   eine echte Suchmaschine für ihre Inhalte
            anbieten.




30 |
Vielen Dank für Ihre
Aufmerksamkeit.

www.bui.haw-hamburg.de/lewandowski.html



Aktuelles Buch:
Handbuch Internet-Suchmaschinen
(Akademische Verlagsgesellschaft Aka, 2009)


E-Mail:
dirk.lewandowski@haw-hamburg.de
1 of 32

Recommended

Suchmaschinen vs. OPAC by
Suchmaschinen vs. OPACSuchmaschinen vs. OPAC
Suchmaschinen vs. OPACDirk Lewandowski
1.1K views33 slides
Suchmaschinen verstehen by
Suchmaschinen verstehenSuchmaschinen verstehen
Suchmaschinen verstehenDirk Lewandowski
2.1K views57 slides
Wie Suchmaschinen die Inhalte des Web interpretieren by
Wie Suchmaschinen die Inhalte des Web interpretierenWie Suchmaschinen die Inhalte des Web interpretieren
Wie Suchmaschinen die Inhalte des Web interpretierenDirk Lewandowski
1.5K views30 slides
Neue Trends: Google, SEO und Co.? by
Neue Trends: Google, SEO und Co.?Neue Trends: Google, SEO und Co.?
Neue Trends: Google, SEO und Co.?Dirk Lewandowski
729 views24 slides
Ausgewählte Forschungsfragen im Bereich Suche by
Ausgewählte Forschungsfragen im Bereich SucheAusgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich SucheDirk Lewandowski
1.3K views50 slides
Wie entwickeln sich Suchmaschinen heute, was kommt morgen? by
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?Wie entwickeln sich Suchmaschinen heute, was kommt morgen?
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?Dirk Lewandowski
1.5K views35 slides

More Related Content

What's hot

Recherchieren by
RecherchierenRecherchieren
RecherchierenVerlag/Management Publishing
171 views21 slides
Wie gut sind Google und Co.? by
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Dirk Lewandowski
413 views47 slides
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter... by
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...Dirk Lewandowski
423 views23 slides
Relevanzranking als Erfolgsfaktor für Discoverysysteme by
Relevanzranking als Erfolgsfaktor für DiscoverysystemeRelevanzranking als Erfolgsfaktor für Discoverysysteme
Relevanzranking als Erfolgsfaktor für DiscoverysystemeHaake
792 views16 slides
Suchmaschinenforschung an der HAW Hamburg by
Suchmaschinenforschung an der HAW HamburgSuchmaschinenforschung an der HAW Hamburg
Suchmaschinenforschung an der HAW HamburgDirk Lewandowski
1.2K views36 slides
Workshop "Direkte Nutzerunterstützung durch Suchvorschläge während der Eingab... by
Workshop "Direkte Nutzerunterstützung durch Suchvorschläge während der Eingab...Workshop "Direkte Nutzerunterstützung durch Suchvorschläge während der Eingab...
Workshop "Direkte Nutzerunterstützung durch Suchvorschläge während der Eingab...Dirk Lewandowski
640 views29 slides

What's hot(11)

Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter... by Dirk Lewandowski
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...
Dirk Lewandowski423 views
Relevanzranking als Erfolgsfaktor für Discoverysysteme by Haake
Relevanzranking als Erfolgsfaktor für DiscoverysystemeRelevanzranking als Erfolgsfaktor für Discoverysysteme
Relevanzranking als Erfolgsfaktor für Discoverysysteme
Haake792 views
Suchmaschinenforschung an der HAW Hamburg by Dirk Lewandowski
Suchmaschinenforschung an der HAW HamburgSuchmaschinenforschung an der HAW Hamburg
Suchmaschinenforschung an der HAW Hamburg
Dirk Lewandowski1.2K views
Workshop "Direkte Nutzerunterstützung durch Suchvorschläge während der Eingab... by Dirk Lewandowski
Workshop "Direkte Nutzerunterstützung durch Suchvorschläge während der Eingab...Workshop "Direkte Nutzerunterstützung durch Suchvorschläge während der Eingab...
Workshop "Direkte Nutzerunterstützung durch Suchvorschläge während der Eingab...
Dirk Lewandowski640 views
Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends by Dirk Lewandowski
Web-Suchmaschinen: Suchverhalten, Informationsqualität, TrendsWeb-Suchmaschinen: Suchverhalten, Informationsqualität, Trends
Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends
Dirk Lewandowski1.7K views
Suchmaschinen im Internet – neue Erkenntnisse und Perspektiven by Dirk Lewandowski
Suchmaschinen im Internet – neue Erkenntnisse und PerspektivenSuchmaschinen im Internet – neue Erkenntnisse und Perspektiven
Suchmaschinen im Internet – neue Erkenntnisse und Perspektiven
Dirk Lewandowski962 views
Wie Web 2.0 und Suche zusammenwachsen by Dirk Lewandowski
Wie Web 2.0 und Suche zusammenwachsenWie Web 2.0 und Suche zusammenwachsen
Wie Web 2.0 und Suche zusammenwachsen
Dirk Lewandowski942 views
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie... by Thomas Koch
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Thomas Koch1.8K views
Zur sozialen Konstruktion von Recherche-Ergebnissen - Discovery-Systeme by Thomas Hapke
Zur sozialen Konstruktion von Recherche-Ergebnissen - Discovery-SystemeZur sozialen Konstruktion von Recherche-Ergebnissen - Discovery-Systeme
Zur sozialen Konstruktion von Recherche-Ergebnissen - Discovery-Systeme
Thomas Hapke1.7K views

Viewers also liked

Android by
AndroidAndroid
AndroidEnrique Sanhueza Neira!
151 views1 slide
проблемы бизнеса нашего времени by
проблемы бизнеса нашего временипроблемы бизнеса нашего времени
проблемы бизнеса нашего времениAsin Totio
731 views2 slides
Proyecto by
ProyectoProyecto
Proyectomediadri02
227 views6 slides
ビー・テクノロジーの子会社:アメリカ法人閉鎖のお知らせ by
ビー・テクノロジーの子会社:アメリカ法人閉鎖のお知らせビー・テクノロジーの子会社:アメリカ法人閉鎖のお知らせ
ビー・テクノロジーの子会社:アメリカ法人閉鎖のお知らせTsuyoshi Horigome
373 views1 slide
Cat drmest by
Cat drmestCat drmest
Cat drmestKazuo Shimokawa
596 views2 slides
Concepto básico de excel by
Concepto básico de excelConcepto básico de excel
Concepto básico de excelmediadri02
448 views1 slide

Viewers also liked(9)

проблемы бизнеса нашего времени by Asin Totio
проблемы бизнеса нашего временипроблемы бизнеса нашего времени
проблемы бизнеса нашего времени
Asin Totio731 views
ビー・テクノロジーの子会社:アメリカ法人閉鎖のお知らせ by Tsuyoshi Horigome
ビー・テクノロジーの子会社:アメリカ法人閉鎖のお知らせビー・テクノロジーの子会社:アメリカ法人閉鎖のお知らせ
ビー・テクノロジーの子会社:アメリカ法人閉鎖のお知らせ
Tsuyoshi Horigome373 views
Concepto básico de excel by mediadri02
Concepto básico de excelConcepto básico de excel
Concepto básico de excel
mediadri02448 views
42^ Giornata Camel Challenge 2011-12 by kuci87
42^ Giornata Camel Challenge 2011-1242^ Giornata Camel Challenge 2011-12
42^ Giornata Camel Challenge 2011-12
kuci87280 views

Similar to Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern

Suchmaschinen, Bürde für Informationsspezialisten? by
Suchmaschinen, Bürde für Informationsspezialisten?Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?Dirk Lewandowski
864 views19 slides
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3) by
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)Dirk Lewandowski
646 views11 slides
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1) by
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Dirk Lewandowski
571 views13 slides
Ist meine Suchmaschine wirklich so gut, wie ich glaube? by
Ist meine Suchmaschine wirklich so gut, wie ich glaube?Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Ist meine Suchmaschine wirklich so gut, wie ich glaube?Dirk Lewandowski
1.1K views22 slides
Wie gut sind Google und Co.? by
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Dirk Lewandowski
998 views47 slides
Das Nutzerverhalten in der Web-Suche by
Das Nutzerverhalten in der Web-SucheDas Nutzerverhalten in der Web-Suche
Das Nutzerverhalten in der Web-SucheDirk Lewandowski
655 views22 slides

Similar to Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern(20)

Suchmaschinen, Bürde für Informationsspezialisten? by Dirk Lewandowski
Suchmaschinen, Bürde für Informationsspezialisten?Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?
Dirk Lewandowski864 views
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Dirk Lewandowski646 views
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Dirk Lewandowski571 views
Ist meine Suchmaschine wirklich so gut, wie ich glaube? by Dirk Lewandowski
Ist meine Suchmaschine wirklich so gut, wie ich glaube?Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Dirk Lewandowski1.1K views
Das Nutzerverhalten in der Web-Suche by Dirk Lewandowski
Das Nutzerverhalten in der Web-SucheDas Nutzerverhalten in der Web-Suche
Das Nutzerverhalten in der Web-Suche
Dirk Lewandowski655 views
Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen by Dirk Lewandowski
Wissensarmut trotz (oder gar durch) Nutzung von SuchmaschinenWissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Dirk Lewandowski976 views
Wie können wir (Suchmaschinen-)Nutzer besser verstehen? by Dirk Lewandowski
Wie können wir (Suchmaschinen-)Nutzer besser verstehen?Wie können wir (Suchmaschinen-)Nutzer besser verstehen?
Wie können wir (Suchmaschinen-)Nutzer besser verstehen?
Dirk Lewandowski1.1K views
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen by Dirk Lewandowski
Die Macht der Suchmaschinen und ihr Einfluss auf unsere EntscheidungenDie Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Dirk Lewandowski2.3K views
ASEO - Akademische Suchmaschinenoptiminerung by Christian Reinboth
ASEO - Akademische SuchmaschinenoptiminerungASEO - Akademische Suchmaschinenoptiminerung
ASEO - Akademische Suchmaschinenoptiminerung
Christian Reinboth1.7K views
Herausforderungen und Lösungen bei der Publikation und Nutzung von Normdaten ... by Jakob .
Herausforderungen und Lösungen bei der Publikation und Nutzung von Normdaten ...Herausforderungen und Lösungen bei der Publikation und Nutzung von Normdaten ...
Herausforderungen und Lösungen bei der Publikation und Nutzung von Normdaten ...
Jakob .711 views
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Dirk Lewandowski595 views
"SEO Texte": So schreibst du Texte für User, die auch gefunden werden. by Daniel Marx
"SEO Texte": So schreibst du Texte für User, die auch gefunden werden. "SEO Texte": So schreibst du Texte für User, die auch gefunden werden.
"SEO Texte": So schreibst du Texte für User, die auch gefunden werden.
Daniel Marx951 views
Neue Entwicklungen im Bereich der Suchmaschinen (technologie) by Dirk Lewandowski
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)Neue Entwicklungen im Bereich der Suchmaschinen (technologie)
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)
Dirk Lewandowski1K views
Enterprise Search: Potenziale und Fallstricke by Alexander Stocker
Enterprise Search: Potenziale und FallstrickeEnterprise Search: Potenziale und Fallstricke
Enterprise Search: Potenziale und Fallstricke
Alexander Stocker4.8K views
Einführung in die Suchmaschinenoptimierung by Wolfgang Wiese
Einführung in die SuchmaschinenoptimierungEinführung in die Suchmaschinenoptimierung
Einführung in die Suchmaschinenoptimierung
Wolfgang Wiese2.2K views
Discovery Systeme - Evaluationsprozess by sfk01
Discovery Systeme - EvaluationsprozessDiscovery Systeme - Evaluationsprozess
Discovery Systeme - Evaluationsprozess
sfk01863 views

More from Dirk Lewandowski

The Need for and fundamentals of an Open Web Index by
The Need for and fundamentals of an Open Web IndexThe Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web IndexDirk Lewandowski
230 views17 slides
In a World of Biased Search Engines by
In a World of Biased Search EnginesIn a World of Biased Search Engines
In a World of Biased Search EnginesDirk Lewandowski
583 views48 slides
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni... by
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...Dirk Lewandowski
319 views45 slides
Künstliche Intelligenz bei Suchmaschinen by
Künstliche Intelligenz bei SuchmaschinenKünstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei SuchmaschinenDirk Lewandowski
466 views28 slides
Analysing search engine data on socially relevant topics by
Analysing search engine data on socially relevant topicsAnalysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topicsDirk Lewandowski
191 views36 slides
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert by
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertGoogle Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertDirk Lewandowski
278 views27 slides

More from Dirk Lewandowski(20)

The Need for and fundamentals of an Open Web Index by Dirk Lewandowski
The Need for and fundamentals of an Open Web IndexThe Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web Index
Dirk Lewandowski230 views
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni... by Dirk Lewandowski
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
Dirk Lewandowski319 views
Künstliche Intelligenz bei Suchmaschinen by Dirk Lewandowski
Künstliche Intelligenz bei SuchmaschinenKünstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei Suchmaschinen
Dirk Lewandowski466 views
Analysing search engine data on socially relevant topics by Dirk Lewandowski
Analysing search engine data on socially relevant topicsAnalysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topics
Dirk Lewandowski191 views
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert by Dirk Lewandowski
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertGoogle Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Dirk Lewandowski278 views
Suchverhalten und die Grenzen von Suchdiensten by Dirk Lewandowski
Suchverhalten und die Grenzen von SuchdienstenSuchverhalten und die Grenzen von Suchdiensten
Suchverhalten und die Grenzen von Suchdiensten
Dirk Lewandowski173 views
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden? by Dirk Lewandowski
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Dirk Lewandowski265 views
Are Ads on Google search engine results pages labeled clearly enough? by Dirk Lewandowski
Are Ads on Google search engine results pages labeled clearly enough?Are Ads on Google search engine results pages labeled clearly enough?
Are Ads on Google search engine results pages labeled clearly enough?
Dirk Lewandowski910 views
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen? by Dirk Lewandowski
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Dirk Lewandowski1.2K views
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim... by Dirk Lewandowski
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Dirk Lewandowski1.3K views
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen by Dirk Lewandowski
Verwendung von Skalenbewertungen in der Evaluierung von SuchmaschinenVerwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Dirk Lewandowski833 views
Medientage 2013: Die Zukunft der Suche by Dirk Lewandowski
Medientage 2013: Die Zukunft der SucheMedientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der Suche
Dirk Lewandowski1.1K views
Suchmaschinen: Googlerisierung der Gesellschaft by Dirk Lewandowski
Suchmaschinen: Googlerisierung der GesellschaftSuchmaschinen: Googlerisierung der Gesellschaft
Suchmaschinen: Googlerisierung der Gesellschaft
Dirk Lewandowski1.5K views
Wie beeinflussen Suchmaschinen den Informationsmarkt? by Dirk Lewandowski
Wie beeinflussen Suchmaschinen den Informationsmarkt?Wie beeinflussen Suchmaschinen den Informationsmarkt?
Wie beeinflussen Suchmaschinen den Informationsmarkt?
Dirk Lewandowski543 views
Warum wir Alternativen zu Google benötigen by Dirk Lewandowski
Warum wir Alternativen zu Google benötigenWarum wir Alternativen zu Google benötigen
Warum wir Alternativen zu Google benötigen
Dirk Lewandowski1.2K views
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge... by Dirk Lewandowski
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
Dirk Lewandowski1.1K views

Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern

  • 1. Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de
  • 2. Gliederung Einführung: Wo stehen Suchmaschinen heute? Spezialangebote der Suchmaschinen Bündelung von Inhalten Ranking Fazit
  • 3. Gliederung Einführung: Wo stehen Suchmaschinen heute? Spezialangebote der Suchmaschinen Bündelung von Inhalten Ranking Fazit
  • 4. Web search: „Always different, always the same“ AltaVista 1996 3 | http://web.archive.org/web/19961023234631/http://altavista.digital.com/
  • 5. Wo stehen Suchmaschinen heute? •  Große Web-Datenbanken sind vorhanden •  Google, Yahoo, MSN/Live.com, Ask, Cuil •  Betrieb dieser Datenbanken technisch möglich. •  Navigationsanfragen können zuverlässig beantwortet werden. •  Informationsorientierte Anfragen können meist zufriedenstellend beantwortet werden. •  Großer Unterschied zwischen den Anfragen. •  Keine Suchmaschine kann alle Anfragen am besten beantworten. •  Integration zusätzlicher Quellen •  Spezialisierte Web-Datenbanken: News, Blogs, Video, Bücher, wissenschaftliche Inhalte, usw. •  Shortcuts: Wetter, Reise, Patente, usw. •  Zukunft: Faktenextraktion •  Einbindung kostenpflichtiger Dokumente 4 |
  • 7. Additional databases Universal Search News results ads •  x organic results image results video results organic results (contd.)
  • 8. Herausforderungen für Bibliotheken •  Nutzer verwenden Suchmaschinen zur Suche nach „Bibliotheksinhalten“ •  Suchmaschinen „erziehen“ Nutzer zu „schlechtem“ Rechercheverhalten. •  Suchmaschinen zielen auf Kernbereiche der Bibliotheken –  Buchsuche –  Wissenschaftliche Inhalte
  • 9. „Die meisten Nutzer sind nicht willens, bei der Formulierung ihres Suchziels allzu viel kognitive und zeitliche Energie aufzuwenden.“ (Machill et al. 2003) •  Suchanfragen –  Durchschnittliche Länge: 1,7 Wörter –  Ca. 50% Einwort-Anfragen –  kaum Verwendung von Operatoren und erweiterter Suche •  Ergebnisseiten –  80% der Nutzer gehen nicht über die erste Ergebnisseite hinaus. –  Nutzer betrachten bevorzugt die ersten Ergebnisse (“über dem Knick”). –  Pro Session werden bis etwa fünf Dokumente angesehen. –  Sessions dauern i.d.R. weniger als 15 Minuten. •  Nutzer sind meist mit ihren Suchergebnissen zufrieden. •  Nutzer erwarten, dass alle Systeme so leicht zu bedienen sind wie Google.
  • 10. Selektionsverhalten (Top11 Treffer) (Granka et al. 2004) 9 |
  • 11. „Most people are looking for quick wins.“ (Nicholas 2008) •  Beispiele aus der wissenschaftlichen Suche •  Nutzer kommen über Suchmaschinen, schauen herum und nehmen das mit, was sie brauchen können. •  Es wird eine Vielzahl von Quellen benutzt. •  Die Hälfte der Nutzer betrachtet nur 1-3 Seiten. •  40% der Nutzer kommen innerhalb von sechs Monaten nicht mehr auf die Website zurück. •  Nutzer sehen sich Artikel online nur ein paar Minuten lang an, vor allem kurze Artikel werden gelesen. •  Nutzer sammeln zwar Artikel (als Ausdrucke oder Downloads), lesen sie dann aber nicht.  Was wäre, wenn Ihre Nutzer auch so suchen? 10 | (Nicholas 2008)
  • 12. Gliederung Einführung: Wo stehen Suchmaschinen heute? Spezialangebote der Suchmaschinen Bündelung von Inhalten Ranking Fazit
  • 13. Bücher •  Microsoft hat sein Engagement in der Buchsuche eingestellt. •  Google Book Search könnte durch die Einigung mit (US-)Verlegern/Autoren zum wichtigsten Anbieter von E-Books werden. •  Direkter Verkauf und Lizenzierung (z.B. an Bibliotheken). •  Die Buchsuche wird in die regulären Trefferlisten eingebunden.
  • 15. Wissenschaftliche Inhalte •  Recherche kostenlos - Inhalte kostenlos –  Forschungsportal –  Alle Open-Access-Suchmaschinen •  Recherche kostenlos - Inhalte kostenlos/kostenpflichtig –  Google Scholar –  Scirus •  Zugang zur Recherche kostenpflichtig –  Thomson Scientific Web Plus Google ist in der Lage, wissenschaftliche Inhalte in die reguläre Websuche einzubinden. Microsoft hat seine Wissenschaftssuchmaschine eingestellt.
  • 16. Google Scholar: Inhalte Inhalte von Google Scholar •  Wissenschaftliche Literatur aus dem Web –  Zeitschriftenaufsätze (peer review), Konferenzbeiträge –  Bücher –  Preprints, Postprints –  Reports –  Seminararbeiten –  ... •  Quellen –  freies Web –  Verlage und Fachgesellschaften (Crawling; keine Feeds!) –  Open-Access-Archive und -Zeitschriften –  Kein Quellenverzeichnis; Umfang der Quellen unklar
  • 17. Gliederung Einführung: Wo stehen Suchmaschinen heute? Spezialangebote der Suchmaschinen Bündelung von Inhalten Ranking Fazit
  • 18. Rankingfaktoren •  Textspezifische Faktoren –  „Wie gut passen Anfrage und Dokument zusammen?“ –  Worthäufigkeiten, Position der Suchbegriffe im Dokument, ... •  Popularität –  „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses Dokument treffen würde?“ –  Linkpopularität, Klickpopularität. •  Aktualität –  „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“ –  Datumsangaben, Linkstruktur, ... •  Lokalität –  „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“ –  Länderinterfaces 17 | Im Detail: Lewandowski 2005, Kap. 6
  • 19. Qualität der Inhalte im Web vs. der Treffer in Suchmaschinen •  Suchmaschinen bewerten mehr als nur den Dokumententext •  Ergebnisse werden an die Anfrage angepasst –  Allgemeine Anfragen werden mit allgemeinen Dokumenten beantwortet, spezifische Anfragen mit spezifischen. –  Durchmischung der Trefferliste. –  Für viele Anfragen gibt es Seiten, die in den Ergebnissen auftauchen “müssen”. •  Qualitätsbestimmung nur aufgrund formaler Merkmale –  Ungeklärte Frage der Verlässlichkeit der Dokumente. –  Keine Quellenkontrolle. –  Relevanzuntersuchungen messen nur die empfundene Qualität der Ergebnisse. 18 | Dirk Lewandowski
  • 20. Additional databases Universal Search News results ads •  x organic results image results video results organic results (contd.)
  • 21. Probleme der OPACs •  Unvollständiger Datenbestand –  Aufsätze, Literaturdatenbanken fehlen (weitgehend) •  “Elektronischer Zettelkatalog”? •  Das Nutzerverhalten hat sich geändert –  Kurze Suchanfragen, schnelle Ergebnisse, ein Ergebnisset –  Nutzererwartungen werden stark von den Web-Suchmaschinen beeinflusst. •  Known-Item-Suche vs. thematische Suche –  OPACs müssen mit beidem klarkommen.
  • 22. Wie der OPAC verbessert werden soll (“Katalog 2.0”) •  Nutzerpartizipation –  Rezensionen –  Bewertungen •  Anreicherung der bibliographischen Daten –  Rezensionen –  Inhaltsverzeichnisse •  Verbesserung der Navigation –  Auswahlmenüs auf den Trefferseiten (Kombination von Suche und Browsing) •  Erweiterung der Datenbasis –  Federated search
  • 23. Kern aller Suchanwendungen: Relevanzranking •  Web 2.0 Anwendungen verbessern den Katalog, berühren aber den Kern (die Suche) nur am Rand. •  “Search must work” •  Nutzererwartungen –  Schneller Weg zu den Ergebnissen. –  Kein allzu großes Nachdenken über die Formulierung der Suchanfrage. –  Keine Suche nach der passenden Datenbank vor der Suche. –  Nachdem ein paar Ergebnisse auf der ersten Trefferseite angesehen wurden, wird entschieden, wie/ob die Recherche fortgeführt wird.
  • 24. Ranking: Mißverständnisse •  Ein klares Sortierkriterium ist besser als ein Ranking nach Relevanz. –  Ranking verändert nicht die Anzahl der Ergebnisse, sondern nur die Reihenfolge. –  Andere Sortieroptionen können angeboten werden. •  Bibliothekskataloge arbeiten ohne Ranking –  Konventionelle OPACs sortieren nach dem Erscheinungsjahr. •  Ranking ist nutzlos: Es funktioniert einfach nicht. –  Es ist schwer, “Relevanz” zu bestimmen. Relevanz ist sowohl vom Kontext abhängig als auch vom individuellen Nutzer. Trotzdem kann Ranking wenigstens eine befriedigende Trefferliste ergeben. •  Ranking ist gar nicht so kompliziert. Man muss doch nur ein paar Standardmaße (TF/IDF) anwenden. –  Text matching reicht für ein gutes Ranking bei weitem nicht aus!
  • 25. Gemischte Trefferlisten •  Ranking-Algorithmen bevorzugen „das immer gleiche“. Nutzer verlangen aber nach einer gewissen Vielfalt in der Trefferliste. •  Beispiel: Allgemeine Anfrage –  Nachschlagewerk –  Lehrbuch –  Einschlägige Datenbank –  Aktuelle Literatur –  Einschlägige Zeitschriften
  • 26. Additional databases Universal Search News results ads •  x organic results image results video results organic results (contd.)
  • 27. Gliederung Einführung: Wo stehen Suchmaschinen heute? Spezialangebote der Suchmaschinen Bündelung von Inhalten Ranking Fazit
  • 28. Suchmaschinen entwickeln sich beständig #1 weiter. Sie verbessern das Ranking und erweitern ihre Datenbestände. 27 |
  • 29. Suchmaschinen konkurrieren mit #2 Bibliotheken auch hinsichtlich der angebotenen Inhalte. 28 |
  • 30. Suche ist ein Kern der Bibliotheksangebote #3 und sollte entsprechend behandelt werden. Der OPAC muss der zentrale Zugang zu allen Bibliotheksangeboten sein. 29 |
  • 31. Ranking ist essentiell. Bibliotheken müssen #4 eine echte Suchmaschine für ihre Inhalte anbieten. 30 |
  • 32. Vielen Dank für Ihre Aufmerksamkeit. www.bui.haw-hamburg.de/lewandowski.html Aktuelles Buch: Handbuch Internet-Suchmaschinen (Akademische Verlagsgesellschaft Aka, 2009) E-Mail: dirk.lewandowski@haw-hamburg.de