Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends

Dirk Lewandowski
Dirk LewandowskiProfessor at Hamburg University of Applied Sciences
Web-Suchmaschinen:
Suchverhalten, Informationsqualität, Trends
Prof. Dr. Dirk Lewandowski
dirk.lewandowski@haw-hamburg.de
Agenda




 Nutzerverhalten

 Wie gut sind die gängigen Suchmaschinen?

 Suche und Web 2.0

 Fazit




1 |
Agenda




 Nutzerverhalten

 Wie gut sind die gängigen Suchmaschinen?

 Suche und Web 2.0

 Fazit




2 |
Bedeutung der Suchmaschinen




 • Suchmaschinen sind der Zugang zu Informationen im Netz.
    – Andere Zugänge (Kataloge, usw.) haben kaum noch Bedeutung.
    – Suchmaschinen bestimmen über die sichtbaren Inhalte des Web.
    – Suchmaschinen bestimmen das Nutzerverhalten (auch für andere
      Informationssysteme).




3 |
Drei Anfragetypen

 Anfragetypen nach Broder (2002)



 • Informational (informationsorientiert)
      – Nutzer möchte sich zu einem Thema informieren.
      – Ziel sind mehrere Dokumente.

 • Navigational (navigationsorientiert)
      – Ziel ist es, eine bestimmte Seite (wieder) zu finden.
      – Typisch: Suche nach Homepage („Daimler Chrysler“).
      – Ziel ist i.d.R. ein Dokument.

 • Transactional (transaktionsorientiert)
      – Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll.
      – Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.


4 |
„Die meisten Nutzer sind nicht willens, bei der Formulierung ihres
 Suchziels allzu viel kognitive und zeitliche Energie aufzuwenden.“
                                                                          (Machill et al. 2003)




 • Boolesche Operatoren
    – Bei weniger als 10% der Anfragen; keine Veränderung im Lauf der Jahre
      (Spink&Jansen 2004).
    – Nur etwa die Hälfte der Nutzer weiß, dass es Operatoren gibt (Machill et al.
      2003).
    – 20% der Nutzer geben an, sie öfter zu verwenden (Machill et al. 2003).
    – Etwa die Hälfte der Anfragen mit Operatoren enthält Fehler (Spink et al. 2000),
      bei der Verwendung von Plus-/Minuszeichen lag die Fehlerquote bei 2/3.

 • Profisuche
    – 59% der Nutzer kennen die Profisuche (Machill et al. 2003).
    – Nur 14% nutzen sie öfter (Machill et al. 2003).



5 |
Grunddaten zum Nutzerverhalten (2)




 • Auswertung der Treffer
    – 80% der Nutzer betrachten nur die erste Ergebnisseite (= 10 Treffer)
      (Spink&Jansen 2004).
    – Vor allem die Treffer auf den ersten Listenplätzen werden angesehen; möglichst
      kein Scrollen
    – Pro Session werden nur etwa fünf Dokumente gesichtet (Spink&Jansen 2004).
    – Sessions dauern weniger als 15 Minuten.

 • Kaum Veränderungen im Lauf der Zeit




6 |
Google groß




7 |

                   

               

Google klein
9 |
Selektionsverhalten (Top11 Treffer)




                                       (Granka et al. 2004)



10 |
Eye-tracking




11 |            (Enquiro Eye Tracking Report II)
Agenda




 Nutzerverhalten

 Wie gut sind die gängigen Suchmaschinen?

 Suche und Web 2.0

 Fazit




12 |
Die Qualität von Suchmaschinen kann nur durch eine
 Kombination unterschiedlicher Faktoren gemessen werden.
 Qualitätsfaktoren für Suchmaschinen


 • Qualität des Index
    – Größe des Datenbestands, Abdeckung des Web
    – Abdeckung bestimmter Bereiche (Sprachräume, Länder)
    – Überschneidungen der Indices
    – Aktualität des Datenbestands

 • Qualität der Suchresultate
    – Retrievaleffektivität
    – Zufriedenheit der Nutzer
    – Überschneidungen der (Top-)Ergebnisse

 • Qualität der Suchfunktionen

 • Nutzerfreundlichkeit + Benutzerführung                   (Lewandowski & Höchstötter 2007)

13 |
Web-Abdeckung




 Keine Suchmaschine deckt das gesamte Web ab!
    – Aber: keine genauen Zahlen; aktuelle Untersuchungen fehlen.
    – Größe des Web ist unbekannt; die großen Suchmaschinen haben einige
      Milliarden Dokumente indexiert.
    – Wenig erforschter Bereich: Invisible Web.

 Definitionen Invisible/Deep Web
    – “Text pages, files, or other often high-quality authoritative information available
      via the World Wide Web that general-purpose search engines cannot, due to
      technical limitations, or will not, due to deliberate choice, add to their indices of
      Web pages" (Sherman u. Price 2001).
    – “The deep Web - those pages do not exist until they are created dynamically as
      the result of a specific search“ (Bergman 2001).

14 |
Country Bias




15 |
Überschneidung der Datenbestände




 • Überschneidung der Indices
    – Relativ gering, daher lohnt sich die Suche in mehreren Suchmaschinen.

 • Überschneidung der Suchergebnisse
    – Sehr gering innerhalb der Top10, 20.




16 |
Überschneidung der Trefferlisten (Top10)




17 |
Aktualität der Datenbestände




 • Wichtig wegen
    – Auffinden und Erfassen neuer Dokumente.
    – Aktualisierung veränderter Dokumente; korrekte Repräsentation der URLs.

 • Untersuchung 2005-2007
    – Beobachtungszeitraum jeweils sechs Wochen.
    – 40 täglich aktualisierte Seiten (+ 30 unregelmäßig aktualisierte).




18 |
Auch aktuelle Seiten werden nicht zuverlässig regelmäßig
 indexiert.




19 |
Aktualität der Datenbestände




20 |
Aktualität der Datenbestände




21 |

                                Quelle: Lewandowski et al. 2006
Retrievaleffektivität: Navigationsorientierte Anfragen




22 |
Retrievaleffektivität: Informationsorientierte Anfragen

 Klassische Tests


 • Welche Suchmaschine liefert die besten Treffer?

 • Test anhand von
    – einer bestimmten Anzahl von Suchanfragen (50).
    – einer bestimmten Anzahl von Treffern pro Suchmaschine (20).
    – Bewertungen durch Juroren (wichtige Frage: wer bewertet?).
    – Ja/Nein-Entscheidungen über Relevanz, verschiedenen Skalen.




23 |
Precision ist das am häufigsten verwendete Retrievalmaß.

 Klassische Retrievalmaße


 • Precision
    – Anteil der relevanten ausgegebenen Treffer an der Gesamtheit der
      ausgegebenen Treffer.
    – Wird bei Suchmaschinen i.d.R. bis zu einem Cut-Off-Wert bestimmt (z.B. 20).

 • Recall
    – Anteil der relevanten ausgegebenen Treffer an der Gesamtheit aller überhaupt
      vorhandenen Treffer (= aller im Web vorhandener relevanter Dokumente).
    – Bei Suchmaschinen nicht messbar (Ausweg evtl. über Pooling-Methoden).

 • Fallout
    – Anteil der ausgegebenen nicht relevanten Treffer an der Gesamtzahl der nicht
       relevanten Treffer im Datenbestand.
 • Generality
    – Anteil der relevanten Dokumente im zugrunde liegenden Datenbestand.
24 |
Precision@10 zwischen 0,43 und 0,60.




25 |
Skalenbewertung zeigt die Gruppierung der Suchmaschinen
 noch deutlicher.




26 |
Keine klare Reihung der Suchmaschinen, wenn einzelne
 Anfragen betrachtet werden.




27 |
Offene Frage: Wie können Retrievalmaße dem spezifischen
 Verhalten der Suchmaschinen-Nutzer angepasst werden?
 Problembereiche


 • Such-Sessions
    – Nur Treffer auf der ersten Ergebnisseite (bzw. auf dem direkt sichtbaren Bildschirmbereich)
      werden angesehen.
    – In der Regel werden maximal fünf Dokumente angesehen.
    – Recherche wird oft abgebrochen, sobald ein passendes Dokument gefunden wurde.
     Wie können die Maße dem Bedürfnis nach nur einem/wenigen relevanten Treffern
      angepasst werden?

 • Zusammensetzung der Trefferlisten
     – Abbildung mehrerer Facetten eines Themas auf den vorderen Plätzen der Trefferlisten.
      Wie kann in der Evaluierung auf Facetten eingegangen werden?

 • Interaktion
     – Allgemeines IR-Evaluationsproblem: Recherche ist immer als interaktiver Prozess
       anzusehen.
      Wie können die Maße an den tatsächlichen Suchprozess angepasst werden?
28 |
Agenda




 Nutzerverhalten

 Wie gut sind die gängigen Suchmaschinen?

 Suche und Web 2.0

 Fazit




29 |
„Such-Ansätze“ des Web 2.0




 • Social Bookmarking
    – Nutzer speichern Lesezeichen online und machen diese öffentlich zugänglich.
    – Lesezeichen werden mit tags verschlagwortet.
    – Beispiele: Mr. Wong; del.icio.us

 • Frage-Antwort-Dienste
     – Nutzer stellen Fragen, Community antwortet.
     – Fragen und Antworten werden mit tags verschlagwortet.
     – Beispiele: Yahoo Clever, Lycos IQ




30 |
Suchmaschinen, Social Bookmarking, Frage-Antwort-Dienste



Suchmaschinen



F&A-Diente


Social Bookmarking




                                                    (Gammer et al. 2008)


     31 |
Fazit Web 2.0 Dienste für die Suche




 • Web 2.0 Dienste bieten bisher keine den Suchmaschinen vergleichbare
   Trefferqualität.

 • Bislang kaum Ausnutzung der klassischen IR-Verfahren in diesen
   Anwendungen.

 • Mashup der Ergebnisse aus allen Quellen könnte zu Qualitätssteigerung
   führen.




32 |
Agenda




 Nutzerverhalten

 Wie gut sind die gängigen Suchmaschinen?

 Suche und Web 2.0

 Fazit




33 |
Fazit




 • Suchmaschinen prägen das Nutzerverhalten auch für andere
   Informationssysteme.
     – „Google kann das doch auch!“

 • Qualität der Suchmaschinen ist nur durch eine Kombination verschiedener
   Faktoren messbar.
    – Empirische Untersuchungen zeigen deutliche Unterschiede.
    – Beliebtheit von Google lässt sich nicht allein durch die Qualität erklären.

 • Web 2.0 Dienste verbessern die Suche bislang nicht.
    – Potential ist aber durchaus vorhanden.




34 |
Vielen Dank für Ihre
Aufmerksamkeit.

www.bui.haw-hamburg.de/lewandowski.html

Alle in der Präsentation genannten
Artikel zum Download.


Bücher:
Handbuch Internet-Suchmaschinen
(erscheint im Oktober)

Web-2.0-Dienste als Ergänzung zu
algorithmischen Suchmaschinen


E-Mail:
dirk.lewandowski@haw-hamburg.de
1 of 36

Recommended

Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter... by
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...Dirk Lewandowski
423 views23 slides
Neue Entwicklungen im Bereich der Suchmaschinen (technologie) by
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)Neue Entwicklungen im Bereich der Suchmaschinen (technologie)
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)Dirk Lewandowski
1K views24 slides
Suchmaschinen im Internet – neue Erkenntnisse und Perspektiven by
Suchmaschinen im Internet – neue Erkenntnisse und PerspektivenSuchmaschinen im Internet – neue Erkenntnisse und Perspektiven
Suchmaschinen im Internet – neue Erkenntnisse und PerspektivenDirk Lewandowski
962 views29 slides
Suchmaschinenforschung an der HAW Hamburg by
Suchmaschinenforschung an der HAW HamburgSuchmaschinenforschung an der HAW Hamburg
Suchmaschinenforschung an der HAW HamburgDirk Lewandowski
1.2K views36 slides
Wie können wir (Suchmaschinen-)Nutzer besser verstehen? by
Wie können wir (Suchmaschinen-)Nutzer besser verstehen?Wie können wir (Suchmaschinen-)Nutzer besser verstehen?
Wie können wir (Suchmaschinen-)Nutzer besser verstehen?Dirk Lewandowski
1.1K views32 slides
Wie Suchmaschinen die Inhalte des Web interpretieren by
Wie Suchmaschinen die Inhalte des Web interpretierenWie Suchmaschinen die Inhalte des Web interpretieren
Wie Suchmaschinen die Inhalte des Web interpretierenDirk Lewandowski
1.5K views30 slides

More Related Content

What's hot

Evaluierungsläufe by
EvaluierungsläufeEvaluierungsläufe
EvaluierungsläufeChristiane Behnert
388 views15 slides
Wie gut sind Google und Co.? by
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Dirk Lewandowski
413 views47 slides
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1) by
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Dirk Lewandowski
571 views13 slides
Suchmaschinen verstehen by
Suchmaschinen verstehenSuchmaschinen verstehen
Suchmaschinen verstehenDirk Lewandowski
2.1K views57 slides
Perspektiven eines Open Web Index by
Perspektiven eines Open Web IndexPerspektiven eines Open Web Index
Perspektiven eines Open Web IndexDirk Lewandowski
1.6K views40 slides
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven by
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenInternet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenDirk Lewandowski
871 views49 slides

What's hot(8)

Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Dirk Lewandowski571 views
Perspektiven eines Open Web Index by Dirk Lewandowski
Perspektiven eines Open Web IndexPerspektiven eines Open Web Index
Perspektiven eines Open Web Index
Dirk Lewandowski1.6K views
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven by Dirk Lewandowski
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenInternet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Dirk Lewandowski871 views
Wie entwickeln sich Suchmaschinen heute, was kommt morgen? by Dirk Lewandowski
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?Wie entwickeln sich Suchmaschinen heute, was kommt morgen?
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?
Dirk Lewandowski1.5K views
Ausgewählte Forschungsfragen im Bereich Suche by Dirk Lewandowski
Ausgewählte Forschungsfragen im Bereich SucheAusgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich Suche
Dirk Lewandowski1.3K views

Similar to Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends

Suchmaschinen, Bürde für Informationsspezialisten? by
Suchmaschinen, Bürde für Informationsspezialisten?Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?Dirk Lewandowski
864 views19 slides
Wie gut sind Google und Co.? by
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Dirk Lewandowski
998 views47 slides
Ist meine Suchmaschine wirklich so gut, wie ich glaube? by
Ist meine Suchmaschine wirklich so gut, wie ich glaube?Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Ist meine Suchmaschine wirklich so gut, wie ich glaube?Dirk Lewandowski
1.1K views22 slides
Web-Index-Workshop 2014 by
Web-Index-Workshop 2014Web-Index-Workshop 2014
Web-Index-Workshop 2014Dirk Lewandowski
604 views24 slides
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen by
Die Macht der Suchmaschinen und ihr Einfluss auf unsere EntscheidungenDie Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere EntscheidungenDirk Lewandowski
2.3K views44 slides
Web-Suche? Gibt‘s nicht mehr! by
Web-Suche? Gibt‘s nicht mehr!Web-Suche? Gibt‘s nicht mehr!
Web-Suche? Gibt‘s nicht mehr!Dirk Lewandowski
906 views33 slides

Similar to Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends(20)

Suchmaschinen, Bürde für Informationsspezialisten? by Dirk Lewandowski
Suchmaschinen, Bürde für Informationsspezialisten?Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?
Dirk Lewandowski864 views
Ist meine Suchmaschine wirklich so gut, wie ich glaube? by Dirk Lewandowski
Ist meine Suchmaschine wirklich so gut, wie ich glaube?Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Dirk Lewandowski1.1K views
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen by Dirk Lewandowski
Die Macht der Suchmaschinen und ihr Einfluss auf unsere EntscheidungenDie Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Dirk Lewandowski2.3K views
Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen by Dirk Lewandowski
Wissensarmut trotz (oder gar durch) Nutzung von SuchmaschinenWissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Dirk Lewandowski976 views
Warum Suche (trotzdem) bedeutend ist by Dirk Lewandowski
Warum Suche (trotzdem) bedeutend istWarum Suche (trotzdem) bedeutend ist
Warum Suche (trotzdem) bedeutend ist
Dirk Lewandowski924 views
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge... by Dirk Lewandowski
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
Dirk Lewandowski1.1K views
Wie Web 2.0 und Suche zusammenwachsen by Dirk Lewandowski
Wie Web 2.0 und Suche zusammenwachsenWie Web 2.0 und Suche zusammenwachsen
Wie Web 2.0 und Suche zusammenwachsen
Dirk Lewandowski942 views
Von wem wir abhängig sind: Über die Auffindbarkeit von Informationen by Dirk Lewandowski
Von wem wir abhängig sind: Über die Auffindbarkeit von InformationenVon wem wir abhängig sind: Über die Auffindbarkeit von Informationen
Von wem wir abhängig sind: Über die Auffindbarkeit von Informationen
Dirk Lewandowski1.1K views
Was Nutzer in Suchmaschinen wirklich sehen by Dirk Lewandowski
Was Nutzer in Suchmaschinen wirklich sehenWas Nutzer in Suchmaschinen wirklich sehen
Was Nutzer in Suchmaschinen wirklich sehen
Dirk Lewandowski329 views
Ethnographische Studien und Kontextinterviews bei eResult by eResult_GmbH
Ethnographische Studien und Kontextinterviews bei eResultEthnographische Studien und Kontextinterviews bei eResult
Ethnographische Studien und Kontextinterviews bei eResult
eResult_GmbH6.6K views
Das Nutzerverhalten in der Web-Suche by Dirk Lewandowski
Das Nutzerverhalten in der Web-SucheDas Nutzerverhalten in der Web-Suche
Das Nutzerverhalten in der Web-Suche
Dirk Lewandowski655 views
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen? by Dirk Lewandowski
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Dirk Lewandowski1.2K views
[Mobile Usability Testing] Zahlen, Daten, Fakten Mobil - World Usability Day ... by UserZoom Deutschland
[Mobile Usability Testing] Zahlen, Daten, Fakten Mobil - World Usability Day ...[Mobile Usability Testing] Zahlen, Daten, Fakten Mobil - World Usability Day ...
[Mobile Usability Testing] Zahlen, Daten, Fakten Mobil - World Usability Day ...
Webcast "Not provided – was nun? by Unic
Webcast "Not provided – was nun?Webcast "Not provided – was nun?
Webcast "Not provided – was nun?
Unic1.4K views

More from Dirk Lewandowski

The Need for and fundamentals of an Open Web Index by
The Need for and fundamentals of an Open Web IndexThe Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web IndexDirk Lewandowski
230 views17 slides
In a World of Biased Search Engines by
In a World of Biased Search EnginesIn a World of Biased Search Engines
In a World of Biased Search EnginesDirk Lewandowski
583 views48 slides
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni... by
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...Dirk Lewandowski
319 views45 slides
Künstliche Intelligenz bei Suchmaschinen by
Künstliche Intelligenz bei SuchmaschinenKünstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei SuchmaschinenDirk Lewandowski
466 views28 slides
Analysing search engine data on socially relevant topics by
Analysing search engine data on socially relevant topicsAnalysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topicsDirk Lewandowski
191 views36 slides
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert by
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertGoogle Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertDirk Lewandowski
278 views27 slides

More from Dirk Lewandowski(20)

The Need for and fundamentals of an Open Web Index by Dirk Lewandowski
The Need for and fundamentals of an Open Web IndexThe Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web Index
Dirk Lewandowski230 views
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni... by Dirk Lewandowski
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
Dirk Lewandowski319 views
Künstliche Intelligenz bei Suchmaschinen by Dirk Lewandowski
Künstliche Intelligenz bei SuchmaschinenKünstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei Suchmaschinen
Dirk Lewandowski466 views
Analysing search engine data on socially relevant topics by Dirk Lewandowski
Analysing search engine data on socially relevant topicsAnalysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topics
Dirk Lewandowski191 views
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert by Dirk Lewandowski
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertGoogle Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Dirk Lewandowski278 views
Suchverhalten und die Grenzen von Suchdiensten by Dirk Lewandowski
Suchverhalten und die Grenzen von SuchdienstenSuchverhalten und die Grenzen von Suchdiensten
Suchverhalten und die Grenzen von Suchdiensten
Dirk Lewandowski173 views
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden? by Dirk Lewandowski
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Dirk Lewandowski265 views
Are Ads on Google search engine results pages labeled clearly enough? by Dirk Lewandowski
Are Ads on Google search engine results pages labeled clearly enough?Are Ads on Google search engine results pages labeled clearly enough?
Are Ads on Google search engine results pages labeled clearly enough?
Dirk Lewandowski910 views
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim... by Dirk Lewandowski
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Dirk Lewandowski1.3K views
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen by Dirk Lewandowski
Verwendung von Skalenbewertungen in der Evaluierung von SuchmaschinenVerwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Dirk Lewandowski833 views
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Dirk Lewandowski646 views
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Dirk Lewandowski595 views
Medientage 2013: Die Zukunft der Suche by Dirk Lewandowski
Medientage 2013: Die Zukunft der SucheMedientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der Suche
Dirk Lewandowski1.1K views
Suchmaschinen: Googlerisierung der Gesellschaft by Dirk Lewandowski
Suchmaschinen: Googlerisierung der GesellschaftSuchmaschinen: Googlerisierung der Gesellschaft
Suchmaschinen: Googlerisierung der Gesellschaft
Dirk Lewandowski1.5K views
Wie beeinflussen Suchmaschinen den Informationsmarkt? by Dirk Lewandowski
Wie beeinflussen Suchmaschinen den Informationsmarkt?Wie beeinflussen Suchmaschinen den Informationsmarkt?
Wie beeinflussen Suchmaschinen den Informationsmarkt?
Dirk Lewandowski543 views
Warum wir Alternativen zu Google benötigen by Dirk Lewandowski
Warum wir Alternativen zu Google benötigenWarum wir Alternativen zu Google benötigen
Warum wir Alternativen zu Google benötigen
Dirk Lewandowski1.2K views
Why we need an independent index of the Web by Dirk Lewandowski
Why we need an independent index of the WebWhy we need an independent index of the Web
Why we need an independent index of the Web
Dirk Lewandowski1K views

Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends

  • 1. Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de
  • 2. Agenda Nutzerverhalten Wie gut sind die gängigen Suchmaschinen? Suche und Web 2.0 Fazit 1 |
  • 3. Agenda Nutzerverhalten Wie gut sind die gängigen Suchmaschinen? Suche und Web 2.0 Fazit 2 |
  • 4. Bedeutung der Suchmaschinen • Suchmaschinen sind der Zugang zu Informationen im Netz. – Andere Zugänge (Kataloge, usw.) haben kaum noch Bedeutung. – Suchmaschinen bestimmen über die sichtbaren Inhalte des Web. – Suchmaschinen bestimmen das Nutzerverhalten (auch für andere Informationssysteme). 3 |
  • 5. Drei Anfragetypen Anfragetypen nach Broder (2002) • Informational (informationsorientiert) – Nutzer möchte sich zu einem Thema informieren. – Ziel sind mehrere Dokumente. • Navigational (navigationsorientiert) – Ziel ist es, eine bestimmte Seite (wieder) zu finden. – Typisch: Suche nach Homepage („Daimler Chrysler“). – Ziel ist i.d.R. ein Dokument. • Transactional (transaktionsorientiert) – Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll. – Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei. 4 |
  • 6. „Die meisten Nutzer sind nicht willens, bei der Formulierung ihres Suchziels allzu viel kognitive und zeitliche Energie aufzuwenden.“ (Machill et al. 2003) • Boolesche Operatoren – Bei weniger als 10% der Anfragen; keine Veränderung im Lauf der Jahre (Spink&Jansen 2004). – Nur etwa die Hälfte der Nutzer weiß, dass es Operatoren gibt (Machill et al. 2003). – 20% der Nutzer geben an, sie öfter zu verwenden (Machill et al. 2003). – Etwa die Hälfte der Anfragen mit Operatoren enthält Fehler (Spink et al. 2000), bei der Verwendung von Plus-/Minuszeichen lag die Fehlerquote bei 2/3. • Profisuche – 59% der Nutzer kennen die Profisuche (Machill et al. 2003). – Nur 14% nutzen sie öfter (Machill et al. 2003). 5 |
  • 7. Grunddaten zum Nutzerverhalten (2) • Auswertung der Treffer – 80% der Nutzer betrachten nur die erste Ergebnisseite (= 10 Treffer) (Spink&Jansen 2004). – Vor allem die Treffer auf den ersten Listenplätzen werden angesehen; möglichst kein Scrollen – Pro Session werden nur etwa fünf Dokumente gesichtet (Spink&Jansen 2004). – Sessions dauern weniger als 15 Minuten. • Kaum Veränderungen im Lauf der Zeit 6 |
  • 9.   Google klein
  • 10. 9 |
  • 11. Selektionsverhalten (Top11 Treffer) (Granka et al. 2004) 10 |
  • 12. Eye-tracking 11 | (Enquiro Eye Tracking Report II)
  • 13. Agenda Nutzerverhalten Wie gut sind die gängigen Suchmaschinen? Suche und Web 2.0 Fazit 12 |
  • 14. Die Qualität von Suchmaschinen kann nur durch eine Kombination unterschiedlicher Faktoren gemessen werden. Qualitätsfaktoren für Suchmaschinen • Qualität des Index – Größe des Datenbestands, Abdeckung des Web – Abdeckung bestimmter Bereiche (Sprachräume, Länder) – Überschneidungen der Indices – Aktualität des Datenbestands • Qualität der Suchresultate – Retrievaleffektivität – Zufriedenheit der Nutzer – Überschneidungen der (Top-)Ergebnisse • Qualität der Suchfunktionen • Nutzerfreundlichkeit + Benutzerführung (Lewandowski & Höchstötter 2007) 13 |
  • 15. Web-Abdeckung Keine Suchmaschine deckt das gesamte Web ab! – Aber: keine genauen Zahlen; aktuelle Untersuchungen fehlen. – Größe des Web ist unbekannt; die großen Suchmaschinen haben einige Milliarden Dokumente indexiert. – Wenig erforschter Bereich: Invisible Web. Definitionen Invisible/Deep Web – “Text pages, files, or other often high-quality authoritative information available via the World Wide Web that general-purpose search engines cannot, due to technical limitations, or will not, due to deliberate choice, add to their indices of Web pages" (Sherman u. Price 2001). – “The deep Web - those pages do not exist until they are created dynamically as the result of a specific search“ (Bergman 2001). 14 |
  • 17. Überschneidung der Datenbestände • Überschneidung der Indices – Relativ gering, daher lohnt sich die Suche in mehreren Suchmaschinen. • Überschneidung der Suchergebnisse – Sehr gering innerhalb der Top10, 20. 16 |
  • 19. Aktualität der Datenbestände • Wichtig wegen – Auffinden und Erfassen neuer Dokumente. – Aktualisierung veränderter Dokumente; korrekte Repräsentation der URLs. • Untersuchung 2005-2007 – Beobachtungszeitraum jeweils sechs Wochen. – 40 täglich aktualisierte Seiten (+ 30 unregelmäßig aktualisierte). 18 |
  • 20. Auch aktuelle Seiten werden nicht zuverlässig regelmäßig indexiert. 19 |
  • 22. Aktualität der Datenbestände 21 | Quelle: Lewandowski et al. 2006
  • 24. Retrievaleffektivität: Informationsorientierte Anfragen Klassische Tests • Welche Suchmaschine liefert die besten Treffer? • Test anhand von – einer bestimmten Anzahl von Suchanfragen (50). – einer bestimmten Anzahl von Treffern pro Suchmaschine (20). – Bewertungen durch Juroren (wichtige Frage: wer bewertet?). – Ja/Nein-Entscheidungen über Relevanz, verschiedenen Skalen. 23 |
  • 25. Precision ist das am häufigsten verwendete Retrievalmaß. Klassische Retrievalmaße • Precision – Anteil der relevanten ausgegebenen Treffer an der Gesamtheit der ausgegebenen Treffer. – Wird bei Suchmaschinen i.d.R. bis zu einem Cut-Off-Wert bestimmt (z.B. 20). • Recall – Anteil der relevanten ausgegebenen Treffer an der Gesamtheit aller überhaupt vorhandenen Treffer (= aller im Web vorhandener relevanter Dokumente). – Bei Suchmaschinen nicht messbar (Ausweg evtl. über Pooling-Methoden). • Fallout – Anteil der ausgegebenen nicht relevanten Treffer an der Gesamtzahl der nicht relevanten Treffer im Datenbestand. • Generality – Anteil der relevanten Dokumente im zugrunde liegenden Datenbestand. 24 |
  • 26. Precision@10 zwischen 0,43 und 0,60. 25 |
  • 27. Skalenbewertung zeigt die Gruppierung der Suchmaschinen noch deutlicher. 26 |
  • 28. Keine klare Reihung der Suchmaschinen, wenn einzelne Anfragen betrachtet werden. 27 |
  • 29. Offene Frage: Wie können Retrievalmaße dem spezifischen Verhalten der Suchmaschinen-Nutzer angepasst werden? Problembereiche • Such-Sessions – Nur Treffer auf der ersten Ergebnisseite (bzw. auf dem direkt sichtbaren Bildschirmbereich) werden angesehen. – In der Regel werden maximal fünf Dokumente angesehen. – Recherche wird oft abgebrochen, sobald ein passendes Dokument gefunden wurde.  Wie können die Maße dem Bedürfnis nach nur einem/wenigen relevanten Treffern angepasst werden? • Zusammensetzung der Trefferlisten – Abbildung mehrerer Facetten eines Themas auf den vorderen Plätzen der Trefferlisten.  Wie kann in der Evaluierung auf Facetten eingegangen werden? • Interaktion – Allgemeines IR-Evaluationsproblem: Recherche ist immer als interaktiver Prozess anzusehen.  Wie können die Maße an den tatsächlichen Suchprozess angepasst werden? 28 |
  • 30. Agenda Nutzerverhalten Wie gut sind die gängigen Suchmaschinen? Suche und Web 2.0 Fazit 29 |
  • 31. „Such-Ansätze“ des Web 2.0 • Social Bookmarking – Nutzer speichern Lesezeichen online und machen diese öffentlich zugänglich. – Lesezeichen werden mit tags verschlagwortet. – Beispiele: Mr. Wong; del.icio.us • Frage-Antwort-Dienste – Nutzer stellen Fragen, Community antwortet. – Fragen und Antworten werden mit tags verschlagwortet. – Beispiele: Yahoo Clever, Lycos IQ 30 |
  • 32. Suchmaschinen, Social Bookmarking, Frage-Antwort-Dienste Suchmaschinen F&A-Diente Social Bookmarking (Gammer et al. 2008) 31 |
  • 33. Fazit Web 2.0 Dienste für die Suche • Web 2.0 Dienste bieten bisher keine den Suchmaschinen vergleichbare Trefferqualität. • Bislang kaum Ausnutzung der klassischen IR-Verfahren in diesen Anwendungen. • Mashup der Ergebnisse aus allen Quellen könnte zu Qualitätssteigerung führen. 32 |
  • 34. Agenda Nutzerverhalten Wie gut sind die gängigen Suchmaschinen? Suche und Web 2.0 Fazit 33 |
  • 35. Fazit • Suchmaschinen prägen das Nutzerverhalten auch für andere Informationssysteme. – „Google kann das doch auch!“ • Qualität der Suchmaschinen ist nur durch eine Kombination verschiedener Faktoren messbar. – Empirische Untersuchungen zeigen deutliche Unterschiede. – Beliebtheit von Google lässt sich nicht allein durch die Qualität erklären. • Web 2.0 Dienste verbessern die Suche bislang nicht. – Potential ist aber durchaus vorhanden. 34 |
  • 36. Vielen Dank für Ihre Aufmerksamkeit. www.bui.haw-hamburg.de/lewandowski.html Alle in der Präsentation genannten Artikel zum Download. Bücher: Handbuch Internet-Suchmaschinen (erscheint im Oktober) Web-2.0-Dienste als Ergänzung zu algorithmischen Suchmaschinen E-Mail: dirk.lewandowski@haw-hamburg.de