Wie gut sind Google und Co.?

Dirk Lewandowski
Dirk LewandowskiProfessor at Hamburg University of Applied Sciences
Wie gut sind eigentlich Google und Co.?
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften Hamburg, Department Information
dirk.lewandowski@haw-hamburg.de


Köthen, 24. Juni 2011
Kurzvorstellung

 •  Prof. Dr. Dirk Lewandowski

 •  Professor für
    Information Research & Information Retrieval
    an der Hochschule für Angewandte Wissenschaften
    Hamburg (HAW)

 •  Forschung vor allem zur Qualität von Suchmaschinen,
    Nutzerverhalten, Query Understanding




1 |
Agenda



  Suchmaschinenforschung an der HAW

 Die Websuche hat sich verändert...

 Wie kann man die Suchanfragen der Nutzer verstehen?

 Wie gut sind die Ergebnisse der Suchmaschinen?

 Fazit




2 | Dirk Lewandowski
Agenda



  Suchmaschinenforschung an der HAW

 Die Websuche hat sich verändert...

 Wie kann man die Suchanfragen der Nutzer verstehen?

 Wie gut sind die Ergebnisse der Suchmaschinen?

 Fazit




3 | Dirk Lewandowski
Mission Statement




        Wir wollen den Suchprozess sowohl aus system- als auch aus
        nutzerzentrierter Perspektive verstehen und aus diesem Verständnis
        Empfehlungen für die Verbesserung von Suchsystemen ableiten.




4 | Dirk Lewandowski
Aktuelle Projekte im Bereich Suche




 •  Forschungsprojekte
       •  Qualität von Web-Suchmaschinen (laufend bis 2011)
       •  Forschungsprojekt „Wissenschaftssuchmaschinen“ (seit WS 2008/09)
       •  Query Understanding (seit 2010)
       •  Search Experience (ab 2011)




5 | Dirk Lewandowski
Methoden




                                Logfile-Analyse
                                                               Heuristische
       Relevanztest                                            Evaluation


                                      Search
      Online-Umfrage
                                                           Usability-Test

                       Eye-Tracking
                                              Physiologische
                                              Untersuchung



6 |
Aktuelle Projekte (mit Studierenden) im Bereich Suche




 •  Lehrprojekte
      –  Verbesserung der Musiksuche (WS2010/11; Projektpartner Musicload)
      –  Lokale Suchmaschinen: Eye-Tracking und Usability (WS 2009/10,
         Projektpartner Deutsche Telekom)
      –  Einbindung von Frage-Antwort-Diensten in die Web-Suche (WS2007/08,
         Projektpartner Lycos Europe)

 •  Abgeschlossene Entwicklungsprojekte (mit MA-Studierenden)
      •  Suchanfragenklassifikation (in Zusammenarbeit mit T-Online)
      •  Produktsuche (mit Otto)
      •  Universal-Search-Konzept für die T-Online-Portalsuche


7 | Dirk Lewandowski
Agenda



  Suchmaschinenforschung an der HAW

 Die Websuche hat sich verändert...

 Wie kann man die Suchanfragen der Nutzer verstehen?

 Wie gut sind die Ergebnisse der Suchmaschinen?

 Fazit




8 | Dirk Lewandowski
Web search: „Always different, always the same“

      AltaVista 1996




9 |                           http://web.archive.org/web/19961023234631/http://altavista.digital.com/
•  x




10 |
x




11 |
Anzeigen



        Nachrichten



           Bilder

 x




         Videos

       Blogbeiträge


12 |
Übertragbarkeit der Universal Search – Beispiel T-Online
 Portalsuche




13 | Dirk Lewandowski
Ergebnisselektion




 •  Ergebnisselektion abhängig von
    •  Position des Treffers
       •  Vorkommen des Treffers im „sichtbaren Bereich“
       •  Darstellung/Hervorhebung des Treffers, Trefferbeschreibung
       •  Einblendung in Vorschlägen während der Eingabe




14 |
x




15 | Dirk Lewandowski   (Eyetracking-Studie HAW-Hamburg 2010)
x




16 | Dirk Lewandowski
x




17 | Dirk Lewandowski
Eye-Tracking




 •  x




18 |
Fixationen bei kartenbasierter Darstellung – Beispiel T-Online




19 | Dirk Lewandowski
x




20 |
Agenda



  Suchmaschinenforschung an der HAW

 Die Websuche hat sich verändert...

 Wie kann man die Suchanfragen der Nutzer verstehen?

 Wie gut sind die Ergebnisse der Suchmaschinen?

 Fazit




21 | Dirk Lewandowski
Hätten Sie‘s verstanden?




 •     vatikan              •    frauentausch
 •     stockbrot            •    seelenfarben
 •     bmw                  •    berliner bank
 •     fußball              •    osterei
 •     drehscheibe          •    wgt




22 | Dirk Lewandowski
•     x




23 | Dirk Lewandowski
•     x




24 | Dirk Lewandowski
•     x




25 | Dirk Lewandowski
Die Suchintention kann sich verändern




26 | Dirk Lewandowski
Die Suchintention kann sich verändern




27 | Dirk Lewandowski
Was kann man aus einer Suchanfrage herauslesen?




 •     Genre (Bsp. Nachrichten)
 •     Thema (grob)
 •     Intention (informationsorientiert, navigationsorientiert, transaktionsorientiert)
 •     Ziel (Aktion oder Ressource)
 •     Spezifität (Bsp. „Mindestlohn“)
 •     Bandbreite/Mehrdeutigkeit (Ergebnisse ausdifferenzieren)
 •     Autoritätsbezug
 •     Ortsbezug
 •     Zeitbezug (explizit; implizit; aus dem Suchanfrage-Volumen)



28 | Dirk Lewandowski                                                (nach Calderon-Benavides et al. 2010)
Suchanfragen im Kontext




29 |
Drei Anfragetypen

 Anfragetypen nach Broder (2002)



 •  Informational (informationsorientiert)
       –  Nutzer möchte sich zu einem Thema informieren.
       –  Ziel sind mehrere Dokumente.

 •  Navigational (navigationsorientiert)
       –  Ziel ist es, eine bestimmte Seite (wieder) zu finden.
       –  Typisch: Suche nach Homepage („Daimler Chrysler“).
       –  Ziel ist i.d.R. ein Dokument.

 •  Transactional (transaktionsorientiert)
       –  Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden
          soll.
       –  Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.

30 |
Anwendungsfälle: Konkreter vs. problemorientierter
 Informationsbedarf
  Anwendungsfall       Konkret                       Problemorientiert


  Websuche             Ebay-Homepage                 Informationen über die
                                                     neue Sherlock-Holmes-
                                                     Serie der BBC

  Bibliothekskatalog   Ist das Buch „Information     Welche Bücher gibt es zum
                       Retrieval“ von Stock in der   Thema kollaborative
                       HAW-Bibliothek                Suche?
                       vorhanden?

  Online-Dating        Welche Hobbies hat            Wer passt zu mir?
                       Natalia73?

  Produktsuche         Was kostet der Roomba         Welcher Staubsaugroboter
                       581?                          ist der beste?

31 |
Navigationsorientierte Suchanfragen anhand von Klicks
 bestimmen




32 |
Transaktionsorientierte Suchanfragen anhand der Klicks
 bestimmen




33 |
Einsatzmöglichkeiten von Query Understanding




 •     Anfrageerweiterung
 •     Generierung von Suchvorschlägen
 •     Steuerung der organischen Ergebnisse
 •     Steuerung der Werbung
 •     Steuerung der Universal Search




34 | Dirk Lewandowski
Agenda



  Suchmaschinenforschung an der HAW

 Die Websuche hat sich verändert...

 Wie kann man die Suchanfragen der Nutzer verstehen?

 Wie gut sind die Ergebnisse der Suchmaschinen?

 Fazit




35 | Dirk Lewandowski
Kernkomponenten einer Suchmaschine




                                      (Risvik & Michelsen 2002)




36 |
Die Qualität von Suchmaschinen kann nur durch eine
 Kombination unterschiedlicher Faktoren gemessen werden.

 •  Qualität des Index
     –  Größe des Datenbestands, Abdeckung des Web
     –  Abdeckung bestimmter Bereiche (Sprachräume, Länder)
     –  Überschneidungen der Indices
     –  Aktualität des Datenbestands

 •  Qualität der Suchresultate
       –  Retrievaleffektivität
       –  Zuverlässigkeit der Suchergebnisse
       –  Zufriedenheit der Nutzer
       –  Überschneidungen der (Top-)Ergebnisse

 •  Qualität der Suchfunktionen

 •  Nutzerfreundlichkeit + Benutzerführung
       –  Aufbau der Trefferseiten
                                                              (Lewandowski & Höchstötter 2007; ergänzt)

37 | Dirk Lewandowski
Die Qualität von Suchmaschinen kann nur durch eine
 Kombination unterschiedlicher Faktoren gemessen werden.

 •  Qualität des Index
     –  Größe des Datenbestands, Abdeckung des Web
     –  Abdeckung bestimmter Bereiche (Sprachräume, Länder)
     –  Überschneidungen der Indices
     –  Aktualität des Datenbestands

 •  Qualität der Suchresultate
       –  Retrievaleffektivität
       –  Zuverlässigkeit der Suchergebnisse
       –  Zufriedenheit der Nutzer
       –  Überschneidungen der (Top-)Ergebnisse

 •  Qualität der Suchfunktionen

 •  Nutzerfreundlichkeit + Benutzerführung
       –  Aufbau der Trefferseiten
                                                              (Lewandowski & Höchstötter 2007; ergänzt)

38 | Dirk Lewandowski
Entscheidungen beim Design klassischer Retrievaltests




 1. Welche Suchmaschine(n)?

 2. Wie viele Suchanfragen?
 3. Welche Suchanfragen?
 4. Wie viele Ergebnisse pro Suchanfrage?

 5. Wie viele Juroren?
 6. Welche Juroren(gruppen)?
 7. Wie viele Juroren je Suchanfrage?

 8. Wie sollen Dokumente bewertet werden (Skalen)?
 9. Sollen Dokumentbeschreibungen berücksichtigt werden?

 10.  Mit welchen Kennzahlen soll gemessen werden?
39 |
Precision-Recall-Graph (binär) – Beispiel Websuche




40 | Dirk Lewandowski
Welches Nutzerverhalten kann in Retrievaltests abgebildet
 werden?



 •  Query-response paradigm
    •  Annahme: Nutzer gibt Suchanfrage ein, prüft dann das Ergebnis.
    •  Statisch; „systemorientiert“
     „Klassische“ Retrievaltests (Abfrage der „objektiven“ Trefferqualität)

 •  Interaktives Retrieval
    •  Annahme:
         •  Recherche findet in mehreren Schritten statt.
         •  Bei der Recherche handelt es sich um einen „Dialog“ zwischen Nutzer und
            System.
    •  Dynamisch, „nutzerorientiert“
     Nutzerstudien (Abfrage der Zufriedenheit der Nutzer)


41 |
Trefferqualität in der Nutzerstudie




                                        „Wo ist denn nun
                                        der Jungferstieg?“




                        Jungfernstieg




42 | Dirk Lewandowski
Tools: RAT & Search Logger




 •  RAT (Relevance Assessment Tool)
    •  Werkzeug zum Design und zur Durchführung klassischer Retrievaltests
    •  Baukastenprinzip beim Testdesign
    •  Automatische Abfrage der Treffer der bekannten Suchmaschinen

 •  Search Logger (Entwicklung der Uni Tartu, Estland)
    •  Werkzeug zum Protokollieren von Browserinteraktionen
    •  Task-basiert

 •  Ziel 2011: Zusammenführung der beiden Tools, um interaktives IR in
    Suchmaschinen evaluieren zu können.




43 |
Agenda



  Suchmaschinenforschung an der HAW

 Die Websuche hat sich verändert...

 Wie kann man die Suchanfragen der Nutzer verstehen?

 Wie gut sind die Ergebnisse der Suchmaschinen?

 Fazit




44 | Dirk Lewandowski
Fazit




 •  Im Bereich Suche sind noch viele Fragen offen...

 •  Was die großen Suchmaschinen „gut“ macht, ist vor allem die Antizipation der
    Nutzerbedürfnisse.

 •  Es besteht eine starke Übertragbarkeit der Erkenntnisse aus der Websuche auf
    andere Suchsysteme.

 •  Während Einzelbereiche der Nutzer-/Suchmaschineninteraktion gut verstanden
    werden, fehlt ein Gesamtverständnis des Suchprozesses.

 •  Für viele Fragestellungen sind Kooperationen zwischen Forschung und
    Industrie unerlässlich.

45 |
Vielen Dank für Ihre
Aufmerksamkeit.

www.bui.haw-hamburg.de/lewandowski.html



Aktuelles Buch:
Handbuch Internet-Suchmaschinen 2


E-Mail:
dirk.lewandowski@haw-hamburg.de
1 of 47

Recommended

Ausgewählte Forschungsfragen im Bereich Suche by
Ausgewählte Forschungsfragen im Bereich SucheAusgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich SucheDirk Lewandowski
1.3K views50 slides
Suchmaschinen verstehen by
Suchmaschinen verstehenSuchmaschinen verstehen
Suchmaschinen verstehenDirk Lewandowski
2.1K views57 slides
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven by
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenInternet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenDirk Lewandowski
871 views49 slides
Perspektiven eines Open Web Index by
Perspektiven eines Open Web IndexPerspektiven eines Open Web Index
Perspektiven eines Open Web IndexDirk Lewandowski
1.6K views40 slides
Neue Trends: Google, SEO und Co.? by
Neue Trends: Google, SEO und Co.?Neue Trends: Google, SEO und Co.?
Neue Trends: Google, SEO und Co.?Dirk Lewandowski
729 views24 slides
Wie Suchmaschinen die Inhalte des Web interpretieren by
Wie Suchmaschinen die Inhalte des Web interpretierenWie Suchmaschinen die Inhalte des Web interpretieren
Wie Suchmaschinen die Inhalte des Web interpretierenDirk Lewandowski
1.5K views30 slides

More Related Content

What's hot

Das Nutzerverhalten in der Web-Suche by
Das Nutzerverhalten in der Web-SucheDas Nutzerverhalten in der Web-Suche
Das Nutzerverhalten in der Web-SucheDirk Lewandowski
655 views22 slides
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter... by
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...Dirk Lewandowski
423 views23 slides
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern by
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordernWie Suchmaschinen (immer noch) die Bibliotheken herausfordern
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordernDirk Lewandowski
1.4K views32 slides
Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends by
Web-Suchmaschinen: Suchverhalten, Informationsqualität, TrendsWeb-Suchmaschinen: Suchverhalten, Informationsqualität, Trends
Web-Suchmaschinen: Suchverhalten, Informationsqualität, TrendsDirk Lewandowski
1.7K views36 slides
Neue Entwicklungen im Bereich der Suchmaschinen (technologie) by
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)Neue Entwicklungen im Bereich der Suchmaschinen (technologie)
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)Dirk Lewandowski
1K views24 slides
Suchmaschinen, Bürde für Informationsspezialisten? by
Suchmaschinen, Bürde für Informationsspezialisten?Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?Dirk Lewandowski
864 views19 slides

What's hot(7)

Das Nutzerverhalten in der Web-Suche by Dirk Lewandowski
Das Nutzerverhalten in der Web-SucheDas Nutzerverhalten in der Web-Suche
Das Nutzerverhalten in der Web-Suche
Dirk Lewandowski655 views
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter... by Dirk Lewandowski
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...
Dirk Lewandowski423 views
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern by Dirk Lewandowski
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordernWie Suchmaschinen (immer noch) die Bibliotheken herausfordern
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern
Dirk Lewandowski1.4K views
Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends by Dirk Lewandowski
Web-Suchmaschinen: Suchverhalten, Informationsqualität, TrendsWeb-Suchmaschinen: Suchverhalten, Informationsqualität, Trends
Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends
Dirk Lewandowski1.7K views
Neue Entwicklungen im Bereich der Suchmaschinen (technologie) by Dirk Lewandowski
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)Neue Entwicklungen im Bereich der Suchmaschinen (technologie)
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)
Dirk Lewandowski1K views
Suchmaschinen, Bürde für Informationsspezialisten? by Dirk Lewandowski
Suchmaschinen, Bürde für Informationsspezialisten?Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?
Dirk Lewandowski864 views

Similar to Wie gut sind Google und Co.?

Suchmaschinenforschung an der HAW Hamburg by
Suchmaschinenforschung an der HAW HamburgSuchmaschinenforschung an der HAW Hamburg
Suchmaschinenforschung an der HAW HamburgDirk Lewandowski
1.2K views36 slides
Ist meine Suchmaschine wirklich so gut, wie ich glaube? by
Ist meine Suchmaschine wirklich so gut, wie ich glaube?Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Ist meine Suchmaschine wirklich so gut, wie ich glaube?Dirk Lewandowski
1.1K views22 slides
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1) by
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Dirk Lewandowski
571 views13 slides
Suchmaschinen-Update by
Suchmaschinen-UpdateSuchmaschinen-Update
Suchmaschinen-UpdateDirk Lewandowski
1.1K views35 slides
Web-Suche? Gibt‘s nicht mehr! by
Web-Suche? Gibt‘s nicht mehr!Web-Suche? Gibt‘s nicht mehr!
Web-Suche? Gibt‘s nicht mehr!Dirk Lewandowski
906 views33 slides
Alternativen zu Google by
Alternativen zu GoogleAlternativen zu Google
Alternativen zu GoogleDirk Lewandowski
1K views27 slides

Similar to Wie gut sind Google und Co.?(20)

Suchmaschinenforschung an der HAW Hamburg by Dirk Lewandowski
Suchmaschinenforschung an der HAW HamburgSuchmaschinenforschung an der HAW Hamburg
Suchmaschinenforschung an der HAW Hamburg
Dirk Lewandowski1.2K views
Ist meine Suchmaschine wirklich so gut, wie ich glaube? by Dirk Lewandowski
Ist meine Suchmaschine wirklich so gut, wie ich glaube?Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Dirk Lewandowski1.1K views
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Dirk Lewandowski571 views
Warum Suche (trotzdem) bedeutend ist by Dirk Lewandowski
Warum Suche (trotzdem) bedeutend istWarum Suche (trotzdem) bedeutend ist
Warum Suche (trotzdem) bedeutend ist
Dirk Lewandowski924 views
Herausforderungen und Lösungen bei der Publikation und Nutzung von Normdaten ... by Jakob .
Herausforderungen und Lösungen bei der Publikation und Nutzung von Normdaten ...Herausforderungen und Lösungen bei der Publikation und Nutzung von Normdaten ...
Herausforderungen und Lösungen bei der Publikation und Nutzung von Normdaten ...
Jakob .711 views
UX Design: Ziele - Metriken - Patterns (4. Sitzung) by Marcus Haberkorn
UX Design: Ziele - Metriken - Patterns (4. Sitzung)UX Design: Ziele - Metriken - Patterns (4. Sitzung)
UX Design: Ziele - Metriken - Patterns (4. Sitzung)
Marcus Haberkorn2K views
Wie können wir (Suchmaschinen-)Nutzer besser verstehen? by Dirk Lewandowski
Wie können wir (Suchmaschinen-)Nutzer besser verstehen?Wie können wir (Suchmaschinen-)Nutzer besser verstehen?
Wie können wir (Suchmaschinen-)Nutzer besser verstehen?
Dirk Lewandowski1.1K views
Wie Web 2.0 und Suche zusammenwachsen by Dirk Lewandowski
Wie Web 2.0 und Suche zusammenwachsenWie Web 2.0 und Suche zusammenwachsen
Wie Web 2.0 und Suche zusammenwachsen
Dirk Lewandowski942 views
Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent... by Hendrik Kalb
Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...
Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...
Hendrik Kalb829 views
Von wem wir abhängig sind: Über die Auffindbarkeit von Informationen by Dirk Lewandowski
Von wem wir abhängig sind: Über die Auffindbarkeit von InformationenVon wem wir abhängig sind: Über die Auffindbarkeit von Informationen
Von wem wir abhängig sind: Über die Auffindbarkeit von Informationen
Dirk Lewandowski1.1K views
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen by Dirk Lewandowski
Die Macht der Suchmaschinen und ihr Einfluss auf unsere EntscheidungenDie Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Dirk Lewandowski2.3K views
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen? by Dirk Lewandowski
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Dirk Lewandowski1.2K views
Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen by Dirk Lewandowski
Wissensarmut trotz (oder gar durch) Nutzung von SuchmaschinenWissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Dirk Lewandowski976 views
Suche ein effizientes Mittel zur Datenintegration by Thomas Kurz
Suche ein effizientes Mittel zur DatenintegrationSuche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur Datenintegration
Thomas Kurz246 views
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie... by Thomas Koch
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Thomas Koch1.8K views
Medientage 2013: Die Zukunft der Suche by Dirk Lewandowski
Medientage 2013: Die Zukunft der SucheMedientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der Suche
Dirk Lewandowski1.1K views

More from Dirk Lewandowski

The Need for and fundamentals of an Open Web Index by
The Need for and fundamentals of an Open Web IndexThe Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web IndexDirk Lewandowski
230 views17 slides
In a World of Biased Search Engines by
In a World of Biased Search EnginesIn a World of Biased Search Engines
In a World of Biased Search EnginesDirk Lewandowski
583 views48 slides
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni... by
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...Dirk Lewandowski
319 views45 slides
Künstliche Intelligenz bei Suchmaschinen by
Künstliche Intelligenz bei SuchmaschinenKünstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei SuchmaschinenDirk Lewandowski
466 views28 slides
Analysing search engine data on socially relevant topics by
Analysing search engine data on socially relevant topicsAnalysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topicsDirk Lewandowski
191 views36 slides
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert by
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertGoogle Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertDirk Lewandowski
278 views27 slides

More from Dirk Lewandowski(20)

The Need for and fundamentals of an Open Web Index by Dirk Lewandowski
The Need for and fundamentals of an Open Web IndexThe Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web Index
Dirk Lewandowski230 views
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni... by Dirk Lewandowski
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
Dirk Lewandowski319 views
Künstliche Intelligenz bei Suchmaschinen by Dirk Lewandowski
Künstliche Intelligenz bei SuchmaschinenKünstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei Suchmaschinen
Dirk Lewandowski466 views
Analysing search engine data on socially relevant topics by Dirk Lewandowski
Analysing search engine data on socially relevant topicsAnalysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topics
Dirk Lewandowski191 views
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert by Dirk Lewandowski
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertGoogle Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Dirk Lewandowski278 views
Suchverhalten und die Grenzen von Suchdiensten by Dirk Lewandowski
Suchverhalten und die Grenzen von SuchdienstenSuchverhalten und die Grenzen von Suchdiensten
Suchverhalten und die Grenzen von Suchdiensten
Dirk Lewandowski173 views
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden? by Dirk Lewandowski
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Dirk Lewandowski265 views
Are Ads on Google search engine results pages labeled clearly enough? by Dirk Lewandowski
Are Ads on Google search engine results pages labeled clearly enough?Are Ads on Google search engine results pages labeled clearly enough?
Are Ads on Google search engine results pages labeled clearly enough?
Dirk Lewandowski910 views
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim... by Dirk Lewandowski
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Dirk Lewandowski1.3K views
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen by Dirk Lewandowski
Verwendung von Skalenbewertungen in der Evaluierung von SuchmaschinenVerwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Dirk Lewandowski833 views
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Dirk Lewandowski646 views
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Dirk Lewandowski595 views
Suchmaschinen: Googlerisierung der Gesellschaft by Dirk Lewandowski
Suchmaschinen: Googlerisierung der GesellschaftSuchmaschinen: Googlerisierung der Gesellschaft
Suchmaschinen: Googlerisierung der Gesellschaft
Dirk Lewandowski1.5K views
Wie beeinflussen Suchmaschinen den Informationsmarkt? by Dirk Lewandowski
Wie beeinflussen Suchmaschinen den Informationsmarkt?Wie beeinflussen Suchmaschinen den Informationsmarkt?
Wie beeinflussen Suchmaschinen den Informationsmarkt?
Dirk Lewandowski543 views
Warum wir Alternativen zu Google benötigen by Dirk Lewandowski
Warum wir Alternativen zu Google benötigenWarum wir Alternativen zu Google benötigen
Warum wir Alternativen zu Google benötigen
Dirk Lewandowski1.2K views
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge... by Dirk Lewandowski
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
Dirk Lewandowski1.1K views
Why we need an independent index of the Web by Dirk Lewandowski
Why we need an independent index of the WebWhy we need an independent index of the Web
Why we need an independent index of the Web
Dirk Lewandowski1K views

Wie gut sind Google und Co.?

  • 1. Wie gut sind eigentlich Google und Co.? Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information dirk.lewandowski@haw-hamburg.de Köthen, 24. Juni 2011
  • 2. Kurzvorstellung •  Prof. Dr. Dirk Lewandowski •  Professor für Information Research & Information Retrieval an der Hochschule für Angewandte Wissenschaften Hamburg (HAW) •  Forschung vor allem zur Qualität von Suchmaschinen, Nutzerverhalten, Query Understanding 1 |
  • 3. Agenda Suchmaschinenforschung an der HAW Die Websuche hat sich verändert... Wie kann man die Suchanfragen der Nutzer verstehen? Wie gut sind die Ergebnisse der Suchmaschinen? Fazit 2 | Dirk Lewandowski
  • 4. Agenda Suchmaschinenforschung an der HAW Die Websuche hat sich verändert... Wie kann man die Suchanfragen der Nutzer verstehen? Wie gut sind die Ergebnisse der Suchmaschinen? Fazit 3 | Dirk Lewandowski
  • 5. Mission Statement  Wir wollen den Suchprozess sowohl aus system- als auch aus nutzerzentrierter Perspektive verstehen und aus diesem Verständnis Empfehlungen für die Verbesserung von Suchsystemen ableiten. 4 | Dirk Lewandowski
  • 6. Aktuelle Projekte im Bereich Suche •  Forschungsprojekte •  Qualität von Web-Suchmaschinen (laufend bis 2011) •  Forschungsprojekt „Wissenschaftssuchmaschinen“ (seit WS 2008/09) •  Query Understanding (seit 2010) •  Search Experience (ab 2011) 5 | Dirk Lewandowski
  • 7. Methoden Logfile-Analyse Heuristische Relevanztest Evaluation Search Online-Umfrage Usability-Test Eye-Tracking Physiologische Untersuchung 6 |
  • 8. Aktuelle Projekte (mit Studierenden) im Bereich Suche •  Lehrprojekte –  Verbesserung der Musiksuche (WS2010/11; Projektpartner Musicload) –  Lokale Suchmaschinen: Eye-Tracking und Usability (WS 2009/10, Projektpartner Deutsche Telekom) –  Einbindung von Frage-Antwort-Diensten in die Web-Suche (WS2007/08, Projektpartner Lycos Europe) •  Abgeschlossene Entwicklungsprojekte (mit MA-Studierenden) •  Suchanfragenklassifikation (in Zusammenarbeit mit T-Online) •  Produktsuche (mit Otto) •  Universal-Search-Konzept für die T-Online-Portalsuche 7 | Dirk Lewandowski
  • 9. Agenda Suchmaschinenforschung an der HAW Die Websuche hat sich verändert... Wie kann man die Suchanfragen der Nutzer verstehen? Wie gut sind die Ergebnisse der Suchmaschinen? Fazit 8 | Dirk Lewandowski
  • 10. Web search: „Always different, always the same“ AltaVista 1996 9 | http://web.archive.org/web/19961023234631/http://altavista.digital.com/
  • 13. Anzeigen Nachrichten Bilder x Videos Blogbeiträge 12 |
  • 14. Übertragbarkeit der Universal Search – Beispiel T-Online Portalsuche 13 | Dirk Lewandowski
  • 15. Ergebnisselektion •  Ergebnisselektion abhängig von •  Position des Treffers •  Vorkommen des Treffers im „sichtbaren Bereich“ •  Darstellung/Hervorhebung des Treffers, Trefferbeschreibung •  Einblendung in Vorschlägen während der Eingabe 14 |
  • 16. x 15 | Dirk Lewandowski (Eyetracking-Studie HAW-Hamburg 2010)
  • 17. x 16 | Dirk Lewandowski
  • 18. x 17 | Dirk Lewandowski
  • 20. Fixationen bei kartenbasierter Darstellung – Beispiel T-Online 19 | Dirk Lewandowski
  • 22. Agenda Suchmaschinenforschung an der HAW Die Websuche hat sich verändert... Wie kann man die Suchanfragen der Nutzer verstehen? Wie gut sind die Ergebnisse der Suchmaschinen? Fazit 21 | Dirk Lewandowski
  • 23. Hätten Sie‘s verstanden? •  vatikan •  frauentausch •  stockbrot •  seelenfarben •  bmw •  berliner bank •  fußball •  osterei •  drehscheibe •  wgt 22 | Dirk Lewandowski
  • 24. •  x 23 | Dirk Lewandowski
  • 25. •  x 24 | Dirk Lewandowski
  • 26. •  x 25 | Dirk Lewandowski
  • 27. Die Suchintention kann sich verändern 26 | Dirk Lewandowski
  • 28. Die Suchintention kann sich verändern 27 | Dirk Lewandowski
  • 29. Was kann man aus einer Suchanfrage herauslesen? •  Genre (Bsp. Nachrichten) •  Thema (grob) •  Intention (informationsorientiert, navigationsorientiert, transaktionsorientiert) •  Ziel (Aktion oder Ressource) •  Spezifität (Bsp. „Mindestlohn“) •  Bandbreite/Mehrdeutigkeit (Ergebnisse ausdifferenzieren) •  Autoritätsbezug •  Ortsbezug •  Zeitbezug (explizit; implizit; aus dem Suchanfrage-Volumen) 28 | Dirk Lewandowski (nach Calderon-Benavides et al. 2010)
  • 31. Drei Anfragetypen Anfragetypen nach Broder (2002) •  Informational (informationsorientiert) –  Nutzer möchte sich zu einem Thema informieren. –  Ziel sind mehrere Dokumente. •  Navigational (navigationsorientiert) –  Ziel ist es, eine bestimmte Seite (wieder) zu finden. –  Typisch: Suche nach Homepage („Daimler Chrysler“). –  Ziel ist i.d.R. ein Dokument. •  Transactional (transaktionsorientiert) –  Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll. –  Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei. 30 |
  • 32. Anwendungsfälle: Konkreter vs. problemorientierter Informationsbedarf Anwendungsfall Konkret Problemorientiert Websuche Ebay-Homepage Informationen über die neue Sherlock-Holmes- Serie der BBC Bibliothekskatalog Ist das Buch „Information Welche Bücher gibt es zum Retrieval“ von Stock in der Thema kollaborative HAW-Bibliothek Suche? vorhanden? Online-Dating Welche Hobbies hat Wer passt zu mir? Natalia73? Produktsuche Was kostet der Roomba Welcher Staubsaugroboter 581? ist der beste? 31 |
  • 33. Navigationsorientierte Suchanfragen anhand von Klicks bestimmen 32 |
  • 34. Transaktionsorientierte Suchanfragen anhand der Klicks bestimmen 33 |
  • 35. Einsatzmöglichkeiten von Query Understanding •  Anfrageerweiterung •  Generierung von Suchvorschlägen •  Steuerung der organischen Ergebnisse •  Steuerung der Werbung •  Steuerung der Universal Search 34 | Dirk Lewandowski
  • 36. Agenda Suchmaschinenforschung an der HAW Die Websuche hat sich verändert... Wie kann man die Suchanfragen der Nutzer verstehen? Wie gut sind die Ergebnisse der Suchmaschinen? Fazit 35 | Dirk Lewandowski
  • 37. Kernkomponenten einer Suchmaschine (Risvik & Michelsen 2002) 36 |
  • 38. Die Qualität von Suchmaschinen kann nur durch eine Kombination unterschiedlicher Faktoren gemessen werden. •  Qualität des Index –  Größe des Datenbestands, Abdeckung des Web –  Abdeckung bestimmter Bereiche (Sprachräume, Länder) –  Überschneidungen der Indices –  Aktualität des Datenbestands •  Qualität der Suchresultate –  Retrievaleffektivität –  Zuverlässigkeit der Suchergebnisse –  Zufriedenheit der Nutzer –  Überschneidungen der (Top-)Ergebnisse •  Qualität der Suchfunktionen •  Nutzerfreundlichkeit + Benutzerführung –  Aufbau der Trefferseiten (Lewandowski & Höchstötter 2007; ergänzt) 37 | Dirk Lewandowski
  • 39. Die Qualität von Suchmaschinen kann nur durch eine Kombination unterschiedlicher Faktoren gemessen werden. •  Qualität des Index –  Größe des Datenbestands, Abdeckung des Web –  Abdeckung bestimmter Bereiche (Sprachräume, Länder) –  Überschneidungen der Indices –  Aktualität des Datenbestands •  Qualität der Suchresultate –  Retrievaleffektivität –  Zuverlässigkeit der Suchergebnisse –  Zufriedenheit der Nutzer –  Überschneidungen der (Top-)Ergebnisse •  Qualität der Suchfunktionen •  Nutzerfreundlichkeit + Benutzerführung –  Aufbau der Trefferseiten (Lewandowski & Höchstötter 2007; ergänzt) 38 | Dirk Lewandowski
  • 40. Entscheidungen beim Design klassischer Retrievaltests 1. Welche Suchmaschine(n)? 2. Wie viele Suchanfragen? 3. Welche Suchanfragen? 4. Wie viele Ergebnisse pro Suchanfrage? 5. Wie viele Juroren? 6. Welche Juroren(gruppen)? 7. Wie viele Juroren je Suchanfrage? 8. Wie sollen Dokumente bewertet werden (Skalen)? 9. Sollen Dokumentbeschreibungen berücksichtigt werden? 10.  Mit welchen Kennzahlen soll gemessen werden? 39 |
  • 41. Precision-Recall-Graph (binär) – Beispiel Websuche 40 | Dirk Lewandowski
  • 42. Welches Nutzerverhalten kann in Retrievaltests abgebildet werden? •  Query-response paradigm •  Annahme: Nutzer gibt Suchanfrage ein, prüft dann das Ergebnis. •  Statisch; „systemorientiert“  „Klassische“ Retrievaltests (Abfrage der „objektiven“ Trefferqualität) •  Interaktives Retrieval •  Annahme: •  Recherche findet in mehreren Schritten statt. •  Bei der Recherche handelt es sich um einen „Dialog“ zwischen Nutzer und System. •  Dynamisch, „nutzerorientiert“  Nutzerstudien (Abfrage der Zufriedenheit der Nutzer) 41 |
  • 43. Trefferqualität in der Nutzerstudie „Wo ist denn nun der Jungferstieg?“ Jungfernstieg 42 | Dirk Lewandowski
  • 44. Tools: RAT & Search Logger •  RAT (Relevance Assessment Tool) •  Werkzeug zum Design und zur Durchführung klassischer Retrievaltests •  Baukastenprinzip beim Testdesign •  Automatische Abfrage der Treffer der bekannten Suchmaschinen •  Search Logger (Entwicklung der Uni Tartu, Estland) •  Werkzeug zum Protokollieren von Browserinteraktionen •  Task-basiert •  Ziel 2011: Zusammenführung der beiden Tools, um interaktives IR in Suchmaschinen evaluieren zu können. 43 |
  • 45. Agenda Suchmaschinenforschung an der HAW Die Websuche hat sich verändert... Wie kann man die Suchanfragen der Nutzer verstehen? Wie gut sind die Ergebnisse der Suchmaschinen? Fazit 44 | Dirk Lewandowski
  • 46. Fazit •  Im Bereich Suche sind noch viele Fragen offen... •  Was die großen Suchmaschinen „gut“ macht, ist vor allem die Antizipation der Nutzerbedürfnisse. •  Es besteht eine starke Übertragbarkeit der Erkenntnisse aus der Websuche auf andere Suchsysteme. •  Während Einzelbereiche der Nutzer-/Suchmaschineninteraktion gut verstanden werden, fehlt ein Gesamtverständnis des Suchprozesses. •  Für viele Fragestellungen sind Kooperationen zwischen Forschung und Industrie unerlässlich. 45 |
  • 47. Vielen Dank für Ihre Aufmerksamkeit. www.bui.haw-hamburg.de/lewandowski.html Aktuelles Buch: Handbuch Internet-Suchmaschinen 2 E-Mail: dirk.lewandowski@haw-hamburg.de