Warum wir Alternativen zu Google benötigen
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften Hamburg
dirk.lewandowski@haw-hamburg.de
@Dirk_Lew
Leuphana Universität Lüneburg, 19.2.2014
Agenda
1. Die Bedeutung der Suchmaschinen und das Verhalten ihrer Nutzer
2. Der Suchmaschinenmarkt
3. Was kann Google aus der aktuellen Marktsituation machen?
4. Nutzerzufriedenheit
5. Warum Alternativen?
6. Alternative Suchmaschinen
7. Ein freier Index des Web
8. Fazit
Wer das Internet nutzt, nutzt Suchmaschinen
• Suchmaschinen sind der beliebteste Dienst des Internt (Purcell, Brenner &
Raine, 2012; van Eimeren & Frees, 2013)
van Eimeren, B.; Frees, B. (2013): Rasanter Anstieg des Internetkonsums – Onliner fast drei Stunden täglich im Netz:
Ergebnisse der ARD/ZDF-Onlinestudie 2013. Media Perspektiven 54(7-8), 358-372.
Masse
• In Deutschland in einem
Monat 5,6 Milliarden
Suchanfragen („Kern-Suche“).
• Pro Tag: >180 Millionen
• Pro Stunde: 7,5 Millionen
• Pro Minute: 125.448
• Pro Sekunde: 2.091
ComScore. (2010). comScore Reports Global Search Market Growth of 46 Percent in 2009.
http://comscore.com/Press_Events/Press_Releases/2010/1/Global_Search_Market_Grows_46_Percent_in_2009
Eingabe der Suchanfrage
• Art der Eingabe von Suchanfragen
– Aneinanderreihung von Suchwörtern
– Zunehmende Dialogorientierung
• Suchanfragen sind kurz und ungenau
– „Die meisten Nutzer sind nicht willens, bei der Formulierung ihres Suchziels allzu
viel kognitive und zeitliche Energie aufzuwenden.“ (Machill et al., 2003)
– „Übersetzungsproblem“ Informationsbedürfnis à Suchanfrage
• Unterstützung der Formulierung von Suchanfragen
– Suchvorschläge während der Eingabe
• Präzisierung der Suchanfrage (v.a. durch mehr Suchwörter)
• Lenkung der Nutzer
Ergebnisseite als Ganzes
• Suchergebnisseite
– Search Engine Results Page (SERP)
• Drei Bereiche:
– Organische Ergebnisse
– Navigationselemente
– Werbung
• Wahrnehmung der SERP: Der Knick („fold“)
– Above the fold
– Below the fold
Organische Ergebnisse
• „Organisch“ = aus dem Index der Suchmaschine
erzeugt
– Alle Dokumente aus dem Index haben potentiell die
gleiche Chance, zu einer Suchanfrage gezeigt zu
werden.
• Sonderfall: Universal-Search-Ergebnisse
– Universal-Search-Ergebnisse kommen aus speziellen
Indices („Kollektionen“) und werden in die Liste der
organischen Ergebnisse eingespeist.
– „Neutralität“ der Ergebnisse ist stark von der Kollektion
abhängig.
„Knowledge Graph“
• Strukturierte Informationen (bei Google in der
rechten Spalte dargestellt)
– „Wichtigste“ Informationen werden zusammengefasst
(v.a. aus Wikipedia)
– Wichtigste „Werke“ werden mit Bildern angezeigt
– Verwandte Suchanfragen (inkl. Bildern)
Wandel der Trefferpräsentation: Mehr Macht für die
Suchmaschine, weniger Entscheidungsfreiheit für den Nutzer?
1. Trefferliste
– Lesen von oben nach unten; Positionseffekte
2. Universal-Search-Ergebnisseite
– Grundsätzliche Beibehaltung der Listendarstellung
– Lenkung der Aufmerksamkeit durch grafische Elemente, Hervorhebungen
3. Direkte Antworten / extrahierte Informationen
– Aufbrechen der Listendarstellung
– Ergebnisseiten bestehen nicht mehr notwendigerweise aus Verweisen auf
Dokumente
Suchmaschinenoptimierung
• SEO = Alle Maßnahmen, um die Sichtbarkeit von Dokumenten in
Suchmaschinen zu erhöhen
• Einfluss auf die Suchergebnisse v.a. im kommerziellen Bereich evident
– SEO für journalistische Inhalte
– SEO für NGOs, PR, staatliche Institutionen
– Academic SEO
• SEO hat für Suchmaschinen sowohl positive wie negative Effekte
Der Suchmaschinenmarkt (Deutschland)
ComScore-Zahlen März 2012;
http://www.focus.de/digital/internet/netzoekonomie-blog/suchmaschinen-googles-marktanteil-steigt-
auf-96-prozent-in-deutschland_aid_723240.html
95,9
1,1
0,9
0 10 20 30 40 50 60 70 80 90 100
Google
Bing
Yahoo
Index vs. Suchinterface
• Geschäftsmodell Partnerindices
– Eine Suchmaschine mit eigenem Index stellt ihre Ergebnisse und ihre
Textanzeigen dem Partner zur Verfügung
– Das mit den Werbeklicks verdiente Geld wird nach einem vorher festgelegten
Schlüssel zwischen Suchmaschine und Partner aufgeteilt
• Attraktivität des Modells
– Minimale zusätzliche Kosten pro Anfrage für die gebende Suchmaschine
– Enorme Kostenersparnis für die nehmende Suchmaschine (Betrieb einer eigenen
Suchmaschine entfällt)
– Ergebnis: Ausdünnung des Suchmaschinenmarkts
Die Geschichte der Web-Suchmaschinen
Grafik mit historischer Entwicklung unter http://www.bruceclay.com/eu/serc_histogram/histogram.htm
3. Was kann Google aus der aktuellen Marktsituation machen?
Google Shopping results
Google Ads
Desktop layout Mobile layout
Information icon
with hover text
Information icon
with hover text
Organic results
Clickable areas
Rival links
20
Desktop layout
Total number of clicks:
1000
Number of clicks on
shopping results and links
to rival offerings: 642
Most of the clicks were on
organic results and Google
Shopping results (93%).
593 clicks (59.3%)
0 clicks (0%)
358 clicks (35.8%)
49 clicks (4.9%)
Logged clicks (desktop layout)
23
Lewandowski, D.; Sünkler, S.: Representative online study to evaluate the commitments proposed by Google as part of EU
competition investigation AT.39740-Google - Report for Germany
http://www.bui.haw-hamburg.de/fileadmin/user_upload/lewandowski/google-reports/Google_Online_Survey_DE.pdf
Task 1: DSLR camera (desktop layout)
1
Germany France Spain Italy
Distribution of clicks
(n = 1000 for each
country)
Google Shopping
Results
593 (59.3%) 667 (66.7%) 587 (58.7%) 632 (63.2%)
Organic Results 358 (35.8%) 279 (27.9%) 410 (41%) 289 (28.9%)
Rival Links 49 (4.9%) 54 (5.4%) 3 (0.3%) 79 (7.9%)
Lewandowski, D.; Sünkler, S.: Representative online study to evaluate the commitments proposed by Google as part of EU
competition investigation AT.39740-Google - Report for Germany
http://www.bui.haw-hamburg.de/fileadmin/user_upload/lewandowski/google-reports/Google_Online_Survey_DE.pdf
Information icon
with hover text
Organic results
Desktop layout
News results
Organic results
Knowledge
Graph
News result
Clickable areas
Lewandowski, D.; Sünkler, S.: Representative online study to evaluate the commitments proposed by Google as part of EU
competition investigation AT.39740-Google - Report for Germany
http://www.bui.haw-hamburg.de/fileadmin/user_upload/lewandowski/google-reports/Google_Online_Survey_DE.pdf
Desktop layout
Logged clicks (desktop layout)
3 clicks (0.3%)
478 clicks (47.7%)
13 clicks (1.3%)
Total number of clicks:
1000
Most of the clicks were on
organic results and News
results.
509 clicks (50.9%)
Organic Result Position Clicks
1 214
2 146
3 66
4 69
5 10
6 4
Lewandowski, D.; Sünkler, S.: Representative online study to evaluate the commitments proposed by Google as part of EU
competition investigation AT.39740-Google - Report for Germany
http://www.bui.haw-hamburg.de/fileadmin/user_upload/lewandowski/google-reports/Google_Online_Survey_DE.pdf
Task 3: obama(desktop layout)
5
Germany France Spain Italy
Distribution of clicks
(n = 1000 for each
country)
Google News
Results
478 (47.8%) 127 (12.7%) 377 (37.7%) 445 (44.5%)
Organic Results 509 (50.9%) 741 (74.1%) 544 (54.4%) 486 (48.6%)
Google Knowledge
Graph
13 (1.3%) 132 (13.2%) 79 (7.9%) 59 (5.9%)
Lewandowski, D.; Sünkler, S.: Representative online study to evaluate the commitments proposed by Google as part of EU
competition investigation AT.39740-Google - Report for Germany
http://www.bui.haw-hamburg.de/fileadmin/user_upload/lewandowski/google-reports/Google_Online_Survey_DE.pdf
Zusammenspiel zwischen Suchenden und Suchmaschinen
• Diskrepanz zwischen der Bedeutung der Suche und dem Verständnis
der Nutzer
– Kenntnis der Suchmöglichkeiten
– Kenntnis der Funktionsweise von Suchmaschinen
– Kenntnis der Geschäftsmodelle der Suchmaschinen
• Wesentliche Probleme entstehen erst aus der Marktsituation heraus
– Einfluss der Ergebnisdarstellung
– Einfluss der Suchmaschinenoptimierung
– Sammlung von Nutzerdaten
à Nur die Schulung der Nutzer und eine Vielfalt auf dem Suchmaschinen-
markt kann zu einer gesellschaftlich befriedigenden Lösung führen.
Anfragetypen in der Websuche
nach Broder (2002)
• Informational (informationsorientiert)
– Nutzer möchte sich zu einem Thema informieren.
– Ziel sind mehrere Dokumente.
• Navigational (navigationsorientiert)
– Ziel ist es, eine bestimmte Seite (wieder) zu finden.
– Typisch: Suche nach Homepage („Ebay“).
– Ziel ist i.d.R. ein Dokument.
• Transactional (transaktionsorientiert)
– Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll.
– Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.
Zufriedenheit der Nutzer in Bezug auf die Anfragetypen
Tabelle 1: Eindeutige Bewertbarkeit von Suchanfragen nach Anfragetyp
Navigationsorientiert Informationsorientiert Transaktionsorientiert
Eindeutig bewertbar Suche nach einem bereits
bekannten Dokument
Suche nach einem Faktum
Suche nach Trivia
Informationsorientierte
Suche, zu der Informationen
aus einer bestimmten Quelle
erwartet werden (bspw.
Wikipedia)
Suche nach einer bekannten
Website, auf der eine
Transaktion durchgeführt
werden soll
Nicht eindeutig
bewertbar
- Klassische
Informationssuche mit dem
Anspruch, ein vollständiges
Bild zu gewinnen bzw. einen
umfassenden Überblick
Mehrere Varianten der
Transaktion möglich
Warum brauchen wir mehr als eine Suchmaschine / Bias der
Suchmaschinen
• Wahl zwischen verschiedenen (algorithmischen) Sichten auf die Welt
• Drei Ebenen von Suchmaschinen-Bias (Weber, 2011)
– Implementierung der Suchmaschine
– Verhalten der Anbieter von Inhalten
– Nutzung von Suchmaschinen
à Eine „verzerrungsfreie“ Suchmaschine kann es nicht geben
• Verzerrungen werden zum Problem durch die Kombination von
• Dominanz des Modells „algorithmische Web-Suchmaschine“
• Dominanz von Google in diesem Bereich
• Nutzerverhalten
Alternative Suchmaschinen
• Was ist eigentlich eine „alternative Suchmaschine“?
– Jede Suchmaschine außer Google? à „Google Killer“, Cuil†
– Suchmaschinen, die grundlegend dasselbe machen wie Google? à Bing
– Suchmaschinen, die sich durch regionale Kompetenz abheben? à Seekport†
– Suchmaschinen, die neue/alternative Ansätze zur Erschließung und
Durchsuchbarmachung des Web verfolgen?
Staatliche Förderung alternativer Suchmaschinen
• Idee: Dem Marktführer Google eine Alternative gegenüberstellen
• Quaero/Theseus: Finanzierung eines „Google Killers“?
– Quaero: Technologien für die Multimedia-Suche
– Theseus: Semantische Technologien im Business-to-Business-Kontext (ohne
expliziten Fokus auf Suche)
• Bereits in der Vergangenheit heftige Kritik an der Idee,
Suchmaschinen(technologie) staatlich zu fördern
• Problem: Eine einzige Alternative.
• Scheitern aus verschiedenen Gründen möglich, u.a.
– Schlechtes Marketing
– Gestaltung der Benutzeroberfläche
– ...
Die “lokale Kopie” des Web
Risvik, K. M., & Michelsen, R. (2002). Search engines and web dynamics. Computer Networks, 39(3), 289–302.
Die wirtschaftliche Perspektive
• Nur die größten Internet-Unternehmen können es sich leisten, eigene Web-
Indexe aufzubauen
• Microsoft ist neben Google das einzige Unternehmen, das über einen
umfassenden Web-Index verfügt
• Yahoo hat seinen eigenen Index bereits vor einigen Jahren aufgegeben
• Die Vielfalt der Alternativen auf dem Suchmaschinenmarkt ist trügerisch: In
den meisten Fällen handelt es sich um „Suchmaschinen“, die auf einen
Partnerindex zurückgreifen.
• Momentan scheint der Aufbau eines eigenen Web-Index für keinen Anbieter
attraktiv zu sein – auch wenn der Zugriff auf die Daten für eine Vielzahl von
Unternehmen wertvoll wäre
Lösung
• Man muss die Bedingungen schaffen, die die Schaffung alternativer
Suchmaschinen ermöglichen
• Dies würde Innovationen durch Firmen, Institutionen und Individuen fördern.
• Dies würde zu einem fairen Wettbewerb um die besten Ideen, wie man
diesen Index (für Suchanwendungen und andere Zwecke) nutzen könnte,
führen
Vision
• „Ein für alle zu fairen Konditionen zugänglicher Index des Web“
– „Für alle“ meint, dass jeder Interessierte auf diesen Index zugreifen
kann.
– „Faire Bedingungen“ bedeutet nicht unbedingt kostenlos, sondern kann
auch ein faires Bezahlmodell vorsehen.
– Unter „zugänglich“ ist zu verstehen, dass der Index leicht automatisch
abgefragt werden kann. Weiterhin sollte tatsächlich alles im Index
enthaltene auch abfragbar sein.
– Und „Index des Web“ meint schließlich möglichst alle Inhalte des Web
(und ggf. darüber hinaus).
Finanzierung
• Finanzierung
– Aufgrund der immensen Kosten kann ein solcher Index nur auf europäischer
Ebene geschaffen werden.
• Wer kann einen solchen Index betreiben?
– Bestehende Forschungseinrichtung oder eine neu zu gründende Einrichtung
– Der Betreiber des Index darf nicht allein über die Art der Erschließung der
Dokumente und ihre Verfügbarmachung bestimmen. à Kuratorium aus
(potentiellen) Anwendern
#1
Die aktuelle Marktdominanz einer
Suchmaschine ist nicht wünschenswert. Die
Situation wird sich durch wirtschaftlichen
Wettbewerb allein nicht lösen.
#2
Ein freier Web-Index kann die Voraussetzungen
für einen fruchtbaren Wettbewerb auf dem
Suchmaschinenmarkt schaffen.
#3
Diese Aufgabe ist mit Infrastrukturaufgaben
des Staates zu vergleichen – in Bezug auf
die Sammlung und Verfügbarmachung von
Wissen ist vor allem der Vergleich mit den
Bibliotheken zu ziehen.
Vielen Dank für Ihre Aufmerksamkeit.
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften Hamburg,
Department Information
http://www.bui.haw-hamburg.de/lewandowski.html
http://www.searchstudies.org
dirk.lewandowski@haw-hamburg.de
@Dirk_Lew