Perspektiven eines Open Web Index

Dirk Lewandowski
Dirk LewandowskiProfessor at Hamburg University of Applied Sciences
Perspektiven eines „Open Web Index“
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften Hamburg
dirk.lewandowski@haw-hamburg.de
@Dirk_Lew
DGI-Forum Wittenberg „True Fiction: Die Digitalisierung unseres Alltags“
Wittenberg, 25. September 2015
Gliederung
1.  Die Bedeutung der Suchmaschinen und der Suchmaschinenmarkt
2.  Das „Problem Google“
3.  Alternative Suchmaschinen
4.  Lösungsvorschläge
5.  Die Initiative „Open Web Index“ (OWI)
6.  Fazit
Die Bedeutung der Suchmaschinen und der Suchmaschinenmarkt
Ansätze zur Erschließung der Inhalte des Web (Auswahl)
Wer das Internet nutzt, nutzt Suchmaschinen
•  Suchmaschinen sind der beliebteste Dienst des Internt (Purcell, Brenner &
Raine, 2012; van Eimeren & Frees, 2013)
van Eimeren, B.; Frees, B. (2013): Rasanter Anstieg des Internetkonsums – Onliner fast drei Stunden täglich im Netz:
Ergebnisse der ARD/ZDF-Onlinestudie 2013. Media Perspektiven 54(7-8), 358-372.
Entwicklung des Suchanfragevolumens (USA)
Daten von ComScore. Die Daten wurden aus den regelmäßig bei „Search Engine Land“ veröffentlichten Zahlen
zusammengestellt. (s. http:// searchengineland.com/library/stats/stats-comscore))
Es wird eigentlich nur eine Suchmaschine genutzt
ComScore-Zahlen Deutschland, März 2012;
http://www.focus.de/digital/internet/netzoekonomie-blog/suchmaschinen-googles-marktanteil-steigt-
auf-96-prozent-in-deutschland_aid_723240.html
95,9
1,1
0,9
0 10 20 30 40 50 60 70 80 90 100
Google
Bing
Yahoo
Das „Problem Google“
Durch Google bzw. seine Marktmacht verursachte Probleme
1.  Nur eine von vielen möglichen algorithmischen Sichten auf die Inhalte
des Web
2.  Bevorzugung eigener Angebote
3.  Effekt der Suchmaschinenoptimierung
4.  (Dominanz bei der Online-Werbung)
Perspektiven eines Open Web Index
Perspektiven eines Open Web Index
Desktop layout
593 clicks (59.3%)
0 clicks (0%)
358 clicks (35.8%)
49 clicks (4.9%)
Bevorzugung eigener Angebote
23
Lewandowski, D.; Sünkler, S.: Representative online study to evaluate the commitments proposed by Google as part of EU
competition investigation AT.39740-Google - Report for Germany
http://searchstudies.org/tl_files/Publikationen_PDFs/2013/Google_Online_Survey_DE.pdf
Perspektiven eines Open Web Index
Anfragetypen in der Websuche
nach Broder (2002)
•  Informational (informationsorientiert)
–  Nutzer möchte sich zu einem Thema informieren.
–  Ziel sind mehrere Dokumente.
•  Navigational (navigationsorientiert)
–  Ziel ist es, eine bestimmte Seite (wieder) zu finden.
–  Typisch: Suche nach Homepage („Ebay“).
–  Ziel ist i.d.R. ein Dokument.
•  Transactional (transaktionsorientiert)
–  Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll.
–  Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.
Zufriedenheit der Nutzer in Bezug auf die Anfragetypen
Tabelle 1: Eindeutige Bewertbarkeit von Suchanfragen nach Anfragetyp
Navigationsorientiert Informationsorientiert Transaktionsorientiert
Eindeutig bewertbar Suche nach einem bereits
bekannten Dokument
Suche nach einem Faktum
Suche nach Trivia
Informationsorientierte
Suche, zu der Informationen
aus einer bestimmten Quelle
erwartet werden (bspw.
Wikipedia)
Suche nach einer bekannten
Website, auf der eine
Transaktion durchgeführt
werden soll
Nicht eindeutig
bewertbar
- Klassische
Informationssuche mit dem
Anspruch, ein vollständiges
Bild zu gewinnen bzw. einen
umfassenden Überblick
Mehrere Varianten der
Transaktion möglich
Über was haben Suchmaschinen eigentlich Macht?
•  Über das, was überhaupt in den Index
aufgenommen wird
–  Technisch bedingte Probleme der Web-Indexierung
–  Demokratisch legitimierter Ausschluss von Inhalten
–  Willkürlicher Ausschluss von Inhalten
•  Über das, was wir als Nutzer zu sehen
bekommen
–  Reihung der Dokumente
–  Anordnung der Suchergebnisseiten
–  Direkte Antworten
Es kann keine verzerrungsfreie Suchmaschine geben
•  Verzerrungen werden zum Problem durch die Kombination von
•  Dominanz des Modells „algorithmische Web-Suchmaschine“
•  Dominanz von Google in diesem Bereich
•  Nutzerverhalten
•  Probleme werden sich zukünftig noch verstärken durch
•  Direkte Beantwortung von Suchanfragen
•  Wandel von Suchanfragen und Dokumenten
XXXX
•  XXXX
–  XXXX
–  XXXX
•  XXXX
–  XXXX
–  XXXX
Alternative Suchmaschinen
Alternative Suchmaschinen
•  Was ist eigentlich eine „alternative Suchmaschine“?
–  Jede Suchmaschine außer Google? à „Google Killer“, Cuil†
–  Suchmaschinen, die grundlegend dasselbe machen wie Google? à Bing
–  Suchmaschinen, die sich durch regionale Kompetenz abheben? à Seekport†
–  Suchmaschinen, die neue/alternative Ansätze zur Erschließung und
Durchsuchbarmachung des Web verfolgen?
•  Keine Alternative: „Suchmaschinen“, die Ergebnisse einer anderen
Suchmaschine anzeigen.
Beziehungsgeflecht der Suchmaschinen (Deutschland)
Lewandowski, D. (2015). Suchmaschinen verstehen. Berlin Heidelberg: Springer Vieweg. S. 158)
Das Partnerindex-Modell hat den Suchmaschinenmarkt
ausgedünnt
•  Geschäftsmodell Partnerindices
–  Eine Suchmaschine mit eigenem Index stellt ihre Ergebnisse und
ihre Textanzeigen dem Partner zur Verfügung
–  Das mit den Werbeklicks verdiente Geld wird nach einem vorher
festgelegten Schlüssel zwischen Suchmaschine und Partner
aufgeteilt
•  Attraktivität des Modells
–  Minimale zusätzliche Kosten pro Anfrage für die gebende
Suchmaschine
–  Enorme Kostenersparnis für die nehmende Suchmaschine
(Betrieb einer eigenen Suchmaschine entfällt)
–  Ergebnis: Ausdünnung des Suchmaschinenmarkts
•  Suchmaschinen-Indexe aktuell
–  Google
–  Bing
–  Yandex
–  Baidu
•  Eingestellte Suchmachinen-
Indexe (seit 2009)
–  Yahoo
–  Ask
–  Cuil
•  Neue Suchmaschinen-Indexe
–  Blekko
–  Duck Duck Go
•  Web-Indexe für Analysezwecke
(Beispiel)
–  Moz
–  OpenCrawl
Überblick Web-Indexe
Auswahl
Bias der Suchmaschinen
•  Drei Ebenen von Suchmaschinen-Bias (Weber, 2011)
–  Implementierung der Suchmaschine
–  Verhalten der Anbieter von Inhalten
–  Nutzung von Suchmaschinen
à  Eine „verzerrungsfreie“ Suchmaschine kann es nicht geben
•  Verzerrungen werden zum Problem durch die Kombination von
•  Dominanz des Modells „algorithmische Web-Suchmaschine“
•  Dominanz von Google in diesem Bereich
•  Nutzerverhalten
Warum brauchen wir mehr als eine Suchmaschine?
•  Meinungsvielfalt
•  Wahl zwischen verschiedenen (algorithmischen) Sichten auf die Welt
•  Ideologiefreie Suchmaschinen sind nicht möglich
Mögliche Lösungen
Lösungsvorschläge
1.  Der Markt wird‘s richten
2.  Google zu fairer Ergebnisanzeige verpflichten
3.  Google zerschlagen
4.  Eine alternative Suchmaschine aufbauen
5.  Google zwingen, seinen Index zu öffnen
6.  Web-Index als Infrastrukturmaßnahme
Die “lokale Kopie” des Web
Risvik, K. M., & Michelsen, R. (2002). Search engines and web dynamics. Computer Networks, 39(3), 289–302.
Entkopplung von Index und Diensten
Risvik, K. M., & Michelsen, R. (2002). Search engines and web dynamics. Computer Networks, 39(3), 289–302.
Infrastruktur
(öffentlich)
Dienste
(Eigeninitiative)
Ein offener Web-Index schafft die Voraussetzungen für die
Informationsautonomie der europäischen Wirtschaft und
Gesellschaft
•  „Ein für alle zu fairen Konditionen zugänglicher Index des Web“
–  „Für alle“ meint, dass jeder Interessierte auf diesen Index zugreifen
kann.
–  „Faire Bedingungen“ bedeutet nicht unbedingt kostenlos, sondern kann
auch ein faires Bezahlmodell vorsehen.
–  Unter „zugänglich“ ist zu verstehen, dass der Index leicht automatisch
abgefragt werden kann. Weiterhin sollte tatsächlich alles im Index
enthaltene auch abfragbar sein.
–  Und „Index des Web“ meint schließlich möglichst alle Inhalte des Web
(und ggf. darüber hinaus).
Finanzierung
•  Finanzierung
–  Aufgrund der immensen Kosten kann ein solcher Index nur auf europäischer
Ebene geschaffen werden.
•  Wer kann einen solchen Index betreiben?
–  Bestehende Forschungseinrichtung oder eine neu zu gründende Einrichtung
–  Der Betreiber des Index darf nicht allein über die Art der Erschließung der
Dokumente und ihre Verfügbarmachung bestimmen. à Kuratorium aus
(potentiellen) Anwendern
Die Initiative „Open Web Index“ (OWI)
Beteiligte
•  Sprecher
–  Dr. Wolfgang Sander-Beuermann, Suma e.V.
–  Prof. Dr. Dirk Lewandowski, Hochschule für Angewandte Wissenschaften
Hamburg
•  Beteiligte
–  Wissenschaft
–  Industrie (Deutsche Telekom, 1&1)
–  Informationsinfrastruktureinrichtungen
–  Public Relations
Arbeiten
•  Konzeptpapier „An Open Web Index for Europe“
•  Vernetzung von Interessierten aus unterschiedlichen Bereichen
•  Workshops und Veranstaltungen
•  Lobbyarbeit
•  Website: www.openwebindex.eu
Fazit
#1
Das „Google-Problem“ wurde (endlich)
erkannt. Wir sprechen nun über mögliche
Lösungen.
#2 Eine konstruktive Lösung ist einer
destruktiven vorzuziehen.
#3
Frei zugängliches Wissen ist die Quelle von
kontinuierlichem Wettbewerb, Innovation
und Unternehmertum auf der einen und
persönlicher und Meinungsfreiheit auf der
anderen Seite.
Der Open Web Index schafft dafür die
Voraussetzung.
#4
Diese Aufgabe ist mit Infrastrukturaufgaben
des Staates zu vergleichen – in Bezug auf
die Sammlung und Verfügbarmachung von
Wissen ist vor allem der Vergleich mit den
Bibliotheken zu ziehen.
Vielen Dank für Ihre Aufmerksamkeit
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften Hamburg,
Department Information
dirk.lewandowski@haw-hamburg.de
Website:
www.searchstudies.org
1 of 40

Recommended

Wie Suchmaschinen die Inhalte des Web interpretieren by
Wie Suchmaschinen die Inhalte des Web interpretierenWie Suchmaschinen die Inhalte des Web interpretieren
Wie Suchmaschinen die Inhalte des Web interpretierenDirk Lewandowski
1.5K views30 slides
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven by
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenInternet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenDirk Lewandowski
871 views49 slides
Wie entwickeln sich Suchmaschinen heute, was kommt morgen? by
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?Wie entwickeln sich Suchmaschinen heute, was kommt morgen?
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?Dirk Lewandowski
1.5K views35 slides
Neue Trends: Google, SEO und Co.? by
Neue Trends: Google, SEO und Co.?Neue Trends: Google, SEO und Co.?
Neue Trends: Google, SEO und Co.?Dirk Lewandowski
729 views24 slides
Suchmaschinen verstehen by
Suchmaschinen verstehenSuchmaschinen verstehen
Suchmaschinen verstehenDirk Lewandowski
2.1K views57 slides
Wie gut sind Google und Co.? by
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Dirk Lewandowski
413 views47 slides

More Related Content

What's hot

Suchmaschinen im Internet – neue Erkenntnisse und Perspektiven by
Suchmaschinen im Internet – neue Erkenntnisse und PerspektivenSuchmaschinen im Internet – neue Erkenntnisse und Perspektiven
Suchmaschinen im Internet – neue Erkenntnisse und PerspektivenDirk Lewandowski
962 views29 slides
Wie Web 2.0 und Suche zusammenwachsen by
Wie Web 2.0 und Suche zusammenwachsenWie Web 2.0 und Suche zusammenwachsen
Wie Web 2.0 und Suche zusammenwachsenDirk Lewandowski
942 views14 slides
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1) by
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Dirk Lewandowski
571 views13 slides
Web-Index-Workshop 2014 by
Web-Index-Workshop 2014Web-Index-Workshop 2014
Web-Index-Workshop 2014Dirk Lewandowski
604 views24 slides
Suchmaschinen, Bürde für Informationsspezialisten? by
Suchmaschinen, Bürde für Informationsspezialisten?Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?Dirk Lewandowski
864 views19 slides
Query Understanding by
Query UnderstandingQuery Understanding
Query UnderstandingDirk Lewandowski
1.2K views26 slides

What's hot(17)

Suchmaschinen im Internet – neue Erkenntnisse und Perspektiven by Dirk Lewandowski
Suchmaschinen im Internet – neue Erkenntnisse und PerspektivenSuchmaschinen im Internet – neue Erkenntnisse und Perspektiven
Suchmaschinen im Internet – neue Erkenntnisse und Perspektiven
Dirk Lewandowski962 views
Wie Web 2.0 und Suche zusammenwachsen by Dirk Lewandowski
Wie Web 2.0 und Suche zusammenwachsenWie Web 2.0 und Suche zusammenwachsen
Wie Web 2.0 und Suche zusammenwachsen
Dirk Lewandowski942 views
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Dirk Lewandowski571 views
Suchmaschinen, Bürde für Informationsspezialisten? by Dirk Lewandowski
Suchmaschinen, Bürde für Informationsspezialisten?Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?
Dirk Lewandowski864 views
Von wem wir abhängig sind: Über die Auffindbarkeit von Informationen by Dirk Lewandowski
Von wem wir abhängig sind: Über die Auffindbarkeit von InformationenVon wem wir abhängig sind: Über die Auffindbarkeit von Informationen
Von wem wir abhängig sind: Über die Auffindbarkeit von Informationen
Dirk Lewandowski1.1K views
Konferenzbeitrag DGI 2010 (DGI10): Lösung zum multilingualen Wissensmanagemen... by LLudwig
Konferenzbeitrag DGI 2010 (DGI10): Lösung zum multilingualen Wissensmanagemen...Konferenzbeitrag DGI 2010 (DGI10): Lösung zum multilingualen Wissensmanagemen...
Konferenzbeitrag DGI 2010 (DGI10): Lösung zum multilingualen Wissensmanagemen...
LLudwig1.2K views
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen by Dirk Lewandowski
Die Macht der Suchmaschinen und ihr Einfluss auf unsere EntscheidungenDie Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Dirk Lewandowski2.3K views
Medienbildung in der schule - Recherche by simoross
Medienbildung in der schule - RechercheMedienbildung in der schule - Recherche
Medienbildung in der schule - Recherche
simoross732 views
Suchmaschinen: Googlerisierung der Gesellschaft by Dirk Lewandowski
Suchmaschinen: Googlerisierung der GesellschaftSuchmaschinen: Googlerisierung der Gesellschaft
Suchmaschinen: Googlerisierung der Gesellschaft
Dirk Lewandowski1.5K views
Relevanzranking als Erfolgsfaktor für Discoverysysteme by Haake
Relevanzranking als Erfolgsfaktor für DiscoverysystemeRelevanzranking als Erfolgsfaktor für Discoverysysteme
Relevanzranking als Erfolgsfaktor für Discoverysysteme
Haake792 views
Suchmaschinenforschung an der HAW Hamburg by Dirk Lewandowski
Suchmaschinenforschung an der HAW HamburgSuchmaschinenforschung an der HAW Hamburg
Suchmaschinenforschung an der HAW Hamburg
Dirk Lewandowski1.2K views
Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends by Dirk Lewandowski
Web-Suchmaschinen: Suchverhalten, Informationsqualität, TrendsWeb-Suchmaschinen: Suchverhalten, Informationsqualität, Trends
Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends
Dirk Lewandowski1.7K views
Linked Open Data in digitalen Bibliotheken by Alexander Haffner
Linked Open Data in digitalen BibliothekenLinked Open Data in digitalen Bibliotheken
Linked Open Data in digitalen Bibliotheken
Alexander Haffner1.9K views
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter... by Dirk Lewandowski
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...
Dirk Lewandowski423 views

Similar to Perspektiven eines Open Web Index

Wie gut sind Google und Co.? by
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Dirk Lewandowski
998 views47 slides
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern by
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordernWie Suchmaschinen (immer noch) die Bibliotheken herausfordern
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordernDirk Lewandowski
1.4K views32 slides
Web-Monitoring Smarte - Tools zur kostenfreien Web-Analyse by
Web-Monitoring Smarte - Tools zur kostenfreien Web-Analyse Web-Monitoring Smarte - Tools zur kostenfreien Web-Analyse
Web-Monitoring Smarte - Tools zur kostenfreien Web-Analyse Sandra Schön (aka Schoen)
1.3K views17 slides
Medientage 2013: Die Zukunft der Suche by
Medientage 2013: Die Zukunft der SucheMedientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der SucheDirk Lewandowski
1.1K views14 slides
Warum Suche (trotzdem) bedeutend ist by
Warum Suche (trotzdem) bedeutend istWarum Suche (trotzdem) bedeutend ist
Warum Suche (trotzdem) bedeutend istDirk Lewandowski
924 views19 slides
Neue Entwicklungen im Bereich der Suchmaschinen (technologie) by
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)Neue Entwicklungen im Bereich der Suchmaschinen (technologie)
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)Dirk Lewandowski
1K views24 slides

Similar to Perspektiven eines Open Web Index(20)

Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern by Dirk Lewandowski
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordernWie Suchmaschinen (immer noch) die Bibliotheken herausfordern
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern
Dirk Lewandowski1.4K views
Medientage 2013: Die Zukunft der Suche by Dirk Lewandowski
Medientage 2013: Die Zukunft der SucheMedientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der Suche
Dirk Lewandowski1.1K views
Warum Suche (trotzdem) bedeutend ist by Dirk Lewandowski
Warum Suche (trotzdem) bedeutend istWarum Suche (trotzdem) bedeutend ist
Warum Suche (trotzdem) bedeutend ist
Dirk Lewandowski924 views
Neue Entwicklungen im Bereich der Suchmaschinen (technologie) by Dirk Lewandowski
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)Neue Entwicklungen im Bereich der Suchmaschinen (technologie)
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)
Dirk Lewandowski1K views
Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herau... by Cornelius Puschmann
Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herau...Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herau...
Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herau...
Cornelius Puschmann1.8K views
Competitive Intelligence: Wettbewerbsbeobachtung im SEO und Online Marketing by Philipp Klöckner
Competitive Intelligence: Wettbewerbsbeobachtung im SEO und Online MarketingCompetitive Intelligence: Wettbewerbsbeobachtung im SEO und Online Marketing
Competitive Intelligence: Wettbewerbsbeobachtung im SEO und Online Marketing
Philipp Klöckner23.6K views
Entwicklung, Kategorisierung von Suchmaschinen by 121WATT GmbH
Entwicklung, Kategorisierung von SuchmaschinenEntwicklung, Kategorisierung von Suchmaschinen
Entwicklung, Kategorisierung von Suchmaschinen
121WATT GmbH2.6K views
Referat by Dobleran
ReferatReferat
Referat
Dobleran490 views
Wegweiser durch den Social Media Monitoring-Dschungel by ForschungsWeb GmbH
Wegweiser durch den Social Media Monitoring-DschungelWegweiser durch den Social Media Monitoring-Dschungel
Wegweiser durch den Social Media Monitoring-Dschungel
ForschungsWeb GmbH1.7K views
Ist meine Suchmaschine wirklich so gut, wie ich glaube? by Dirk Lewandowski
Ist meine Suchmaschine wirklich so gut, wie ich glaube?Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Dirk Lewandowski1.1K views
Wie beeinflussen Suchmaschinen den Informationsmarkt? by Dirk Lewandowski
Wie beeinflussen Suchmaschinen den Informationsmarkt?Wie beeinflussen Suchmaschinen den Informationsmarkt?
Wie beeinflussen Suchmaschinen den Informationsmarkt?
Dirk Lewandowski543 views
Web monitoring anbietervergleich 2010 by ulrikehartmann71
Web monitoring anbietervergleich 2010Web monitoring anbietervergleich 2010
Web monitoring anbietervergleich 2010
ulrikehartmann71808 views
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie... by Thomas Koch
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Thomas Koch1.8K views
Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim by Kai Eckert
Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim
Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim
Kai Eckert1K views
Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen by Dirk Lewandowski
Wissensarmut trotz (oder gar durch) Nutzung von SuchmaschinenWissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Dirk Lewandowski976 views

More from Dirk Lewandowski

The Need for and fundamentals of an Open Web Index by
The Need for and fundamentals of an Open Web IndexThe Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web IndexDirk Lewandowski
230 views17 slides
In a World of Biased Search Engines by
In a World of Biased Search EnginesIn a World of Biased Search Engines
In a World of Biased Search EnginesDirk Lewandowski
583 views48 slides
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni... by
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...Dirk Lewandowski
319 views45 slides
Künstliche Intelligenz bei Suchmaschinen by
Künstliche Intelligenz bei SuchmaschinenKünstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei SuchmaschinenDirk Lewandowski
466 views28 slides
Analysing search engine data on socially relevant topics by
Analysing search engine data on socially relevant topicsAnalysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topicsDirk Lewandowski
191 views36 slides
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert by
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertGoogle Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertDirk Lewandowski
278 views27 slides

More from Dirk Lewandowski(19)

The Need for and fundamentals of an Open Web Index by Dirk Lewandowski
The Need for and fundamentals of an Open Web IndexThe Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web Index
Dirk Lewandowski230 views
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni... by Dirk Lewandowski
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
Dirk Lewandowski319 views
Künstliche Intelligenz bei Suchmaschinen by Dirk Lewandowski
Künstliche Intelligenz bei SuchmaschinenKünstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei Suchmaschinen
Dirk Lewandowski466 views
Analysing search engine data on socially relevant topics by Dirk Lewandowski
Analysing search engine data on socially relevant topicsAnalysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topics
Dirk Lewandowski191 views
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert by Dirk Lewandowski
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertGoogle Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Dirk Lewandowski278 views
Suchverhalten und die Grenzen von Suchdiensten by Dirk Lewandowski
Suchverhalten und die Grenzen von SuchdienstenSuchverhalten und die Grenzen von Suchdiensten
Suchverhalten und die Grenzen von Suchdiensten
Dirk Lewandowski173 views
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden? by Dirk Lewandowski
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Dirk Lewandowski265 views
Are Ads on Google search engine results pages labeled clearly enough? by Dirk Lewandowski
Are Ads on Google search engine results pages labeled clearly enough?Are Ads on Google search engine results pages labeled clearly enough?
Are Ads on Google search engine results pages labeled clearly enough?
Dirk Lewandowski910 views
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen? by Dirk Lewandowski
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Dirk Lewandowski1.2K views
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim... by Dirk Lewandowski
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Dirk Lewandowski1.3K views
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen by Dirk Lewandowski
Verwendung von Skalenbewertungen in der Evaluierung von SuchmaschinenVerwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Dirk Lewandowski833 views
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Dirk Lewandowski646 views
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Dirk Lewandowski595 views
Warum wir Alternativen zu Google benötigen by Dirk Lewandowski
Warum wir Alternativen zu Google benötigenWarum wir Alternativen zu Google benötigen
Warum wir Alternativen zu Google benötigen
Dirk Lewandowski1.2K views
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge... by Dirk Lewandowski
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
Dirk Lewandowski1.1K views
Why we need an independent index of the Web by Dirk Lewandowski
Why we need an independent index of the WebWhy we need an independent index of the Web
Why we need an independent index of the Web
Dirk Lewandowski1K views

Perspektiven eines Open Web Index

  • 1. Perspektiven eines „Open Web Index“ Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg dirk.lewandowski@haw-hamburg.de @Dirk_Lew DGI-Forum Wittenberg „True Fiction: Die Digitalisierung unseres Alltags“ Wittenberg, 25. September 2015
  • 2. Gliederung 1.  Die Bedeutung der Suchmaschinen und der Suchmaschinenmarkt 2.  Das „Problem Google“ 3.  Alternative Suchmaschinen 4.  Lösungsvorschläge 5.  Die Initiative „Open Web Index“ (OWI) 6.  Fazit
  • 3. Die Bedeutung der Suchmaschinen und der Suchmaschinenmarkt
  • 4. Ansätze zur Erschließung der Inhalte des Web (Auswahl)
  • 5. Wer das Internet nutzt, nutzt Suchmaschinen •  Suchmaschinen sind der beliebteste Dienst des Internt (Purcell, Brenner & Raine, 2012; van Eimeren & Frees, 2013) van Eimeren, B.; Frees, B. (2013): Rasanter Anstieg des Internetkonsums – Onliner fast drei Stunden täglich im Netz: Ergebnisse der ARD/ZDF-Onlinestudie 2013. Media Perspektiven 54(7-8), 358-372.
  • 6. Entwicklung des Suchanfragevolumens (USA) Daten von ComScore. Die Daten wurden aus den regelmäßig bei „Search Engine Land“ veröffentlichten Zahlen zusammengestellt. (s. http:// searchengineland.com/library/stats/stats-comscore))
  • 7. Es wird eigentlich nur eine Suchmaschine genutzt ComScore-Zahlen Deutschland, März 2012; http://www.focus.de/digital/internet/netzoekonomie-blog/suchmaschinen-googles-marktanteil-steigt- auf-96-prozent-in-deutschland_aid_723240.html 95,9 1,1 0,9 0 10 20 30 40 50 60 70 80 90 100 Google Bing Yahoo
  • 9. Durch Google bzw. seine Marktmacht verursachte Probleme 1.  Nur eine von vielen möglichen algorithmischen Sichten auf die Inhalte des Web 2.  Bevorzugung eigener Angebote 3.  Effekt der Suchmaschinenoptimierung 4.  (Dominanz bei der Online-Werbung)
  • 12. Desktop layout 593 clicks (59.3%) 0 clicks (0%) 358 clicks (35.8%) 49 clicks (4.9%) Bevorzugung eigener Angebote 23 Lewandowski, D.; Sünkler, S.: Representative online study to evaluate the commitments proposed by Google as part of EU competition investigation AT.39740-Google - Report for Germany http://searchstudies.org/tl_files/Publikationen_PDFs/2013/Google_Online_Survey_DE.pdf
  • 14. Anfragetypen in der Websuche nach Broder (2002) •  Informational (informationsorientiert) –  Nutzer möchte sich zu einem Thema informieren. –  Ziel sind mehrere Dokumente. •  Navigational (navigationsorientiert) –  Ziel ist es, eine bestimmte Seite (wieder) zu finden. –  Typisch: Suche nach Homepage („Ebay“). –  Ziel ist i.d.R. ein Dokument. •  Transactional (transaktionsorientiert) –  Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll. –  Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.
  • 15. Zufriedenheit der Nutzer in Bezug auf die Anfragetypen Tabelle 1: Eindeutige Bewertbarkeit von Suchanfragen nach Anfragetyp Navigationsorientiert Informationsorientiert Transaktionsorientiert Eindeutig bewertbar Suche nach einem bereits bekannten Dokument Suche nach einem Faktum Suche nach Trivia Informationsorientierte Suche, zu der Informationen aus einer bestimmten Quelle erwartet werden (bspw. Wikipedia) Suche nach einer bekannten Website, auf der eine Transaktion durchgeführt werden soll Nicht eindeutig bewertbar - Klassische Informationssuche mit dem Anspruch, ein vollständiges Bild zu gewinnen bzw. einen umfassenden Überblick Mehrere Varianten der Transaktion möglich
  • 16. Über was haben Suchmaschinen eigentlich Macht? •  Über das, was überhaupt in den Index aufgenommen wird –  Technisch bedingte Probleme der Web-Indexierung –  Demokratisch legitimierter Ausschluss von Inhalten –  Willkürlicher Ausschluss von Inhalten •  Über das, was wir als Nutzer zu sehen bekommen –  Reihung der Dokumente –  Anordnung der Suchergebnisseiten –  Direkte Antworten
  • 17. Es kann keine verzerrungsfreie Suchmaschine geben •  Verzerrungen werden zum Problem durch die Kombination von •  Dominanz des Modells „algorithmische Web-Suchmaschine“ •  Dominanz von Google in diesem Bereich •  Nutzerverhalten •  Probleme werden sich zukünftig noch verstärken durch •  Direkte Beantwortung von Suchanfragen •  Wandel von Suchanfragen und Dokumenten
  • 18. XXXX •  XXXX –  XXXX –  XXXX •  XXXX –  XXXX –  XXXX
  • 20. Alternative Suchmaschinen •  Was ist eigentlich eine „alternative Suchmaschine“? –  Jede Suchmaschine außer Google? à „Google Killer“, Cuil† –  Suchmaschinen, die grundlegend dasselbe machen wie Google? à Bing –  Suchmaschinen, die sich durch regionale Kompetenz abheben? à Seekport† –  Suchmaschinen, die neue/alternative Ansätze zur Erschließung und Durchsuchbarmachung des Web verfolgen? •  Keine Alternative: „Suchmaschinen“, die Ergebnisse einer anderen Suchmaschine anzeigen.
  • 21. Beziehungsgeflecht der Suchmaschinen (Deutschland) Lewandowski, D. (2015). Suchmaschinen verstehen. Berlin Heidelberg: Springer Vieweg. S. 158)
  • 22. Das Partnerindex-Modell hat den Suchmaschinenmarkt ausgedünnt •  Geschäftsmodell Partnerindices –  Eine Suchmaschine mit eigenem Index stellt ihre Ergebnisse und ihre Textanzeigen dem Partner zur Verfügung –  Das mit den Werbeklicks verdiente Geld wird nach einem vorher festgelegten Schlüssel zwischen Suchmaschine und Partner aufgeteilt •  Attraktivität des Modells –  Minimale zusätzliche Kosten pro Anfrage für die gebende Suchmaschine –  Enorme Kostenersparnis für die nehmende Suchmaschine (Betrieb einer eigenen Suchmaschine entfällt) –  Ergebnis: Ausdünnung des Suchmaschinenmarkts
  • 23. •  Suchmaschinen-Indexe aktuell –  Google –  Bing –  Yandex –  Baidu •  Eingestellte Suchmachinen- Indexe (seit 2009) –  Yahoo –  Ask –  Cuil •  Neue Suchmaschinen-Indexe –  Blekko –  Duck Duck Go •  Web-Indexe für Analysezwecke (Beispiel) –  Moz –  OpenCrawl Überblick Web-Indexe Auswahl
  • 24. Bias der Suchmaschinen •  Drei Ebenen von Suchmaschinen-Bias (Weber, 2011) –  Implementierung der Suchmaschine –  Verhalten der Anbieter von Inhalten –  Nutzung von Suchmaschinen à  Eine „verzerrungsfreie“ Suchmaschine kann es nicht geben •  Verzerrungen werden zum Problem durch die Kombination von •  Dominanz des Modells „algorithmische Web-Suchmaschine“ •  Dominanz von Google in diesem Bereich •  Nutzerverhalten
  • 25. Warum brauchen wir mehr als eine Suchmaschine? •  Meinungsvielfalt •  Wahl zwischen verschiedenen (algorithmischen) Sichten auf die Welt •  Ideologiefreie Suchmaschinen sind nicht möglich
  • 27. Lösungsvorschläge 1.  Der Markt wird‘s richten 2.  Google zu fairer Ergebnisanzeige verpflichten 3.  Google zerschlagen 4.  Eine alternative Suchmaschine aufbauen 5.  Google zwingen, seinen Index zu öffnen 6.  Web-Index als Infrastrukturmaßnahme
  • 28. Die “lokale Kopie” des Web Risvik, K. M., & Michelsen, R. (2002). Search engines and web dynamics. Computer Networks, 39(3), 289–302.
  • 29. Entkopplung von Index und Diensten Risvik, K. M., & Michelsen, R. (2002). Search engines and web dynamics. Computer Networks, 39(3), 289–302. Infrastruktur (öffentlich) Dienste (Eigeninitiative)
  • 30. Ein offener Web-Index schafft die Voraussetzungen für die Informationsautonomie der europäischen Wirtschaft und Gesellschaft •  „Ein für alle zu fairen Konditionen zugänglicher Index des Web“ –  „Für alle“ meint, dass jeder Interessierte auf diesen Index zugreifen kann. –  „Faire Bedingungen“ bedeutet nicht unbedingt kostenlos, sondern kann auch ein faires Bezahlmodell vorsehen. –  Unter „zugänglich“ ist zu verstehen, dass der Index leicht automatisch abgefragt werden kann. Weiterhin sollte tatsächlich alles im Index enthaltene auch abfragbar sein. –  Und „Index des Web“ meint schließlich möglichst alle Inhalte des Web (und ggf. darüber hinaus).
  • 31. Finanzierung •  Finanzierung –  Aufgrund der immensen Kosten kann ein solcher Index nur auf europäischer Ebene geschaffen werden. •  Wer kann einen solchen Index betreiben? –  Bestehende Forschungseinrichtung oder eine neu zu gründende Einrichtung –  Der Betreiber des Index darf nicht allein über die Art der Erschließung der Dokumente und ihre Verfügbarmachung bestimmen. à Kuratorium aus (potentiellen) Anwendern
  • 32. Die Initiative „Open Web Index“ (OWI)
  • 33. Beteiligte •  Sprecher –  Dr. Wolfgang Sander-Beuermann, Suma e.V. –  Prof. Dr. Dirk Lewandowski, Hochschule für Angewandte Wissenschaften Hamburg •  Beteiligte –  Wissenschaft –  Industrie (Deutsche Telekom, 1&1) –  Informationsinfrastruktureinrichtungen –  Public Relations
  • 34. Arbeiten •  Konzeptpapier „An Open Web Index for Europe“ •  Vernetzung von Interessierten aus unterschiedlichen Bereichen •  Workshops und Veranstaltungen •  Lobbyarbeit •  Website: www.openwebindex.eu
  • 35. Fazit
  • 36. #1 Das „Google-Problem“ wurde (endlich) erkannt. Wir sprechen nun über mögliche Lösungen.
  • 37. #2 Eine konstruktive Lösung ist einer destruktiven vorzuziehen.
  • 38. #3 Frei zugängliches Wissen ist die Quelle von kontinuierlichem Wettbewerb, Innovation und Unternehmertum auf der einen und persönlicher und Meinungsfreiheit auf der anderen Seite. Der Open Web Index schafft dafür die Voraussetzung.
  • 39. #4 Diese Aufgabe ist mit Infrastrukturaufgaben des Staates zu vergleichen – in Bezug auf die Sammlung und Verfügbarmachung von Wissen ist vor allem der Vergleich mit den Bibliotheken zu ziehen.
  • 40. Vielen Dank für Ihre Aufmerksamkeit Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information dirk.lewandowski@haw-hamburg.de Website: www.searchstudies.org