Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Wissensarmut trotz (oder gar durch) Nutzung von
Suchmaschinen?
Prof. Dr. Dirk Lewandowski
dirk.lewandowski@haw-hamburg.de
http://www.bui.haw-hamburg.de/lewandowski.html
@Dirk_Lew
Universität Rostock, 13. Dezember 2012
Wissensarmut
• These 1: Suchmaschinen ermöglichen einen extrem erleichterten Zugang
zu Informationen, was zu einem (potentiellen) Informationsreichtum führt.
• These 2: Die Nutzer sind nur eingeschränkt in der Lage, sich diesen
Informationsreichtum zu erschließen.
• These 3: Die positive Bewertung der Suchergebnisse für bestimmte
Anfragetypen führt zu einer übertrieben positiven Bewertung der
Suchergebnisse als Ganzes.
• These 4: Kommerzielle Interessen erschweren den Zugang zu
Informationen (und damit der Bildung von Wissen).
• These 5: Nur die Bereitstellung eines zu fairen Konditionen frei
zugänglichen Web-Index kann Suchmaschinen zu Werkzeugen im Dienste
eines Wissensreichtums machen.
Gliederung
1. Die Bedeutung der Suchmaschinen
2. Das Verhalten der Suchmaschinennutzer
3. Anfragetypen und die Bewertung der Qualität der Suchergebnisse
4. Interessengeleitete Suchergebnisseiten
5. Wege zum Wissensreichtum (im Kontext Suchmaschinen)
Gliederung
1. Die Bedeutung der Suchmaschinen
2. Das Verhalten der Suchmaschinennutzer
3. Anfragetypen und die Bewertung der Qualität der Suchergebnisse
4. Interessengeleitete Suchergebnisseiten
5. Wege zum Wissensreichtum (im Kontext Suchmaschinen)
Web search: „Always different, always the same“
http://web.archive.org/web/19961023234631/http://altavista.digital.com/
Masse
• In Deutschland in einem
Monat 5,6 Milliarden
Suchanfragen („Kern-Suche“).
• Pro Tag: >180 Millionen
• Pro Stunde: 7,5 Millionen
• Pro Minute: 125.448
• Pro Sekunde: 2.091
Der Suchmaschinenmarkt (Deutschland)
ComScore-Zahlen März 2012;
http://www.focus.de/digital/internet/netzoekonomie-blog/suchmaschinen-googles-marktanteil-steigt-
auf-96-prozent-in-deutschland_aid_723240.html
95,9
1,1
0,9
0 10 20 30 40 50 60 70 80 90 100
Google
Bing
Yahoo
Suchmaschinen und Information Overload
• Zugang zu Informationen durch Suchmaschinen
– Masse (viele Mrd. Dokumente indexiert)
– Aktualität (allerdings nur schwer in der Recherche bestimmbar)
– Funktionierendes Ranking (s.u.)
• Information Overload
– „Information Overload kann anhand der Menge der Informationen definiert
werden, die ein Mensch zu verarbeiten in der Lage ist. Übersteigt die
Informationsmenge, die dieser Mensch für seine Arbeit benötigt und verarbeiten
kann, für einen nennenswerten Zeitraum sein Fassungsvermögen, so würde er
unter Information Overload leiden.“ (Lewandowski, 2012)
Strategien gegen Information Overload
• Vermeidungsstrategien bzw. unsystematische Linderung
– Informationen ignorieren
– Beschränkung auf eine Quelle bzw. Quellengruppe
• Strategien
– Technische Filter
– Informations- bzw. Recherchekompetenz
• Quellenauswahl
• Durchführung der Recherche
• Aufbereitung der Ergebnisse
– Überdenken des Anspruchs auf Vollständigkeit
(Lewandowski, 2012)
Gliederung
1. Die Bedeutung der Suchmaschinen
2. Das Verhalten der Suchmaschinennutzer
3. Anfragetypen und die Bewertung der Qualität der Suchergebnisse
4. Interessengeleitete Suchergebnisseiten
5. Wege zum Wissensreichtum (im Kontext Suchmaschinen)
Das typische Verhalten der Suchmaschinennutzer
• Suchanfragen sind kurz und ungenau
– „Die meisten Nutzer sind nicht willens, bei der Formulierung ihres Suchziels allzu
viel kognitive und zeitliche Energie aufzuwenden.“ (Machill et al., 2003)
• Trefferselektion beeinflusst durch
– Suchmaschinenmarke (Jansen et al. 2007)
– Position des Treffers (Keane, O'Brien, & Smyth, 2008)
– Treffer steht im sichtbaren Bereich (Granka et al. 2005; Cutrell 2007)
– Aussagekräftige Beschreibungen, hervorgehobene Keywords (Lewandowski
2008)
– Treffer ist besonders hervorgehoben – Universal Search
Gliederung
1. Die Bedeutung der Suchmaschinen
2. Das Verhalten der Suchmaschinennutzer
3. Anfragetypen und die Bewertung der Qualität der Suchergebnisse
4. Interessengeleitete Suchergebnisseiten
5. Wege zum Wissensreichtum (im Kontext Suchmaschinen)
Anfragetypen in der Websuche
nach Broder (2002)
• Informational (informationsorientiert)
– Nutzer möchte sich zu einem Thema informieren.
– Ziel sind mehrere Dokumente.
• Navigational (navigationsorientiert)
– Ziel ist es, eine bestimmte Seite (wieder) zu finden.
– Typisch: Suche nach Homepage („Uni Regensburg“).
– Ziel ist i.d.R. ein Dokument.
• Transactional (transaktionsorientiert)
– Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll.
– Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.
Bewertung des Sucherfolgs durch Nutzer
• Bewertung nach Anfragetypen
– Informationsorientiert à Nachweis schwierig (Annahme: 50% eindeutig bewertbar)
– Navigationsorientiert à Nachweis eindeutig (Annahme: 100% eindeutig bewertbar)
– Transaktionsorientiert à Nachweis leicht bis schwierig (Annahme: 50% eindeutig
bewertbar)
Gliederung
1. Die Bedeutung der Suchmaschinen
2. Das Verhalten der Suchmaschinennutzer
3. Anfragetypen und die Bewertung der Qualität der Suchergebnisse
4. Interessengeleitete Suchergebnisseiten
5. Wege zum Wissensreichtum (im Kontext Suchmaschinen)
Gruppen von Rankingfaktoren bei Suchmaschinen
• Textstatistik
– „Wie gut passen Anfrage und Dokument zusammen?“
– Worthäufigkeiten, Position der Suchbegriffe im Dokument, ...
• Popularität
– „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses
Dokument treffen würde?“
– Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell).
• Aktualität
– „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“
– Datumsangaben, Linkstruktur, ...
• Lokalität (=Nutzermodell/Standort)
– „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“
– Länderinterfaces
Im Detail: Lewandowski 2005, Kap. 6
Gruppen von Rankingfaktoren bei Suchmaschinen
• Textstatistik
– „Wie gut passen Anfrage und Dokument zusammen?“
– Worthäufigkeiten, Position der Suchbegriffe im Dokument, ...
• Popularität
– „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses
Dokument treffen würde?“
– Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell).
• Aktualität
– „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“
– Datumsangaben, Linkstruktur, ...
• Lokalität (=Nutzermodell/Standort)
– „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“
– Länderinterfaces
vor 1998
1998
2001
2004
Im Detail: Lewandowski 2005, Kap. 6
Ergebnisseite als Ganzes
• Suchergebnisseite
– Search Engine Results Page (SERP)
• Drei Bereiche:
– Organische Ergebnisse
– Navigationselemente
– Werbung
• Wahrnehmung der SERP: Der Knick („fold“)
– Above the fold
– Below the fold
Organische Ergebnisse
• „Organisch“ = aus dem Index der Suchmaschine
erzeugt
– Alle Dokumente aus dem Index haben potentiell die
gleiche Chance, zu einer Suchanfrage gezeigt zu
werden.
• Sonderfall: Universal-Search-Ergebnisse
– Universal-Search-Ergebnisse kommen aus speziellen
Indices („Kollektionen“) und werden in die Liste der
organischen Ergebnisse eingespeist.
Beispiel für Werbung
• Kennzeichnung
– Farblich hinterlegt
– Anzeigenblöcke mit dem Wort
„Anzeigen“ gekennzeichnet.
• Unterscheidbarkeit von
organischen Ergebnissen und
Werbung
– Werbung kann relevant sein;
Werbung wie organische
Ergebnisse beschrieben
Suchmaschinenoptimierung (SEO)
• Definition
• Alle Maßnahmen, die dazu geeignet sind, die Position von Webseiten im Ranking
der Suchmaschinen zu verbessern.
• Kommerzieller Bereich
– Etablierte Branche; alle nennenswerten Websites verwenden
Suchmaschinenoptimierung
• Weiterentwicklung von SEO
– NGOs
– Academic Search Engine Optimization
Können Suchmaschinen-Ergebnisseiten (SERPs) neutral sein?
• Probleme in allen Bereichen der SERP
– Anzeigen: Unterscheidbar von den organischen Suchergebnissen?
– Organische Ergebnisse: Durch SEO manipuliert?
– Universal Search: Werbung für die eigenen Angebote der Suchmaschinen?
• Was wäre eine neutrale Suchergebnisseite?
– Anzeigen klar von den organischen Ergebnissen getrennt + gekennzeichnet
– Hinweise auf eigene Angebote klar gekennzeichnet; Alternativen angegeben
– Durch SEO optimierte Seiten gekennzeichnet?
Gliederung
1. Die Bedeutung der Suchmaschinen
2. Das Verhalten der Suchmaschinennutzer
3. Anfragetypen und die Bewertung der Qualität der Suchergebnisse
4. Interessengeleitete Suchergebnisseiten
5. Wege zum Wissensreichtum (im Kontext Suchmaschinen)
Index vs. Suchinterface
• Suchmaschinen mit eigenem Index
– Google, Bing, Exalead, ...
• Suchmaschinen, die auf einen Partnerindex zurückgreifen
– T-Online, Web.de, AOL.de, ...
• Geschäftsmodell Partnerindices
– Eine Suchmaschine mit eigenem Index stellt (1) ihre statischen Ergebnissets und
(2) ihre Textanzeigen dem Partner zur Verfügung
– Das mit den Werbeklicks verdiente Geld wird nach einem vorher festgelegten
Schlüssel zwischen Suchmaschine und Partner aufgeteilt
Das Beziehungsgeflecht der Suchmaschinen (1)
Grafik mit historischer Entwicklung unter http://www.bruceclay.com/eu/serc_histogram/histogram.htm
Vision: Ein frei zugänglicher Suchmaschinenindex
• Neue Suchmaschinen können nicht entstehen, da die Anfangsinvestitionen
zu hoch sind.
• Die Idee einer staatlichen / öffentlich-rechtlichen Suchmaschine ist
gescheitert (und nicht wünschenswert).
• Lösung: Bereitstellung eines Index, auf den alle frei zu fairen Bedingungen
zugreifen können.
• Ziel: Informationsvielfalt durch Suchmaschinen.
Wege zum Wissensreichtum: Zwei Bereiche
• Individuum
– Informationskompetenz
– Neu: Informationskompetenz hinsichtlich der Manipulierbarkeit von
Suchergebnissen
• Suchmaschinen
– Index vs. Suchmaschine
– Neu: Vielfalt durch zahlreiche Suchmaschinen, die den gleichen Datenbestand
verwenden können.
à Wissensreichtum durch eine Vielfalt von Suchmaschinen, die von
kompetenten Nutzern bedient werden.
Wissensarmut
• These 1: Suchmaschinen ermöglichen einen extrem erleichterten Zugang
zu Informationen, was zu einem (potentiellen) Informationsreichtum führt.
• These 2: Die Nutzer sind nur eingeschränkt in der Lage, sich diesen
Informationsreichtum zu erschließen.
• These 3: Die positive Bewertung der Suchergebnisse für bestimmte
Anfragetypen führt zu einer übertrieben positiven Bewertung der
Suchergebnisse als Ganzes.
• These 4: Kommerzielle Interessen erschweren den Zugang zu
Informationen (und damit der Bildung von Wissen).
• These 5: Nur die Bereitstellung eines zu fairen Konditionen frei
zugänglichen Web-Index kann Suchmaschinen zu Werkzeugen im Dienste
eines Wissensreichtums machen.
Vielen Dank für Ihre Aufmerksamkeit
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften
Hamburg
dirk.lewandowski@haw-hamburg,de
Twitter: Dirk_Lew
http://www.bui.haw-hamburg.de/
lewandowski.html