Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven

Dirk Lewandowski
Dirk LewandowskiProfessor at Hamburg University of Applied Sciences
Internet-Suchmaschinen
Aktueller Stand und Entwicklungsperspektiven
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften Hamburg
Prof. Dr. Dirk Lewandowski
•  Professor für Information Research &
Information Retrieval an der Hochschule
für Angewandte Wissenschaften Hamburg
•  Forschung vor allem zur Qualität von
Suchmaschinen, Nutzerverhalten, Query
Understanding, gesellschaftliche Aspekte
der Web-Suche
Inhalt
1.  Der Suchmaschinenmarkt: Wo stehen wir heute?
2.  Aktuelle Entwicklungen
–  Semantische Suche
–  Soziale Suche
–  Suchneutralität
3.  Zusammenfassung: Warum ist das wichtig?
Der Suchmaschinenmarkt: Wo stehen wir heute?
XXXX
http://web.archive.org/web/19961023234631/http://altavista.digital.com/
Suchmaschinen
7 | Dirk
Lewandowski
•  x
E-Commerce
Site-intern und andere Datenbestände
Service
Masse
• In Deutschland in einem
Monat 5,6 Milliarden
Suchanfragen („Kern-Suche“).
• Pro Tag: >180 Millionen
• Pro Stunde: 7,5 Millionen
• Pro Minute: 125.448
• Pro Sekunde: 2.091
11
|
Der Suchmaschinenmarkt: Wo stehen wir heute?
•  Suchmaschinen sind der Zugang zum Wissen im Web
•  (Quasi-)Monopol in der Web-Suche, Vielfalt in anderen Bereichen
•  Suche bleibt ein weitgehend unterschätzter Bereich
Aktuelle Entwicklungen (1): Semantische Suche
Semantik?
•  „Semantic Web“
–  Idee, dass durch semantische Auszeichnungen alle Inhalte des Web miteinander
verbunden werden und von Maschinen verstanden werden können.
–  Alternative Ansätze: Linked Open Data, ...
•  „Low Level Semantics“
–  Faktenextraktion aus „chaotischen“ Dokumenten
–  Einfache Auszeichnungen durch Website-Betreiber (Eigeninteresse bedienen)
•  Verstehen der Dokumente vs. Verstehen der Suchanfragen
Semantische Suche: Dokumente verstehen
Semantische Annotation von Dokumenten
•  Semantische Annotationen können in der Suche ausgenutzt werden, um
•  die Ergebnisqualität zu verbessern
•  die Trefferdarstellung („Snippets“) zu verbessern
•  Das Problem von „echten“ Semantic-Web-Anwendungen ist die Komplexität
in der Erstellung.
•  Im letzten Jahr haben sich die großen Suchmaschinen auf ein gemeinsames
Format für semantische Annotationen geeignet, das in HTML umgesetzt wird.
17 | Dirk
Lewandowski
•  x
Beispiel Google Knowledge Graph
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Semantische Suche: Suchanfragen verstehen
Suchanfragen verstehen
•  bbl
•  vatikan
•  stockbrot
•  motonetix
•  nedcom
•  fußball
•  drehscheibe
•  frauentausch
•  seelenfarben
•  kachelmannwetter
•  osterei
•  wie ich
•  wgt
Suchanfragen im Kontext
Beispiel: Navigationsorientierte Suchanfragen anhand von Klicks
bestimmen
(Lewandowski, Drechsler & von Mach, im Druck)
Semantische Suche
•  Verbesserung der Qualität der Suchergebnisse durch
–  Verstehen der Suchanfrage
–  Kontextsensitive Vorschläge zur Verbesserung der Suchanfrage
–  Verstehen der Dokumente, dadurch besserer Abgleich mit der Suchanfrage
–  Semantische Anreicherung der Ergebnisbeschreibungen („Snippets“), dadurch
besser fundierte Entscheidung der Nutzer?
–  Präsentation von aus Dokumenten zusammengestellten Ergebnissen (auf den
Seiten der Suchmaschine)
Aktuelle Entwicklungen (2): Soziale Suche
Gruppen von Rankingfaktoren
•  Textstatistik
–  „Wie gut passen Anfrage und Dokument zusammen?“
–  Worthäufigkeiten, Position der Suchbegriffe im Dokument, ...
•  Popularität
–  „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses
Dokument treffen würde?“
–  Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell).
•  Aktualität
–  „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“
–  Datumsangaben, Linkstruktur, ...
•  Lokalität
–  „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“
–  Länderinterfaces
Soziale Suche
•  Problem des bisherigen Rankings: Qualität wird vor allem durch Popularität (Links/
Klicks) gemessen
•  Populär bei der Masse
•  Populär in einer bestimmten Nutzergruppe
•  Populär bei einem bestimmten Nutzer (Personalisierung)
•  Das Versprechen des „Social Ranking“:
•  Von Bekannten empfohlene Suchergebnisse sind relevanter und vertrauenswürdiger.
•  Problem: Im Gegensatz zu Linkdaten aus dem freien Web handelt es sich bei Sozialen
Netzwerken um geschlossene Netzwerke, auf die die Suchmaschinen nicht per
Crawling zugreifen können.
Bing und Facebook
•  Vereinbarung über die Nutzung von Facebook-Daten in Bing
–  Anmeldung in Bing mit dem Facebook-Account
–  Bislang nur in den USA verfügbar
–  Bing-Websuche in Facebook integriert
•  Anreicherung der Suchergebnisse durch Daten aus Facebook
–  Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden
–  Höheres Ranking von empfohlenen Ergebnissen
–  Möglichkeit, Suchergebnisse in Facebook zu posten
–  Diskussion mit Facebook-Freunden auf den Bing-Ergebnisseiten
29 | Dirk
Lewandowski
•  x
Google und Google+
•  Aufbau eines eigenen sozialen Netzwerks durch Google
–  Integration in alle Google-Dienste
–  Bislang allerdings nicht besonders erfolgreich
•  Anreicherung der Suchergebnisse
–  Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden
–  Höheres Ranking von empfohlenen Ergebnissen
•  Weiterer Nutzen von Google+
–  „Klarnamen-Pflicht“
–  Kombination mit anderen Profilen im Web (Twitter, etc.)
–  Verbindung mit Daten zur Autorschaft (rel=author)
à Dadurch „Vertrauens-Graph“ als weitere Komponente des Rankings
Fazit Soziale Suche
•  Soziale Suche vielschichtig (kollaborative Suche, ...), wichtigster Punkt ist
aber das Einbeziehen von Daten aus sozialen Netzwerken in das Ranking
und die Ergebnispräsentation.
•  Beide großen Suchmaschinen haben Ansätze, solche Daten zu integrieren.
–  Vorteil Bing: Daten aus dem Netzwerk, in dem tatsächlich etwas los ist.
–  Vorteil Google: Tiefere Integration möglich, da es sich um ein eigenes Netzwerk
handelt.
Aktuelle Entwicklungen (3): Suchneutralität
33 |
•  x
34 |
•  x
Anzeigen
Nachrichten
Bilder
Videos
Blogbeiträge
Zusammenstellung der Suchergebnisse
•  Das Suchanfragevolumen ist sehr ungleichmäßig verteilt.
•  Treffer auf den vorderen Plätzen werden sehr stark bevorzugt.
•  Durch entsteht ein großer Einfluss von Suchmaschinen (Google) auf das,
was Nutzer zu sehen bekommen.
1.  Dürfen die Suchmaschinen ihre eigenen Angebote / die Angebote von Partnern
in der Ergebnisdarstellung bevorzugen?
2.  Tun sie das?
•  „Such-Neutralität“ bedeutet, dass eine Suchmaschine alle Dokumente im
Index nach gleichen Kriterien in das Ranking mit einbezieht.
36 | Dirk
Lewandowski
•  x
37 | Dirk
Lewandowski
•  x
38 | Dirk
Lewandowski
•  x
Aus welchen Quellen kommen die top10 organischen Ergebnisse?
Beispiel Google (2008)
Problemfelder
•  Bevorzugung eigener Angebote
–  In den organischen Ergebnissen
–  In den Universal-Search-Ergebnissen
•  Aufnahme in den Index
–  Bsp. Paid Inclusion bei Google Shopping: Eintragungen werden kostenpflichtig
–  Folgen weitere Dienste (Places, ...)?
à Kennzeichnung als eigenes Angebot bzw. Partnerangebot als Lösung?
Zusammenfassung: Warum ist das wichtig?
Um wen geht‘s?
1.  Anbieter von Inhalten
2.  Anbieter von Suchsystemen
3.  Rechercheure
Konsequenzen für Anbieter von Inhalten
•  Es wird zunehmend schwieriger, sich auf den Suchergebnisseiten zu
platzieren.
–  Mehr Konkurrenz
–  Schnellere Orientierung der Nutzer auf den Ergebnisseiten; mehr
verschiedenartige Inhalte.
–  Aktuelle Möglichkeiten der semantischen Auszeichnung nutzen
•  Die (langsame) Wende von Dokumenten zu Fakten bzw.
Informationszusammenstellungen erfordert ein Umdenken hinsichtlich der
Sichtbarkeit in Suchmaschinen bzw. deren Traffic-Vermittlung.
44 |
Dirk
•  x
(Eyetracking-Studie HAW-Hamburg 2010)
45 |
Dirk
•  x
46 |
Dirk
•  x
Konsequenzen für Anbieter von Suchsystemen
•  Das in den Web-Suchmaschinen erlernte Suchverhalten wird auf andere
Systeme übertragen
–  Navigationsorientierte Anfragen beantworten
–  Suchvorschläge während der Eingabe
–  Zusammenstellung der Suchergebnisseiten
–  Möglichkeiten zur Kollaboration (soziale Netzwerke) geben
Konsequenzen für Rechercheure
•  Suchmaschinen sind weniger denn je neutrale Informationsvermittler
–  Eigeninteressen der Suchmaschinen beachten
–  Gezielte Auswahl der passenden Informationsquellen
•  „Gegensteuern“ gegen den „Popularitätsbias“ der Suchmaschinen
–  Personalisierung bzw. Suchanfrageinterpretation ausschalten; Bsp. Google
–  Populäre Websites aus der Suche ausschließen; Bsp. Millionshort
Vielen Dank für Ihre Aufmerksamkeit
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften
Hamburg
dirk.lewandowski@haw-hamburg,de
Twitter: Dirk_Lew
http://www.bui.haw-hamburg.de/
lewandowski.html
1 of 49

Recommended

Wie entwickeln sich Suchmaschinen heute, was kommt morgen? by
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?Wie entwickeln sich Suchmaschinen heute, was kommt morgen?
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?Dirk Lewandowski
1.5K views35 slides
Perspektiven eines Open Web Index by
Perspektiven eines Open Web IndexPerspektiven eines Open Web Index
Perspektiven eines Open Web IndexDirk Lewandowski
1.6K views40 slides
Suchmaschinen verstehen by
Suchmaschinen verstehenSuchmaschinen verstehen
Suchmaschinen verstehenDirk Lewandowski
2.1K views57 slides
Wie Suchmaschinen die Inhalte des Web interpretieren by
Wie Suchmaschinen die Inhalte des Web interpretierenWie Suchmaschinen die Inhalte des Web interpretieren
Wie Suchmaschinen die Inhalte des Web interpretierenDirk Lewandowski
1.5K views30 slides
Neue Trends: Google, SEO und Co.? by
Neue Trends: Google, SEO und Co.?Neue Trends: Google, SEO und Co.?
Neue Trends: Google, SEO und Co.?Dirk Lewandowski
729 views24 slides
Wie gut sind Google und Co.? by
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Dirk Lewandowski
413 views47 slides

More Related Content

What's hot

Suchmaschinen im Internet – neue Erkenntnisse und Perspektiven by
Suchmaschinen im Internet – neue Erkenntnisse und PerspektivenSuchmaschinen im Internet – neue Erkenntnisse und Perspektiven
Suchmaschinen im Internet – neue Erkenntnisse und PerspektivenDirk Lewandowski
962 views29 slides
Wie Web 2.0 und Suche zusammenwachsen by
Wie Web 2.0 und Suche zusammenwachsenWie Web 2.0 und Suche zusammenwachsen
Wie Web 2.0 und Suche zusammenwachsenDirk Lewandowski
942 views14 slides
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern by
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordernWie Suchmaschinen (immer noch) die Bibliotheken herausfordern
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordernDirk Lewandowski
1.4K views32 slides
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1) by
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Dirk Lewandowski
571 views13 slides
Query Understanding by
Query UnderstandingQuery Understanding
Query UnderstandingDirk Lewandowski
1.2K views26 slides
Suchmaschinen, Bürde für Informationsspezialisten? by
Suchmaschinen, Bürde für Informationsspezialisten?Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?Dirk Lewandowski
864 views19 slides

What's hot(20)

Suchmaschinen im Internet – neue Erkenntnisse und Perspektiven by Dirk Lewandowski
Suchmaschinen im Internet – neue Erkenntnisse und PerspektivenSuchmaschinen im Internet – neue Erkenntnisse und Perspektiven
Suchmaschinen im Internet – neue Erkenntnisse und Perspektiven
Dirk Lewandowski962 views
Wie Web 2.0 und Suche zusammenwachsen by Dirk Lewandowski
Wie Web 2.0 und Suche zusammenwachsenWie Web 2.0 und Suche zusammenwachsen
Wie Web 2.0 und Suche zusammenwachsen
Dirk Lewandowski942 views
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern by Dirk Lewandowski
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordernWie Suchmaschinen (immer noch) die Bibliotheken herausfordern
Wie Suchmaschinen (immer noch) die Bibliotheken herausfordern
Dirk Lewandowski1.4K views
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Dirk Lewandowski571 views
Suchmaschinen, Bürde für Informationsspezialisten? by Dirk Lewandowski
Suchmaschinen, Bürde für Informationsspezialisten?Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?
Dirk Lewandowski864 views
Von wem wir abhängig sind: Über die Auffindbarkeit von Informationen by Dirk Lewandowski
Von wem wir abhängig sind: Über die Auffindbarkeit von InformationenVon wem wir abhängig sind: Über die Auffindbarkeit von Informationen
Von wem wir abhängig sind: Über die Auffindbarkeit von Informationen
Dirk Lewandowski1.1K views
Konferenzbeitrag DGI 2010 (DGI10): Lösung zum multilingualen Wissensmanagemen... by LLudwig
Konferenzbeitrag DGI 2010 (DGI10): Lösung zum multilingualen Wissensmanagemen...Konferenzbeitrag DGI 2010 (DGI10): Lösung zum multilingualen Wissensmanagemen...
Konferenzbeitrag DGI 2010 (DGI10): Lösung zum multilingualen Wissensmanagemen...
LLudwig1.2K views
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen by Dirk Lewandowski
Die Macht der Suchmaschinen und ihr Einfluss auf unsere EntscheidungenDie Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Dirk Lewandowski2.3K views
Suchmaschinen: Googlerisierung der Gesellschaft by Dirk Lewandowski
Suchmaschinen: Googlerisierung der GesellschaftSuchmaschinen: Googlerisierung der Gesellschaft
Suchmaschinen: Googlerisierung der Gesellschaft
Dirk Lewandowski1.5K views
Relevanzranking als Erfolgsfaktor für Discoverysysteme by Haake
Relevanzranking als Erfolgsfaktor für DiscoverysystemeRelevanzranking als Erfolgsfaktor für Discoverysysteme
Relevanzranking als Erfolgsfaktor für Discoverysysteme
Haake792 views
Suchmaschinenforschung an der HAW Hamburg by Dirk Lewandowski
Suchmaschinenforschung an der HAW HamburgSuchmaschinenforschung an der HAW Hamburg
Suchmaschinenforschung an der HAW Hamburg
Dirk Lewandowski1.2K views
Suchmaschinenoptimierung - Vortrag Heiko Depner, La Mina GmbH - 02.12.2014 by kommoguntia
Suchmaschinenoptimierung - Vortrag Heiko Depner, La Mina GmbH - 02.12.2014Suchmaschinenoptimierung - Vortrag Heiko Depner, La Mina GmbH - 02.12.2014
Suchmaschinenoptimierung - Vortrag Heiko Depner, La Mina GmbH - 02.12.2014
kommoguntia903 views
Medienbildung in der schule - Recherche by simoross
Medienbildung in der schule - RechercheMedienbildung in der schule - Recherche
Medienbildung in der schule - Recherche
simoross732 views
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter... by Dirk Lewandowski
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...
Vergleichende Betrachtung der Funktionalität und Leistungsfähigkeit von Inter...
Dirk Lewandowski423 views
Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends by Dirk Lewandowski
Web-Suchmaschinen: Suchverhalten, Informationsqualität, TrendsWeb-Suchmaschinen: Suchverhalten, Informationsqualität, Trends
Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends
Dirk Lewandowski1.7K views
Linked Open Data in digitalen Bibliotheken by Alexander Haffner
Linked Open Data in digitalen BibliothekenLinked Open Data in digitalen Bibliotheken
Linked Open Data in digitalen Bibliotheken
Alexander Haffner1.9K views

Similar to Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven

Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2) by
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)Dirk Lewandowski
595 views11 slides
Wie gut sind Google und Co.? by
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Dirk Lewandowski
998 views47 slides
Suchmaschinen-Update by
Suchmaschinen-UpdateSuchmaschinen-Update
Suchmaschinen-UpdateDirk Lewandowski
1.1K views35 slides
Neue Entwicklungen im Bereich der Suchmaschinen (technologie) by
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)Neue Entwicklungen im Bereich der Suchmaschinen (technologie)
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)Dirk Lewandowski
1K views24 slides
Warum Suche (trotzdem) bedeutend ist by
Warum Suche (trotzdem) bedeutend istWarum Suche (trotzdem) bedeutend ist
Warum Suche (trotzdem) bedeutend istDirk Lewandowski
924 views19 slides
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen? by
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?Dirk Lewandowski
1.2K views45 slides

Similar to Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven(20)

Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Dirk Lewandowski595 views
Neue Entwicklungen im Bereich der Suchmaschinen (technologie) by Dirk Lewandowski
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)Neue Entwicklungen im Bereich der Suchmaschinen (technologie)
Neue Entwicklungen im Bereich der Suchmaschinen (technologie)
Dirk Lewandowski1K views
Warum Suche (trotzdem) bedeutend ist by Dirk Lewandowski
Warum Suche (trotzdem) bedeutend istWarum Suche (trotzdem) bedeutend ist
Warum Suche (trotzdem) bedeutend ist
Dirk Lewandowski924 views
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen? by Dirk Lewandowski
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Dirk Lewandowski1.2K views
Competitive Intelligence: Wettbewerbsbeobachtung im SEO und Online Marketing by Philipp Klöckner
Competitive Intelligence: Wettbewerbsbeobachtung im SEO und Online MarketingCompetitive Intelligence: Wettbewerbsbeobachtung im SEO und Online Marketing
Competitive Intelligence: Wettbewerbsbeobachtung im SEO und Online Marketing
Philipp Klöckner23.6K views
Wie beeinflussen Suchmaschinen den Informationsmarkt? by Dirk Lewandowski
Wie beeinflussen Suchmaschinen den Informationsmarkt?Wie beeinflussen Suchmaschinen den Informationsmarkt?
Wie beeinflussen Suchmaschinen den Informationsmarkt?
Dirk Lewandowski543 views
Medientage 2013: Die Zukunft der Suche by Dirk Lewandowski
Medientage 2013: Die Zukunft der SucheMedientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der Suche
Dirk Lewandowski1.1K views
Google Search Trends 2014 - Session auf der Internet World München 2014 by seonative
Google Search Trends 2014 - Session auf der Internet World München 2014Google Search Trends 2014 - Session auf der Internet World München 2014
Google Search Trends 2014 - Session auf der Internet World München 2014
seonative1.2K views
Werbeplanung.at SUMMIT 15 – Die Konstanten der SEO – Thomas Urban by Werbeplanung.at Summit
Werbeplanung.at SUMMIT 15 – Die Konstanten der SEO – Thomas UrbanWerbeplanung.at SUMMIT 15 – Die Konstanten der SEO – Thomas Urban
Werbeplanung.at SUMMIT 15 – Die Konstanten der SEO – Thomas Urban
Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent... by Hendrik Kalb
Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...
Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...
Hendrik Kalb829 views
Blogger Outreach ist das i-Pünktchen in der SEO-Strategie by iCrossing GmbH
Blogger Outreach ist das i-Pünktchen in der SEO-StrategieBlogger Outreach ist das i-Pünktchen in der SEO-Strategie
Blogger Outreach ist das i-Pünktchen in der SEO-Strategie
iCrossing GmbH1.1K views
Suche ein effizientes Mittel zur Datenintegration by Thomas Kurz
Suche ein effizientes Mittel zur DatenintegrationSuche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur Datenintegration
Thomas Kurz246 views

More from Dirk Lewandowski

The Need for and fundamentals of an Open Web Index by
The Need for and fundamentals of an Open Web IndexThe Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web IndexDirk Lewandowski
230 views17 slides
In a World of Biased Search Engines by
In a World of Biased Search EnginesIn a World of Biased Search Engines
In a World of Biased Search EnginesDirk Lewandowski
583 views48 slides
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni... by
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...Dirk Lewandowski
319 views45 slides
Künstliche Intelligenz bei Suchmaschinen by
Künstliche Intelligenz bei SuchmaschinenKünstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei SuchmaschinenDirk Lewandowski
466 views28 slides
Analysing search engine data on socially relevant topics by
Analysing search engine data on socially relevant topicsAnalysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topicsDirk Lewandowski
191 views36 slides
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert by
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertGoogle Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertDirk Lewandowski
278 views27 slides

More from Dirk Lewandowski(17)

The Need for and fundamentals of an Open Web Index by Dirk Lewandowski
The Need for and fundamentals of an Open Web IndexThe Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web Index
Dirk Lewandowski230 views
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni... by Dirk Lewandowski
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
Dirk Lewandowski319 views
Künstliche Intelligenz bei Suchmaschinen by Dirk Lewandowski
Künstliche Intelligenz bei SuchmaschinenKünstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei Suchmaschinen
Dirk Lewandowski466 views
Analysing search engine data on socially relevant topics by Dirk Lewandowski
Analysing search engine data on socially relevant topicsAnalysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topics
Dirk Lewandowski191 views
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert by Dirk Lewandowski
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertGoogle Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Dirk Lewandowski278 views
Suchverhalten und die Grenzen von Suchdiensten by Dirk Lewandowski
Suchverhalten und die Grenzen von SuchdienstenSuchverhalten und die Grenzen von Suchdiensten
Suchverhalten und die Grenzen von Suchdiensten
Dirk Lewandowski173 views
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden? by Dirk Lewandowski
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Dirk Lewandowski265 views
Are Ads on Google search engine results pages labeled clearly enough? by Dirk Lewandowski
Are Ads on Google search engine results pages labeled clearly enough?Are Ads on Google search engine results pages labeled clearly enough?
Are Ads on Google search engine results pages labeled clearly enough?
Dirk Lewandowski910 views
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim... by Dirk Lewandowski
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Dirk Lewandowski1.3K views
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen by Dirk Lewandowski
Verwendung von Skalenbewertungen in der Evaluierung von SuchmaschinenVerwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Dirk Lewandowski833 views
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3) by Dirk Lewandowski
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Dirk Lewandowski646 views
Warum wir Alternativen zu Google benötigen by Dirk Lewandowski
Warum wir Alternativen zu Google benötigenWarum wir Alternativen zu Google benötigen
Warum wir Alternativen zu Google benötigen
Dirk Lewandowski1.2K views
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge... by Dirk Lewandowski
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
Dirk Lewandowski1.1K views
Why we need an independent index of the Web by Dirk Lewandowski
Why we need an independent index of the WebWhy we need an independent index of the Web
Why we need an independent index of the Web
Dirk Lewandowski1K views

Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven

  • 1. Internet-Suchmaschinen Aktueller Stand und Entwicklungsperspektiven Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg
  • 2. Prof. Dr. Dirk Lewandowski •  Professor für Information Research & Information Retrieval an der Hochschule für Angewandte Wissenschaften Hamburg •  Forschung vor allem zur Qualität von Suchmaschinen, Nutzerverhalten, Query Understanding, gesellschaftliche Aspekte der Web-Suche
  • 3. Inhalt 1.  Der Suchmaschinenmarkt: Wo stehen wir heute? 2.  Aktuelle Entwicklungen –  Semantische Suche –  Soziale Suche –  Suchneutralität 3.  Zusammenfassung: Warum ist das wichtig?
  • 4. Der Suchmaschinenmarkt: Wo stehen wir heute?
  • 9. Site-intern und andere Datenbestände
  • 11. Masse • In Deutschland in einem Monat 5,6 Milliarden Suchanfragen („Kern-Suche“). • Pro Tag: >180 Millionen • Pro Stunde: 7,5 Millionen • Pro Minute: 125.448 • Pro Sekunde: 2.091 11 |
  • 12. Der Suchmaschinenmarkt: Wo stehen wir heute? •  Suchmaschinen sind der Zugang zum Wissen im Web •  (Quasi-)Monopol in der Web-Suche, Vielfalt in anderen Bereichen •  Suche bleibt ein weitgehend unterschätzter Bereich
  • 13. Aktuelle Entwicklungen (1): Semantische Suche
  • 14. Semantik? •  „Semantic Web“ –  Idee, dass durch semantische Auszeichnungen alle Inhalte des Web miteinander verbunden werden und von Maschinen verstanden werden können. –  Alternative Ansätze: Linked Open Data, ... •  „Low Level Semantics“ –  Faktenextraktion aus „chaotischen“ Dokumenten –  Einfache Auszeichnungen durch Website-Betreiber (Eigeninteresse bedienen) •  Verstehen der Dokumente vs. Verstehen der Suchanfragen
  • 16. Semantische Annotation von Dokumenten •  Semantische Annotationen können in der Suche ausgenutzt werden, um •  die Ergebnisqualität zu verbessern •  die Trefferdarstellung („Snippets“) zu verbessern •  Das Problem von „echten“ Semantic-Web-Anwendungen ist die Komplexität in der Erstellung. •  Im letzten Jahr haben sich die großen Suchmaschinen auf ein gemeinsames Format für semantische Annotationen geeignet, das in HTML umgesetzt wird.
  • 21. Suchanfragen verstehen •  bbl •  vatikan •  stockbrot •  motonetix •  nedcom •  fußball •  drehscheibe •  frauentausch •  seelenfarben •  kachelmannwetter •  osterei •  wie ich •  wgt
  • 23. Beispiel: Navigationsorientierte Suchanfragen anhand von Klicks bestimmen (Lewandowski, Drechsler & von Mach, im Druck)
  • 24. Semantische Suche •  Verbesserung der Qualität der Suchergebnisse durch –  Verstehen der Suchanfrage –  Kontextsensitive Vorschläge zur Verbesserung der Suchanfrage –  Verstehen der Dokumente, dadurch besserer Abgleich mit der Suchanfrage –  Semantische Anreicherung der Ergebnisbeschreibungen („Snippets“), dadurch besser fundierte Entscheidung der Nutzer? –  Präsentation von aus Dokumenten zusammengestellten Ergebnissen (auf den Seiten der Suchmaschine)
  • 26. Gruppen von Rankingfaktoren •  Textstatistik –  „Wie gut passen Anfrage und Dokument zusammen?“ –  Worthäufigkeiten, Position der Suchbegriffe im Dokument, ... •  Popularität –  „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses Dokument treffen würde?“ –  Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell). •  Aktualität –  „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“ –  Datumsangaben, Linkstruktur, ... •  Lokalität –  „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“ –  Länderinterfaces
  • 27. Soziale Suche •  Problem des bisherigen Rankings: Qualität wird vor allem durch Popularität (Links/ Klicks) gemessen •  Populär bei der Masse •  Populär in einer bestimmten Nutzergruppe •  Populär bei einem bestimmten Nutzer (Personalisierung) •  Das Versprechen des „Social Ranking“: •  Von Bekannten empfohlene Suchergebnisse sind relevanter und vertrauenswürdiger. •  Problem: Im Gegensatz zu Linkdaten aus dem freien Web handelt es sich bei Sozialen Netzwerken um geschlossene Netzwerke, auf die die Suchmaschinen nicht per Crawling zugreifen können.
  • 28. Bing und Facebook •  Vereinbarung über die Nutzung von Facebook-Daten in Bing –  Anmeldung in Bing mit dem Facebook-Account –  Bislang nur in den USA verfügbar –  Bing-Websuche in Facebook integriert •  Anreicherung der Suchergebnisse durch Daten aus Facebook –  Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden –  Höheres Ranking von empfohlenen Ergebnissen –  Möglichkeit, Suchergebnisse in Facebook zu posten –  Diskussion mit Facebook-Freunden auf den Bing-Ergebnisseiten
  • 30. Google und Google+ •  Aufbau eines eigenen sozialen Netzwerks durch Google –  Integration in alle Google-Dienste –  Bislang allerdings nicht besonders erfolgreich •  Anreicherung der Suchergebnisse –  Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden –  Höheres Ranking von empfohlenen Ergebnissen •  Weiterer Nutzen von Google+ –  „Klarnamen-Pflicht“ –  Kombination mit anderen Profilen im Web (Twitter, etc.) –  Verbindung mit Daten zur Autorschaft (rel=author) à Dadurch „Vertrauens-Graph“ als weitere Komponente des Rankings
  • 31. Fazit Soziale Suche •  Soziale Suche vielschichtig (kollaborative Suche, ...), wichtigster Punkt ist aber das Einbeziehen von Daten aus sozialen Netzwerken in das Ranking und die Ergebnispräsentation. •  Beide großen Suchmaschinen haben Ansätze, solche Daten zu integrieren. –  Vorteil Bing: Daten aus dem Netzwerk, in dem tatsächlich etwas los ist. –  Vorteil Google: Tiefere Integration möglich, da es sich um ein eigenes Netzwerk handelt.
  • 32. Aktuelle Entwicklungen (3): Suchneutralität
  • 35. Zusammenstellung der Suchergebnisse •  Das Suchanfragevolumen ist sehr ungleichmäßig verteilt. •  Treffer auf den vorderen Plätzen werden sehr stark bevorzugt. •  Durch entsteht ein großer Einfluss von Suchmaschinen (Google) auf das, was Nutzer zu sehen bekommen. 1.  Dürfen die Suchmaschinen ihre eigenen Angebote / die Angebote von Partnern in der Ergebnisdarstellung bevorzugen? 2.  Tun sie das? •  „Such-Neutralität“ bedeutet, dass eine Suchmaschine alle Dokumente im Index nach gleichen Kriterien in das Ranking mit einbezieht.
  • 39. Aus welchen Quellen kommen die top10 organischen Ergebnisse? Beispiel Google (2008)
  • 40. Problemfelder •  Bevorzugung eigener Angebote –  In den organischen Ergebnissen –  In den Universal-Search-Ergebnissen •  Aufnahme in den Index –  Bsp. Paid Inclusion bei Google Shopping: Eintragungen werden kostenpflichtig –  Folgen weitere Dienste (Places, ...)? à Kennzeichnung als eigenes Angebot bzw. Partnerangebot als Lösung?
  • 42. Um wen geht‘s? 1.  Anbieter von Inhalten 2.  Anbieter von Suchsystemen 3.  Rechercheure
  • 43. Konsequenzen für Anbieter von Inhalten •  Es wird zunehmend schwieriger, sich auf den Suchergebnisseiten zu platzieren. –  Mehr Konkurrenz –  Schnellere Orientierung der Nutzer auf den Ergebnisseiten; mehr verschiedenartige Inhalte. –  Aktuelle Möglichkeiten der semantischen Auszeichnung nutzen •  Die (langsame) Wende von Dokumenten zu Fakten bzw. Informationszusammenstellungen erfordert ein Umdenken hinsichtlich der Sichtbarkeit in Suchmaschinen bzw. deren Traffic-Vermittlung.
  • 47. Konsequenzen für Anbieter von Suchsystemen •  Das in den Web-Suchmaschinen erlernte Suchverhalten wird auf andere Systeme übertragen –  Navigationsorientierte Anfragen beantworten –  Suchvorschläge während der Eingabe –  Zusammenstellung der Suchergebnisseiten –  Möglichkeiten zur Kollaboration (soziale Netzwerke) geben
  • 48. Konsequenzen für Rechercheure •  Suchmaschinen sind weniger denn je neutrale Informationsvermittler –  Eigeninteressen der Suchmaschinen beachten –  Gezielte Auswahl der passenden Informationsquellen •  „Gegensteuern“ gegen den „Popularitätsbias“ der Suchmaschinen –  Personalisierung bzw. Suchanfrageinterpretation ausschalten; Bsp. Google –  Populäre Websites aus der Suche ausschließen; Bsp. Millionshort
  • 49. Vielen Dank für Ihre Aufmerksamkeit Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg dirk.lewandowski@haw-hamburg,de Twitter: Dirk_Lew http://www.bui.haw-hamburg.de/ lewandowski.html