SlideShare uses cookies to improve functionality and performance, and to provide you with relevant advertising. If you continue browsing the site, you agree to the use of cookies on this website. See our User Agreement and Privacy Policy.
SlideShare uses cookies to improve functionality and performance, and to provide you with relevant advertising. If you continue browsing the site, you agree to the use of cookies on this website. See our Privacy Policy and User Agreement for details.
Successfully reported this slideshow.
Activate your 14 day free trial to unlock unlimited reading.
1.
Things, not Strings
ADV Tagung - Suchstrategien für heute und morgen
12. November, 2014
Dr. Bernhard Haslhofer
Data Scientist
AIT - Austrian Institute of Technology
bernhard.haslhofer@ait.ac.at
2.
Things, not Strings
http://googleblog.blogspot.co.at/2012/05/introducing-knowledge-graph-things-not.html
22.
Schritte / Probleme
• Named Entity Detection: “…EM-Qualifikation gegen
Russland: So geht Marcel Koller mit dem David Alaba-
Ausfall um…”
• Named Entity Disambiguation: “…Aufregendes Derby
lässt die Austria aufatmen…”
(Austria = Fußballverein/Land)?
• Named Entity Linkage/Resolution:
• David Alaba = http://dbpedia.org/resource/David_Alaba
• Austria = http://www.freebase.com/m/03mp37
22
23.
Tools
• AlchemyAPI (http://www.alchemyapi.com/):
• identifiziert eine Vielzahl von Entitätstypen (Personen,
Orte, Ereignisse, etc.) in Dokumenten
• unterstützt DBPedia, Freebase
• DBPedia Spotlight (https://github.com/dbpedia-spotlight):
• annotiert DBPedia Entitäten in Dokumenten
• ….
23
25.
• Heutige und zukünftige Suchstrategien basieren
auf Volltextsuche + Knowledge Graph
• Google Knowledge Graph
• Microsoft Bing Satori Knowledge Base
• …
25
26.
• Identifikation, Extraktion und Verlinkung von Dingen
“Things” gewinnt zunehmend an Bedeutung
• Verfügbarkeit offener, strukturierter Daten ist
essentiell zum Aufbau von Knowledge Graphs
26
28.
• Knowledge Base/Graph
• ist Voraussetzung für Question-Answering Systeme (z.b., IBM
Watson)
• bildet Basis für natürlichsprachige Suche
• ermöglicht Antizipation zukünftiger Suchanfragen
28