12 - Linked Data Engineering - Semantic Web Technologien, WS 2011/12

1,785 views
1,708 views

Published on

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,785
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
69
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

12 - Linked Data Engineering - Semantic Web Technologien, WS 2011/12

  1. 1. Semantic Web Technologien Vorlesung Dr. Harald Sack Hasso-Plattner-Institut für Softwaresystemtechnik Universität Potsdam Wintersemester 2011/12 Blog zur Vorlesung: http://wwwsoup2011.blogspot.com/Dienstag, 17. Januar 12
  2. 2. Semantic Web TechnologienWiederholung2 a l i c o g ng t o l r i On ee i n ng E Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  3. 3. Semantic Web Technologien Vorlesungsinhalt3 1. Einführung 2. Semantic Web Basisarchitektur Die Sprachen des Semantic Web - Teil 1 3. Wissensrepräsentation und Logik Die Sprachen des Semantic Web - Teil 2 4. Semantic Web Anwendungen Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  4. 4. t ic a n S e m & n s o4 t a t i a c a d D l i k e p p i n A L W eb Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  5. 5. Semantic Web Technologien Vorlesungsinhalt 4. Semantic Web Anwendungen 4.1.Ontological Engineering 4.2.Linked Data Engineering 4.3.Semantic Search 4.4.Aktuelle Projekte: Yovisto, mediaglobe und Semantic Media Explorer Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  6. 6. 6 4.1 Linked Data Engineering 4.1.1 APIs vs. Linked Data 4.1.2 Linked Data Principles 4.1.3 Linked Data @ Work 4.1.4 Linked Data Research Challenges Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  7. 7. Wie beschaffen wir uns eigentlich Informationen....? Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12 Turmbau zu Babel, Pieter Brueghel, 1563
  8. 8. Information und wo man sie findet •Wie beschaffen wir uns eigentlich Informationen über Dinge?8 •...etwa über ein Buch? Sack Harald •...über einen Film? ng urnau Stiftu Friedrich M •...über abstrakte Konzepte? Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12 Turmbau zu Babel, Pieter Brueghel, 1563
  9. 9. Wir schlagen einfach unter dem jeweiligen NAMEN nach...9 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  10. 10. Information und wo man sie findet •...Wir schlagen einfach unter den entsprechenden Namen nach10 Friedrich Murnau Stiftung Sack Harald „Brave New World“ „Der blaue Engel“ „Rache / Revenge“ Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  11. 11. Information und wo man sie findet •...früher ging man in die Bibliothek11 Brave New World siehe auch Schöne neue Welt Welt wohin? : ein Roman der Zukunft Wackere neue Welt : ein Roman der Zukunft kontrolliertes Vokabular Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  12. 12. Information und wo man sie findet •...früher ging man in die Bibliothek12 Brave New World. - Aldous H U X L E Y. - The Albatros Continental Library, 47 Metadaten (Hamburg usw., Albatros Verlag, 1933) 257 S. 8“ II 1, 2506, 34548 Identifier/ Locator Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  13. 13. Information und wo man sie findet •...heute geht man ins WWW13 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam http://www.worldcat.orgDienstag, 17. Januar 12
  14. 14. Information und wo man sie findet •...heute geht man ins WWW14 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam http://www.worldcat.orgDienstag, 17. Januar 12
  15. 15. Information und wo man sie findet •Ist Information heute nicht im WWW vorhanden,15 kann sie nur schwer gefunden werden (wenn überhaupt...) HTTP HTML JDBC Web-Server Datenbank Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  16. 16. Das WWW heute... •Das WWW ist für die Nutzung durch den Menschen bestimmt16 •Das WWW basiert auf der Markupsprache HTML •HTML beschreibt •wie Informationen dargestellt werden sollen (XHMLT + CSS), •wie Informationen miteinander verknüpft werden können, •aber nicht, was diese Informationen bedeuten…. bedarf der Interpretation durch den Menschen... Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  17. 17. Das WWW heute... •Daten selbst sind verschlossen in abgeschirmten „Datensilos“17 •Andere Applikationen können diese Daten weder zugreifen noch weiterverarbeiten Datenbank Datenbank Datenbank Datenbank Datenbank Datenbank Datenbank Datenbank Datenbank Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  18. 18. Das WWW heute... •Aber es gibt eine ganze Reihe unterschiedlicher (proprietärer)18 Web-APIs, Austauschdatenformate und darauf aufbauende Mashups Mashup Web Web Web Web API 1 API 2 API 3 API 4 Datenbank 1 Datenbank 2 Datenbank 3 Datenbank 4 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  19. 19. Die Probleme liegen auf der Hand....19 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam http://www.w3.org/2009/Talks/0204-ted-tbl/#(22)Dienstag, 17. Januar 12
  20. 20. Also auch die Lösung... •...Öffnen der proprietären Datensilos20 •...Veröffentlichung aller Daten von allgemeinem Interesse •...und zwar so, dass •andere Anwendungen diese Daten zugreifen, benutzen und weiterverarbeiten können und •alle Anwendungen sich zusätzliche (Meta)daten zu den verfügbaren Daten beschaffen können Datenbank 1 Datenbank 2 Datenbank 3 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  21. 21. Also auch die Lösung... •...Anwendungen schlagen unter dem jeweiligen Namen die21 zugehörigen (Meta)daten im Web nach tung M urnau Stif Friedrich http://dbpedia.org/resource/Der_Blaue_Engel http://dbpedia.org/resource/Brave_New_World Harald Sack http://dbpedia.org/resource/Revenge Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  22. 22. Also auch die Lösung... • Nutze semantische Technologien,22 •um strukturierte Daten im Web zu publizieren •um Verbindungen von einer Datenquelle zu Daten aus anderen Datenquellen zu ziehen RDF Data RDF Data RDF Data RDF Data RDF Links RDF Links RDF Links Datenbank 1 Datenbank 2 Datenbank 3 Datenbank 4 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  23. 23. 23 4.1 Linked Data Engineering 4.1.1 APIs vs. Linked Data 4.1.2 Linked Data Principles 4.1.3 Linked Data @ Work 4.1.4 Linked Data Research Challenges Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  24. 24. Linked Data and the ‘Web of Data‘24 ■ Begriff wurde von geht auf Idee von Tim Berners-Lee zurück (Tim Berners-Lee, Linked Data, 2006, http://www.w3.org/DesignIssues/LinkedData.html) □ Menge von Best practices zur Veröffentlichung und Verknüpfung von strukturierten Daten im Web □ Grundannahme: Der Wert (Nützlichkeit) von Daten im Web steigt je stärker diese mit Daten aus anderen Datenquellen verknüpft sind. Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  25. 25. Linked Data25 ■ Begriff wurde von geht auf Idee von Tim Berners-Lee zurück (Tim Berners-Lee, Linked Data, 2006, http://www.w3.org/DesignIssues/LinkedData.html) The Web of data is about a data and naming model on the Web M.Hausenblas, Quick Linked Data Introduction, http://www.slideshare.net/mediasemanticweb/quick-linked-data-introduction Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  26. 26. 26 Linked Data Principles (1) Use URIs as names for things. (2) Use HTTP URIs, so that people can look up those names. (3) When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL) (4) Include links to other URIs, so that they can discover more things. Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  27. 27. Linked Data Principles (1) Use URIs as names for things.27 • URIs identifizieren nicht nur Dokumente, sondern beliebige reale Objekte und abstrakte Konzepte http://wwwsoup2011.blogspot.com/ http://dbpedia.org/resource/Albert_Einstein http://musicbrainz.org/artist/b10bbbfc-cf9e-42e0-be17-e2c3e1d2600d Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  28. 28. Linked Data Principles28 (2) Use HTTP URIs, so that people can look up those names. • HTTP URIs (URLs) als global eindeutige Namen erlauben das „Nachschlagen“ (Dereferenzieren) der zugehörigen Information im Web • via http Content Negotiation • 303 URIs http Response Code 303 ,See Other‘ (redirect) • Hash URIs http://example.com/Harald#me Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  29. 29. Linked Data für Mensch und Maschine ■ URI soll sowohl für Menschen als auch für Computer29 interpretierbare Informationen liefern, d.h. (Thing) URI Accept: Accept: text/html application/rdf+xml (RDF data) (HTML page) Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  30. 30. Linked Data für Mensch und Maschine ■ Server liefert unterschiedliche HTTP Responses in Abhängigkeit30 vom HTTP-Accept-Header (Content Negotiation) http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/ Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  31. 31. Linked Data für Mensch und Maschine ■ URI soll sowohl für Menschen als auch für Computer31 interpretierbare Informationen liefern, d.h. (Thing) http://dbpedia.org/resource/Ernest_Hemingway Accept: Accept: text/html application/rdf+xml http://dbpedia.org/data/ http://dbpedia.org/page/ Ernest_Hemingway.rdf Ernest_Hemingway (RDF data) (HTML page) Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  32. 32. Linked Data Principles32 (3) When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL) • RDF als universelles Datenmodell zur Veröffentlichung strukturierter Daten im Web • Alle URIs in RDF-Graphen aus dem Web dereferenzierbar machen • Vermeide möglichst folgende RDF Konstrukte, da im Linked Data Kontext problematisch: • RDF Reifikation • RDF Collections und Containers • unbenannte Blank Nodes Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  33. 33. Linked Data Principles33 (4) Include links to other URIs, so that they can discover more things. • RDF-Verweise zwischen Daten in verschiedenen Datenquellen setzen, um (inhaltlich) zusammenhängende Informationen zu finden • Relationship Links Links auf externe LOD Entitäten, die mit den beschriebenen in Bezug stehen • Identity Links Links auf externe LOD Entitäten, die dasselbe Objekt oder Konzept beschreiben • Vocabulary Links Links auf Definitionen der beschriebenen LOD Entität Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  34. 34. Dereferenzierung von URIs ■ Bsp.: FOAF (Friend-of-a-Friend)34 <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:dbpedia=“http://dbpedia.org/resource/“> </rdf:RDF> ... <foaf:Person rdf:ID=“http://hpi.uni-potsdam.de/meinel/sack/foaf.rdf#harald“> <foaf:name>Harald Sack</foaf:name> <foaf:homepage rdf:resource="http://www.hpi.uni-potsdam.de/meinel/team/ sack.html"/> <foaf:based_near rdf:resource="dbpedia:Potsdam“/> ... </foaf:Person> ... Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  35. 35. Dereferenzierung von URIs ■ Bsp.: FOAF (Friend-of-a-Friend)35 rdf:type hpihs:harald foaf:Person foaf:name Harald Sack foaf:based_near dbpedia:Potsdam (dbpedia:Potsdam = http://dbpedia.org/resource/Potsdam) GET /resource/Potsdam HTTP/1.0 Accept: application/rdf+xml Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  36. 36. Dereferenzierung von URIs ■ Bsp.: FOAF (Friend-of-a-Friend)36 rdf:type hpihs:harald foaf:Person foaf:name Harald Sack foaf:based_near dbpedia:Potsdam GET /resource/Potsdam HTTP/1.0 150.833 Accept: application/rdf+xml n io o p ulat p e dia: dbpedia:Potsdam dbp sko s:s ub jec t dbpedia:Cities_in_Germany Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  37. 37. Dereferenzierung von URIs ■ Bsp.: FOAF (Friend-of-a-Friend)37 rdf:type hpihs:harald foaf:Person 150.833 foaf:name Harald Sack n o p u lati o i a:p db ped foaf:based_near dbpedia:Potsdam sk os :su bje ct skos:subject dbpedia:Berlin dbpedia:Cities_in_Germany ub ject s :s sko dbpedia:Jena Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  38. 38. Die Anwendung der Linked Data Prinzipien führt zur Entstehung eines ,Web of Data‘38 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  39. 39. Entwicklung des ,Web of Data‘39 May 2007 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  40. 40. Entwicklung des ,Web of Data‘40 Nov 2007 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  41. 41. Entwicklung des ,Web of Data‘41 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  42. 42. Entwicklung des ,Web of Data‘42 July 2009 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  43. 43. Entwicklung des ,Web of Data‘43 September 2010 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  44. 44. Entwicklung des ,Web of Data‘ 31 Mrd. RDF Tripel 504 Mio. Links44 September 2011 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  45. 45. Zentraler Hub innerhalb des Link Data Graphen ist die DBpedia http://dbpedia.org/45 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  46. 46. DBPedia □ Zentraler Bestandteil: Wikipedia Info-Boxen46 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  47. 47. DBPedia □ Zentraler Bestandteil: Wikipedia Info-Boxen47 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  48. 48. DBPedia □ Zentraler Bestandteil: Wikipedia Info-Boxen48 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  49. 49. DBPedia □ Zentraler Bestandteil: Wikipedia Info-Boxen49 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  50. 50. Semantic Mashups □ Semantic Mashups sind Anwendungen, die vernetzte RDF-50 Daten aus unterschiedlichen Datenquellen nutzen □ im Gegensatz zu diversen Schnittstellen und Ergebnisformaten regulärer Web-APIs bieten vernetzte Daten (Linked Data) folgende Vorteile: □ flexibles, standardisiertes Datenformat (RDF) □ standardisierter Zugriffsmechanismus (http) □ Möglichkeit, Verweise (RDF-Links) zwischen unterschiedlichen Datenquellen zu setzen » ermöglicht Navigation » wird von Suchmaschinen genutzt (Crawler) » Ermöglichung expressiver Suchfunktionalität über gesammelte Daten hinweg S. Auer, J. Lehmann, Ch. Bizer: Semantitsche Mashups auf Basis vernetzter Daten, in T. Pellegrini, A. Blumauer (Hrsg.): Social Semantic Web, Springer, 2009. Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  51. 51. Linked Data Quellen im Web □ native Publikation51 □ D2R-Server, OpenLink Virtuoso, Pubby, etc. □ Implementierung von Wrapper um existierende Anwendungen/APIs □ SIOC-Exporter für Wordpress, Drupal, phpBB,... □ RDF Book Mashup (Amazon API, Google Base-API,...) □ Linking Open Data Project □ Semantic Web Education and Outreach Arbeitsgruppe des W3C □ Verzeichnis aller bekannter Quellen vernetzter Daten mit offener Lizenz » DBPedia, Flickr, Open-Cyc, FOAF, SIOC, GeoNames, ... Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  52. 52. Browser für Linked Data ■ Unterschied zu nativen RDF-Browsern52 □ zu visualisierende RDF-Daten liegen nicht notwendigerweise im lokalen Repository, sondern verteilt im WWW □ erfordert dynamisches Nachladen von RDF Ressourcen ■ Tabulator (Tim Berners-Lee, MIT-Arbeitsgruppe) (T. Berners-Lee et al.: Tabulator: Exploring and analyzing linked data on the semantic web, in Proc. 3rd Int. Semantic Web User Interaction Workshop, 2006, http:// swui.semanticweb.org/swui06/papers/Berners-Lee/Berners-Lee.pdf) ■ OpenLink RDF Browser □ erlaubt Darstellung als Graph, Zeitreihe, Landkarte, etc. http://demo.openlinksw.com/DAV/JS/rdfbrowser/index.html ■ Zitgist Browser http://browser.zitgist.com/ ■ DISCO Browser http://sites.wiwiss.fu-berlin.de/suhl/bizer/ng4j/disco/ Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  53. 53. Suchmaschinen für Linked Data ■ Crawler-basiert, folgen Verknüpfungen von Datensätzen, um einen Index zu erstellen, an den Suchabfragen gerichtet werden53 können ■ Swoogle □ Stichwort-basierte Volltextsuche (Apache-Lucene), nutzt semantische Annotation nur begrenzt http://swoogle.umbc.edu/ ■ Semantic Web Search Engine (SWSE) □ nutzt zusätzlich rdf:type Properties zur Filterung der Suche http://swse.deri.org/ ■ Sindice http://www.sindice.com/ ■ Falcons □ mit Datenbrowser zur Analyse der Suchergebnisse http://iws.seu.edu.cn/services/falcons/ ■ Sig.ma - Semantic Information Mashup (auf der Basis von Sindice) http://sig.ma/ Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  54. 54. http://dbpedia.neofonie.com54 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  55. 55. Linked Open Data ■ offen zugängliche Linked Data Ressourcen im WWW, d.h. lizensiert als55 „Creative Common CC-BY“ ■ 5-Sterne Kriterien für Linked Open Data Available on the web (whatever format) but with an open licence, to be Open Data Available as machine-readable structured data (e.g. excel instead of image scan of a table) as (2) plus non-proprietary format (e.g. CSV instead of excel) All the above plus, Use open standards from W3C (RDF and SPARQL) to identify things, so that people can point at your stuff All the above, plus: Link your data to other people’s data to provide context Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  56. 56. 4.1 Linked Data Engineering 4.1.1 APIs vs. Linked Data56 4.1.2 Linked Data Principles 4.1.3 Linked Data @ Work 4.1.4 Linked Data Research Challenges Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  57. 57. Linked Data □ geordnet nach Kategorien57 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  58. 58. Linked Data User Generated Content Medien58 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  59. 59. Linked Data Publications59 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  60. 60. Linked Data60 Government Geographic Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  61. 61. 61 Cross-Domain Life Sciences Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam Linked DataDienstag, 17. Januar 12
  62. 62. Linking Open Data ■ Some statistics (as of 09/2011)62 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  63. 63. Linked Data Ontologien □ Ontologien halten die Linked Data Cloud zusammen63 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  64. 64. Linked Data Ontologien □ z.B. OWL □ owl:sameAs verknüpft identische Individuen64 □ owl:equivalentClass verknüpft äquivalente Klassen Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  65. 65. Linked Data Ontologien □ z.B. umbel (version 1.0, Feb. 2011) □ „Upper Mapping and Binding65 Exchange Layer“ □ Teilmenge von OpenCyc als RDF Tripel basierend auf SKOS und OWL2 □ Upper Ontology mit 28.000 Konzepten (skos:Concept) □ 46.000 Mappings zu DBpedia, geonames u.a. (owl:equivalentClass, rdfs:subClassOf) □ Links zu über 2 Mio Wikipedia-Seiten Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  66. 66. Linked Data Ontologien □ z.B. SKOS □ „Simple Knowledge Organization System“66 □ basiert auf RDF und RDFS und dient der Definition und zum Mapping von Voka- bularien und Ontologien □ skos:Concept (Klassen / Konzepte) □ skos:narrower □ skos:broader □ skos:related □ skos:exactMatch, skos:narrowMatch, skos:broadMatch, skos:relatedMatch Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  67. 67. Linked Data Driven Web Applications □ Notwendige Komponenten: □ Local RDF Store67 □ caching of results □ permanent storage □ Logic (Controller) und User Interface (-> Business Logic) □ (nicht LOD spezifisch) □ Data Integration component □ Daten direkt aus LOD-Cloud oder □ via Semantic Indexer (sindice, etc.) holen □ Data Republishing component □ Applikations-eigene Daten in Web of Data zurückschreiben Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  68. 68. Linked Data Driven Web Applications68 M.Hausenblas: Linked Data Applications, DERI Technical Report, 2009 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  69. 69. Linked Data Driven Web Applications □ Zugriff auf Linked Data erfolgt über SPARQL Endpoints □ ...aber wo finde ich SPARQL Endpoints?69 □ W3C: Currently Alive SPARQL Endpoints http://esw.w3.org/SparqlEndpoints □ SPARQL endpoints are a RESTful Web Services □ HTTP GET Request mit SPARQL query □ Result als □ XML, JSON, plaintext (SPARQL Select/Ask) □ RDF/XML, NTriples, Turtle, N3 (SPARQL Describe/Construct) □ Datenformat kann über HTTP Accept Header gesteuert werden z.B. Accept: application/sparql-results+json □ (oder über Parameter in der SPARQL query) Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  70. 70. Linked Data Driven Web Applications □ Einfacher geht es mit einer entsprechenden Library: □ SPARQL Javascript Library70 http://www.thefigtrees.net/lee/blog/2006/04/ sparql_calendar_demo_a_sparql.html □ ARC for SPARQL (PHP) http://arc.semsol.org/ □ RAP - RDF API für PHP http://www4.wiwiss.fu-berlin.de/bizer/rdfapi/index.html □ Jena/ARQ (Java) http://jena.sourceforge.net/ □ Sesame (Java) http://www.openrdf.org/ □ SPARQL Wrapper (Python) http://sparql-wrapper.sourceforge.net/ □ ... Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  71. 71. Linked Data Driven Web Applications □ Simples Beispiel mit Jena ARQ:71 import com.hp.hpl.jena.query.*; String service = "..."; // address of the SPARQL endpoint String query = "SELECT ..."; // your SPARQL query QueryExecution e = QueryExecutionFactory.sparqlService(service, query) ResultSet results = e.execSelect(); while ( results.hasNext() ) { ! ! QuerySolution s = results.nextSolution(); ! ! // ... } e.close(); Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  72. 72. Linked Data Driven Web Applications □ Komplexe SPARQL Abfragen über mehrere SPARQL72 Endpoints hinweg 1. Nacheinander Anfragen an verschiedene SPARQL Endpoints richten 2. Abfrage an eine LOD Repository Sammlung 3. Aufbau einer lokalen Kopie aus mehreren LOD-Quellen 4. Nutzung eines föderierten Abfragesystems a) Traditioneller Ansatz b) Link Traversal Based Query Execution Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  73. 73. Komplexe SPARQL Abfragen über mehrere SPARQL Endpoints hinweg 1. Nacheinander Anfragen an verschiedene SPARQL Endpoints richten73 □ Idee: Richte SPARQL Anfragen an weitere SPARQL-Endpoints basierend auf den Ergebnissen der vorangegangenen Abfragen □ d.h. Platzhalter in Query-Templates werden durch Ergebnisse der vorangegangenen SPARQL-Abfragen ersetzt Query1 Erg1 LOD2 Query2(Erg1) Erg2 LOD3 LOD1 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  74. 74. Komplexe SPARQL Abfragen über mehrere SPARQL Endpoints hinweg 1. Nacheinander Anfragen an verschiedene SPARQL Endpoints richten74 String s1 = "http://sparql.yovisto.com/"; String s2 = "http://dbpedia.org/sparql"; String qTmpl = "SELECT ?c WHERE{ <%s> <http://dbpedia.org/ontology/abstract> ?a }"; String q1 = "SELECT ?s WHERE { ..."; QueryExecution e1 = QueryExecutionFactory.sparqlService(s1,q1); ResultSet results1 = e1.execSelect(); while ( results1.hasNext() ) { ! QuerySolution s1 = results.nextSolution(); ! String q2 = String.format( qTmpl, s1.getResource("s").getURI() ); ! QueryExecution e2= QueryExecutionFactory.sparqlService(s2,q2); ! ResultSet results2 = e2.execSelect(); ! while ( results2.hasNext() ) { ! ! // ... ! } Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  75. 75. Komplexe SPARQL Abfragen über mehrere SPARQL Endpoints hinweg 1. Nacheinander Anfragen an verschiedene SPARQL Endpoints richten75 □ Vorteile: □ Abgefragte Daten sind stets aktuell □ Nachteile: □ Jeder der verwendeten Datensätze benötigt einen SPARQL Endpoint □ Programmlogik erforderlich □ ineffizient Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  76. 76. Komplexe SPARQL Abfragen über mehrere SPARQL Endpoints hinweg76 2. Abfrage an eine LOD Repository Sammlung □ Idee: Nutze einen vorhandenen SPARQL Endpoint, der den Zugang zu einer Menge von verschiedenen LOD Datensätzen ermöglicht □ = Data Centralization □ SPARQL Endpoints, über die eine Vielzahl der LOD-Datensätze zugegriffen werden können: □ http://uberblic.org □ http://lod.openlinksw.com/sparql Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  77. 77. Komplexe SPARQL Abfragen über mehrere SPARQL Endpoints hinweg77 2. Abfrage an eine LOD Repository Sammlung □ Vorteile: □ Benötigt keine spezielle Programmlogik □ Nachteile: □ abgefragte Daten sind möglicherweise nicht immer aktuell □ möglicherweise sind nicht alle benötigten Datensätze in der Sammlung enthalten Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  78. 78. Komplexe SPARQL Abfragen über mehrere SPARQL Endpoints hinweg78 3. Aufbau einer lokalen Kopie aus mehreren LOD Quellen □ Idee: Nutze einen lokalen SPARQL Endpoint und kopiere alle relevanten LOD Datensätze darauf □ = Data Centralization □ LOD Datensätze können gewonnen werden aus □ RDF Dumps (falls vorhanden) □ (Focused) Crawling □ z.B. Ldspider http://code.google.com/p/ldspider/ Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  79. 79. Komplexe SPARQL Abfragen über mehrere SPARQL Endpoints hinweg79 3. Aufbau einer lokalen Kopie aus mehreren LOD Quellen □ Vorteile: □ Benötigt keine spezielle Programmlogik □ Umfasst alle benötigten LOD Datensätze □ Unabhängig von der Verfügbarkeit der originalen SPARQL Endpoints □ Nachteile: □ Aufwand bzgl. Aufbau und Wartung des lokalen SPARQL Endpoints □ Kompliziert, wenn nicht auf RDF-Dumps zurückgegriffen werden kann □ Synchronisation mit den originalen Daten notwendig, d.h. abgefragte Daten sind möglicherweise nicht immer aktuell Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  80. 80. Komplexe SPARQL Abfragen über mehrere SPARQL Endpoints hinweg80 4. Nutzung eines föderierten Abfragesystems □ Idee (traditioneller Ansatz): Ein Mediator wird zwischen Query und Datenquellen geschalten, der die Query in Subqueries zerlegt und die Ergebnisse wieder zusammenfasst ry 1 S u bque LOD1 Query Mediator Subquery2 Su bq ue ry LOD2 3 LOD3 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  81. 81. Komplexe SPARQL Abfragen über mehrere SPARQL Endpoints hinweg81 4. Nutzung eines föderierten Abfragesystems □ Idee (traditioneller Ansatz): Ein Mediator wird zwischen Query und Datenquellen geschalten, der die Query in Subqueries zerlegt und die Ergebnisse wieder zusammenfasst 1 re sult LOD1 Result Mediator result2 res LOD2 ult 3 LOD3 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  82. 82. Komplexe SPARQL Abfragen über mehrere SPARQL Endpoints hinweg82 4. Nutzung eines föderierten Abfragesystems □ Vorteile: □ Benötigt keine spezielle Programmlogik □ Nachteile: □ Abgefragte LOD Daten müssen über aktiven SPARQL- Endpoint verfügen □ Abgefragte LOD-Datenquellen müssen im Voraus bekannt sein □ Neue bzw. unbekannte LOD-Datenquellen werden nicht berücksichtigt (!) Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  83. 83. Komplexe SPARQL Abfragen über mehrere SPARQL Endpoints hinweg83 4. Nutzung eines föderierten Abfragesystems Mit Link Traversal Based Query Execution □ Idee: Verknüpfe Auswertung der Query direkt mit Traversierung des RDF-Graphen Query: Suche Publikationen des Vortragenden eines yovisto-Videos speaker PND-id Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  84. 84. Query: Suche Publikationen des Vortragenden eines yovisto-Videos84 speaker PND-id http://www.yovisto.com/resource/video/6389 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  85. 85. Query: Suche Publikationen des Vortragenden eines yovisto-Videos85 speaker PND-id http://www.yovisto.com/resource/speaker/813 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  86. 86. Query: Suche Publikationen des Vortragenden eines yovisto-Videos86 speaker PND-id http://dbpedia.org/resource/Max_Planck owl:sameAs <http://d-nb.info/gnd/118594818> Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  87. 87. Query: Suche Publikationen des Vortragenden eines yovisto-Videos87 speaker PND-id http://d-nb.info/gnd/118594818 :118594818 :preferredNameForThePerson "Planck, Max" ; :publicationOfThePerson "Planck, Max: Sinn und Grenzen der exakten Wissenschaft. - 1942"@de ; :publicationOfThePerson "Planck, Max: Der Kausalbegriff in der Physik. - 1932"@de ; :publicationOfThePerson "Planck, Max: Religion und Naturwissenschaft. - 1938"@de ; :publicationOfThePerson "Planck, Max: Kausalgesetz und Willensfreiheit. - 1923"@de ; :publicationOfThePerson "Planck, Max: Determinismus oder Indeterminismus? Vortrag. - 1938"@de ; :publicationOfThePerson "Planck, Max: Positivismus und reale Auu00DFenwelt. - 1931"@de ; :publicationOfThePerson "Planck, Max: Sinn und Grenzen der exakten wissenschaft. - 1942"@de ; :publicationOfThePerson "Planck, Max: Significato e limiti della scienza esatta. - 1943"@de ; :publicationOfThePerson "Planck, Max: Wege zur physikalischen Erkenntnis. - 1944"@de . Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  88. 88. Komplexe SPARQL Abfragen über mehrere SPARQL Endpoints hinweg88 4. Nutzung eines föderierten Abfragesystems Mit Link Traversal Based Query Execution □ Implementierungen: □ Semantic Web Client library (SWClLib) for Java http://www4.wiwiss.fu-berlin.de/bizer/ng4j/semwebclient/ □ SQUIN http://squin.org □ Provides SWClLib functionality as a Web service □ Accessible like a SPARQL endpoint □ Vorteile: □ Benötigt keine spezielle Programmlogik Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  89. 89. Komplexe SPARQL Abfragen über mehrere SPARQL Endpoints hinweg89 4. Nutzung eines föderierten Abfragesystems Mit Link Traversal Based Query Execution □ Vorteile: □ Keine zusätzliche Programmlogik notwendig □ Datenbestände sind stets aktuell □ Nicht alle Datenbestände müssen im Voraus bekannt sein □ Nachteile: □ Online Query während Query Evaluation ist zeitaufwändiger als zentralisierte Abfrage □ ABER: lokaler RDF-Store fungiert als Cache □ Eventuell unvollständige Ergebnisse... Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  90. 90. 90 4.1 Linked Data Engineering 4.1.1 APIs vs. Linked Data 4.1.2 Linked Data Principles 4.1.3 Linked Data @ Work 4.1.4 Linked Data Research Challenges Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  91. 91. Linked Data Achievements ■ Extension of the Web with a91 data commons (31b RDF triples = facts) ■ Vibrant global RTD community ■ Industrial uptake starting (BBC, Thomson, Reuters, etc.) ■ Emerging governmental adoption in sight ■ Establishing Linked Data as a deployment path for the Semantic Web Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  92. 92. Linked Data Challenges ■ Coherence92 relatively few, expensively maintained links ■ Quality partly low quality data and inconsistencies ■ Performance still substantial penalties compared to relational database technologies ■ Data consumption large scale processing, schema mapping and data fusion still in its infancy ■ Usability Missing direct end user tools and network effect Sören Auer:"Linked Data: Now what?" ESWC2010 Panel Discussion Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  93. 93. 93 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  94. 94. 94 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  95. 95. Selected Linked Data Research Challenges (1) Crawling the Semantic Web95 (2) Structural Analysis (3) Content-based Analysis (4) Data Cleansing (5) Heuristics for Ranking Semantic Web Data (6) Augmenting Semantic Web Infrastructure Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  96. 96. So what? ■ Interesting Facts to find out about96 Semantic Web & Linked Data ■ How big is the Semantic Universe? ■ # tripel ■ # documents ■ # interlinking ■ Linking Open Data is only registered vocabulary/data in the LOD- Wiki → 31b RDF triples ■ What else is out there ... and how much of it? ■ ...and how do we get it? Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  97. 97. (1) Crawling the Semantic Web ■ Of course we are not the first to be out there...97 ■ Swoogle Li Ding et al: Finding and Ranking Knowledge on the Semantic Web, ISWC 2005. ■ Scutter/Slug Leigh Dodds: Slug: A Semantic Web Crawler, 2006 ■ Sindice Giovanni Tumarello et al: Sindice.com - weaving the open linked data, ISWC 2007 → 2.1b RDF triples ■ SWSE Andreas Harth et al: SWSE: Objects before Documents, Semantic Web Challenge 2008, ISWC 2008 → 1.1b RDF triples ■ Falcons G.Cheng et al.:Falcons: Searching and Browsing Entities on the Semantic Web, WWW17 2008. → 2.9b RDF triples Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  98. 98. (2) Analyzing the Semantic Web I - Structural Analysis ■ Again we are not the first to be out there... ■ Structural Analysis of the ,early‘ WWW98 unconnected components appendices appendices IN SCC OUT 44m nodes 56m nodes 44m nodes tunnels unconnected components A. Broder et al.: Graph structure in the Web. In Comput. Netw. 33, 1-6 (Jun. 2000), 309-320. Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  99. 99. (2) Analyzing the Semantic Web I - Structural Analysis ■ Again we are not the first to be out there... ■ Structural Analysis of the ,early‘ Semantic Web99 Weiyi Ge et al.: Object Link Structure in the Semantic Web, ESWC 2010 ■ Experimental Setup ■ 18m RDF documents (Falcons crawl 2009) ■ 110m nodes with 190m edges ■ Analysis of RDF link graph ■ average node degree: ≈3.4 ■ effective diameter: ≈11.5 ■ Largest connected component: ≈88% of all nodes Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  100. 100. (3) Analyzing the Semantic Web II Content-Based Analysis100 ■ Again we are not the first to be out there... A. Hoigan et al: Weaving the Pedantic Web, LDOW 2010 ■ 150k documents with more than 12m RDF triples ■ Discovered categories of symptoms: ■ incomplete → dead links ■ incoherent → no correct interpretation (local) ■ hijack → no correct interpretation (remote) ■ inconsistent → contradictions Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  101. 101. (3) Analyzing the Semantic Web II Content-Based Analysis101 ■ Again we are not the first to be out there... Urbani et al: OWL Reasoning with WebPIE: Calculating the Closure of 100 Billion Triples, ESWC 2010 ■ Artificial Benchmark dataset used Leigh University Benchmark (LUBM) with 100b RDF triples ■ Computing the transitive closure (= reasoning) ■ Making implicit knowledge explicit Fabio Capello San Canzian d‘Isonzo hasBirthPlace class membership is a can be deduced Person hasBirthPlace Place Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  102. 102. (4) Analyzing the Semantic Web III - Data Cleansing ■ trying to clean out Linked Open Data and102 possibly also (partially) the Semantic Web... (1)Identify inconsistencies and ambiguities by (automated) content-based analysis (2)Solve inconsistencies & ambiguities ■ if possible by reasoning ■ else by crowdsourcing (game-based evaluation, etc.) Cleaning out the Augean stables... AUGEAN-STABLES: Extremely nasty and smelly warehouses of filth, straw Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam and manureDienstag, 17. Januar 12
  103. 103. (5) Analyzing the Semantic Web IV - Relevance Ranking ■ Linked Data provides (unbiased) knowledge103 ■ unbiased = no distinction of what is important, what is not important ■ e.g., Albert Einstein ■ > 600 facts (triples) ■ > 80 properties ■ no ranking ■ no relevance http://dbpedia.org/page/Albert_Einstein Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  104. 104. (5) Analyzing the Semantic Web IV - Relevance Ranking ■ We have developed heuristics for ranking objects and properties, e.g.104 :AmericanVegetarian rdf:type rdf:type rdf:type :Albert_Einstein :Scientist :Bill_Cosby rdf:type :doctoralAdviser :Alfred_Kleiner considered to be relevant Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  105. 105. 105 4.1 Linked Data Engineering 4.1.1 APIs vs. Linked Data 4.1.2 Linked Data Principles 4.1.3 Linked Data @ Work 4.1.4 Linked Data Research Challenges Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  106. 106. Semantic Web Technologien Vorlesungsinhalt 4. Semantic Web Anwendungen 4.1. Ontological Engineering 4.2. Linked Data Engineering 4.3. Semantic Search 4.4. Aktuelle Projekte: Yovisto, mediaglobe und Semantic Media Explorer Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  107. 107. Nächste Vorlesung:107 t i c a n S e m c h a r S e Albrecht Dürer: Melancholia I, 1514 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  108. 108. 4. Semantic Web Anwendungen 4.2 Linked Data Engineering108 Literatur • T. Heath, Ch. Bitzer Linked Data - Evolving the Web into a Global Data Space, Morgan & Claypool, 2011. Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12
  109. 109. 4. Semantic Web Anwendungen 4.2 Linked Data Engineering109 Materialien □Blog http://wwwsoup2011.blogspot.com/ □Webseite http://www.hpi.uni-potsdam.de/studium/lehrangebot/veranstaltung/ semantic_web_technologien.html □bibsonomy - Bookmarks http://www.bibsonomy.org/user/lysander07/swt1112_13 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 17. Januar 12

×