• Save
 SoSe 2013 | IT-Zertifikat: AMM - Semantic Web und das Resource Description Framework
Upcoming SlideShare
Loading in...5
×
 

SoSe 2013 | IT-Zertifikat: AMM - Semantic Web und das Resource Description Framework

on

  • 264 views

 

Statistics

Views

Total Views
264
Slideshare-icon Views on SlideShare
195
Embed Views
69

Actions

Likes
0
Downloads
0
Comments
0

1 Embed 69

http://www.hki.uni-koeln.de 69

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

     SoSe 2013 | IT-Zertifikat: AMM - Semantic Web und das Resource Description Framework SoSe 2013 | IT-Zertifikat: AMM - Semantic Web und das Resource Description Framework Presentation Transcript

    • Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // jan.wieners@uni-koeln.de Daten- und Metadatenstandards Sommersemester 2013 03. Juli 2013 – Semantic Web und das Resource Description Framework
    • Ausgangspunkt: Das World Wide Web (WWW)  Einschränkungen des WWW Semantic Web  Problemstellung, Intention, Worum geht„s?  Wissensrepräsentation  Ontologien  Mikroformate  RDF  RDF / XML  Anwendung: FOAF Sitzungsüberblick
    • World Wide Web
    •  Internet vs. WWW  WWW: Sehr großer Ressourcenfundus:  Dokumente bzw. Textuelle Information (HTML-Dokumente, PDF, etc.)  Bilder  Videodateien  …  1989 am CERN entwickelt  Intention: Austausch von Forschungsergebnissen  Konzepte: Das WWW…  bietet Mechanismen, um auf Dokumente des Internets zugreifen zu können  HTTP, sowie die Eindeutige Referenzierung von Inhalten: URL  bietet eine Syntax (HTML), um Dokumente anzuzeigen und miteinander zu verknüpfen (Hyperlinks) World Wide Web
    • Aufruf einer Website - HTTP  Client stellt Anfrage an Server  Server beantwortet Anfrage, d.h. liefert ein Dokument / eine Ressource zurück  HTML definiert eine Syntax, die von Rechnern verstanden werden kann  HTML sagt dem Rechner, wie das Dokument angezeigt werden soll World Wide Web
    • …die Nadel im Heuhaufen…?
    • Suchmaschinen: Google
    • Suchmaschinen: Google
    • „Magic“:  Rechtschreibfehler: „accidentally“ vs. „acidentally“ It‘s magic?
    • „Magic“ II:  Ranking: Sortierung der Treffer von hochrelevanten zu weniger relevanten Treffern „Magic“ III:  Performance: It‘s magic?
    • „What„s wrong with the web?“ – die Grenzen des WWW I. „Wer ist Jan Wieners?“  Suchanfrage: Wieners  [Wer], [ist] weniger relevante Suchterme World Wide Web
    • Probleme:  Prüfung der Suchergebnisse auf Benutzerseite - daran haben wir uns gewöhnt  Gefahr / Dilemma: Die Suchanfrage ist überspezifiziert  Durch Angabe weiterer Suchterme schränken wir die Trefferliste erneut ein  Weiteres Problem: Es könnten Seiten im WWW existieren, die sich mit dem Suchbegriff beschäftigen, ihn jedoch nicht nennen, z.B. Jan W.  (Zunehmendes Problem „Filter Bubble“: Wir bekommen nur die Suchergebnisse, die Suchmaschinenanbieter für uns vorsehen) World Wide Web
    • „What„s wrong with the web?“ – die Grenzen des WWW  II. „Zeige mir Fotos von Paris“  Suchmaschinen versuchen (mitunter), die Bedeutung eines Bildes / das im Bild dargestellt durch den Kontext zu erschließen:  Dateiname  Text, der sich in Bildnähe befindet
    • „What„s wrong with the web?“ – die Grenzen des WWW  III. „Finde Musik, die ich mögen könnte“  Knackpunkt: Hintergrundwissen – Welche Musik mag ich derzeit? (Musikgeschmack verändert sich mitunter) World Wide Web
    • Oh weh, was meint sie / er damit bloß??? Den Computermechanismen mangelt„s an Wissen! „knowledge gap“:  Probleme im Verständnis natürlicher Sprache  Interpretation des Inhaltes von Bildern oder anderen multimedialen Dingen  Computer verfügt nicht über Hintergrundwissen über das der Benutzer / die Benutzerin verfügt  Computer verfügt nicht über Hintergrundwissen über die Benutzerin / den Benutzer
    • Paradigmenwechsel: von passiver Rechenleistung zu aktiver Rechenleistung (Verständnis der Inhalte) Das Semantic Web will Computern helfen, die Bedeutung hinter den Webseiten zu "verstehen“  Das derzeitige WWW dreht sich um Dokumente  Das Semantic Web dreht sich um Dinge (Menschen, Musik, Filme), um Konzepte Eine Möglichkeit: Einbettung semantischer Information in HTML-Seiten Semantic Web
    • Semantic Web
    • Ach so ist das gemeint! …hätte sie / er das nicht gleich sagen können?!? Wissenslücke zwischen Benutzer und Computer mindern  Bereitstellung von Wissen in einer Art und Weise, in der es von Computern verarbeitet werden und für weiteres Schließen verwendet werden kann  Z.B.: Bereitstellung von (semantischen) Metainformationen, die die Inhalte der Website beschreiben (description, keywords, etc.)
    • “Home pages typically say things such as:”  "My name is..."  "I work for..."  "I'm interested in..."  "I live near..."  "My blog is..."  "I write in this weblog..."  "You can see me in this picture..."  "My Public Key is ..." “FOAF is a way to say all those things, but so that computers can interpret it. Computers can't understand English yet, so we have to be a little more precise in how we say these things. FOAF is a way of saying these things for computers.” Friend-of-A-Friend (FOAF)
    • Bild + Metadaten  Schlüsselwörter  Georeferenzierung ◦ Adresskodierung (Postanschrift) ◦ Zuweisung von Koordinaten (Geotagging) ◦ …
    •  Konzept des Semantic Web formuliert 1996 von Tim Berners-Lee  Kerntechnologien (logikbasierte Sprachen zur Representation von Wissen und (automatisiertem) Schließen) entwickelt im Forschungsfeld der Künstlichen Intelligenz.  Standards: W3C  Ursprüngliche Intention: Annotation – Anreicherung der Inhalte im WWW durch Metadaten Semantic Web
    • Kurzer Exkurs: Künstliche Intelligenz
    • Kurzer Exkurs: Künstliche Intelligenz Menschliches Denken Rationales Denken „[Die Automatisierung von] Aktivitäten, die wir dem menschlichen Denken zuordnen, Aktivitäten wie beispielsweise Entscheidungsfindung, Problemlösung, Lernen..“ (Bellman, 1978) „Die Studie mentaler Fähigkeiten durch die Nutzung programmiertechnischer Modelle.“ (Charniak und McDermott,1985) Menschliches Handeln Rationales Handeln „Das Studium des Problems, Computer dazu zu bringen, Dinge zu tun, bei denen ihnen momentan der Mensch noch überlegen ist.“ (Rich und Knight, 1991) „Computerintelligenz ist die Studie des Entwurfs intelligenter Agenten.“ (Poole et al., 1998) Fokussierungsweisen von KI nach Russell / Norvig
    • Ein Knackpunkt: Das Semantic Web macht Arbeit. Benutzerinnen und Benutzer müssen neben Inhalten auch Metadaten, d.h. beschreibende Inhalte bereitstellen Bei Webseiten: Mikroformate …zurück zum Semantic Web
    • Beispiel: Mikroformat „hCard“ (vgl. http://de.wikipedia.org/wiki/Mikroformate): XHTML, einfach: <div> <div>Max Mustermann</div> <div>Musterfirma</div <div>01234/56789</div> <a href="http://example.com/">http://example.com/</a> </div> Im Mikroformat „hCard“: <div class="vcard"> <div class="fn">Max Mustermann</div> <div class="org">Musterfirma</div> <div class="tel">01234/56789</div> <a class="url" href="http://example.com/">http://example.com/</a> </div> Semantic Web
    • Wissensrepräsentation: Ontologien und Ontologiesprachen (Ontologie: Wissenschaft vom Sein des Seienden)  Ontologien werden formuliert in formalen Sprachen mit einer wohldefinierten Syntax  Ontologien gründen auf der Arbeit von Gemeinschaften (Communities)  RDF und OWL = am häufigsten verwendete Sprachen Ontologien  Leichtgewichtige: Unterscheidungen zwischen Klassen, Instanzen und Eigenschaften, jedoch nur minimale Beschreibung der Konzepte  Schwergewichtige: Machen„s möglich, präziser zu beschreiben, wie Klassen von anderen Klassen abgeleitet sind  In der Praxis: leichtgewichtige Ontologien Semantic Web
    • Das Resource Description Framework (RDF)
    • The Resource Description Framework (RDF)  Erfunden, um Ressourcen im WWW zu beschreiben  Domänenunabhängig, d.h. kann auch dazu verwendet werden, Entitäten der realen Welt zu beschreiben  RDF ist eine einfache Modellierungssprache, ist jedoch die Grundlage für komplexere Sprachen wie OWL RDF
    • W3C (http://www.w3schools.com/rdf/rdf_intro.asp):  RDF stands for Resource Description Framework  RDF is a framework for describing resources on the web  RDF is designed to be read and understood by computers  RDF is not designed for being displayed to people  RDF is written in XML  RDF is a part of the W3C's Semantic Web Activity  RDF is a W3C Recommendation RDF
    • <?xml version="1.0"?> <RDF> <Description about="http://www.hki.uni-koeln.de/wieners"> <author>Jan Wieners</author> <homepage> http://www.hki.uni-koeln.de </homepage> </Description> </RDF> RDF (reduziert, ohne Namensräume)
    • <?xml version="1.0"?> <RDF> <Description about="http://www.hki.uni-koeln.de/wieners"> <author>Jan Wieners</author> <homepage> http://www.hki.uni-koeln.de </homepage> </Description> </RDF> RDF (reduziert, ohne Namensräume) Ressource (resource)  Worum geht„s?
    • <?xml version="1.0"?> <RDF> <Description about="http://www.hki.uni-koeln.de/wieners"> <author>Jan Wieners</author> <homepage> http://www.hki.uni-koeln.de </homepage> </Description> </RDF> RDF (reduziert, ohne Namensräume) Ressource (resource)  Worum geht„s? Eigenschaft (property)
    • <?xml version="1.0"?> <RDF> <Description about="http://www.hki.uni-koeln.de/wieners"> <author>Jan Wieners</author> <homepage> http://www.hki.uni-koeln.de </homepage> </Description> </RDF> RDF (reduziert, ohne Namensräume) Ressource (resource)  Worum geht„s? Eigenschaft (property) Eigenschaftswert (property value)
    • <?xml version="1.0"?> <RDF> <Description about="http://www.hki.uni-koeln.de/wieners"> <author>Jan Wieners</author> <homepage> http://www.hki.uni-koeln.de </homepage> </Description> </RDF> RDF (reduziert, ohne Namensräume) Ressource (resource)  Worum geht„s? Eigenschaft (property) Eigenschaftswert (property value) RDF-Statement = Ressource + Eigenschaft + Eigenschaftswert „Jan Wieners ist der Autor von http://www.hki.uni- koeln.de/wieners“
    • <?xml version="1.0"?> <RDF> <Description about="http://www.hki.uni-koeln.de/wieners"> <author>Jan Wieners</author> <homepage> http://www.hki.uni-koeln.de </homepage> </Description> </RDF> RDF (reduziert, ohne Namensräume) Ressource (resource)  Worum geht„s? Eigenschaft (property) Eigenschaftswert (property value) RDF-Statement: Jan Wieners ist der Autor von http://www.hki.uni-koeln.de/wieners Subjekt: http://www.hki.uni-koeln.de/wieners Prädikat: “ist der Autor von” Objekt: Jan Wieners
    • RDF (mit Namensräumen) <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:hki="http://www.hki.uni-koeln.de"> <rdf:Description rdf:about="http://www.hki.uni- koeln.de/ITZert"> <hki:author>Jan Wieners</hki:author> <hki:homepage>http://www.hki.uni- koeln.de/wieners</hki:homepage> </rdf:Description> </rdf:RDF>
    • <?xml version="1.0"?> <RDF> <Description about="http://www.hki.uni-koeln.de/wieners"> <author>Jan Wieners</author> <homepage> http://www.hki.uni-koeln.de </homepage> </Description> </RDF> RDF Ressource (resource)  Worum geht„s? Eigenschaft (property) Eigenschaftswert (property value)  http://www.w3.org/RDF/Validator/
    • <?xml version="1.0"?> <RDF> <Description about="http://www.hki.uni-koeln.de/wieners"> <author>Jan Wieners</author> <homepage> http://www.hki.uni-koeln.de </homepage> </Description> </RDF> RDF Ressource (resource)  Worum geht„s? Eigenschaft (property) Eigenschaftswert (property value)  http://www.w3.org/RDF/Validator/
    • Unterscheidung:  Ressourcen: Alles, was über einen Uniform Resource Identifier (URI) referenziert werden kann  Eigenschaften (properties): Eigenschaften von Ressourcen  Ausdrücke (Expressions) werden geformt mit Tripeln in der Form (Subjekt, Prädikat, Objekt)  Ausdrücke (statements) = resource + properties RDF
    • Intention:  Globaler, eindeutiger Bezeichner für Entitäten  Unterklassen: URL, URN  Beispiele:  http://de.wikipedia.org/wiki/Uniform_Resource_Ide ntifier  urn:isbn:4-7980-1224-6  mailto:birgit.mustermann@example.org  geo:48.33,14.122;u=22.5 Uniform Resource Identifier
    • Namespaces / Namensräume  Klassen und Eigenschaften unterhalb des gleichen URI bilden einen Namespace. Beispiel: Dublin Core  http://purl.org/dc/elements/1.1/title  http://purl.org/dc/elements/1.1/creator  http://purl.org/dc/elements/1.1/date FOAF  http://xmlns.com/foaf/0.1 RDF
    • RDF/XML und die Praxis: FOAF
    • „The FOAF ("Friend of a Friend") project is a community driven effort to define an RDF vocabulary for expressing metadata about people, and their interests, relationships and activities.” Grundaufbau eines FOAF-Dokumentes: RDF / XML und FOAF <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <!– Hier kommt das FOAF-XML rein --> </rdf:RDF>
    • Hinzufügen einer Person und eines Namens: RDF / XML und FOAF <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:Person> <foaf:name>Jan Wieners</foaf:name> </foaf:Person> </rdf:RDF>
    • Hinzufügen einer Email-Adresse: RDF / XML und FOAF <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:Person> <foaf:name>Jan Wieners</foaf:name> <foaf:mbox rdf:resource="mailto:jan.wieners@uni-koeln.de"/> </foaf:Person> </rdf:RDF>
    • Relationen zu anderen Personen ergänzen: <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:Person> <foaf:name>Jan Wieners</foaf:name> <foaf:mbox rdf:resource="mailto:jan.wieners@uni-koeln.de"/> </foaf:Person> <foaf:Person rdf:nodeID="Joyce"> <foaf:name>James Joyce</foaf:name> <rdfs:seeAlso rdf:resource="http://www.example.com/jamesjoyce.rdf"/> </foaf:Person> <foaf:Person rdf:nodeID="Jan"> <foaf:name>Jan Wieners</foaf:name> <foaf:knows rdf:nodeID="Joyce"/> <foaf:knows> <foaf:Person rdf:nodeID="Murakami"> <foaf:name>Haruki Murakami</foaf:name> </foaf:Person> </foaf:knows>
    • Beschreiben Sie sich selbst mit den Begriffen aus FOAF in RDF / XML. Ergänzen Sie Freund- und Bekanntschaften. Das FOAF- Vokabular finden Sie erläutert unter http://xmlns.com/foaf/spec/. Prüfen Sie Ihre Arbeit mit dem W3C-Validator unter http://www.w3.org/RDF/Validator Startpunkt: RDF - Übung <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <!– Hier kommt das FOAF-XML rein --> </rdf:RDF>
    • /