Linked Open (Library) Data
Upcoming SlideShare
Loading in...5
×
 

Linked Open (Library) Data

on

  • 1,182 views

 

Statistics

Views

Total Views
1,182
Views on SlideShare
1,182
Embed Views
0

Actions

Likes
1
Downloads
4
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Linked Open (Library) Data Linked Open (Library) Data Presentation Transcript

  • Linked Open (Library) Data Fabian Fürste Universitätsbibliothek TU Berlin 12.12.12 http://bit.ly/RuxQIC
  • Der Typ da vorne …• Web-Anwendungen an der Universitätsbibliothek der TU Berlin• Momentaner Schwerpunkt: Forschungsdaten, Repositorien• Bibliothekswissenschaft & Neueste Geschichte an der HU Berlin• > 10 Jahre Webentwicklung• Idee: Anwendung, die bibliographische Daten analysieren und visuell darstellen kann• Problem: kein Zugriff auf Testdaten
  • Web HTML
  • WebHyperlinks verbinden Dokumente
  • Web ? ? ?Aber: die Bedeutung der Verbindung bleibt unklar
  • Semantic Web se·man·tic adj. of or relating to meaning,especially in language.
  • Semantic WebTim Berners Lee Vision Tim Berners-Lee
  • Semantic Web “The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation.” “In the near future, these developments will usher in significant new functionality as machines become much better able to process and ‘understand’ the data that they merely display at present.” “The Semantic Web will bring structure to the meaningful contentof Web pages, creating an environment where software agents roaming from page to page can readily carry out sophisticated tasks for users.” http://www.scientificamerican.com/article.cfm?id=the-semantic-web
  • Knowledge Web„With the Knowledge Web, …• humanitys accumulated store of information will become more accessible, more manageable, and more useful.• anyone who wants to learn will be able to find the best and the most meaningful explanations of what they want to know.• anyone with something to teach will have a way to reach those who want to learn.• teachers will move beyond their present role as dispensers of information and become guides, mentors, facilitators, and authors. The Knowledge Web will make us all smarter. The Knowledge Web is an idea whose time has come.“ http://www.edge.org/3rd_culture/hillis04/hillis04_index.html
  • Magic Unicorn Web
  • … oder einfach nur … Linked Data
  • … oder einfach nur … Linked Data = best practicezur standardisierten und webbasierten Veröffentlichung von Daten
  • … oder einfach nur … Linked Data Beispiele RelFinder Sig.ma
  • RDF 1999• Resource Description Framework• grundsätzliches und einfaches Datenmodell• für die Beschreibung von Dingen und Objekten (Resource Description)• Notation über XML oder andere Formate• Idee: jeder faktische Sachverhalt kann analog zur (westlichen) Sprache über die Bestandteile Subjekt-Prädikat-Objekt beschrieben werden• Ziel: mehr Interoperabilität zwischen Daten
  • RDF 1999Aussagen-Statements in Tripel-Form Subjekt Prädikat Objekt 1. Die Ressource XY ist vom Typ Buch. 2. Die Ressource XY trägt den Titel „Der Steppenwolf“. 3. Die Ressource XY wurde geschrieben von Hermann Hesse. 4. Die Ressource XY hat einen Umfang von 270 Seiten. 5. Die Ressource XY besitzt die ISBN-Nummer 978-3-51806-675-1.
  • RDF 1999Aussagen-Statements in Tripel-Form Subjekt Prädikat Objekt 1. <XY> <vom Typ> <Buch> . 2. <XY> <trägt Titel> „Der Steppenwolf“ . 3. <XY> <geschrieben von> <Hermann Hesse> . 4. <XY> <hat Umfang von> „270 Seiten“ . 5. <XY> <besitzt ISBN> „9783518066751“ .
  • RDF 1999
  • RDF 1999• Ding1 – Relation – Ding2 <http://www.example.org/books/XY> <vom Typ> <Buch> ; 1. <trägt den Titel> "Der Steppenwolf" ; 2. <wurde geschrieben von> <Hermann Hesse> ; 3. <hat Seiten> "240" ; 4. <hat die ISBN> „9783518066751“ . 5.
  • RDF 1999• URI-Ressource1 – URI-Property – URI-Ressource2 oder Literal <http://example.org/books/XY> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> 1. <http://purl.org/ontology/bibo/Book> ; <http://purl.org/dc/terms/title> "Der Steppenwolf" ; 2. <http://purl.org/dc/terms/creator> <Hermann Hesse> ; 3. <http://purl.org/ontology/bibo/pages> "240" ; 4. <http://purl.org/ontology/bibo/isbn13> "9783518066751" . 5.
  • RDF 1999• URI-Ressource1 – URI-Property – URI-Ressource2 oder Literal @prefix rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns# . @prefix dc: http://purl.org/dc/elements/1.1/ . @prefix bibo: <http://purl.org/ontology/bibo/> . <http://example.org/books/XY> rdf:type bibo:Book ; 1. dc:title "Der Steppenwolf ; 2. dc:creator <http://example.org/authors/Hermann_Hesse> ; 3. bibo:pages "240" ; 4. bibo:isbn13 "9783518066751" . 5.
  • RDF 1999• URI-Ressource1 – URI-Property – URI-Ressource2 oder Literal @prefix rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns# . @prefix rdfs: http://www.w3.org/2000/01/rdf-schema# . @prefix dc: http://purl.org/dc/elements/1.1/ . @prefix bibo: <http://purl.org/ontology/bibo/> . <http://example.org/books/XY> rdf:type bibo:Book ; 1. dc:title "Der Steppenwolf"@de ; 2. dc:creator <http://example.org/authors/Hermann_Hesse> ; 3. bibo:pages "240" ; 4. bibo:isbn13 "9783518066751" ; 5. rdfs:seeAlso <http://dbpedia.org/resource/Steppenwolf_(novel)> ; 6. bibo:isbn10 "3518066757" ;
  • Exkurs: XML• Extensible Markup Language• lingua franca des standardisierten Datenaustauschs im Web• Unterstützung von Namensräumen• Unterstützung von Umwandlungen einer XML-Struktur in eine beliebige andere XML-Struktur (XSLT) <buch> <titel> Der Steppenwolf </titel> <autor> Hermann Hesse </autor> <seitenzahl> 270 </seitenzahl> </buch>
  • Exkurs: XML<?xml version="1.0"?> <rdf:RDF xmlns:bibo="http://purl.org/ontology/bibo/" xmlns:dbpedia="http://dbpedia.org/resource/" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:dc="http://purl.org/dc/terms/"> <bibo:Book rdf:about="http://example.org/books/XY"> 1. <dc:title xml:lang="de">Der Steppenwolf</dc:title> 2. <dc:creator rdf:resource="http://example.org/authors/Hermann_Hesse"/> 3. <bibo:pages>240</bibo:pages> 4. <bibo:isbn13>9783518066751</bibo:isbn13> 5. <rdfs:seeAlso rdf:resource="http://dbpedia.org/resource/Der_Steppenwolf" 6. <dc:title xml:lang="en">Steppenwolf</dc:title> 7. <dc:created rdf:datatype="http://www.w3.org/2001/XMLSchema#date"> 8. 1927-01-01 </dc:created> <dc:publisher>Suhrkamp</dc:publisher> 9. <bibo:isbn10>3518066757</bibo:isbn10> 10. </bibo:Book> </rdf:RDF>
  • RDFS, OWL, SKOS• Vokabulare ermöglichen die Modellierung von Wissen• 2 Ebenen: 1. Modellebene (Vokabulare) Konzepte, Klassen und Beziehungen für die Beschreibung von Ressourcen/Objekten 2. Instanzebene (Datensets) anhand der Vokabulare beschriebene Ressourcen/Objekte
  • RDFS, OWL, SKOSRDF Schema (RDFS)• grundlegendes Set an Elementen, um Relationen darstellen zu können• Class, subClassOf, seeAlso, label, …Web Ontology Language (OWL)• mächtige Sprache zur Formalisierung von Beziehungen• sameAs, Transitivität (Vererbung), Umkehrungen, Wertebereiche, …Simple Knowledge Organization System (SKOS)• Elemente zur Darstellung von Konzepten und ihren Hierarchien und Relationen untereinander in Taxonomien, Thesauri, Klassifikationen• narrower, broader, related, …
  • Beispiel
  • Beispiel
  • Beispiel
  • Vokabulare• Dublin Core (DC) – elementares Set an Prädikaten zur Auszeichnung v. Dokumenteninformation – title, creator, date, subject, …• Friend Of A Friend (FOAF) – Prädikate zur Beschreibung von Personen und Organisationen – http://xmlns.com/foaf/0.1/ – Person, Organization, givenName, familyName, …• Bio – Prädikate zur Beschreibung von Lebensereignissen von Personen – http://purl.org/vocab/bio/0.1/ – Birth, Death, Mother, Father, Marriage, Divorce, …• Geo – Properties für die Beschreibung von Orten – http://www.w3.org/2003/01/geo/ – lat (Latitude), long (Longitude), …
  • Vokabulare• Bibliographic Ontology (Bibo) – offenes und community-getriebenes Vokabular – zur Beschreibung von bibliographischen Objekten – http://bibliontology.com/ – Document, Book, Chapter, Proceedings, Journal, pages, …• FRBRcore (frbr) – frühe Abbildung der Functional Requirements for Bibliographic Records in RDF (2005, nicht mehr weiterentwickelt) – http://vocab.org/frbr/core.html – Work, Expression, Manifestation, reproductionOf, LegalWork, …• Resource Description & Access (RDA) – Neuentwicklung eines bibliographischen Regelwerks unter Einbeziehung von FRBR als Linked Data – Kritik – Einführung steht bevor
  • Datensets• Dbpedia – Fakten aus der Wikipedia in RDF (v.a. Infoboxen) – fungiert als zentrales Drehkreuz für RDF-Links – verschiedene Sprachversionen – enthält URIs für 3.7 Mio. “Dinge” und eine eigene Ontologie – Beispiel: http://dbpedia.org/resource/Chur• lobid.org Organisationen – Bibliothekssigel-Verzeichnis in RDF – experimenteller Dienst des hbz Köln – Beispiel: http://lobid.org/organisation/CH-000805-8/about• Geonames API – Geographische Information in RDF aus verschiedenen Quellen – Beispiel: http://api.geonames.org/search?q=chur&type=rdf&maxRows=10&lang=de&username=d
  • SPARQL• Abfragesprache, ähnlich SQL• „Zu versuchen, das semantische Web ohne SPARQL zu nutzen ist wie der Versuch, relationale Datenbanken ohne SQL zu benutzen“ (TBL)• Abfrage von Tripelstores• Möglichkeit, neue RDF-Tripel aus Ergebnissen zu generieren
  • SPARQL• Abfragesprache, ähnlich SQL• „Zu versuchen, das semantische Web ohne SPARQL zu nutzen ist wie der Versuch, relationale Datenbanken ohne SQL zu benutzen“ (TBL)• Abfrage von Tripelstores Tripelstore (schematische Darstellung)
  • SPARQL http://dbpedia.org/snorql/PREFIX dbo: http://dbpedia.org/ontology/SELECT ?name ?birth ?death ?person WHERE { ?person dbo:birthPlace :Tokyo . ?person dbo:occupation :Writer . ?person foaf:name ?name . ?person dbo:deathDate ?death .FILTER (?birth > "1800-01-01"^^xsd:date) .FILTER (?death < "2000-01-01"^^xsd:date) . }
  • SPARQL http://sparql.freeyourmetadata.org/ Graph: http://viaf.org/viaf/41841418/rdf.xml SELECT ?s ?p ?o WHERE { ?s ?p ?o . } ORDER BY ?p LIMIT 50 SELECT ?s ?o WHERE {?s <http://www.w3.org/2002/07/owl#sameAs> ?o . } ORDER BY ?s LIMIT 10
  • Die 4 Regeln für Linked Data1. Verwende zur Bezeichnung von Objekten URIs.2. Verwende HTTP URIs, so dass sich die Bezeichnungen nachschlagen lassen.3. Stelle zweckdienliche Informationen bereit, wenn jemand eine URI nachschlägt (mittels der Standards RDF und SPARQL)4. Zu diesen Informationen gehören insbesondere Links auf andere URIs, über die weitere Objekte entdeckt werden können.Quelle: Tim Berners-Lee, Linked Data Design Issues, 2006
  • RDFa• hybrider Ansatz• Vereinigung von HTML-Markup und Linked Data in 1 Darstellung• konkurriert mit Microdata & Microformats• HTML5-valide• Visualisierung: http://rdfa.info/play/
  • RDFa<!DOCTYPE html> <html prefix="xsd: http://www.w3.org/2001/XMLSchema# rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns# rdfs: http://www.w3.org/2000/01/rdf-schema# owl: http://www.w3.org/2002/07/owl# dc: http://purl.org/dc/elements/1.1/ foaf: http://xmlns.com/foaf/0.1/ bio: http://purl.org/vocab/bio/0.1/ bibo: http://purl.org/ontology/bibo/ dbpedia: http://dbpedia.org/resource/ geo: http://www.w3.org/2003/01/geo/wgs84_pos#"> <head></head> <body> <div about="http://example.org/books/XY"> <h1><span property="dc:title">Der Steppenwolf</span> von <span property="dc:creator" content="Hermann Hesse">Hermann Hesse</span></h1> <div property="dc:date" content="1927-01-01" datatype="xsd:date">1927 erschienen</div> <div property="dc:publisher">Suhrkamp</div> <div property="bibo:pages" content="240">240 S.</div> <div property="bibo:isbn10" content="3518066757">3-51806-675-7</div> <div property="bibo:isbn13" content="9783518066751">978-3-51806-675-1</div> <a rel="rdfs:seeAlso" href="http://dbpedia.org/resource/Steppenwolf_(novel)">Link</a> </div> </body></html>
  • All together now …Linked Data …• … sind eine Erweiterung des WWW um strukturierte Daten• … sind Daten, in denen realen “Dingen” repräsentative Adressen im Web zugeordnet werden (URIs), über Vokabulare beschrieben werden und maschinenlesbar veröffentlicht werden.• … sind dem URI-Prinzip verpflichtet• … sind auf Aussagen nach dem Muster Subjekt-Prädikat-Objekt aufgebaut• … ermöglichen die Abfrage von weit verteilten und heterogenen Daten aus unterschiedlichsten Bereichen über eine Schnittstelle (SPARQL)• … sind generisch in XML oder eingebettet in HTML nutzbar
  • … oder einfach nur … Linked Data = things not strings
  • EntwicklungenLinked Data LOD Open Data
  • Entwicklungen Open Data“The coolest thing to do with your data will be thought of by someone else” Rufus Pollock, Open Knowledge Foundation
  • Entwicklungen Open Data USA http://www.data.gov/ http://nycopendata.tumblr.com/ UK http://www.data.gov.uk/ http://www.fixmystreet.com Schweiz http://opendata.ch/http://make.opendata.ch/doku.php?id=project:wheredidmytaxesgo Datenjournalismus http://www.opendatacity.de/
  • Entwicklungen Open Data Lizenzmodelle CC0 (Creative Commons) Gemeinfreiheit der Daten (Public Domain) völliger Verzicht auf Rechtsansprüche ODC (Open Data Commons)speziell für Daten und Datenbanken geschrieben Verzicht auf Gemeinfreiheit der Daten Beispiel: OpenStreetMap
  • Evolution von LOD
  • Evolution von LOD
  • Evolution von LOD
  • Evolution von LOD
  • Evolution von LOD
  • Evolution von LOD
  • Evolution von LOD
  • Evolution von LOD
  • Evolution von LOD
  • Evolution von LOD
  • Evolution von LOD
  • Evolution von LOD
  • Evolution von LOD Bizer, State of the LOD Cloud. 2011
  • Evolution von LOD „Live“http://inkdroid.org/lod-graph/
  • Entwicklungen Schema.orgGoogle, Yahoo, Bing, Yandexhttp://schema.org/docs/full.html
  • LOD in Bibliotheken viel Bewegung seit 2009
  • LOD in Bibliotheken• vielerorts Freigabe von bibliographischen Daten durch Bibliotheken, Verbünde und Nationalbibliotheken• LoC-Initiative zur Schaffung eines bibliographischen Rahmenmodells (BibFrame)• Konferenz „Semantic Web in Bibliotheken“ in der 4. Auflage 2012• LODLAM Challenges 2013
  • LOD in Bibliotheken• bibliographische Metadaten• Normdaten (Personen, Körperschaften, Schlagworte)Besondere Herausforderungen:• fehlende Granularität• keine eineindeutige globale Identifizierung• aufwändige Verknüpfung von Datensätzen• aufwändige Erfassung von digitalen Objekten• schwierige Erweiterbarkeit• anzeigeorientiert, Katalogkarte nachahmend• in natürlicher Sprache der verschiedenen Sprachkreise formuliert• unflexibel
  • LOD in Bibliotheken Quelle: http://ipac.ub.tu-berlin.de
  • LOD in Bibliotheken Quelle: Kimber, Automation in Libraries. 1974, p.74
  • LOD in Bibliotheken LDR-1 L 00000nM2.01200024------h FMT-1 L MH 001-1 L $$aBV024483282 003-1 L $$a20091117 026-1 L $$aBVBBV024483282 027-1 L $$aTU002674438 030-1 L a|5dc||||||17 037b1 L $$ager 050-1 L a||||||||||||| 051-1 L sz||||| 070b1 L $$aDE-12 080-1 L $$a05 100-1 L $$pHesse, Hermann$$d1877-1962$$9(DE-588)11855042X 331-1 L $$a<<Der>> Steppenwolf 359-1 L $$aHermann Hesse 403-1 L $$a244. - 251. Tsd. 410-1 L $$aFrankfurt am Main 412-1 L $$aSuhrkamp 425-1 L $$a1978 425a1 L $$a1978 433-1 L $$a237 S. 451-1 L $$aBibliothek Suhrkamp ; 226 453r1 L $$aBV000003123 455-1 L $$a226 456-1 L $$a226 700g1 L $$aGM 3668 [. . .]
  • LOD in Bibliotheken “We, the participants of ELAG 2011, hold these truths to be self-evident, that MARC must die,and that Linked Open Data is the future.” (Anders Söderbäck, LIBRIS)
  • LOD in Bibliotheken
  • Alt vs Neuhttp://authorities.loc.gov/ vs. http://id.loc.gov/
  • The Big Picture• Zukunft von a) Katalogisierung b) inhaltlicher Sacherschließung • Forschungsdaten: Verknüpfung von Publikationen mit Primärdatensätzen, Modellen, … • Wer hat relevante und wertvolle Vokabulare / Daten für eine OA- Veröffentlichung? • Lizenzen: Wer hält die Rechte an diesen Daten? • Was ist überhaupt ein Datensatz? • Wie kann das technische Know How in Bibliotheken und Verbünden gestärkt werden? • Ist das Bibliothekswesen technisch überhaupt reformierbar? ;) • Wie könnten konkrete Anwendungsszenarien in Gedächtnisinstitutionen aussehen?
  • Perspektiven: Anwender• semantische Suche unter Einschluss von: • anderen Sprachen • synonymen Begriffen • verwandten Themen• automatisierte Anreicherung von Bibliotheksinhalten mit Webinhalten• Integration von Bibliotheksinhalten in das Primärmedium der Nutzer • Ende des bibliothekarischen Elfenbeinturms: wir werden endlich Teil des Informationsraums WWW • die Daten müssen zu den Nutzern, nicht die Nutzer zu den Daten kommen• vereinfachte Integration von Webdiensten, Nutzungsstatistiken, nutzergenerierten Annotationen, …• wesentlich verbessere Filter- und Navigationsmöglichkeiten
  • Perspektiven: Bibliotheken• Etablierung von Bibliotheken als Player im Informationsraum WWW• Öffnung von Bibliotheken hin zu nicht-bibliothekarischen Inhalten: • ausgesuchte automatisierte Anreicherungen: Wikipedia, Rezensionen, Titelbilder, Nutzerannotationen, Inhaltsverzeichnisse, Volltexte, Hintergrundwissen, … • Bibliotheken als Kuratoren qualitativ hochwertiger Information• Vermeidung von Redundanz: • einfache Übernahme von Daten über Verbund-, Länder- und Kulturgrenzen noch mehr Kooperation: Teilen, Erweitern, Wiederverwenden• Erstellung automatisierter und tagesaktueller Zusammenstellungen: • z.B. Fach- und Hochschulbibliographien
  • Perspektiven: Bibliotheken• mehr Unabhängigkeit von Systemherstellern und bei der Auswahl von Softwarewerkzeugen• eventuell: höhere Attraktivität von Bibliotheken für technisches Personal Verbesserte Evaluationsmöglichkeiten (v.a. föderale Bibliotheksinfrastrukturen) Daten in bibliographischen Datensätzen, die sich für eine Verlinkung eignen: Personen Organisationen Datumsangaben geographische Informationen Statistiken: Ausleihen, Verlängerungen
  • Links & Literatur
  • Links & Literatur On The Record, Working Group on the Future of Bibliographic Control, 2008 http://www.loc.gov/bibliographic-future/news/ Library Linked Data Incubator Group Final Report, W3C Incubator Group Report, 2011 http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/ futurelib: Designing the future -- Library Systems and Data Formats http://futurelib.pbworks.com/w/page/13686657/FrontPage Übersicht: Bibliographische und bibliothekarische Daten http://thedatahub.org/group/bibliographic http://thedatahub.org/group/lld „Linked Library Data“ Mailingliste des W3C http://lists.w3.org/Archives/Public/public-lld/
  • finVielen Dank!
  • Reserve-SlidesQuelle: http://winfwiki.wi-fom.de/images/thumb/5/58/SW.LayerCake.png/800px-SW.LayerCake.png