Länkad data    Länkad data i Sverige, 17 april, 2012Marie Gustafsson Friberger, Malmö högskola         marie.friberger@mah...
Översikt•   Länkade data och den semantiska webben•   En kort introduktion till SW-relaterad W3C    rekommendationer•   Nå...
Hans Rosling           http://www.flickr.com/photos/23176450@N08/2663925153/
Hans Rosling"The database hugging in public institutions        is hampering innovation."Hans Rosling at OECD World Forum ...
6
• Hur tillhandahålla data så att den går att  återanvända?• Hur möjliggöra upptäckandet av relevanta  data bland alla data...
★ Tillgänglig på webben (oavsett format),med en öppen licens★★ Tillgänglig som maskinläsbar struktureraddata (t ex Excel i...
Principer för länkade data1. Använd URI:er för att namnge saker2. Använd HTTP URI:er så att dessa namn   kan användas för ...
10
Linked data                                                                                                11Linking Open ...
Semantiska webben• Data-webb (snarare än dokument-webb).• Idag kontrollerar applikationer ofta sin egen  data och delar in...
Main SW componentscommon formats for                 define the conceptsintegration and                    and relationship...
En kort introduktion tillW3C-rekommendationer   relaterade till den  semantiska webben
Resource Description    Framework
“Description”?Subject - Predicate - Object
Subject - Predicate - Object               Image from the book Semantic Web for the Working Ontologist by Allemang and Hen...
Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
Flera källor  +       +       Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
En graf...             Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
Vad är vad?• Om två källor använder samma  benämningar, avser de då samma ”sak”?• URI:er to the rescue!• Två noder avser s...
SPARQL• SPARQL Protocol and RDF Query  Language• En fråga består av en uppsättning trippel-  mönster (tripple patterns).• ...
Ontologier – OWL• Kallas ofta vokabulärer i  samband med länkade data• Används för att beskriva  begrepp och relationer me...
Simple KnowledgeOrganization System (SKOS)• RDF vokabulär för att representera   semiformella knowledge organization syste...
Exempel          DBpedia          NYTimes          25
• Extraherar strukturerad information från  Wikipedia och tillgängliggör den via  webben.• Beskriver över 3,4 miljoner sak...
Möjliga frågor• DBPedia gör det möjligt att ställa frågor där  informationen som behövs för att svara  finns spridd över fle...
Personer födda iKöpenhamn innan år 1900.   28
29
30
NYTimes –Linked Open Data   http://data.nytimes.com/
32
Example app: Who Went Where?
Vill du göra data och/    eller vokabulär      tillgängliga?
Välja vokabulär• Hur många använder? Vilka?• Underhåll och styrning• Vilka koncept täcker den?• Hur uttrycksfull är den?  ...
Verktyg för att utveckla      vokabulär                       Specifikt för SKOS:• Protégé              • PoolParty Thesaur...
Recept för att publicera     länkade data• Statiska RDF/XML-filer• Som RDF inbäddad i HTML (RDFa)• Genom egna server-side s...
Vill du hitta data?
39
40
Vill du bygga?
42
Läs mer!•   Heath and Bizer (2011) Linked Data: Evolving the    Web into a Global Data Space    http://linkeddatabook.com/...
Länkad data
Upcoming SlideShare
Loading in...5
×

Länkad data

684

Published on

Min introduktion till länkad data från träffen om länkad data i Sverige: http://ldsv.eventbrite.com/

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
684
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
7
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Länkad data

  1. 1. Länkad data Länkad data i Sverige, 17 april, 2012Marie Gustafsson Friberger, Malmö högskola marie.friberger@mah.se twitter: mariegus
  2. 2. Översikt• Länkade data och den semantiska webben• En kort introduktion till SW-relaterad W3C rekommendationer• Några exempel• Vill du tillgängliggöra data och/eller vokabulär?• Vill du hitta data?• Vill du bygga? 2
  3. 3. Hans Rosling http://www.flickr.com/photos/23176450@N08/2663925153/
  4. 4. Hans Rosling"The database hugging in public institutions is hampering innovation."Hans Rosling at OECD World Forum in Istanbul, 2007 http://www.viddler.com/explore/JesseRobbins/videos/4/ http://www.flickr.com/photos/23176450@N08/2663925153/
  5. 5. 6
  6. 6. • Hur tillhandahålla data så att den går att återanvända?• Hur möjliggöra upptäckandet av relevanta data bland alla dataset som finns tillgängliga?• Hur möjliggöra att applikationer kan integrera data från tidigare okända datakällor? 7
  7. 7. ★ Tillgänglig på webben (oavsett format),med en öppen licens★★ Tillgänglig som maskinläsbar struktureraddata (t ex Excel i stället för scannad tabell)★★★ som (2) samt ickeproprietärt format(t ex CSV i stället för Excel)★★★★ Alla ovan, plus att använda W3C-standarder (RDFoch SPARQL) för beskriva saker★★★★★ Alla ovan plus att länka din data till andras data
  8. 8. Principer för länkade data1. Använd URI:er för att namnge saker2. Använd HTTP URI:er så att dessa namn kan användas för att få mer information3. När någon kollar en URI, ge användbar information genom standarder (RDF*, SPARQL)4. Inkludera länkar till andra URI:er så att fler saker kan upptäckas http://www.w3.org/DesignIssues/LinkedData.html
  9. 9. 10
  10. 10. Linked data 11Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
  11. 11. Semantiska webben• Data-webb (snarare än dokument-webb).• Idag kontrollerar applikationer ofta sin egen data och delar inte med sig av den.• Visionen med den semantiska webben är att göra det möjligt att kombinera data från flera olika källor. 12
  12. 12. Main SW componentscommon formats for define the conceptsintegration and and relationships usedcombination of data drawn to describe andfrom diverse sources represent an area of concern Linked OntologiesRDF OWL Data Vocabularies SPARQL SKOS 13
  13. 13. En kort introduktion tillW3C-rekommendationer relaterade till den semantiska webben
  14. 14. Resource Description Framework
  15. 15. “Description”?Subject - Predicate - Object
  16. 16. Subject - Predicate - Object Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  17. 17. Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  18. 18. Flera källor + + Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  19. 19. En graf... Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  20. 20. Vad är vad?• Om två källor använder samma benämningar, avser de då samma ”sak”?• URI:er to the rescue!• Två noder avser samma sak om de använder samma URI.
  21. 21. SPARQL• SPARQL Protocol and RDF Query Language• En fråga består av en uppsättning trippel- mönster (tripple patterns).• Trippel-mönster är som RDF-tripplar förutom att varje subjekt, predikat och objekt kan vara en variabel.
  22. 22. Ontologier – OWL• Kallas ofta vokabulärer i samband med länkade data• Används för att beskriva begrepp och relationer mellan begrepp I någon domän• Kan innehålla allt från en enkel vokabulär till komplexa logiska uttryck för att dra slutsatser baserat på data 23
  23. 23. Simple KnowledgeOrganization System (SKOS)• RDF vokabulär för att representera semiformella knowledge organization systems (KOSs), exempelvis thesauri o taxonomier.ex:animals rdf:type skos:Concept; skos:prefLabel "animals"@en; skos:narrower ex:mammals. ex:birds rdf:type skos:Concept; skos:prefLabel "birds"@en; skos:related ex:ornithology. 24
  24. 24. Exempel DBpedia NYTimes 25
  25. 25. • Extraherar strukturerad information från Wikipedia och tillgängliggör den via webben.• Beskriver över 3,4 miljoner saker, varav 1,5 miljoner är klassificerad i en konsistent ontologi som innehåller 312.000 personer, 413.000 platser, 94.000 musik album, 49.000 filmer, 15.000 videospel, 140.000 organisationer, 146.000 arter och 4.600 sjukdomar.
  26. 26. Möjliga frågor• DBPedia gör det möjligt att ställa frågor där informationen som behövs för att svara finns spridd över flera olika Wikipedia- artiklar.• Till exempel...
  27. 27. Personer födda iKöpenhamn innan år 1900. 28
  28. 28. 29
  29. 29. 30
  30. 30. NYTimes –Linked Open Data http://data.nytimes.com/
  31. 31. 32
  32. 32. Example app: Who Went Where?
  33. 33. Vill du göra data och/ eller vokabulär tillgängliga?
  34. 34. Välja vokabulär• Hur många använder? Vilka?• Underhåll och styrning• Vilka koncept täcker den?• Hur uttrycksfull är den? Baserat på http://linkeddatabook.com/ 35
  35. 35. Verktyg för att utveckla vokabulär Specifikt för SKOS:• Protégé • PoolParty Thesaurus• TopBraid Composer Manager• NeOn Toolkit • VocBench (developed by the FAO of the UN) 36
  36. 36. Recept för att publicera länkade data• Statiska RDF/XML-filer• Som RDF inbäddad i HTML (RDFa)• Genom egna server-side scripts• Från relationsdatabaser• Från RDF Triple Stores• Genom att ”wrappa” existerande API:er 37 http://linkeddatabook.com/
  37. 37. Vill du hitta data?
  38. 38. 39
  39. 39. 40
  40. 40. Vill du bygga?
  41. 41. 42
  42. 42. Läs mer!• Heath and Bizer (2011) Linked Data: Evolving the Web into a Global Data Space http://linkeddatabook.com/editions/1.0/• Allemang and Hendler (2011) Semantic Web for the Working Ontologist http://workingontologist.org/• http://www.w3.org/2001/sw/wiki/Tools
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×