SlideShare a Scribd company logo
1 of 43
Download to read offline
Länkad data
    Länkad data i Sverige, 17 april, 2012

Marie Gustafsson Friberger, Malmö högskola
         marie.friberger@mah.se
             twitter: mariegus
Översikt
•   Länkade data och den semantiska webben

•   En kort introduktion till SW-relaterad W3C
    rekommendationer

•   Några exempel

•   Vill du tillgängliggöra data och/eller vokabulär?

•   Vill du hitta data?

•   Vill du bygga?

                            2
Hans Rosling




           http://www.flickr.com/photos/23176450@N08/2663925153/
Hans Rosling
"The database hugging in public institutions
        is hampering innovation."

Hans Rosling at OECD World Forum in Istanbul, 2007
  http://www.viddler.com/explore/JesseRobbins/videos/4/




                                                          http://www.flickr.com/photos/23176450@N08/2663925153/
6
• Hur tillhandahålla data så att den går att
  återanvända?
• Hur möjliggöra upptäckandet av relevanta
  data bland alla dataset som finns tillgängliga?
• Hur möjliggöra att applikationer kan
  integrera data från tidigare okända
  datakällor?



                      7
★ Tillgänglig på webben (oavsett format),
med en öppen licens
★★ Tillgänglig som maskinläsbar strukturerad
data (t ex Excel i stället för scannad tabell)
★★★ som (2) samt ickeproprietärt format
(t ex CSV i stället för Excel)
★★★★ Alla ovan, plus att använda W3C-standarder (RDF
och SPARQL) för beskriva saker
★★★★★ Alla ovan plus att länka din data till andras data
Principer för länkade data
1. Använd URI:er för att namnge saker
2. Använd HTTP URI:er så att dessa namn
   kan användas för att få mer information
3. När någon kollar en URI, ge användbar
   information genom standarder (RDF*,
   SPARQL)
4. Inkludera länkar till andra URI:er så att fler
   saker kan upptäckas

                                      http://www.w3.org/DesignIssues/LinkedData.html
10
Linked data




                                                                                                11
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
Semantiska webben

• Data-webb (snarare än dokument-webb).
• Idag kontrollerar applikationer ofta sin egen
  data och delar inte med sig av den.
• Visionen med den semantiska webben är
  att göra det möjligt att kombinera data från
  flera olika källor.


                      12
Main SW components
common formats for                 define the concepts
integration and                    and relationships used
combination of data drawn          to describe and
from diverse sources               represent an area of
                                   concern


                Linked           Ontologies
RDF                                                 OWL
                 Data
                                 Vocabularies
    SPARQL                                         SKOS

                            13
En kort introduktion till
W3C-rekommendationer
   relaterade till den
  semantiska webben
Resource Description
    Framework
“Description”?

Subject - Predicate - Object
Subject - Predicate - Object




               Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
Flera källor




  +

       +       Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
En graf...




             Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
Vad är vad?

• Om två källor använder samma
  benämningar, avser de då samma ”sak”?
• URI:er to the rescue!
• Två noder avser samma sak om de
  använder samma URI.
SPARQL
• SPARQL Protocol and RDF Query
  Language
• En fråga består av en uppsättning trippel-
  mönster (tripple patterns).
• Trippel-mönster är som RDF-tripplar
  förutom att varje subjekt, predikat och
  objekt kan vara en variabel.
Ontologier – OWL
• Kallas ofta vokabulärer i
  samband med länkade data
• Används för att beskriva
  begrepp och relationer mellan
  begrepp I någon domän
• Kan innehålla allt från en enkel
  vokabulär till komplexa
  logiska uttryck för att dra
  slutsatser baserat på data
                              23
Simple Knowledge
Organization System (SKOS)
• RDF vokabulär för att representera
   semiformella knowledge organization systems
   (KOSs), exempelvis thesauri o taxonomier.

ex:animals rdf:type skos:Concept;
  skos:prefLabel "animals"@en;
  skos:narrower ex:mammals.

                               ex:birds rdf:type skos:Concept;
                                 skos:prefLabel "birds"@en;
                                 skos:related ex:ornithology.



                          24
Exempel
          DBpedia
          NYTimes




          25
• Extraherar strukturerad information från
  Wikipedia och tillgängliggör den via
  webben.
• Beskriver över 3,4 miljoner saker, varav 1,5
  miljoner är klassificerad i en konsistent
  ontologi som innehåller 312.000 personer,
  413.000 platser, 94.000 musik album, 49.000
  filmer, 15.000 videospel, 140.000
  organisationer, 146.000 arter och 4.600
  sjukdomar.
Möjliga frågor

• DBPedia gör det möjligt att ställa frågor där
  informationen som behövs för att svara
  finns spridd över flera olika Wikipedia-
  artiklar.
• Till exempel...
Personer födda i
Köpenhamn innan år 1900.




   28
29
30
NYTimes –
Linked Open Data



   http://data.nytimes.com/
32
Example app: Who Went Where?
Vill du göra data och/
    eller vokabulär
      tillgängliga?
Välja vokabulär

• Hur många använder? Vilka?
• Underhåll och styrning
• Vilka koncept täcker den?
• Hur uttrycksfull är den?
           Baserat på http://linkeddatabook.com/
                    35
Verktyg för att utveckla
      vokabulär
                       Specifikt för SKOS:
• Protégé              • PoolParty Thesaurus
• TopBraid Composer      Manager

• NeOn Toolkit         • VocBench (developed by
                         the FAO of the UN)



                  36
Recept för att publicera
     länkade data
• Statiska RDF/XML-filer
• Som RDF inbäddad i HTML (RDFa)
• Genom egna server-side scripts
• Från relationsdatabaser
• Från RDF Triple Stores
• Genom att ”wrappa” existerande API:er
                    37   http://linkeddatabook.com/
Vill du hitta data?
39
40
Vill du bygga?
42
Läs mer!
•   Heath and Bizer (2011) Linked Data: Evolving the
    Web into a Global Data Space
    http://linkeddatabook.com/editions/1.0/

•   Allemang and Hendler (2011) Semantic Web for
    the Working Ontologist
    http://workingontologist.org/

•   http://www.w3.org/2001/sw/wiki/Tools

More Related Content

Viewers also liked

Viewers also liked (8)

Alla ska koda? (presentation Geek Girl Meetup Öresund 2014)
Alla ska koda? (presentation Geek Girl Meetup Öresund 2014)Alla ska koda? (presentation Geek Girl Meetup Öresund 2014)
Alla ska koda? (presentation Geek Girl Meetup Öresund 2014)
 
Geek Girl Mini-presentation på Geek Girl Meetup 2016
Geek Girl Mini-presentation på Geek Girl Meetup 2016Geek Girl Mini-presentation på Geek Girl Meetup 2016
Geek Girl Mini-presentation på Geek Girl Meetup 2016
 
Data games presenation at øredev 2013
Data games presenation at øredev 2013Data games presenation at øredev 2013
Data games presenation at øredev 2013
 
Kom igång med Makey Makey
Kom igång med Makey MakeyKom igång med Makey Makey
Kom igång med Makey Makey
 
Öppna data i skolan
Öppna data i skolanÖppna data i skolan
Öppna data i skolan
 
Preparing for the Impact of Web 3.0
Preparing for the Impact of Web 3.0 Preparing for the Impact of Web 3.0
Preparing for the Impact of Web 3.0
 
Web 3.0 The Semantic Web
Web 3.0 The Semantic WebWeb 3.0 The Semantic Web
Web 3.0 The Semantic Web
 
Geek Girl Mini – Växjö december 2016
Geek Girl Mini – Växjö december 2016Geek Girl Mini – Växjö december 2016
Geek Girl Mini – Växjö december 2016
 

Similar to Länkad data

Pondusseminarium, Helsingfors 2014-02-11
Pondusseminarium, Helsingfors 2014-02-11Pondusseminarium, Helsingfors 2014-02-11
Pondusseminarium, Helsingfors 2014-02-11
Lars Lundqvist
 
Gymnasiearbete biologi NN17.pptx
Gymnasiearbete biologi NN17.pptxGymnasiearbete biologi NN17.pptx
Gymnasiearbete biologi NN17.pptx
ngbib
 
Presentation av OER projekt under OER konferens 2010-02-09
Presentation av OER projekt under OER konferens 2010-02-09Presentation av OER projekt under OER konferens 2010-02-09
Presentation av OER projekt under OER konferens 2010-02-09
Erik Axdorph
 
Rolf Källman SPECTRUM Hamburg 10 juni 2013
Rolf Källman SPECTRUM Hamburg 10 juni 2013Rolf Källman SPECTRUM Hamburg 10 juni 2013
Rolf Källman SPECTRUM Hamburg 10 juni 2013
Digisam
 
Att bygga webbapplikationer baserade på länkad data
Att bygga webbapplikationer baserade på länkad dataAtt bygga webbapplikationer baserade på länkad data
Att bygga webbapplikationer baserade på länkad data
Matthias Palmer
 

Similar to Länkad data (20)

Librisxl treffpunkt mikromarc
Librisxl treffpunkt mikromarcLibrisxl treffpunkt mikromarc
Librisxl treffpunkt mikromarc
 
LIBRIS öppna Infrastruktur
LIBRIS öppna InfrastrukturLIBRIS öppna Infrastruktur
LIBRIS öppna Infrastruktur
 
Synd presentation
Synd presentationSynd presentation
Synd presentation
 
Introduktion till LODify
Introduktion till LODifyIntroduktion till LODify
Introduktion till LODify
 
LODify - länkade data i molnet
LODify - länkade data i molnetLODify - länkade data i molnet
LODify - länkade data i molnet
 
NORDLOD
NORDLODNORDLOD
NORDLOD
 
MOA 2015, Open Aceess och hittbarhet
MOA 2015, Open Aceess och hittbarhetMOA 2015, Open Aceess och hittbarhet
MOA 2015, Open Aceess och hittbarhet
 
Öppen tillgång till forskningsdata och FAIR-principerna - Karl Gertows presen...
Öppen tillgång till forskningsdata och FAIR-principerna - Karl Gertows presen...Öppen tillgång till forskningsdata och FAIR-principerna - Karl Gertows presen...
Öppen tillgång till forskningsdata och FAIR-principerna - Karl Gertows presen...
 
Statusrapportering från utredningsgrupp 5
Statusrapportering från utredningsgrupp 5Statusrapportering från utredningsgrupp 5
Statusrapportering från utredningsgrupp 5
 
Webbens Arkitektur
Webbens ArkitekturWebbens Arkitektur
Webbens Arkitektur
 
Pondusseminarium, Helsingfors 2014-02-11
Pondusseminarium, Helsingfors 2014-02-11Pondusseminarium, Helsingfors 2014-02-11
Pondusseminarium, Helsingfors 2014-02-11
 
Riksdagens öppna data 20130412
Riksdagens öppna data 20130412Riksdagens öppna data 20130412
Riksdagens öppna data 20130412
 
Gymnasiearbete biologi NN17.pptx
Gymnasiearbete biologi NN17.pptxGymnasiearbete biologi NN17.pptx
Gymnasiearbete biologi NN17.pptx
 
"Samla och leverera digitalt kulturarv" 2013-10-07 (ARAB)
"Samla och leverera digitalt kulturarv" 2013-10-07 (ARAB)"Samla och leverera digitalt kulturarv" 2013-10-07 (ARAB)
"Samla och leverera digitalt kulturarv" 2013-10-07 (ARAB)
 
Mediernas digitalisering länkad data
Mediernas digitalisering länkad dataMediernas digitalisering länkad data
Mediernas digitalisering länkad data
 
Presentation av OER projekt under OER konferens 2010-02-09
Presentation av OER projekt under OER konferens 2010-02-09Presentation av OER projekt under OER konferens 2010-02-09
Presentation av OER projekt under OER konferens 2010-02-09
 
Norvegiana som LOD - effekter för projektet "Kultur och naturresan"
Norvegiana som LOD - effekter för projektet "Kultur och naturresan"Norvegiana som LOD - effekter för projektet "Kultur och naturresan"
Norvegiana som LOD - effekter för projektet "Kultur och naturresan"
 
Rolf Källman SPECTRUM Hamburg 10 juni 2013
Rolf Källman SPECTRUM Hamburg 10 juni 2013Rolf Källman SPECTRUM Hamburg 10 juni 2013
Rolf Källman SPECTRUM Hamburg 10 juni 2013
 
Att bygga webbapplikationer baserade på länkad data
Att bygga webbapplikationer baserade på länkad dataAtt bygga webbapplikationer baserade på länkad data
Att bygga webbapplikationer baserade på länkad data
 
Webbapplikationer - Kursintroduktion (anton.tibblin@mah.se)
Webbapplikationer - Kursintroduktion (anton.tibblin@mah.se)Webbapplikationer - Kursintroduktion (anton.tibblin@mah.se)
Webbapplikationer - Kursintroduktion (anton.tibblin@mah.se)
 

Länkad data

  • 1. Länkad data Länkad data i Sverige, 17 april, 2012 Marie Gustafsson Friberger, Malmö högskola marie.friberger@mah.se twitter: mariegus
  • 2. Översikt • Länkade data och den semantiska webben • En kort introduktion till SW-relaterad W3C rekommendationer • Några exempel • Vill du tillgängliggöra data och/eller vokabulär? • Vill du hitta data? • Vill du bygga? 2
  • 3. Hans Rosling http://www.flickr.com/photos/23176450@N08/2663925153/
  • 4. Hans Rosling "The database hugging in public institutions is hampering innovation." Hans Rosling at OECD World Forum in Istanbul, 2007 http://www.viddler.com/explore/JesseRobbins/videos/4/ http://www.flickr.com/photos/23176450@N08/2663925153/
  • 5.
  • 6. 6
  • 7. • Hur tillhandahålla data så att den går att återanvända? • Hur möjliggöra upptäckandet av relevanta data bland alla dataset som finns tillgängliga? • Hur möjliggöra att applikationer kan integrera data från tidigare okända datakällor? 7
  • 8. ★ Tillgänglig på webben (oavsett format), med en öppen licens ★★ Tillgänglig som maskinläsbar strukturerad data (t ex Excel i stället för scannad tabell) ★★★ som (2) samt ickeproprietärt format (t ex CSV i stället för Excel) ★★★★ Alla ovan, plus att använda W3C-standarder (RDF och SPARQL) för beskriva saker ★★★★★ Alla ovan plus att länka din data till andras data
  • 9. Principer för länkade data 1. Använd URI:er för att namnge saker 2. Använd HTTP URI:er så att dessa namn kan användas för att få mer information 3. När någon kollar en URI, ge användbar information genom standarder (RDF*, SPARQL) 4. Inkludera länkar till andra URI:er så att fler saker kan upptäckas http://www.w3.org/DesignIssues/LinkedData.html
  • 10. 10
  • 11. Linked data 11 Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
  • 12. Semantiska webben • Data-webb (snarare än dokument-webb). • Idag kontrollerar applikationer ofta sin egen data och delar inte med sig av den. • Visionen med den semantiska webben är att göra det möjligt att kombinera data från flera olika källor. 12
  • 13. Main SW components common formats for define the concepts integration and and relationships used combination of data drawn to describe and from diverse sources represent an area of concern Linked Ontologies RDF OWL Data Vocabularies SPARQL SKOS 13
  • 14. En kort introduktion till W3C-rekommendationer relaterade till den semantiska webben
  • 15. Resource Description Framework
  • 17. Subject - Predicate - Object Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  • 18. Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  • 19. Flera källor + + Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  • 20. En graf... Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  • 21. Vad är vad? • Om två källor använder samma benämningar, avser de då samma ”sak”? • URI:er to the rescue! • Två noder avser samma sak om de använder samma URI.
  • 22. SPARQL • SPARQL Protocol and RDF Query Language • En fråga består av en uppsättning trippel- mönster (tripple patterns). • Trippel-mönster är som RDF-tripplar förutom att varje subjekt, predikat och objekt kan vara en variabel.
  • 23. Ontologier – OWL • Kallas ofta vokabulärer i samband med länkade data • Används för att beskriva begrepp och relationer mellan begrepp I någon domän • Kan innehålla allt från en enkel vokabulär till komplexa logiska uttryck för att dra slutsatser baserat på data 23
  • 24. Simple Knowledge Organization System (SKOS) • RDF vokabulär för att representera semiformella knowledge organization systems (KOSs), exempelvis thesauri o taxonomier. ex:animals rdf:type skos:Concept; skos:prefLabel "animals"@en; skos:narrower ex:mammals. ex:birds rdf:type skos:Concept; skos:prefLabel "birds"@en; skos:related ex:ornithology. 24
  • 25. Exempel DBpedia NYTimes 25
  • 26. • Extraherar strukturerad information från Wikipedia och tillgängliggör den via webben. • Beskriver över 3,4 miljoner saker, varav 1,5 miljoner är klassificerad i en konsistent ontologi som innehåller 312.000 personer, 413.000 platser, 94.000 musik album, 49.000 filmer, 15.000 videospel, 140.000 organisationer, 146.000 arter och 4.600 sjukdomar.
  • 27. Möjliga frågor • DBPedia gör det möjligt att ställa frågor där informationen som behövs för att svara finns spridd över flera olika Wikipedia- artiklar. • Till exempel...
  • 28. Personer födda i Köpenhamn innan år 1900. 28
  • 29. 29
  • 30. 30
  • 31. NYTimes – Linked Open Data http://data.nytimes.com/
  • 32. 32
  • 33. Example app: Who Went Where?
  • 34. Vill du göra data och/ eller vokabulär tillgängliga?
  • 35. Välja vokabulär • Hur många använder? Vilka? • Underhåll och styrning • Vilka koncept täcker den? • Hur uttrycksfull är den? Baserat på http://linkeddatabook.com/ 35
  • 36. Verktyg för att utveckla vokabulär Specifikt för SKOS: • Protégé • PoolParty Thesaurus • TopBraid Composer Manager • NeOn Toolkit • VocBench (developed by the FAO of the UN) 36
  • 37. Recept för att publicera länkade data • Statiska RDF/XML-filer • Som RDF inbäddad i HTML (RDFa) • Genom egna server-side scripts • Från relationsdatabaser • Från RDF Triple Stores • Genom att ”wrappa” existerande API:er 37 http://linkeddatabook.com/
  • 38. Vill du hitta data?
  • 39. 39
  • 40. 40
  • 42. 42
  • 43. Läs mer! • Heath and Bizer (2011) Linked Data: Evolving the Web into a Global Data Space http://linkeddatabook.com/editions/1.0/ • Allemang and Hendler (2011) Semantic Web for the Working Ontologist http://workingontologist.org/ • http://www.w3.org/2001/sw/wiki/Tools