SlideShare a Scribd company logo
Länkade data - vad, varför och hur
Seminarium Dataföreningen Västra
IT på framkanten
Göteborg, 2014-12-10
Hannes Ebner
hannes@metasolutions.se
Matthias Palmér
matthias@metasolutions.se
metasolutions.se
Översikt
● Inledning
● Varför är länkade data bra?
● Vad är länkade data?
● Vanliga vokabulärer
-- Paus --
● Exempel på länkade data i Sverige
● Hur kommer man igång med länkade data?
● Teknologier som stödjer länkade data
Vitbokens upplägg
1. Introduktion
2. Fördelar
3. Kom igång
4. Teknikplattformar
5. Scenarier
6. Vanliga frågor
7. Relaterad information
Läs vitboken på http://lankadedata.se/vitbok/
Kompetensförstärkning kring länkade
öppna data i Sverige
● Vitbok
● Webbinarier
○ AstraZeneca
○ Riksantikvarieämbetet
○ Kungliga biblioteket
○ Nobel Media
○ Svenska Yle
Vitboken lever vidare
● Webbinarier även efter projektet
● Vitboken ligger kvar på GitHub
○ Kommer att uppdateras
○ Bidrag är mycket välkomna
(Skicka pull requests, lägga upp synpunkter, …)
● Undervisningsmaterial på länkadedata.se
Ett stort tack till VINNOVA för att de möjliggjort detta
projekt och till de som givit feedback!
★★★★★ gör din information tillgänglig på Webben
★★★★★ (oberoende av format) under en öppen licens
★★★★★ gör informationen tillgänglig som strukturerad data
★★★★★ (t. ex., Excel format istället för en bild av en tabell)
★★★★★ använd icke-proprietära format
★★★★★ (t. ex., CSV istället för Excel)
★★★★★ använd URI:er för att identifiera ting,
RDF för att uttrycka påståenden om dem
★★★★★ länka dina data till andras data,
det ger sammanhang
Olika tillgång till Data
Öppna data & länkade data
“Länkade data tillför länkar och ett enhetligt format
(RDF) som saknas hos öppna data.” - Vitboken
Öppna
Data
Länkade
öppna
Data
Länkade
Data
Länkade data enligt Tim Berners-Lee
“Linked data is relationships”
● Data ses som information om ting
● Ting identiferas med URI:er (webbadresser)
● Ladda ett ting (via HTTP) så får du:
○ fakta om ting
○ relationer (länkar) till andra ting
● Fakta och relationer uttrycks i språket RDF
Länkade Data - kort och koncist
Ting och relationer
http://trafikverket.se/bil/EPH879
http://skv.se/person/7508286620
EPH879
identifier
1989
created
En bil hos trafikverket:
GET http://trafikverket.se/bil/EPH879
volvo
type
owner
En person hos skatteverket:
GET http://skv.se/person/eph879
http://skv.se/person/7508286620
Sven
Andersson
1975-08-28
http://data.scb.se/terms/lkf/0380
firstName
lastName
dateOfBirth
birthPlace
2007
2008
2009
2010
2011
"Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/"
2014
Fördelar
1. Data blir en del av webben skicka med data i webbsidor
2. Förbättrad sökbarhet sökmaskiner förstår dina data bättre än
dina webbsidor
3. Interoperabilitet lättare att utbyta och samköra data
4. Återanvändbara datauttryck mindre jobb för den egna organisationen
5. Kompetenta datauttryck inga fyrkantiga lådor i runda hål
6. Ökad datakvalitét via länkar positionera dina data och externalisera
information
Förstå och återanvänd varandras data
● Ingen scraping
● Liknande uttryck
● Bättre tillgänglighet på webben
och i sökmotorer
Specialisering
● minska duplicering
● fokusera på de egna datas
specifika och unika mervärden
(genom att länka till andras data)
Förenklad maskinell bearbetning
● Semantiken klargörs
● Färdiga ramverk finns
Varför - Länkade Data
Vad är Länkade Data?
På med blåstället och kavla upp ärmarna!
(Grunderna är enkla men det är lätt
att gå vilse i bland tekniska begrepp.)
Grunderna i Länkade Data
Adressbarhet - URI
● ting har globala identifierare (URI:er)
● använd webbadresser, börjar på HTTP
Enhetligt språk - RDF
● RDF har karaktären av ett nätverk (graf)
● språket består av enskilda påståenden om:
○ fakta om ting - tex. titel, storlek, datum
○ relationer mellan ting - tex. känner, del av
● ett språk, många format - RDF/XML, Turtle, N3
(jmf. Svenska i tal, skrift, stenografi etc.)
Länkar
● mellan ting i samma datamängd
● mellan ting i andra datamängder
RDF 1.1
Resource Description Framework
Tre enkla regler:
1. Ett påstående uttrycks som “trippel” (“statement”),
med subjekt, predikat och object
2. Alla delar av ett trippel är namn (identifierare) för
entiteter (konkret eller abstrakt)
3. Objekt kan även ha ett text- eller datavärde
(literaler)
RDF 1.1 är en
W3C Rekommendation
fastställdes februari 2014
Hämta påståenden om ting
GET http://data.nobelprize.org/resource/laureate/5
GET http://data.nobelprize.org/resource/nobelprize/Physica/1903
3. Vad är länkade data
Hämta påståenden om ting 2
GET http://data.nobelprize.org/resource/laureate/5
GET http://data.nobelprize.org/resource/nobelprize/Physica/1903
Turtle formatet
GET http://data.nobelprize.org/resource/nobelprize/Physics/1903
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix dbpedia: <http://dbpedia.org/ontology/> .
@prefix nobel: <http://data.nobelprize.org/resource/terms/> .
http://data.nobelprize.org/resource/nobelprize/Physics/1903
rdf:type nobel:nobelPrize ;
rdf:type dbpedia:Award ;
nobel:laureate http://data.nobelprize.org/resource/laureate/4 ;
nobel:laureate http://data.nobelprize.org/resource/laureate/5 ;
nobel:laureate http://data.nobelprize.org/resource/laureate/6 ;
nobel:category http://data.nobelprize.org/resource/category/Physics ;
nobel:year 1903 ;
rdfs:label “Physics 1903”@en .
RDF 1.1 Turtle är en
W3C Rekommendation
fastställdes februari 2014
Frågespråket
● PREFIX, SELECT, WHERE
● DESCRIBE, CONSTRUCT, ASK
● GRAPH, UNION, OPTIONAL
● FILTER, LIMIT
Resultatformat: XML, JSON, CSV, TSV
Uppdateringsspråket
Protokoll för frågor och uppdateringar över HTTP
Graph Store HTTP Protokoll
(RESTful alternativ till protokollet ovan, används oftast för
uppdatering av hela grafer.)
SPARQL - översikt
SPARQL1.1
består av 11 olika
W3C Rekommendationer
fastställdes mars 2013
Nobelpristagare födda i Berlin
SELECT ?s ?label
WHERE {
?s <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://data.nobelprize.org/terms/Laureate> .
?s <http://dbpedia.org/ontology/birthPlace> <http://data.nobelprize.org/resource/city/Berlin> .
?s <http://www.w3.org/2000/01/rdf-schema#label> ?label .
}
PREFIX nobel: <http://data.nobelprize.org/terms/>
PREFIX nobelcity: <http://data.nobelprize.org/resource/city/>
PREFIX dbpo: <http://dbpedia.org/ontology/>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
SELECT * WHERE {
?s a nobel:Laureate ;
dbpo:birthPlace nobelcity:Berlin ;
rdfs:label ?label .
}
vi skriver om frågan
för att förbättra läsbarheten
Nobelpristagare födda i Berlin
PREFIX dbpo: <http://dbpedia.org/ontology/>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX nobelcity: <http://data.nobelprize.org/resource/city/>
SELECT * WHERE {
?s dbpo:birthPlace nobelcity:Berlin .
?s rdfs:label ?label .
}
s label
http://data.nobelprize.org/resource/laureate/491 "Gustav Stresemann"
http://data.nobelprize.org/resource/laureate/253 "Georg Wittig"
http://data.nobelprize.org/resource/laureate/340 "Ernst Boris Chain"
http://data.nobelprize.org/resource/laureate/640 "Nelly Sachs"
http://data.nobelprize.org/resource/laureate/361 "Werner Forssmann"
http://data.nobelprize.org/resource/laureate/266 "John C. Polanyi"
http://data.nobelprize.org/resource/laureate/580 "Paul Johann Ludwig Heyse"
http://data.nobelprize.org/resource/laureate/391 "Max Delbrück"
http://data.nobelprize.org/resource/laureate/185 "Adolf Otto Reinhold Windaus"
http://data.nobelprize.org/resource/laureate/164 "Johann Friedrich Wilhelm Adolf von Baeyer"
Kör frågan!
Vem var Gustav Stresemann?
SELECT ?property ?value WHERE {
<http://data.nobelprize.org/resource/laureate/491>
?property ?value .
}
Alla direkta tripplar för Gustav Stresemann:
Kör frågan!
Alla direkta tripplar
property value
dbpedia-owl:birthPlace <http://data.nobelprize.org/resource/city/Berlin>
dbpedia-owl:birthPlace <http://data.nobelprize.org/resource/country/Germany>
dbpprop:dateOfBirth 1878-05-10 (xsd:date)
dbpprop:dateOfDeath 1929-10-03 (xsd:date)
dbpedia-owl:deathPlace <http://data.nobelprize.org/resource/city/Berlin>
dbpedia-owl:deathPlace <http://data.nobelprize.org/resource/country/Germany>
foaf:familyName Stresemann
foaf:gender male
foaf:givenName Gustav
rdfs:label Gustav Stresemann
nobel:laureateAward <http://data.nobelprize.org/resource/laureateaward/486>
nobel:nobelPrize <http://data.nobelprize.org/resource/nobelprize/Peace/1926>
owl:sameAs dbpedia:Gustav_Stresemann
owl:sameAs freebase:m.01bdkd
owl:sameAs <http://viaf.org/viaf/61621945>
rdf:type nobel:Laureate
rdf:type foaf:Person 4. SPARQL
Alla tripplar
Naturligtvis kan man hämta direkt via HTTP:
Alternativt använda SPARQL:
Eller ännu enklare:
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
DESCRIBE * WHERE {
?s rdfs:label "Gustav Stresemann" .
}
DESCRIBE <http://data.nobelprize.org/resource/laureate/491>
GET http://data.nobelprize.org/resource/laureate/491
Kör frågan!
GET http://data.nobelprize.org/page/laureate/491
Resultatet i RDF formatet Turtle
<http://data.nobelprize.org/resource/laureate/491>
rdf:type foaf:Person , nobel:Laureate ;
rdfs:isDefinedBy <http://data.nobelprize.org/data/laureate/491> ;
rdfs:label "Gustav Stresemann" ;
nobel:laureateAward <http://data.nobelprize.org/resource/laureateaward/486> ;
nobel:nobelPrize <http://data.nobelprize.org/resource/nobelprize/Peace/1926> ;
dbpedia-owl:birthPlace
<http://data.nobelprize.org/resource/city/Berlin> ,
<http://data.nobelprize.org/resource/country/Germany> ;
dbpedia-owl:deathPlace
<http://data.nobelprize.org/resource/city/Berlin> ,
<http://data.nobelprize.org/resource/country/Germany> ;
dbpprop:dateOfBirth "1878-05-10"^^xsd:date ;
dbpprop:dateOfDeath "1929-10-03"^^xsd:date ;
owl:sameAs
<http://viaf.org/viaf/61621945> ,
<http://rdf.freebase.com/ns/m.01bdkd> ,
dbpedia:Gustav_Stresemann ;
foaf:familyName "Stresemann" ;
foaf:gender "male" ;
foaf:givenName "Gustav" ;
foaf:name "Gustav Stresemann" ;
foaf:page <http://data.nobelprize.org/page/laureate/491> .
Relationer kring Gustav Stresemann
Vokabulärer
Koncept-, vokabulär- och ontologispråk
SKOS, RDFS och OWL
Specifika vokabulärer - olika områden
DCTerms, FOAF, SiOC
Breda vokabulärer - försöker fånga upp det mesta
Schema.org, DBPedia-ontology, Freebase,
Yago, Umbel, OpenCyc
Koncept-, vokabulär- och ontologispråk
SKOS, RDFS och OWL
SKOS - “Simple Knowledge Organisation System”
● Hierarki av begrepp
● Att återanvändas som värden endast i objektsposition
RDF Schema 1.1
● Definera klasser och properties i RDF
● subClassOf och subPropertyOf för att förfina
● Fundamentala byggstenar för hela grafen
OWL - “Web Ontology Language”
● Kraftfullare än RDFS
DCMI Terms -
Qualified Dublin Core
Properties:
abstract, accessRights, accrualMethod, accrualPeriodicity,
accrualPolicy, alternative, audience, available, bibliographicCitation,
conformsTo, contributor, coverage, created, creator, date,
dateAccepted, dateCopyrighted, dateSubmitted, description,
educationLevel, extent, format, hasFormat, hasPart, hasVersion,
identifier, instructionalMethod, isFormatOf, isPartOf, isReferencedBy,
isReplacedBy, isRequiredBy, issued, isVersionOf, language, license,
mediator, medium, modified, provenance, publisher, references,
relation, replaces, requires, rights, rightsHolder, source, spatial,
subject, tableOfContents, temporal, title, type, valid
Intoducerades 1995 på Workshop i Dublin Ohio
av olika biblioteksorganisationer
Fokus: beskriva resurser/verk av olika slag
Underhålls av DCMI (Dublin Core Metadata Initiative)
FOAF - Friend Of A Friend
Properties: account | age | based_near | birthday | currentProject | depicts |
dnaChecksum | gender | givenName | holdsAccount | img | interest | knows | lastName | mbox |
member | nick | openid | page | phone | plan | status | surname | thumbnail | title | topic | weblog
Specification: http://xmlns.com/foaf/spec
Introduced in 2000, latest update 2010
Builds upon Dublin Core
Bing,
Google
och Yahoo
Introducerade schema.org 2011
Mer än 800 typer och 600 egenskaper
Används för att förbättra sökresultat
Schema.org
Paus
Exempel på länkade öppna data i
Sverige
Nobelpris
Kulturarv
Statistik
Riktlinjer
Länkade Nobelpris
Vokabulärer
Återanvända vokabulärer
● DC Terms
● FOAF
● DBpedia ontology
● RDF och RDF Schema (givetvist)
Nytt vokabulär
● 10 klasser
● 14 egenskaper
Länkade Nobelpris
Nobel Laureate
Länkar till andra dataset
Nobel Prize
YAGO
Freebase
DBpedia
VIAF
Bio2RDF
Linked Life Data
...
...
Förbättrade webbsidor
Nobelpris i LOD molnet
data.nobelprize.org
● RDF dump
● SPARQL
● GUI
Demo!
SPARQL exempel 1
Kvinnliga svenska nobelpristagare.
SELECT DISTINCT ?label ?motivation WHERE {
?laureate rdf:type nobel:Laureate .
?laureate dbpedia-owl:birthPlace <http://data.nobelprize.
org/resource/country/Sweden> .
?laureate foaf:gender "female" .
?laureate nobel:laureateAward ?award .
?award rdfs:label ?label .
optional {
?award nobel:motivation ?motivation .
FILTER (langMatches(lang(?motivation), "sv"))
}
}
LIMIT 10
Till resultatet
SPARQL exempel 2
Nobelpristagare som är födda i Sverige och delar priset med någon annan.
SELECT DISTINCT ?name WHERE {
?laureate dbpedia-owl:birthPlace <http://data.nobelprize.
org/resource/country/Sweden> .
?laureate nobel:laureateAward ?award .
?award nobel:share ?share .
?laureate foaf:name ?name .
FILTER (xsd:int(?share) > 1 )
}
Till resultatet
Kungliga biblioteket
● LIBRIS
○ Ett av de första exempel på LD i Sverige
○ Bl.a. svensk nationalbibliografi och auktoritetsposter
är CC-licensierade
● Exempel
○ http://libris.kb.se/bib/10432900
○ http://libris.kb.se/data/bib/10432900?format=text%
2Frdf%2Bn3
Riksantikvarieämbetet
● K-samsök
○ Kulturarvsdata som länkade data
○ Aggregering av många mindre leverantörers
dataflöden
○ Levererar till Europeana
● Demo
○ http://www.ksamsok.se/verktyg/verktyg-demo/
Statistiska centralbyrån
● Leverar statistikdata till Eurostat
○ SDMX-RDF via Eurostat
○ Enbart aggregerade data
● RDF Data cube skulle vara ett bra format
○ Finns tyvärr inte
● Fokus på URIer
○ Svensk näringsindelning (SNI)
○ Län, kommuner, församlingar (LKF)
● Exempel
○ http://data.scb.se/terms/lkf/14
○ http://data.scb.se/terms/lkf/1480
○ http://data.scb.se/terms/lkf/148001
○ http://data.scb.se/terms/sni/all
Socialstyrelsen
● Prototypnivå
○ Försäkringsmedicinskt beslutstöd
○ Nationella riktlinjer
● Exempel
○ https://sos.entryscape.com
○ https://sos.entryscape.com/fmb/
Kom igång
● Snabbstart i 6 punkter
● Tekniska lösningskategorier
Utnyttja befintlig plattform – Data ligger kvar i plattform A
1. Utvidga plattformen Plattform A utvidgas med ny funktionalitet
2. Lager ovanpå plattformen Plattform B hämtar data från plattform A
3. Molntjänst ovanpå plattformen Plattform B i molnet hämtar data från plattform A
Ny plattform – Data flyttas från plattform A till plattform B
4. Ny plattform internt Plattform B hanteras inom organisationen
5. Ny plattform i molnet Plattform B hanteras externt av annan organisation
1. Ting 3. Rita grafen 5. Turtle
2. URI:er 4. Återanvänd 6. Publicera
Teknikplattformar
● 14 distinkta teknikplattformar sammanfattas med:
○ kort beskrivning
○ aktivitetsgrad
(kommersiell support, aktiv community, osv)
○ användning och kunder
○ licens
● Plattformarna delas in i lösningskategorier, tex:
○ Molntjänst ovanpå plattformen:
■ Dydra - http://dydra.com
■ EntryScape Import - http://entryscape.com (lodify.com)
■ Swirrl PublishMyData - http://swirrl.com/publishmydata
(visas i webbläsaren)
Relaterad information
● Öppna data i Sverige
○ öppnadata.se
○ E-delegationen
○ SKL:s ramverk
● Länkade data i Sverige
○ Meetups
○ Facebook-grupp Semantiska webben i Sverige
● Länkade data internationellt
○ Se literaturhänvisningar i vitboken
http://lankadedata.se/vitbok/relaterat.html
Länkade data - vad, varför och hur

More Related Content

Viewers also liked

December news (ın turkey)
December news (ın turkey)December news (ın turkey)
December news (ın turkey)
berfinim
 
Aziz Sancar 2015 Nobel Prize in Chemistry
Aziz Sancar 2015 Nobel Prize in ChemistryAziz Sancar 2015 Nobel Prize in Chemistry
Aziz Sancar 2015 Nobel Prize in Chemistry
Gary M. Myles, Ph.D.
 
Dna repair
Dna repairDna repair
Dna repair
anoop kp
 
Nobal prize 2015
Nobal prize 2015Nobal prize 2015
Nobal prize 2015
Nawab Khatoon
 
María Cascales-Libro Premios Nobel 2015
María Cascales-Libro Premios Nobel 2015María Cascales-Libro Premios Nobel 2015
María Cascales-Libro Premios Nobel 2015
Fundación Ramón Areces
 
Beräkning av platsspecifikt riktvärde genom grundvattenmodellering, Hanna Zan...
Beräkning av platsspecifikt riktvärde genom grundvattenmodellering, Hanna Zan...Beräkning av platsspecifikt riktvärde genom grundvattenmodellering, Hanna Zan...
Beräkning av platsspecifikt riktvärde genom grundvattenmodellering, Hanna Zan...
Geological Survey of Sweden
 
Nobel prize in Chemistry - 2015 (Background)
Nobel prize in Chemistry - 2015 (Background)Nobel prize in Chemistry - 2015 (Background)
Nobel prize in Chemistry - 2015 (Background)
Ashok Kumar
 
Marc Abrahams: Improbable Research and the Ig® Nobel Prizes #crossref
Marc Abrahams: Improbable Research and the Ig® Nobel Prizes  #crossrefMarc Abrahams: Improbable Research and the Ig® Nobel Prizes  #crossref
Marc Abrahams: Improbable Research and the Ig® Nobel Prizes #crossref
Crossref
 
COWI-Sverige-deltar-i-stad
COWI-Sverige-deltar-i-stadCOWI-Sverige-deltar-i-stad
COWI-Sverige-deltar-i-stadLasse Press
 
Botkyrka kommun och Digidel 2013
Botkyrka kommun och Digidel 2013Botkyrka kommun och Digidel 2013
Botkyrka kommun och Digidel 2013
Digidel 2013
 
Nobel laureates in chemistry (1901-2015)
Nobel laureates in chemistry (1901-2015)Nobel laureates in chemistry (1901-2015)
Nobel laureates in chemistry (1901-2015)
Jeevika Alagan
 
Aziz sancar
Aziz sancarAziz sancar
Aziz sancar
Xhuljana Malka
 

Viewers also liked (12)

December news (ın turkey)
December news (ın turkey)December news (ın turkey)
December news (ın turkey)
 
Aziz Sancar 2015 Nobel Prize in Chemistry
Aziz Sancar 2015 Nobel Prize in ChemistryAziz Sancar 2015 Nobel Prize in Chemistry
Aziz Sancar 2015 Nobel Prize in Chemistry
 
Dna repair
Dna repairDna repair
Dna repair
 
Nobal prize 2015
Nobal prize 2015Nobal prize 2015
Nobal prize 2015
 
María Cascales-Libro Premios Nobel 2015
María Cascales-Libro Premios Nobel 2015María Cascales-Libro Premios Nobel 2015
María Cascales-Libro Premios Nobel 2015
 
Beräkning av platsspecifikt riktvärde genom grundvattenmodellering, Hanna Zan...
Beräkning av platsspecifikt riktvärde genom grundvattenmodellering, Hanna Zan...Beräkning av platsspecifikt riktvärde genom grundvattenmodellering, Hanna Zan...
Beräkning av platsspecifikt riktvärde genom grundvattenmodellering, Hanna Zan...
 
Nobel prize in Chemistry - 2015 (Background)
Nobel prize in Chemistry - 2015 (Background)Nobel prize in Chemistry - 2015 (Background)
Nobel prize in Chemistry - 2015 (Background)
 
Marc Abrahams: Improbable Research and the Ig® Nobel Prizes #crossref
Marc Abrahams: Improbable Research and the Ig® Nobel Prizes  #crossrefMarc Abrahams: Improbable Research and the Ig® Nobel Prizes  #crossref
Marc Abrahams: Improbable Research and the Ig® Nobel Prizes #crossref
 
COWI-Sverige-deltar-i-stad
COWI-Sverige-deltar-i-stadCOWI-Sverige-deltar-i-stad
COWI-Sverige-deltar-i-stad
 
Botkyrka kommun och Digidel 2013
Botkyrka kommun och Digidel 2013Botkyrka kommun och Digidel 2013
Botkyrka kommun och Digidel 2013
 
Nobel laureates in chemistry (1901-2015)
Nobel laureates in chemistry (1901-2015)Nobel laureates in chemistry (1901-2015)
Nobel laureates in chemistry (1901-2015)
 
Aziz sancar
Aziz sancarAziz sancar
Aziz sancar
 

Similar to Länkade data - vad, varför och hur

Norvegiana som LOD - effekter för projektet "Kultur och naturresan"
Norvegiana som LOD - effekter för projektet "Kultur och naturresan"Norvegiana som LOD - effekter för projektet "Kultur och naturresan"
Norvegiana som LOD - effekter för projektet "Kultur och naturresan"
MetaSolutions AB
 
Öppen data - Peter Krantz
Öppen data - Peter KrantzÖppen data - Peter Krantz
Öppen data - Peter Krantz
Digisam
 
Librisxl treffpunkt mikromarc
Librisxl treffpunkt mikromarcLibrisxl treffpunkt mikromarc
Librisxl treffpunkt mikromarc
Janne Johannesson
 
Webbens Arkitektur
Webbens ArkitekturWebbens Arkitektur
Webbens Arkitektur
niklal
 
Öppen tillgång till forskningsdata och FAIR-principerna - Karl Gertows presen...
Öppen tillgång till forskningsdata och FAIR-principerna - Karl Gertows presen...Öppen tillgång till forskningsdata och FAIR-principerna - Karl Gertows presen...
Öppen tillgång till forskningsdata och FAIR-principerna - Karl Gertows presen...
Kungliga biblioteket National Library of Sweden
 
Sundsvall 42 presentation
Sundsvall 42 presentationSundsvall 42 presentation
Sundsvall 42 presentation
ekkemannen
 
Introduktion till LODify
Introduktion till LODifyIntroduktion till LODify
Introduktion till LODify
MetaSolutions AB
 
LODify - länkade data i molnet
LODify - länkade data i molnetLODify - länkade data i molnet
LODify - länkade data i molnet
MetaSolutions AB
 
NORDLOD
NORDLODNORDLOD
NORDLOD
Peter Krantz
 
Open Space Sessions - One Minute Madness
Open Space Sessions - One Minute MadnessOpen Space Sessions - One Minute Madness
Open Space Sessions - One Minute Madness
Kungliga biblioteket National Library of Sweden
 
"Samla och leverera digitalt kulturarv" 2013-10-07 (ARAB)
"Samla och leverera digitalt kulturarv" 2013-10-07 (ARAB)"Samla och leverera digitalt kulturarv" 2013-10-07 (ARAB)
"Samla och leverera digitalt kulturarv" 2013-10-07 (ARAB)
Lars Lundqvist
 
MOA 2014, OA-publicering vid svenska lärosäten - en kartläggning 2011
MOA 2014, OA-publicering vid svenska lärosäten - en kartläggning 2011MOA 2014, OA-publicering vid svenska lärosäten - en kartläggning 2011
MOA 2014, OA-publicering vid svenska lärosäten - en kartläggning 2011
Kungliga biblioteket National Library of Sweden
 
Lars Borin "Vad är Swe-Clarin?" KB 9 oktober 2015
Lars Borin "Vad är Swe-Clarin?" KB 9 oktober 2015 Lars Borin "Vad är Swe-Clarin?" KB 9 oktober 2015
Lars Borin "Vad är Swe-Clarin?" KB 9 oktober 2015
Digisam
 

Similar to Länkade data - vad, varför och hur (13)

Norvegiana som LOD - effekter för projektet "Kultur och naturresan"
Norvegiana som LOD - effekter för projektet "Kultur och naturresan"Norvegiana som LOD - effekter för projektet "Kultur och naturresan"
Norvegiana som LOD - effekter för projektet "Kultur och naturresan"
 
Öppen data - Peter Krantz
Öppen data - Peter KrantzÖppen data - Peter Krantz
Öppen data - Peter Krantz
 
Librisxl treffpunkt mikromarc
Librisxl treffpunkt mikromarcLibrisxl treffpunkt mikromarc
Librisxl treffpunkt mikromarc
 
Webbens Arkitektur
Webbens ArkitekturWebbens Arkitektur
Webbens Arkitektur
 
Öppen tillgång till forskningsdata och FAIR-principerna - Karl Gertows presen...
Öppen tillgång till forskningsdata och FAIR-principerna - Karl Gertows presen...Öppen tillgång till forskningsdata och FAIR-principerna - Karl Gertows presen...
Öppen tillgång till forskningsdata och FAIR-principerna - Karl Gertows presen...
 
Sundsvall 42 presentation
Sundsvall 42 presentationSundsvall 42 presentation
Sundsvall 42 presentation
 
Introduktion till LODify
Introduktion till LODifyIntroduktion till LODify
Introduktion till LODify
 
LODify - länkade data i molnet
LODify - länkade data i molnetLODify - länkade data i molnet
LODify - länkade data i molnet
 
NORDLOD
NORDLODNORDLOD
NORDLOD
 
Open Space Sessions - One Minute Madness
Open Space Sessions - One Minute MadnessOpen Space Sessions - One Minute Madness
Open Space Sessions - One Minute Madness
 
"Samla och leverera digitalt kulturarv" 2013-10-07 (ARAB)
"Samla och leverera digitalt kulturarv" 2013-10-07 (ARAB)"Samla och leverera digitalt kulturarv" 2013-10-07 (ARAB)
"Samla och leverera digitalt kulturarv" 2013-10-07 (ARAB)
 
MOA 2014, OA-publicering vid svenska lärosäten - en kartläggning 2011
MOA 2014, OA-publicering vid svenska lärosäten - en kartläggning 2011MOA 2014, OA-publicering vid svenska lärosäten - en kartläggning 2011
MOA 2014, OA-publicering vid svenska lärosäten - en kartläggning 2011
 
Lars Borin "Vad är Swe-Clarin?" KB 9 oktober 2015
Lars Borin "Vad är Swe-Clarin?" KB 9 oktober 2015 Lars Borin "Vad är Swe-Clarin?" KB 9 oktober 2015
Lars Borin "Vad är Swe-Clarin?" KB 9 oktober 2015
 

Länkade data - vad, varför och hur

  • 1. Länkade data - vad, varför och hur Seminarium Dataföreningen Västra IT på framkanten Göteborg, 2014-12-10 Hannes Ebner hannes@metasolutions.se Matthias Palmér matthias@metasolutions.se metasolutions.se
  • 2. Översikt ● Inledning ● Varför är länkade data bra? ● Vad är länkade data? ● Vanliga vokabulärer -- Paus -- ● Exempel på länkade data i Sverige ● Hur kommer man igång med länkade data? ● Teknologier som stödjer länkade data
  • 3. Vitbokens upplägg 1. Introduktion 2. Fördelar 3. Kom igång 4. Teknikplattformar 5. Scenarier 6. Vanliga frågor 7. Relaterad information Läs vitboken på http://lankadedata.se/vitbok/
  • 4. Kompetensförstärkning kring länkade öppna data i Sverige ● Vitbok ● Webbinarier ○ AstraZeneca ○ Riksantikvarieämbetet ○ Kungliga biblioteket ○ Nobel Media ○ Svenska Yle
  • 5. Vitboken lever vidare ● Webbinarier även efter projektet ● Vitboken ligger kvar på GitHub ○ Kommer att uppdateras ○ Bidrag är mycket välkomna (Skicka pull requests, lägga upp synpunkter, …) ● Undervisningsmaterial på länkadedata.se Ett stort tack till VINNOVA för att de möjliggjort detta projekt och till de som givit feedback!
  • 6. ★★★★★ gör din information tillgänglig på Webben ★★★★★ (oberoende av format) under en öppen licens ★★★★★ gör informationen tillgänglig som strukturerad data ★★★★★ (t. ex., Excel format istället för en bild av en tabell) ★★★★★ använd icke-proprietära format ★★★★★ (t. ex., CSV istället för Excel) ★★★★★ använd URI:er för att identifiera ting, RDF för att uttrycka påståenden om dem ★★★★★ länka dina data till andras data, det ger sammanhang Olika tillgång till Data
  • 7. Öppna data & länkade data “Länkade data tillför länkar och ett enhetligt format (RDF) som saknas hos öppna data.” - Vitboken Öppna Data Länkade öppna Data Länkade Data
  • 8. Länkade data enligt Tim Berners-Lee “Linked data is relationships”
  • 9. ● Data ses som information om ting ● Ting identiferas med URI:er (webbadresser) ● Ladda ett ting (via HTTP) så får du: ○ fakta om ting ○ relationer (länkar) till andra ting ● Fakta och relationer uttrycks i språket RDF Länkade Data - kort och koncist
  • 10. Ting och relationer http://trafikverket.se/bil/EPH879 http://skv.se/person/7508286620 EPH879 identifier 1989 created En bil hos trafikverket: GET http://trafikverket.se/bil/EPH879 volvo type owner En person hos skatteverket: GET http://skv.se/person/eph879 http://skv.se/person/7508286620 Sven Andersson 1975-08-28 http://data.scb.se/terms/lkf/0380 firstName lastName dateOfBirth birthPlace
  • 11. 2007
  • 12. 2008
  • 13. 2009
  • 14. 2010
  • 15. 2011
  • 16. "Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/" 2014
  • 17. Fördelar 1. Data blir en del av webben skicka med data i webbsidor 2. Förbättrad sökbarhet sökmaskiner förstår dina data bättre än dina webbsidor 3. Interoperabilitet lättare att utbyta och samköra data 4. Återanvändbara datauttryck mindre jobb för den egna organisationen 5. Kompetenta datauttryck inga fyrkantiga lådor i runda hål 6. Ökad datakvalitét via länkar positionera dina data och externalisera information
  • 18. Förstå och återanvänd varandras data ● Ingen scraping ● Liknande uttryck ● Bättre tillgänglighet på webben och i sökmotorer Specialisering ● minska duplicering ● fokusera på de egna datas specifika och unika mervärden (genom att länka till andras data) Förenklad maskinell bearbetning ● Semantiken klargörs ● Färdiga ramverk finns Varför - Länkade Data
  • 19. Vad är Länkade Data? På med blåstället och kavla upp ärmarna! (Grunderna är enkla men det är lätt att gå vilse i bland tekniska begrepp.)
  • 20. Grunderna i Länkade Data Adressbarhet - URI ● ting har globala identifierare (URI:er) ● använd webbadresser, börjar på HTTP Enhetligt språk - RDF ● RDF har karaktären av ett nätverk (graf) ● språket består av enskilda påståenden om: ○ fakta om ting - tex. titel, storlek, datum ○ relationer mellan ting - tex. känner, del av ● ett språk, många format - RDF/XML, Turtle, N3 (jmf. Svenska i tal, skrift, stenografi etc.) Länkar ● mellan ting i samma datamängd ● mellan ting i andra datamängder
  • 21. RDF 1.1 Resource Description Framework Tre enkla regler: 1. Ett påstående uttrycks som “trippel” (“statement”), med subjekt, predikat och object 2. Alla delar av ett trippel är namn (identifierare) för entiteter (konkret eller abstrakt) 3. Objekt kan även ha ett text- eller datavärde (literaler) RDF 1.1 är en W3C Rekommendation fastställdes februari 2014
  • 22. Hämta påståenden om ting GET http://data.nobelprize.org/resource/laureate/5 GET http://data.nobelprize.org/resource/nobelprize/Physica/1903 3. Vad är länkade data
  • 23. Hämta påståenden om ting 2 GET http://data.nobelprize.org/resource/laureate/5 GET http://data.nobelprize.org/resource/nobelprize/Physica/1903
  • 24. Turtle formatet GET http://data.nobelprize.org/resource/nobelprize/Physics/1903 @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix dbpedia: <http://dbpedia.org/ontology/> . @prefix nobel: <http://data.nobelprize.org/resource/terms/> . http://data.nobelprize.org/resource/nobelprize/Physics/1903 rdf:type nobel:nobelPrize ; rdf:type dbpedia:Award ; nobel:laureate http://data.nobelprize.org/resource/laureate/4 ; nobel:laureate http://data.nobelprize.org/resource/laureate/5 ; nobel:laureate http://data.nobelprize.org/resource/laureate/6 ; nobel:category http://data.nobelprize.org/resource/category/Physics ; nobel:year 1903 ; rdfs:label “Physics 1903”@en . RDF 1.1 Turtle är en W3C Rekommendation fastställdes februari 2014
  • 25. Frågespråket ● PREFIX, SELECT, WHERE ● DESCRIBE, CONSTRUCT, ASK ● GRAPH, UNION, OPTIONAL ● FILTER, LIMIT Resultatformat: XML, JSON, CSV, TSV Uppdateringsspråket Protokoll för frågor och uppdateringar över HTTP Graph Store HTTP Protokoll (RESTful alternativ till protokollet ovan, används oftast för uppdatering av hela grafer.) SPARQL - översikt SPARQL1.1 består av 11 olika W3C Rekommendationer fastställdes mars 2013
  • 26. Nobelpristagare födda i Berlin SELECT ?s ?label WHERE { ?s <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://data.nobelprize.org/terms/Laureate> . ?s <http://dbpedia.org/ontology/birthPlace> <http://data.nobelprize.org/resource/city/Berlin> . ?s <http://www.w3.org/2000/01/rdf-schema#label> ?label . } PREFIX nobel: <http://data.nobelprize.org/terms/> PREFIX nobelcity: <http://data.nobelprize.org/resource/city/> PREFIX dbpo: <http://dbpedia.org/ontology/> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> SELECT * WHERE { ?s a nobel:Laureate ; dbpo:birthPlace nobelcity:Berlin ; rdfs:label ?label . } vi skriver om frågan för att förbättra läsbarheten
  • 27. Nobelpristagare födda i Berlin PREFIX dbpo: <http://dbpedia.org/ontology/> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX nobelcity: <http://data.nobelprize.org/resource/city/> SELECT * WHERE { ?s dbpo:birthPlace nobelcity:Berlin . ?s rdfs:label ?label . } s label http://data.nobelprize.org/resource/laureate/491 "Gustav Stresemann" http://data.nobelprize.org/resource/laureate/253 "Georg Wittig" http://data.nobelprize.org/resource/laureate/340 "Ernst Boris Chain" http://data.nobelprize.org/resource/laureate/640 "Nelly Sachs" http://data.nobelprize.org/resource/laureate/361 "Werner Forssmann" http://data.nobelprize.org/resource/laureate/266 "John C. Polanyi" http://data.nobelprize.org/resource/laureate/580 "Paul Johann Ludwig Heyse" http://data.nobelprize.org/resource/laureate/391 "Max Delbrück" http://data.nobelprize.org/resource/laureate/185 "Adolf Otto Reinhold Windaus" http://data.nobelprize.org/resource/laureate/164 "Johann Friedrich Wilhelm Adolf von Baeyer" Kör frågan!
  • 28. Vem var Gustav Stresemann? SELECT ?property ?value WHERE { <http://data.nobelprize.org/resource/laureate/491> ?property ?value . } Alla direkta tripplar för Gustav Stresemann: Kör frågan!
  • 29. Alla direkta tripplar property value dbpedia-owl:birthPlace <http://data.nobelprize.org/resource/city/Berlin> dbpedia-owl:birthPlace <http://data.nobelprize.org/resource/country/Germany> dbpprop:dateOfBirth 1878-05-10 (xsd:date) dbpprop:dateOfDeath 1929-10-03 (xsd:date) dbpedia-owl:deathPlace <http://data.nobelprize.org/resource/city/Berlin> dbpedia-owl:deathPlace <http://data.nobelprize.org/resource/country/Germany> foaf:familyName Stresemann foaf:gender male foaf:givenName Gustav rdfs:label Gustav Stresemann nobel:laureateAward <http://data.nobelprize.org/resource/laureateaward/486> nobel:nobelPrize <http://data.nobelprize.org/resource/nobelprize/Peace/1926> owl:sameAs dbpedia:Gustav_Stresemann owl:sameAs freebase:m.01bdkd owl:sameAs <http://viaf.org/viaf/61621945> rdf:type nobel:Laureate rdf:type foaf:Person 4. SPARQL
  • 30. Alla tripplar Naturligtvis kan man hämta direkt via HTTP: Alternativt använda SPARQL: Eller ännu enklare: PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> DESCRIBE * WHERE { ?s rdfs:label "Gustav Stresemann" . } DESCRIBE <http://data.nobelprize.org/resource/laureate/491> GET http://data.nobelprize.org/resource/laureate/491 Kör frågan! GET http://data.nobelprize.org/page/laureate/491
  • 31. Resultatet i RDF formatet Turtle <http://data.nobelprize.org/resource/laureate/491> rdf:type foaf:Person , nobel:Laureate ; rdfs:isDefinedBy <http://data.nobelprize.org/data/laureate/491> ; rdfs:label "Gustav Stresemann" ; nobel:laureateAward <http://data.nobelprize.org/resource/laureateaward/486> ; nobel:nobelPrize <http://data.nobelprize.org/resource/nobelprize/Peace/1926> ; dbpedia-owl:birthPlace <http://data.nobelprize.org/resource/city/Berlin> , <http://data.nobelprize.org/resource/country/Germany> ; dbpedia-owl:deathPlace <http://data.nobelprize.org/resource/city/Berlin> , <http://data.nobelprize.org/resource/country/Germany> ; dbpprop:dateOfBirth "1878-05-10"^^xsd:date ; dbpprop:dateOfDeath "1929-10-03"^^xsd:date ; owl:sameAs <http://viaf.org/viaf/61621945> , <http://rdf.freebase.com/ns/m.01bdkd> , dbpedia:Gustav_Stresemann ; foaf:familyName "Stresemann" ; foaf:gender "male" ; foaf:givenName "Gustav" ; foaf:name "Gustav Stresemann" ; foaf:page <http://data.nobelprize.org/page/laureate/491> .
  • 33. Vokabulärer Koncept-, vokabulär- och ontologispråk SKOS, RDFS och OWL Specifika vokabulärer - olika områden DCTerms, FOAF, SiOC Breda vokabulärer - försöker fånga upp det mesta Schema.org, DBPedia-ontology, Freebase, Yago, Umbel, OpenCyc
  • 34. Koncept-, vokabulär- och ontologispråk SKOS, RDFS och OWL SKOS - “Simple Knowledge Organisation System” ● Hierarki av begrepp ● Att återanvändas som värden endast i objektsposition RDF Schema 1.1 ● Definera klasser och properties i RDF ● subClassOf och subPropertyOf för att förfina ● Fundamentala byggstenar för hela grafen OWL - “Web Ontology Language” ● Kraftfullare än RDFS
  • 35. DCMI Terms - Qualified Dublin Core Properties: abstract, accessRights, accrualMethod, accrualPeriodicity, accrualPolicy, alternative, audience, available, bibliographicCitation, conformsTo, contributor, coverage, created, creator, date, dateAccepted, dateCopyrighted, dateSubmitted, description, educationLevel, extent, format, hasFormat, hasPart, hasVersion, identifier, instructionalMethod, isFormatOf, isPartOf, isReferencedBy, isReplacedBy, isRequiredBy, issued, isVersionOf, language, license, mediator, medium, modified, provenance, publisher, references, relation, replaces, requires, rights, rightsHolder, source, spatial, subject, tableOfContents, temporal, title, type, valid Intoducerades 1995 på Workshop i Dublin Ohio av olika biblioteksorganisationer Fokus: beskriva resurser/verk av olika slag Underhålls av DCMI (Dublin Core Metadata Initiative)
  • 36. FOAF - Friend Of A Friend Properties: account | age | based_near | birthday | currentProject | depicts | dnaChecksum | gender | givenName | holdsAccount | img | interest | knows | lastName | mbox | member | nick | openid | page | phone | plan | status | surname | thumbnail | title | topic | weblog Specification: http://xmlns.com/foaf/spec Introduced in 2000, latest update 2010 Builds upon Dublin Core
  • 37. Bing, Google och Yahoo Introducerade schema.org 2011 Mer än 800 typer och 600 egenskaper Används för att förbättra sökresultat Schema.org
  • 38. Paus
  • 39. Exempel på länkade öppna data i Sverige Nobelpris Kulturarv Statistik Riktlinjer
  • 41. Vokabulärer Återanvända vokabulärer ● DC Terms ● FOAF ● DBpedia ontology ● RDF och RDF Schema (givetvist) Nytt vokabulär ● 10 klasser ● 14 egenskaper
  • 43. Nobel Laureate Länkar till andra dataset Nobel Prize YAGO Freebase DBpedia VIAF Bio2RDF Linked Life Data ... ...
  • 45. Nobelpris i LOD molnet
  • 46. data.nobelprize.org ● RDF dump ● SPARQL ● GUI Demo!
  • 47. SPARQL exempel 1 Kvinnliga svenska nobelpristagare. SELECT DISTINCT ?label ?motivation WHERE { ?laureate rdf:type nobel:Laureate . ?laureate dbpedia-owl:birthPlace <http://data.nobelprize. org/resource/country/Sweden> . ?laureate foaf:gender "female" . ?laureate nobel:laureateAward ?award . ?award rdfs:label ?label . optional { ?award nobel:motivation ?motivation . FILTER (langMatches(lang(?motivation), "sv")) } } LIMIT 10 Till resultatet
  • 48. SPARQL exempel 2 Nobelpristagare som är födda i Sverige och delar priset med någon annan. SELECT DISTINCT ?name WHERE { ?laureate dbpedia-owl:birthPlace <http://data.nobelprize. org/resource/country/Sweden> . ?laureate nobel:laureateAward ?award . ?award nobel:share ?share . ?laureate foaf:name ?name . FILTER (xsd:int(?share) > 1 ) } Till resultatet
  • 49. Kungliga biblioteket ● LIBRIS ○ Ett av de första exempel på LD i Sverige ○ Bl.a. svensk nationalbibliografi och auktoritetsposter är CC-licensierade ● Exempel ○ http://libris.kb.se/bib/10432900 ○ http://libris.kb.se/data/bib/10432900?format=text% 2Frdf%2Bn3
  • 50. Riksantikvarieämbetet ● K-samsök ○ Kulturarvsdata som länkade data ○ Aggregering av många mindre leverantörers dataflöden ○ Levererar till Europeana ● Demo ○ http://www.ksamsok.se/verktyg/verktyg-demo/
  • 51. Statistiska centralbyrån ● Leverar statistikdata till Eurostat ○ SDMX-RDF via Eurostat ○ Enbart aggregerade data ● RDF Data cube skulle vara ett bra format ○ Finns tyvärr inte ● Fokus på URIer ○ Svensk näringsindelning (SNI) ○ Län, kommuner, församlingar (LKF) ● Exempel ○ http://data.scb.se/terms/lkf/14 ○ http://data.scb.se/terms/lkf/1480 ○ http://data.scb.se/terms/lkf/148001 ○ http://data.scb.se/terms/sni/all
  • 52. Socialstyrelsen ● Prototypnivå ○ Försäkringsmedicinskt beslutstöd ○ Nationella riktlinjer ● Exempel ○ https://sos.entryscape.com ○ https://sos.entryscape.com/fmb/
  • 53. Kom igång ● Snabbstart i 6 punkter ● Tekniska lösningskategorier Utnyttja befintlig plattform – Data ligger kvar i plattform A 1. Utvidga plattformen Plattform A utvidgas med ny funktionalitet 2. Lager ovanpå plattformen Plattform B hämtar data från plattform A 3. Molntjänst ovanpå plattformen Plattform B i molnet hämtar data från plattform A Ny plattform – Data flyttas från plattform A till plattform B 4. Ny plattform internt Plattform B hanteras inom organisationen 5. Ny plattform i molnet Plattform B hanteras externt av annan organisation 1. Ting 3. Rita grafen 5. Turtle 2. URI:er 4. Återanvänd 6. Publicera
  • 54. Teknikplattformar ● 14 distinkta teknikplattformar sammanfattas med: ○ kort beskrivning ○ aktivitetsgrad (kommersiell support, aktiv community, osv) ○ användning och kunder ○ licens ● Plattformarna delas in i lösningskategorier, tex: ○ Molntjänst ovanpå plattformen: ■ Dydra - http://dydra.com ■ EntryScape Import - http://entryscape.com (lodify.com) ■ Swirrl PublishMyData - http://swirrl.com/publishmydata
  • 55.
  • 56.
  • 58. Relaterad information ● Öppna data i Sverige ○ öppnadata.se ○ E-delegationen ○ SKL:s ramverk ● Länkade data i Sverige ○ Meetups ○ Facebook-grupp Semantiska webben i Sverige ● Länkade data internationellt ○ Se literaturhänvisningar i vitboken http://lankadedata.se/vitbok/relaterat.html