Linked DataSAPIENZA UNIVERSITA’ DI ROMADIPARTIMENTO DI SCIENZE DOCUMENTARIE, LINGUISTICO-FILOLOGICHE E GEOGRAFICHESCUOLA D...
Verso i Linked DataNell’ottobre 2011 il Library Linked Data IncubatorGroup (LLD XG) creato presso il World Wide WebConsort...
web di documenti e web di datiIl web ipertestuale o web di documenti = rappresentazionepiatta, lineare, degli oggetti;il w...
Linked Data: una definizioneDati pubblicati sul web in una modalità leggibile e interpretabile dauna macchina, il cui sign...
Partire dai metadatiI metadatidescrittivi (MARC, Dublin Core, PURL, HANDLE, PICO AP ecc.),gestionali - amministrativi (MAG...
Perché il DUBLIN CORENel febbraio 2009, il DC è stato approvato come lo standard ISO 15836,che ha un ruolo fondamentale ne...
OAI-PMH: raccolta e scambio di metadatiL’interazione (che è alla base dell’interoperabilità) tra i variprovider per l’espo...
Linkare i (meta)datiIl web, essendo uno spazio di informazione globale, deveconsistere non solo di documenti linkati, ma a...
Il progetto di W3C Linking Open DataIl progetto di W3C Linking Open Data(Open Definition, <http://opendefinition.org>)forn...
Linking Open Data (LOD) CloudNel settembre 2010, questi dati sono cresciuti a 25 miliardi di triple RDF,interlinkate da ci...
Linking Open Data (LOD) Cloud 2Il sito http://linkeddata.org fornisce tutte leinformazioni su quest’iniziativa e pubblica ...
Il modello LODCon il modello LOD è come se i dati, resi interoperabili, entrassero a far parte di unimmenso database “aper...
LOD: alcuni esempiC’è una grande quantità di LOD già presenti nel Web come, ad esempio,DBPedia.org, Wikipedia eWikiGuida, ...
La DBPediaLa DBpedia Italiana è un progetto per l’estrazione e il riutilizzo di informazionisemanticamente strutturate dal...
Linked Open Data ItaliaLinked Open Data Italia pubblica dati aperti e facilmente accessibili dapersone e applicazioni.I da...
DBpedia ItalianaOltre 1 milione di entità estratte da Wikipedia inlingua italianaDati.camera.itI dati storici ufficiali de...
Supponiamo che i due dataset (amministrazione locale e sovrintendenza) siano stati pubblicati come Linked Data.Per identif...
Anche in Italia le PA producono una enorme quantità di informazione in formatodigitale, e tuttavia spesso si tratta di inf...
Quattro regole per la creazione dei linked datasul web - 1Tim Berners-Lee individua quattro regole per la creazione deilin...
Quattro regole per la creazione dei linked datasul web - 22. Usare HTTP URI in modo che gli oggetti possano essereindividu...
Quattro regole per la creazione dei linked datasul web - 33. Fornire informazioni utili sull’oggetto (quando si individuau...
Quattro regole per la creazione dei linked datasul web - 44. Includere link ad altri URI relativi ai dati esposti permigli...
PER APPROFONDIRE:Iryna Solodovnik, Comunicazione e ricerca semantica di contenuti informativi:tra Metadati, Linked open Da...
5a. Linked Data
5a. Linked Data
Upcoming SlideShare
Loading in …5
×

5a. Linked Data

427 views
338 views

Published on

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
427
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
10
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

5a. Linked Data

  1. 1. Linked DataSAPIENZA UNIVERSITA’ DI ROMADIPARTIMENTO DI SCIENZE DOCUMENTARIE, LINGUISTICO-FILOLOGICHE E GEOGRAFICHESCUOLA DI SPECIALIZZAZIONE IN BENI ARCHIVISTICI E LIBRARIAnno accademico 2012-2013Insegnamento: INFORMATICA PER GLI ARCHIVI E LE BIBLIOTECHEProf. Giovanni SolimineModulo integrativoINFORMATICA PER LE BIBLIOTECHEProf. Maurizio Caminito
  2. 2. Verso i Linked DataNell’ottobre 2011 il Library Linked Data IncubatorGroup (LLD XG) creato presso il World Wide WebConsortium (W3C) ha pubblicato la sua relazione finale.Questa relazione sostiene con forza la necessità cheMusei, Archivi e Biblioteche a partire dalle agenziebibliografiche nazionali, rendano disponibili i loro datinel web in una forma nuova, ovvero come linked data.
  3. 3. web di documenti e web di datiIl web ipertestuale o web di documenti = rappresentazionepiatta, lineare, degli oggetti;il web semantico o web di dati come un contenitore dicose, di oggetti, piuttosto che un contenitore dirappresentazioni di oggetti: i dati afferiscono alla risorsa e nesono parte integrante perché la risorsa non sarebberappresentabile senza questi dati.La concretezza del web semanticosi oppone all’astrattezza del web tradizionale.
  4. 4. Linked Data: una definizioneDati pubblicati sul web in una modalità leggibile e interpretabile dauna macchina, il cui significato sia esplicitamente definito tramiteuna stringa costituita da parole e marcatori.Si costruisce un reticolo di dati collegati (linked data, appunto)appartenenti a un dominio (che costituisce il contesto dipartenza), collegato a sua volta ad altri set di dati esterni, ovverofuori dal dominio, in un contesto di relazioni sempre più estese.(Mauro Guerrini, http://www.bibliotecheoggi.it/content/201200300701.pdf)
  5. 5. Partire dai metadatiI metadatidescrittivi (MARC, Dublin Core, PURL, HANDLE, PICO AP ecc.),gestionali - amministrativi (MAG, DOI, CEDARS, METS ecc.)o strutturali (SGML, XML, EAD, MOA2 ecc.),hanno un unico obiettivo:quello di contribuire a una gestione più chiaradi oggetti/collezioni digitali.
  6. 6. Perché il DUBLIN CORENel febbraio 2009, il DC è stato approvato come lo standard ISO 15836,che ha un ruolo fondamentale nella descrizione di risorse digitali didiverso tipo e nella realizzazione di sistemi di reperimento delleinformazioni più efficienti sul web.«le stringhe di testo, strutturate secondo lo schema DC (quindicielementi nella loro forma non qualificata) e associate aidocumenti digitali, garantiscono un livello minimo dicatalogazione e indicizzazione nel web.I metadati DC si applicano ai contenuti digitali come etichette<tag>, che descrivono le caratteristiche principali di datistrutturati (HTML, XML), consentendo una loro organizzazionepiù efficiente e un recupero più agevole.»
  7. 7. OAI-PMH: raccolta e scambio di metadatiL’interazione (che è alla base dell’interoperabilità) tra i variprovider per l’esposizione e la raccolta di metadati avvienetramite il protocollo Open Archives Initiative Protocol forMetadata Harvesting (OAI-PMH) all’interno di un’architetturadi data providers e server providers.
  8. 8. Linkare i (meta)datiIl web, essendo uno spazio di informazione globale, deveconsistere non solo di documenti linkati, ma anche dimeta(dati) linkati. L’iniziativa Linked Data, sostenutadall’ideatore del World Wide Web, Tim Berners-Lee, hal’obiettivo di promuovere la creazione di nuovi dataset ecollegarli (linkarli) direttamente ai dataset esistenti, tenendo idati sempre aggiornati
  9. 9. Il progetto di W3C Linking Open DataIl progetto di W3C Linking Open Data(Open Definition, <http://opendefinition.org>)fornisce tutte le informazioni necessarie per estendere il webcon Open Data Commons(<http://www.opendatacommons.org/>).L’estensione di dataset avviene attraverso la pubblicazione dicollegamenti (links) RDF, strumento essenziale per condivideremetadati strutturati.
  10. 10. Linking Open Data (LOD) CloudNel settembre 2010, questi dati sono cresciuti a 25 miliardi di triple RDF,interlinkate da circa 395 milioni di link RDF.I collegamenti tra diversi dataset vengono graficamente rappresentati nella forma diuna grande ‘nuvola’ chiamata “LOD cloud diagram”, in cui vi è una visualizzazioneinterattiva dei gruppi di dataset interoperabili
  11. 11. Linking Open Data (LOD) Cloud 2Il sito http://linkeddata.org fornisce tutte leinformazioni su quest’iniziativa e pubblica la “nuvola”aggiornata, ovvero il diagramma della situazionecorrente del Linking Open (LOD) Data Project.
  12. 12. Il modello LODCon il modello LOD è come se i dati, resi interoperabili, entrassero a far parte di unimmenso database “aperto” nel quale vengono pubblicati da istituzioni diverse setdi dati “grezzi” che possono essere liberamente “incrociati” da terze parti, con lapossibilità di generare valore aggiunto.Un esempio pratico: un ente del turismo pubblica una serie di dati sintetici relativia strutture ricettive, ristoranti, musei e monumenti di un determinato luogo, e nellostesso territorio alcuni musei pubblicano i dati delle opere esposte nel museo odegli artisti delle opere.Attraverso i LOD un terzo soggetto ha la possibilità di combinare i due set di datiper offrire un nuovo servizio personalizzato, in base alle esigenze di una tipologiaspecifica di utenti. Naturalmente, questo collegamento potrebbe anche essererealizzato manualmente, però con maggior dispendio di tempo e con maggiorpossibilità di errore.
  13. 13. LOD: alcuni esempiC’è una grande quantità di LOD già presenti nel Web come, ad esempio,DBPedia.org, Wikipedia eWikiGuida, Geonames, MusicBrainz, WordNet,la bibliografia DBLP.Si segnalano, inoltre:• UMBEL Web Services (<http://umbel.zitgist.com/>),• Virtuoso Universal Server (<http://virtuoso.openlinksw.com/>)• Linked Open Data Around-The-Clock (<http://latcproject.eu/>), lepiattaforme create su LOD che pubblicano e distribuiscono i dati sulweb, usando il modello RDF, gli URIs e il protocollo Http.
  14. 14. La DBPediaLa DBpedia Italiana è un progetto per l’estrazione e il riutilizzo di informazionisemanticamente strutturate dalla versione italiana di Wikipedia.Il progetto mira a rendere riutilizzabili le informazioni di Wikipedia da parte disoftware e applicazioni. La DBpedia Italiana permette di eseguire query suicontenuti di Wikipedia e di collegare altri dataset Linked Data a Wikipedia.Oggi la versione inglese di DBpedia è al centro della Linked Open DataCloud e costituisce un importante riferimento per il collegamento tra diversidataset.La base di conoscenza contiene ad oggi più di 1,5 milioni di entità, di cui circa500.000 sono classificate secondo una ontologia. Tra queste vi sono più di263.000 persone, 144.000 luoghi, 38.000 Album musicali, 29.000 film,collegate tra di loro da oltre 25 milioni di links. Al più presto verranno inseritianche link verso siti web esterni e altri nodi della Linked Open Data cloud.
  15. 15. Linked Open Data ItaliaLinked Open Data Italia pubblica dati aperti e facilmente accessibili dapersone e applicazioni.I data set a disposizione, con licenze aperte e pubblicati in modalitàLinkedData, possono essere direttamente interrogati da qualsiasiapplicazione indipendentemente da linguaggi di programmazione etecnologie.http://www.linkedopendata.it/
  16. 16. DBpedia ItalianaOltre 1 milione di entità estratte da Wikipedia inlingua italianaDati.camera.itI dati storici ufficiali della camera dei deputatipubblicati dal Parlamento ItalianoPortale Dati.PiemonteUna piccola collezione di dataset RDF pubblicatidalla Regione PiemonteGeoportale TrentinoVasta collezione di dataset geografici della ProvinciaAutonoma di TrentoProvincia di Carbonia IglesiasIl portale semantico della Provincia di CarboniaIglesiasIstat-ImmigrazioneTutti i dataset ISTAT su Immigrazione in formato RDFDataCubeLinkedOpenCameraCollaborazioni e consulenze della Camera deideputati vigenti al 1° gennaio 2010loc2 Aggiornamento contratti Camera dei Deputati 2010losCollaborazioni e consulenze del Senato dellaRepubblica, 2010GR-Ricettività PiemonteStrutture ricettive turistiche della regione Piemontein formato GoodRelationsGR-Ricettività ToscanaStrutture ricettive turistiche della regione Toscanain formato GoodRelationsMusei Italiani Lista dei musei italianiCAP Italia Codici Avviamento PostaleCNR-IT Organizzazione Consiglio Nazionale delle RicercheScuole Italiane Le oltre 50.000 scuole statali italianeLOIUSThe LOIUS project – Linking Italian UniversityStatisticsDataset
  17. 17. Supponiamo che i due dataset (amministrazione locale e sovrintendenza) siano stati pubblicati come Linked Data.Per identificare i monumenti, il dataset delle sovrintendenza usa URL (del tipo http://cultural-heritage-example.org/monument/XYZ).Il contenuto digitale di tali URL corrisponde alla descrizione dettagliata dei monumenti.Il data set dell’amministrazione locale, inserendo dei link a tali URL, permetterebbe a un software di risolvere l’URL eottenere la descrizione del monumento (sempre aggiornata).Ancora, dal momento che RDF consente di specificare precisi tipi di risorse, potremmo pensare a un semplice script cheTrovi tutte le risorse di tipo “monumento” nel dataset dell’amministrazione locale, e che importi, per ciascuna,informazioni aggiuntive, creando così un dataset misto.Su quest’ultimo nuovo data set arricchito, si potrebbero poi fare query del tipo:“trova tutti gli alberghi vicini a un monumento successivo al XIII secolo, in cui siano esposte sculture del Canova”.
  18. 18. Anche in Italia le PA producono una enorme quantità di informazione in formatodigitale, e tuttavia spesso si tratta di informazioni difficilmente accessibili.Questo dipende anche dal fatto che nel nostro paese mancano linee guida
 omogeneeche ne disciplinino l’uso e il riuso in ambiti diversi da quelli
 d’origine.Ci sono però ampi margini perché ciò sia possibile, primo tra tutti l’art. 1 della legge241/1990, fondamentale riforma sul procedimento amministrativo e sul diritto diaccesso ai documenti amministrativi che sancisce il valore giuridico della trasparenza.Linked Open Data, insieme a dati.piemonte.it, è tra i primi progetti italiani che vanno inquesta direzione.I benefici per i cittadini sono molti:• Tantissimi nuovi servizi a disposizione (creati dalle PA ma anche da aziende e daglistessi cittadini)• Aumento delle opportunità per essere informati (è come aprire migliaia di nuovebiblioteche)• Partecipazione attiva (diritti ma anche responsabilizzazione)Linked Data: benefici per i cittadini
  19. 19. Quattro regole per la creazione dei linked datasul web - 1Tim Berners-Lee individua quattro regole per la creazione deilinked data sul web:1. usare URI (Uniform Resource Identifiers) per identificarecose (oggetti): l’URI è un sistema di identificazioneglobale, valido cioè per tutte le risorse contenute nell’interoweb. L’URI è una pietra miliare dell’architettura del web, inquanto costituisce un meccanismo di identificazione dellerisorse comune a tutto il web. Ciascuna risorsa sul web (unsito, una pagina di un sito, un documento, un qualsiasioggetto) dev’essere identificata da un URI se vuole esserericercata da altri sistemi, utilizzata, collegata, ecc.;
  20. 20. Quattro regole per la creazione dei linked datasul web - 22. Usare HTTP URI in modo che gli oggetti possano essereindividuati da persone e da user agent(browser, programmi…): lo schema utilizzato per lacostruzione di un URI è dichiarato nell’URI stesso prima deidue punti(:); per esempio, http://weather.example.com/).L’http che utilizza l’HyperText Transfer Protocol comeprotocollo è precisamente lo schema prescritto per il websemantico.
  21. 21. Quattro regole per la creazione dei linked datasul web - 33. Fornire informazioni utili sull’oggetto (quando si individuaun URI), usando formati standard come RDF, SPARQL(linguaggio d’interrogazione che nasce per i linked data): ènecessario definire il contesto e le caratteristiche dellarisorsa, tramite l’attribuzione della risorsa stessa a unaclasse, l’identificazione di proprietà e l’assegnazione di valori.
  22. 22. Quattro regole per la creazione dei linked datasul web - 44. Includere link ad altri URI relativi ai dati esposti permigliorare la ricerca nel web di altre informazioni affini aquella di partenza: più i dati sono collegati, più sarà possibile illoro utilizzo nell’ottica di arricchimento e deduzione delleinformazioni.
  23. 23. PER APPROFONDIRE:Iryna Solodovnik, Comunicazione e ricerca semantica di contenuti informativi:tra Metadati, Linked open Data e Ontologie,<http://eprints.rclis.org/15966/1/Metad-LOD-Ontologie.pdf>

×