Successfully reported this slideshow.

Pubblicare Linked Open Data

822 views

Published on

Achille Felicetti, VAST-LAB, PIN S.c.R.L., Università degli Studi di Firenze

  • Be the first to comment

Pubblicare Linked Open Data

  1. 1. Pubblicare Linked Open Data Achille Felicetti VAST-LAB, PIN S.c.R.L., Università degli Studi di Firenze achille.felicetti@pin.unifi.it
  2. 2. Perché? … Come? … Dove? … Conclusioni … !
  3. 3. Tabella Oggetti Museo mpo me Valore 1234 “Vaso tal dei tali” po Reperto Archeologico ovato a Prato nservato Museo Archeologico Firenze tà Firenze (50100) … Tabella Città Campo Valore ID 50100 Nome Firenze Regione Toscana Nazione Italia Coordinate 43.78645 , 11.2489 … …
  4. 4. Tabella Pubblicazioni mpo BN Valore ABC-D-EF-G12345-6 tore Pinco Pallino olo “Titolo tal dei tali” no 1983 nservato Biblioteca Nazionale Firenze de Firenze … Tabella Città … ?? … … … … … … … … … … anc … he …n o !! … … …
  5. 5. o Valore Campo Valore 1234 ISBN ABC-D-EF-G12345-6 “Vaso tal dei tali” Autore Pinco Pallino Reperto Archeologico Titolo “Titolo tal dei tali” to a Prato Anno 1983 ervato Museo Archeologico Firenze Conservato Biblioteca Nazionale Firenze Firenze (50100) Sede Firenze … … … FIRENZE 43.78645,11.24892
  6. 6. http://geonames.org) http://www.geonames.org/6542285/ RENZE
  7. 7. <?xml version="1.0" encoding="UTF-8" standalone="no"?> <rdf:RDF xmlns:cc="http://creativecommons.org/ns#" xmlns:dcterms="http://purl.org/dc xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:gn="http://www.geonames.org/ontology# xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:rdf="http://www.w3.org/1999/02/22 ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:wgs84_pos="http://www.w3.org/2003/01/geo/wgs84_pos#"> <gn:Feature rdf:about="http://sws.geonames.org/6542285/"> <rdfs:isDefinedBy rdf:resource="http://sws.geonames.org/6542285/about.rdf"/> <gn:name>Florence</gn:name> <gn:officialName xml:lang="it">Comune di Firenze</gn:officialName> <gn:officialName xml:lang="fi">Firenze</gn:officialName> <gn:shortName xml:lang="it">Firenze</gn:shortName> <gn:officialName xml:lang="en">Florence</gn:officialName> <gn:featureClass rdf:resource="http://www.geonames.org/ontology#A"/> <gn:featureCode rdf:resource="http://www.geonames.org/ontology#A.ADM3"/> <gn:countryCode>IT</gn:countryCode> <gn:population>368901</gn:population> <wgs84_pos:lat>43.78645</wgs84_pos:lat> <wgs84_pos:long>11.24892</wgs84_pos:long> <gn:parentFeature rdf:resource="http://sws.geonames.org/3176958/"/> <gn:parentCountry rdf:resource="http://sws.geonames.org/3175395/"/> <gn:parentADM1 rdf:resource="http://sws.geonames.org/3165361/"/> <gn:parentADM2 rdf:resource="http://sws.geonames.org/3176958/"/> <gn:childrenFeatures rdf:resource="http://sws.geonames.org/6542285/contains.rdf"/> <gn:locationMap rdf:resource="http://www.geonames.org/6542285/firenze.html"/> </gn:Feature> <foaf:Document rdf:about="http://sws.geonames.org/6542285/about.rdf"> <foaf:primaryTopic rdf:resource="http://sws.geonames.org/6542285/"/> <cc:license rdf:resource="http://creativecommons.org/licenses/by/3.0/"/> <cc:attributionURL rdf:resource="http://sws.geonames.org/6542285/"/> <cc:attributionName rdf:datatype="http://www.w3.org/2001/XMLSchema#string">GeoNames</cc:attribution <dcterms:created rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2007-0513</dcterms:created>
  8. 8. o Valore 1234 Campo Valore “Vaso tal dei tali” ISBN ABC-D-EF-G12345-6 Reperto Archeologico Autore Pinco Pallino oa Prato Titolo “Titolo tal dei tali” rvato Museo Archeologico Firenze Anno 1983 http://www.geonames.org/6542285/ Conservato Biblioteca Nazionale Firenze Sede http://www.geonames.org/6542285 … … … … … … … … … … … … … … …
  9. 9. GeoNames Buone pratiche per la pubblicazione di dati sul Web Semantico 1.Usare le URI come nomi per le cose 2.Utilizzare URI HTTP in modo che gli utenti possano cercare quei no 3.Fornire informazioni utili in RDF quando un utente cerca le URI 4.Includere dichiarazioni RDF che linkano altre URI di informazioni collegate
  10. 10. “Le parole sono conchiglie lasciate dal mar sulla spiaggia. L’uomo non sa da dov vengono, ma le raccoglie per farn soprammobili e collane … Tullio De Maur
  11. 11. Il Web come un unico database glob Campo ID 1234 Nome “Vaso tal dei tali” Tipo Reperto Archeologico Trovato a Prato Conservato WEB Valore Museo Archeologico Firenze Città http://www.geonames.org/6542285/ … … Campo Valore ISBN ABC-D-EF-G12345-6 Autore Pinco Pallino Titolo “Titolo tal dei tali” Anno 1983 Conservato Biblioteca Nazionale Firenze Sede http://www.geonames.org/6542285/ … …
  12. 12. Perché … Preziosi ~ Unici I nostri dati non sono i “nostri” dati !! Heritage -> Eredità Standardizzare ~ Condividere Non reinventare la ruota Perché no … ??
  13. 13. Come …
  14. 14. Archivi diversi … Archivi museali Archivi bibliografici Archivi fotografici Archivi geografici Testi in formato digitale … Diversi formati … •Database relazionali XML •Fogli Excel •File CSV •File XML •PDF •GIS
  15. 15. RL Identificativi univoci globali www.qualchecosa.it TML Formato condiviso yperlinks Collegare documenti ntaggi ontenuto non strutturato No query No applicazioni
  16. 16. ntaggi posizione di dati strutturati cilitano la creazione di ove applicazioni antaggi erfacce proprietarie rmati diversi XML, OAI-PMH, JSON, RSS ashup basato su un set definito di dati ssun legame fra i dati
  17. 17. Tecnologie di Web Semantico Pubblicare dati strutturati sul Web Creare link fra dati provenienti da sorgenti diverse
  18. 18. • • • • Analisi dei dati Ontologie e vocabolari Mappatura e conversione Pubblicazione mpo Valore me 1234 “Vaso tal dei tali” po Reperto Archeologico ovato a Prato nservato Museo Archeologico Firenze tà Firenze (50100) …
  19. 19. Raccogliere conchiglie …
  20. 20. Ontologie (Concetti) •Musei: CIDOC-CRM •Biblioteche: FRBR/FRBRo •… URI ampo Valore 1234 ome “Vaso tal dei tali” po Reperto Archeologico ovato a Prato onservato Museo Archeologico Firenze ttà http://www.geonames.org/6542285/ … Altri LOD: Geonames Vocabolari •Thesauri Locali • • Reperti Archeologi … •Thesauri Globali • • TGN AAT
  21. 21. o Valore 1234 CIDOC-CRM: Obje “Vaso tal dei tali” Reperto Archeologico to a Prato ervato Museo Archeologico Firenze Thesaurus ICC CIDOC-CRM: Pla Firenze (50100) … Mio DB in RDF b:ID rdf:about=”http://miomuseo.org/id/1234”> Db:Tipo>”Reperto Archeologico”</mioDb:Tipo> Db:Conservato>”Museo Archeologico Firenze”</mioDb:Conservato> Db:ID> RM <crm:E22_Man-Made_Object rdf:about=”http://miomuseo.org/id/1234”> <crm:P2_has_type> <crm:E55_Type rdf:about=”http://iccd.it/thesaurus/RA”/> </crm:P2_has_type> <crm:P55_has_current_location> <crm:E53_Place>”Museo Archeologico Firenze”</crm:E53_Place>
  22. 22. Gioco di squadra Curatori: • Conoscono i concetti Sistemisti: • Conoscono gli aspetti tecnologici degli archivi Esperti LOD: • Conoscono le tecnologie Semantic Web
  23. 23. Raccomandazione CIDOC-ICOM su creazione di Linked Open Data per musei: p://www.cidocm.org/URIs_and_Linked_Open_Data.html
  24. 24. Monkey Island - Proprietà: LucasArt
  25. 25. o Valore 1234 “Vaso tal dei tali” Ontologie Thesauri LOD Reperto Archeologico to a Prato ervato Museo Archeologico Firenze Firenze (50100) … Testo libero (sconsigliato) Fogli Excel Diagrammi Mapping tool (Europeana, Mint) <crm:E22_Man-Made_Object rdf:about=”http://miomuseo.org/id/1234”> <crm:P55_has_current_location> <crm:E53_Place>”Museo Archeologico Firenze”</crm:E53_Place> </crm:P55_has_current_location> </crm:E22_Man-Made_Object> R
  26. 26. Mappatura in Excel ICCD, ICCU
  27. 27. ICCD, ICCU, SKOS
  28. 28. MODALITA' DI REPERIMENTO ICOGNIZIONI odice univoco ICCD esponsabile scientifico Motivo Metodo ata ATI DI SCAVO odice univoco ICCD enominazione dello scavo nte responsabile esponsabile scientifico Motivo Metodo ata nità Stratigrafica umero tomba umero inventario di scavo ICCD, ICCU, PI Archaeological Object E22 Man-made Object P24B changed ownership through TCL: Type = "Finding" DSCU, DSCS: Finding Place E53 Place SCAN: Excavation Name E41 Appellation OBJECT FINDING E8 Acquisition P7 took place at P117 occurs during NCUN, DSCI: I E42 Iden P57 is identified by Excavation/Survey E7 Activity P14 carried out by DSCF, DSCA, RCGA,: Excavation responsibles E39 Actor P1 is identified by [DSC Autho P4 has time-span P17 was motivated by P32 used general technique DSCM, RCGM: Method E55 Type [Open Vocabulary] DSCT, RCGE: Motivation E17 Activity [Open Vocabulary] "Rescue Archaeology" DSCD RCGD: Excavation Date E52 Time Span
  29. 29. “SBN to LOD ICCU, SBN, P
  30. 30. • • Implementazione della mappatura concettuale Conversione (semi)automatica dei dati in RDF • Pochi strumenti esistenti • Script personalizzati per ogni archivio • Archivi stand-alone • Creazione di un set di documenti RDF • Duplicazione dati • Aggiornamento … ?? • Archivi già esposti sul Web • Creazione dinamica di RDF (”al volo”) • Aggiornamento dinamico
  31. 31. 2R Server ubblicare database relazionali come Linked Op ata
  32. 32. Disseminare conchigli …
  33. 33. Documentazione e metadati • Rappresentazione HTML • Data Catalog Vocabulary (DCAT) • Vocabulary of Interlinked Datasets (VoID) • DC, DCTERMS (“Access Rights”) • Licenze: Open Data Commons … ”Row Data” • Archivi ZIP per download • File RDF su siti web • Interfacce di accesso Triple Store • Marging con altri dati (sameAs …) • Query Semantiche con SPARQL WEB
  34. 34. OpenLink Virtuoso Server universale per esporre Linked Open Data sul Web Semantico
  35. 35. Creazione di un Web di dati Dati standardizzati -> No formati o software proprietari Dati aperti, condivisi ed accessibili per riutilizzo ”Digital Preservation” Molto ancora da fare ... Tempo? Costi? Dipende dagli archivi … Campo ID WEB http://iccd.it/thesaurus/ http://geonames.org/ Valore 5678 Nome “Anfora Dressel” Tipo http://iccd.it/thesaurus/Anfora Trovato a Arezzo Conservato Museo Archeologico Arezzo Città http://geotree.geonames.org/6542 … …
  36. 36. Achille Felicetti VAST-LAB, PIN, Università degli Studi di Firenze achille.felicetti@pin.unifi.it

×