Europeana e cultura italia per lo sviluppo del semantic web e dei linked open data
1. Europeana e CulturaItalia per lo sviluppo
del Semantic Web e dei Linked Open
Data
Roma , Università di Roma La Sapienza – Dipartimento di Scienze
documentarie, linguistico-filologiche e geografiche
Ciclo di conferenze a.a. 2014-15: 13 aprile 2015
Sara Di Giorgio
Istituto Centrale per il catalogo unico delle biblioteche italiane
responsabile gruppo tecnico CulturaItalia
2. - La politica per il patrimonio culturale digitale
del MiBACT
- Che cosa è CulturaItalia?
- Che cosa è Europeana?
- Linked Open Data
Indice
3. ● 1 Segretariato Generale
● 9 Direzioni Generali
● 17 Direzioni Regionali
● 12 Centri di competenza nazionali (tra cui l’ ICCU)
● 100 Soprintendenze territoriali
● 1,517 Archivi/biblioteche/musei/siti archeologici,
monumenti etc.
● Circa 19,000 dipendenti
Il Ministero dei beni, delle attività culturali e del
turismo (MiBACT) in pillole
4. 1. Servizio Amministrativo
2. Servizio per la promozione
culturale
ICCU è un Istituto Centrale del MiBACT strutturato in
2 servizi e 6 dipartimenti
Progetti:
Internet Culturale
CulturaItalia
Europeana (partico italiana.)
Mondiale Digital Library
(partico italiana.)
progetti europei
Google Books (partico italiana.)
1. Norme standard per la catalogazione e
digitalizzazione
2. Servizio Bibliotecario Nazionale (SBN)
3. Attività di informazione e bibliografiche,
Registry della Biblioteca italiana
4. Digitalizzazione e l'accesso ai documenti
5. Attività di bibliografia, catalogazione e
censimento del libro antico
6. Censimento e gestione della bibliografia
italiana di manoscritti
5. Le Istituzioni della memoria gestiscono una grande
massa di contenuti digitali che deve essere:
– immagazzinata e conservata a lungo termine in modo sicuro
– accessibile in modo permanente
– facilmente riutilizzabile nel tempo da diverse comunità di
ricerca e gruppi di utenti
L’obiettivo è di adottare una Infrastruttura digitale comune
per i beni culturali che porterà alla riduzione dei costi e
al miglioramento dell'interoperabilità attraverso:
– l’adozione di procedure comuni
– nuovi flussi di lavoro e metodologie di ricerca
– sviluppo di nuove competenze e abilità
Il quadro del patrimonio culturale digitale
6. E’ necessario stabilire politiche e strategie comuni, che
tengano conto di processi, servizi, strumenti e
protocolli condivisi, per lo sviluppo di una e-
Infrastructure per il patrimonio culturale che permetterà
alle organizzazioni DCH di:
• accedere ai servizi delle infrastrutture digitali
• creare dei Virtual Research Environment (VRE) in
grado di soddisfare le esigenze delle moderne forme di
collaborazione scientifica.
La visione
7. EUROPEANA
The European Portal
DIGITAL CULTURAL HERITAGE
e-Infrastructure
The European portal for
accessing digital
collections (MLA)
NATIONAL & REGIONAL INITIATIVES
Linked Heritage
RECOMMENDATION
S & GUIDELINES
Network of experts
(hundreds) from 27
European MS, Russia
and Israel
2002 2005 2008 2009 2011 2014 2015
European projects coordinated by the
Italian ministry
Harmonization of EU Member states
National Digitisation Programmes
ATHENA
Esperienze europee del MiBACT
ATHENA
Plus
8. Conferenza internazionale ‘Il riuso dei contenuti culturali digitali per
l’istruzione, il turismo e il tempo libero: un’opportunità per le
istituzioni culturali e le industrie creative, un investimento per il
futuro’, Roma Biblioteca nazionale centrale, 2 ottobre 2014,
organizzata in collaborazione con la Commissione europea, la
Fondazione Europeana e il progetto europeo AthenaPlus, rete europea
di buone pratiche coordinata dall’ICCU.
Durante la conferenza sono state presentate le Raccomandazioni
‘Patrimonio culturale e turismo’rivolte alle istituzioni culturali per
promuovere il loro patrimonio attraverso il digitale e lo sviluppo di
iniziative e servizi turistici innovativi.
Le Raccomandazioni hanno contribuito alla elaborazione del
documento ‘Europeana for Tourism Policy Recommendations’
http://www.athenaplus.eu/getFile.php?id=428
Conferenze internazionali durante la presidenza
italiana della UE: 2 ottobre sul turismo e il riuso
9. Conferenza internazionale sulle Infrastrutture di ricerca e infrastrutture digitali per il
patrimonio culturale, Roma, Biblioteca Nazionale Centrale, 13-14 Novembre 20’14
La conferenza si è concentrata su come la collaborazione avviata tra le i fornitori di
Infrastrutture digitali e le Infrastrutture di ricerca, operanti nel settore dei Beni
Culturali possa rispondere alle sfide globali attraverso una maggiore integrazione delle
infrastrutture di dati e a nuove metodologie di ricerca nel campo del patrimonio culturale
Speaker da ESFRI, Commissione EU,, Parlamento Europeo,
Géant,, e-IRG, DARIAH, ARIADNE, CLARIN, CHARISMA, CENDARI
Il programma e le presentazioni sono on-line:
http://www.otebac.it/internationalconference/index.php?en/1/home
Durante la conferenza è stato presentato un Vision document,
consultabile on-line
http://www.otebac.it/internationalconference/getFile.php?id=16
Conferenze internazionali durante la presidenza
italiana della UE: 13-14 novembre sulle infrastrutture
10. Le infrastrutture europee della ricerca nel settore del
patrimonio culturale
ARIADNE, Advanced Research Infrastructure
for Archaeological
Dataset Networking in Europe
www.ariadne-infrastructure.eu/
DARIAH, Digital Research Infrastructure for the Arts and
Humanities
www.dariah.eu/
CLARIN, Common Language Resources and Technology
Infrastructure,
www.clarin.eu/
11. Le infrastrutture europee della ricerca nel settore del
patrimonio culturale
CHARISMA, Cultural Heritage Advanced Research
Infrastructures, Synergy for a Multidisciplinary Approach to
Conservation/Restoration
www.charismaproject.eu/
CENDARI, Collaborative European Digital Archive
Infrastructure
www.cendari.eu/
EUROPEANA, the European aggregator
www.europeana.eu/
13. CulturaItalia in pillole
Nella presentazione parleremo di:
• Cosa è CulturaItalia
• Chi fornisce i contenuti a Europeana
• L’interoperabilità dei contenuti
• Procedure tecniche
14. «Uno standard è una specifica pubblicata che determina un
linguaggio comune, contiene una specifica tecnica o altri criteri precisi ed
è concepito per essere utilizzato coerentemente, come una norma, una
direttiva o una definizione. Gli standard sono applicati a vari materiali,
prodotti, metodi e servizi. Essi contribuiscono a semplificare la vita e ad
accrescere l’affidabilità e l’efficacia di molti beni e servizi da noi
utilizzati» (definizione della La British Standards Institution )
L’uso appropriato di standard nella digitalizzazione contribuisce determinare
la compatibilità delle risorse, che ne consente l’interoperabilità
Standard e interoperabilità
15. “Per gli utenti non è importante se le
fonti per la conoscenza del
patrimonio sono conservate da
archivi, biblioteche e musei, ma avere
l'accesso alle fonti dati che desiderano
ed essere in grado di utilizzare queste
fonti in modo interdisciplinare.”
CulturaItalia
MissionCulturaItalia: l’interoperabilità
16. 2,4 M record da +35
partner tra cui portali
tematici
990.536 r. Musei
851.686 r. Bibliteche
485.466 r. Archivi
+ 556.852 in arrivo
dal SAN
1.3 M record in CC0 in
Europeana
20.000 Contenuti
editoriali
nel 2014 780.448
visitatori unici; visite
1.073.456
Versione inglese
CulturaItalia, l’aggregatore nazionale di contenuti
http://www.culturaitalia.it
17. CulturaItalia
Che cosa è
PERCHE’
Per rendere possibile lo svolgimento di ricerche nel complesso del
patrimonio culturale digitale italiano on line distribuito su tutto il
territorio (vale a dire, conservato in luoghi differenti da organismi
differenti)
Accelerare la digitalizzazione del patrimonio culturale nazionale
pubblico e privato secondo standard condivisi
Integrare la cultura italiana nel più ampio circuito europeo
CHE COSA E’
Un punto di accesso integrato al patrimonio culturale italiano
diffuso sul territorio: archivi, biblioteche, musei, materiali
audiovideo, etc. attraverso l’INTEROPERABILITA’tra le singole
banche dati
Un e-magazine aggiornato quotidianamente per essere informati su
notizie e eventi culturali in tutte le regioni italiane.
CulturaItalia
18. Obiettivi
CulturaItalia
CulturaItalia raccoglie ed organizza milioni di informazioni sulle risorse che
compongono il ricco universo culturale del paese, mettendole a disposizione
degli utenti della Rete.
Gli obiettivi di CulturaItalia sono in linea con quelli di Europeana
Europeana Stragic plan 2011
- 2015
CulturaItalia si basa sugli stessi standard e tecnologie di Europeana
CulturaItalia: obiettivi
21. CulturaItalia
Nuova funzione di ricerca
I risultati sono presentati in quattro gruppi principali.
Il motore di ricerca interrooga ‘on the fly’ il Catalogo SBN tramite protocollo Z3950
e tramite API il portale Europeana
CulturaItalia: risultati di una ricerca
22. CulturaItalia
Nuova funzione di ricerca
RICERCA PARAMETRICA
Fonte dati -> seleziona in base al nome del fornitore
Categoria -> i risultati classificati in base ad un
Thesaurus, un vocabolario controllato progettato
per gestire e organizzare informazioni eterogenee,
provenienti da sistemi di catalogazione differenti.
Tipo -> le risorse sono raggruppate in base
alla loro tipologia.
Ambito geografico -> seleziona le risorse in base
al luogo.
Ambito cronologico
Data di creazione
Autore
Soggetto
CulturaItalia: risultati di una ricerca
23. Nuova funzione di ricerca
SCHEDA DELLA RISORSA (METADATO)
Anteprima della risorsa->
quando è resa disponibile dal fornitore
Fonte dati -> Link al sito web del fornitore
Consulta la scheda esterna -> Link alla pagina
del sito web del fornitore relativa alla risorsa
Documenti simili -> Presentazione di risorse
simili a quella selezionata
CulturaItalia: risultati di una ricerca
24. CulturaItalia: il processo di ingestion dei contenuti
→ Via EXCEL, CSV, XML
per l’interoperabilità tra
CulturaItalia e la banca dati del
fornitore
→ Via MuseiD-Italia
per fornire le collezioni digitali
museali e automaticamente
renderle interoperabili con
CulturaItalia
25. CulturaItalia organizza in un solo INDICE i metadati provenienti da banche
dati diverse per tema e distribuite sul tutto territorio nazionale
grazie ai seguenti standard internazionali:
Dublin Core (DCMI) per la descrizione dei metadati
inter-disciplinari
OAI-PMH per l’interoperabilità dei sistemi informativi
XML per la rappresentazione dei dati
CulturaItalia promuove l’interoperabilità delle risorse digitali adottando un profilo
applicativo interdisciplinare (PICO AP), basato sulle linee guida del DCMI.
I contenuti e i diritti su di essi rimangono sotto la responsabilità di chi li
crea, gestisce e aggiorna.
CulturaItalia
Standard
I metadati costituiscono il linguaggio della biblioteca digitale, sono
informazioni strutturate che descrivono, localizzano e rendono rintracciabili
le risorse. I metadati sono spesso chiamati dati sui dati. (definizione NISO
2004).
CulturaItalia: aggregazione
26. CulturaItalia realizza l’interoperabilità delle risorse digitali
adottando un profilo applicativo interdisciplinare denominato PICO
AP dall’acronimo di progetto (Portale Italiano della Cultura On-
line), basato sulle linee guida del DCMI.
Il PICO AP è stato elaborato dalla SNS
Gruppo di lavoro: I.Buonazia – M. E. Masci - D. Merlitti – U.Parrini
La scelta del Dublin Core come standard di metadati descrittivi perché offre:
Elementi semplici da comprendere e adoperare
Opzionali e ripetibili
Internazionali e trasversali tra le discipline
Possibilità di qualificare gli Elementi per descrizioni più specifiche e ricche
Costituisce una base per l’interoperabilità semantica dei contenuti
Il DC è ISO Standard 15836 – 200
CulturaItalia: Application Profile
27. Analisi del dominio di CulturaItalia
Il patrimonio tangibile
beni architettonici e paesaggistici
opere mobili e loro collezioni
beni librari, compresa l’attuale
produzione letteraria
beni archivistici
beni archeologici e demo-etno-
antropologici
arte e architettura contemporanea
Il patrimonio intangibile
la musica
la danza, il teatro, gli spettacoli
il cinema
le scienze umane
la cultura scientifica
La complessità del dominio del Portale e delle risorse esistenti ha condotto a
definire un metadata schema che estende ulteriormente il Qualified DC, con
ulteriori estensioni che meglio consentono di gestire i vari contenuti previsti
per il Portale.
CulturaItalia: Application Profile
28. PICO Thesaurus
Italiano-English
Chi – I protagonisti della vita culturale:
• Persone
• Famiglie
• Enti pubblici e privati
Cosa – I beni culturali, le risorse documentarie, i
servizi, le aree disciplinari, le azioni per lo sviluppo e
la conservazione del patrimonio culturale:
• Giacimenti culturali
• Opere d’arte in tutti i settori
• Arte applicata
• Ricerca scientifica e formazione
• Eventi, servizi, normativa
Dove – I luoghi
Quando – La periodizzazione
ES dc:subject – pico:thesaurus
Tutte le risorse sono classificate
nell’Indice di CulturaItalia grazie
al PICO Thesaurus, un vocabolario
controllato gerarchico, sviluppato
in formato SKOS.
Il Thesaurus è disponibile nelle
lingue italiana e inglese.
CulturaItalia
Funzionamento – L’Indice
http://www.culturaitalia.it/pico/thesaurus/4.1/thesaurus_4.1.0.skos.xml
CulturaItalia: Thesaurus
29. Documentazione tecnica
pubblicata on-line
Diffusione standard per
l’interoperabilità, la
digitalizzazione, la qualità
dei contenuti in rete
Supporto tecnico
Download SW applicativo
Data provider
Download validatore XML
dei record in formato PICO
CulturaItalia
Facilitare
Gruppi di lavoro a cui
partecipano esperti dei vari
settori del patrimonio
culturale
CulturaItalia propone uno spazio comune per la diffusione di standard
aperti,dell’ interoperablità dei contenuti e per facilitare la partecipazione degli
istituti culturali al dibattito internazionale sulla conoscenza come bene
comune .
CulturaItalia: attività tecnico-operative
30. CulturaItalia
FASE 1
FASE 1
CulturaItalia
individua e
seleziona le
banche dati
segnalate
FASE 2
FASE 2
CulturaItalia
prende accordi
con i fornitori
responsabili della
loro gestione
FASE 3
CulturaItalia
concorda il livello
di completezza
delle risorse da
pubblicare
FASE 3
FASE 4
CulturaItalia
fornisce il
supporto per
rendere
interoperabile
la banca dati
FASE 4
FASE 5
CulturaItalia
pubblica le
risorse del
fornitore sul
portale della
cultura e su
Europeana
FASE 5
CulturaItalia: attività tecnico-operative
31. Il fornitore che intende rendere interoperabile con CulturaItalia (e Europeana) i
propri contenuti organizzati in banche dati, svolgerà le seguenti attività:
Concordare e pubblicare il documento di mapping tra il PICO AP e lo schema di
catalogazione delle risorse del fornitore
Scegliere il modulo “Data Provider” compatibile con il profilo software della
banca dati
Installare e configurare il modulo “Data Provider” sul server della banca dati
Estrazione dei dati e popolamento del repository OAI-PMH (componente del
Data Provider)
Verifica della qualità dei metadati tramite interrogazione diretta del repository
e tramite un validatore automatico
Harvesting dei metadati e pubblicazione su CulturaItalia
Selezione risorse da inviare a Europeana
Verifica metadati e pubblicazione sul portale Europeo
CulturaItalia
Aderire a CulturaItalia: Banche datiCulturaItalia: attività tecnico-operative
32. CulturaItalia
Criticità
Le criticità che spesso emergono:
poca comprensione dei vantaggi offerti dall’interoperabilità
delle basi dati (più efficace reperibilità delle risorse in rete,
maggiore visibilità del fornitore di contenuti)
scarsa adesione alla filosofia dell’Accesso aperto
difficoltà nella definizione degli accordi con i fornitori di
contenuti
problematica dei diritti d’autore: licenze d’uso diversificate
con i singoli istituti
CulturaItalia: attività tecnico-operative
33. CULTURAITALIA
National cross-domain
aggregator
INTERNET CULTURALE
Thematic aggregator for
Libraries
CulturaItalia e il sistema di aggregazione
SAN
Thematic aggregator
for Archives
MUSEID-ITALIA
Thematic aggregator
for Museums
EUROPEANA
European cross-domain
aggregator
Regional
aggregators
Private
archives Universities
37. Europeana in pillole
Nella presentazione parleremo di:
• Cosa è Europeana
• Cosa offre Europeana
• Chi fornisce i contenuti a Europeana
• La licenza di distrubuzione dei dati
• Accesso e ri-uso dei dati aggregati da Europeana
38. La mission di Europeana
– Europeana è un catalizzatore di iniziative
nell’ambito del patrimonio culturale digitale
– Europeana rende accessibile il patrimonio culturale
attraverso canali digitali per promuovere lo scambio
di idee e informazioni. E’ una risorsa importante per
comprendere meglio la diversità culturale europea,
e dà un contributo allo sviluppo dell’economia della
conoscenza
40. 32M record da +3000
gallerie, musei,
biblioteche e archivi
europei
Libri, giornali, lettere,
diari, documenti
d’archivio
Dipinti, mappe,
disegni, fotografie
Musica, interviste,
radio
Film, cinegiornali,
televisione
Mostre virtuali
31 lingue
Europeana, il portale del patrimonio culturale
d’Europa
http://www.europeana.eu
41. Storia di Europeana
Aprile 2005: Jacques Chirac scrive al presidente della Commissione
europea José Manuel Barroso, che raccomanda la creazione di una
biblioteca digitale europea
La Società per l'informazione e la Direzione media della CE sostengono i
progetti europei per lo scambio di informazioni sul digitale da 15 anni
Settembre 2005: pubblicazione della strategia i2010 della CE sulle
biblioteche digitali
2007: European Digital Library Network - EDLnet – inizia a costruire
Europeana, finanziata nell'ambito dell'iniziativa i2010
Novembre 2008: Lancio del prototipo di Europeana
Estate 2010: il prototipo è diventato un servizio operativo finanziato
nell'ambito del CIP ICT-PSP (Competitiveness and Innovation Framework
Programme)
Gennaio 2011: Viene pubblicato un nuovo rapporto ‘Rinascimento digitale’
in cui si riconosce Europeana come ‘il punto di riferimento per la cultura
europea online'
Settembre 2012: I metadati aggregati da Europeana vengono rilasciati
sotto licenza CC0, per renderli liberamente disponibili per il riutilizzo
42. Come acquisisce i contenuti Europeana?
Attraverso il suo sistema di aggregazione, Europeana rappresenta
2.200 organizzazioni in tutta Europa
Da 150 aggregatori
• Promuove gli aggregatori nazionali
• E’ più efficiente piuttosto che lavorare con ogni singolo fornitore
di contenuti
• Aiuta a sviluppare un processo internazionale di
standardizzazione
Contenuti generati dagli utenti
Progetti di crowdsourcing come Europeana 1914-1918 e
Europeana 1989
43. Aggregatori tematici Iniziative nazionali
Collezioni audio-visive
Aggregatori nazionali
Aggregatori regionali
Archivi
Banche dati tematiche
Bibioteche
e.g. Musées
Lausannois
e.g.
CultuiraIt
alia
Culture.fr
e.g. The
European
Library
e.g. APEX
e.g. EUScreen,
European Film
Gateway
e.g. Judaica Europeana,
Europeana Fashion
Chi fornisce i dati a Europeana?
44. I progetti europei che alimentano Europeana
gestiti e partecipati dall’ICCU
Europeana v3
45. Piano Strategico 2011-2015
Coinvolgere – Europeana propone
modi nuovi di partecipazione dei
cittadini alla loro eredità culturale
Aggregare – Europeana sviluppa una fonte
dati aperta e autorevole di contenuti culturali
europei
Facilitare – Europeana offre un
supporto al settore dei beni culturali
favorendo il trasferimento delle
conoscenze, e l'innovazione
Distribuire – Europeana mette il patrimonio
culturale a disposizione delle persone
ovunque si trovano e quando vogliono
46. Che tipo di dati sono su Europeana?
Testi Immagini Video Audio 3D
47. Com’è un record di Europeana?
Thumbnail/preview
Metadata
Link all’oggetto
digitale
48. In che modo gli utenti accedono a Europeana?
Europeana si propone di fornire i contenuti aggregati agli utenti
dove vogliono e quando vogliono attraverso:
Il portale Europeana
• ad es.: con la ricerca, mostre virtuali, contenuti in primo
piano
Portali legati ai progetti/mostre virtuali
• ad es.: BHL- Poisonous Nature, Europeana Fashion
Siti web e app che utilizzano Europeana API – realizzati
grazie ad hackathon o autonomamente
Social media/blogs
• e.g. Facebook, Twitter, Pinterest, Retronaut
49. Il profilo applicativo di Europeana (EDM)
– EDM is a cross-community development, involving
library, archive and museum experts, plus academic
partners
– A data model that re-uses several existing Semantic
Web-based models
50. Europeana è un enorme dataset culturale aperto
per il ri-uso
– A partire da settembre 2012, i metadati di Europeana
sono disponibili senza restrizioni sotto i termini della
licenza Creative Commons Zero Public Domain
Dedication - CC0.
– Una buona opportunità per gli sviluppatori
• API
– Hack4Europe! è una serie di giornate di hack tenute in
diverse località in tutta Europa, dove gli sviluppatori
utilizzano l’API e in due giorni per creano una nuova
App.
– Search widgets per siti web, es.. CulturaItalia, Partage
Plus
– Sviluppo indipendente – chiunche può richiedere API-
keys
• Linked Open Data – un subset di dati è disponibile per
iniziative LOD
51. Licenza per la distribuzione dei dati
Per i metadati Europeana prevede:
che vengano forniti in linea con l’Europeana Data Model – i dati in
formato EDM
tutti i metadati forniti a Europeana saranno pubblicato secondo i
termini della Creative Commons 0 (licenza relativa al Pubblico Dominio)
per permettere il riuso dei dati sotto forma di Linked Open Data
Europeana presenterà sempre l’attribuzione dei dati al fornitore
Europeana pubblicherà sempre un collegamento ai dati sul sito web
del fornitore
È sempre possibile richiedere Europeana di rimuovere o aggiornare i
metadati
52. • I partner di CulturaItalia scelgono il tipo di licenza da applicare ai
metadati che mettono a disposizione del portale
• Per inviare i dati ad Europeana, CulturaItalia include nell’accordo la
liberatoria per il Pubblico Dominio, Creative Commons CC0, per i
metadati, mentre per le risorse digitali (immagini, audio o video) la
possibilità di esprimere altre licenze o condizioni d’uso. Generalmente
viene utilizzato Rights reserved-Free access
• Oggi sono pubblicati su CulturaItalia:
– 1.626.745 record /metadati in CC0
– 293.170 in CC-BY-NC
– 276.301 diritti riservati
Accordi e licenze
53. Europeana chiede agli aggregatori di ottenere il permesso dai loro
fornitori di dati, compresa una copia del DEA
54. Licenza per la distribuzione dei dati
La licenza distingue tra:
Metadati: Informazioni testuali (inclusi i
collegamenti ipertestuali) utili per
individuare, interpretare e/o gestire il
Contenuto
Anteprima: Una rappresentazione
visiva e/o sonora dei Contenuti in
dimensioni ridotte, sotto forma di
una o più immagini, file di testo, file
audio e/o file di immagini in
movimento.
EDM:rights
55. CulturaItalia/Europeana
Un'opera è nel pubblico dominio se è liberamente utilizzabile
da chiunque per qualunque scopo senza restrizioni dovute
al diritto d'autore (copyright).
Gli enti titolari dei dati che desiderano rinunciare ai diritti
sull'Opera al contribuiscono alla realizzazione di un
patrimonio comune di opere creative, culturali e
scientifiche definiti "Commons“, ‘beni comuni.
Il pubblico potrà sviluppare ulteriormente, modificare, inserire
in altre opere, riutilizzare e ridistribuire del tutto
liberamente, in qualsiasi forma e per ogni finalità, inclusi e
senza alcun limite anche scopi commerciali
I metadati sotto CC0 possono essere ri-utilizzato senza restrizioni in
diverse giurisdizioni, ricadendo sotto il Pubblico Dominio
Licenza per la distribuzione dei dati
56. CC0: per attribuire un'opera al
pubblico dominio è possibile
utilizzare lo strumento CC0.
La Creative Commons Zero deve
essere preceduta da una
dichiarazione relativa alla
provenienza del documento.
Comunità Europea
Riutilizzo delle risorse
•
Le licenze Creative Commons
http://www.aliprandi.org/manuale-cc/
57. Il pubblico dominio è un commons, un bene comune di inestimabile
valore, un bene indispensabile che - come il nostro ambiente naturale
e il patrimonio fisico - merita di essere conosciuto, protetto e
apprezzato.
Ogni anno decine di autori (e le loro opere) – uscendo dai termini di
protezione del copyright – entrano in questo territorio libero dove le
produzioni intellettuali sono liberamente fruibili e condivisibili senza
restrizioni e possono concorrere alla costruzione di nuova
conoscenza.
Il pubblico dominio è un Commons
Dal 2015 sono nel public domain :
Il Piccolo Principe di Antoine de
Saint-Exupery, Il Manifesto del
futurismo italiano di Marinetti, i
romanzi su 007 di Ian Fleming , ’Urlo
di Munch, le registrazioni di Cole
Porter, alcune opere di Mondrian
Kandinsky
58. Layer #1: Digital objects (on the site of the provider)
Layer #2: Previews (lower quality versions of #1)
Layer #3: Metadata (descriptive object information)
EDM:rights
Il Data Exchange Agreement (DEA) distingue:
CC0
59. Il quadro delle licenze previste nella DEA:
statement previsti per le risorse digitali
(EDM:rights)
Public domain
The Public Domain Mark (PDM)
Out of copyright - non commercial re-use (OOC-NC)
The Creative Commons CC0 1.0 Universal Public Domain Dedication (CC0)
Creative commons licences
Creative Commons - Attribution (BY)
Creative Commons - Attribution, ShareAlike (BY-SA)
Creative Commons - Attribution, No Derivatives (BY-ND)
Creative Commons - Attribution, Non-Commercial (BY-NC)
Creative Commons - Attribution, Non-Commercial, ShareAlike (BY-NC-SA)
Creative Commons - Attribution, Non-Commercial
No Derivatives (BY-NC-ND)
Rights reserved
Free access - no re-use
Paid access - no re-use
Unknown rights
Orphan work
Unknown
60. La ricerca su Europeana dei
contenuti per tipologia di riuso
61. 61
F. Morando, Interoperabilità giuridica: rendere i dati (pubblici) aperti
compatibili con imprese e comunità online
L’interoperabilità giuridica
62. 62
• Open Knowledge Foundation Public Domain Calculator
http://publicdomain.okfn.org/calculators/
• Europeana Public Domain Calculator http://www.outofcopyright.eu/
• EDM Rights Selection Tool
http://pro.europeana.eu/web/guest/edm-rights-selection-tool
• Creative Commons ha predisposto un procedimento interattivo guidato per
la scelta e l’applicazione della licenza più vicina alle esigenze del licenziante:
http://creativecommons.org/choose/
Alcuni strumenti utili
66. Vi parlerò di:
• Definizione di Open Data
• Che cosa sono i Linked open data
• dati.culturaitalia.it
• I vantaggi dei LOD
67. Definizione di dato / contenuto aperto
Open Knowledge Foundation.
«un contenuto o un dato si definisce aperto se chiunque è in
grado di utilizzarlo, ri-utilizzarlo e ridistribuirlo, soggetto, al
massimo, alla richiesta di attribuzione e condivisione allo stesso
modo» Open Knowledge Foundation.
•il dato deve essere accessibile, preferibilmente via Internet e in un
formato modificabile;
•deve essere libero da vincoli tecnologici che ne limitino di fatto la
più ampia diffusione;
•eventuali vincoli legali non devono pregiudicare la possibilità
di distribuzione e riuso.
Maggiori informazioni:
http://www.opendefinition.org/okd/italiano/
68. 14 April 2015 Event 68
Open by default
A partire dal 18 marzo 2013, scadenza dei novanta giorni previsti dalla Legge,
dati e documenti pubblicati online dalle amministrazioni titolari - senza una
esplicita licenza d’uso che ne definisca le possibilità e i limiti di riutilizzo – sono
da intendersi come dati aperti, quindi dati che possono essere liberamente
acquisiti da chiunque e riutilizzabili anche per fini commerciali.
La norma è il cosiddetto Decreto Crescita 2.0
(http://www.altalex.com/index.php?idnot=59517). Decreto Legge 18 ottobre
2012, n. 179 recante "Ulteriori misure urgenti per la crescita del Paese" (c.d.
Decreto Crescita 2.0), coordinato con la legge di conversione 17 dicembre
2012,n. 221 e pubblicato in Gazzetta Ufficiale 18 dicembre 2012, n. 294.
69. I principi dei LOD
La disponibilità e il rilascio di Open Data è un patrimonio prezioso per la società
civile e per le imprese, ma affinché si possa valorizzare del tutto l'informazione,
l’apertura da sola non basta.
Linked Open Data mostrano interessanti opportunità per superare le
limitazioni dei modelli Open Data. Se gli Open Data abbattono le barriere
culturali, legali ed economiche al riuso, il movimento Linked Data si concentra
piuttosto sulla messa a punto di strumenti che permettono di dare ai dati
(aperti o non) un'identità e di renderli collegati tra loro e interoperabili.
70. 14 April 2015 Event 70
La classificazione delle 5 stelle
del W3C
1. i propri dati siano ‘aperti’ disponibili sul web (in qualsiasi formato jpg, doc, );
2. il materiale messo sul web sia disponibile come dato strutturato (per
esempio, in excel anziché come scansione dell’immagine di una tabella);
3. siano stati scelti formati non proprietari (per esempio, in csv invece che
excel);
4. siano stati utilizzati URL per identificare gli oggetti, in modo gli utenti
possano puntare a questi oggetti;
5. i propri dati siano stati collegati a dati prodotti da altri in modo da definire un
contesto.
71. CulturaItalia/Europeana
Linked Open Data
Linked Open Data è:
• una tecnologia in grado combinare le informazioni tra di loro
• un modo per condividere i dati con le altre parti
• un modo per offrire agli utenti un’esperienza di ricerca
migliore possibile
Sei vuoi saperne di più vai alla
sezione di CulturaItalia dedicata ai
LOD e all’iniziativa di Europeana
Definizione di Linked Open Data
73. Le quattro regole dei Linked Data
1. Utilizzare URI come nomi per le cose
2. Utilizzare URI HTTP in modo che le
persone possono cercare questi nomi.
3. Quando qualcuno cerca di un URI,
fornire informazioni utili, utilizzando gli
standard RDF (*, SPARQL)
4. Includere link ad altri URI. in modo che
si possano scoprire più cose.
Considerando la rete come un ipertesto, la rete di dati è costruito dai documenti
pubblicati sul web. Tuttavia, a differenza del web come ipertesto, dove i
collegamenti sono relazioni date dai link nei documenti ipertestuali scritti in HTML,
per il web dei dati i link tra le risorse sono descritti attraverso l’ RDF.
Gli URI identificano qualsiasi tipo di oggetto o concetto.
74. Semantic Web
Con il termine Web Semantico, termine coniato dal suo ideatore, Tim
Berners-Lee, si intende la trasformazione del World Wide Web in un
ambiente dove i documenti pubblicati (pagine HTML, file, immagini, e
così via) sono associati ad informazioni e dati (metadati) che ne
specificano il contesto semantico in un formato adatto all'interrogazione
e l'interpretazione (es. tramite motori di ricerca) e, più in generale,
all'elaborazione automatica.
Il Web Semantico è un movimento collaborativo guidato da W3C.
Attraverso l'inserimento di contenuto semantico nelle pagine web, il
Web Semantico mira a convertire l'attuale web, dominato da documenti
in una "rete di dati". Il Semantic Web è basato sul W3C Resource
Description Framework (RDF).
75. Dal web dei documenti al web dei data
Web of documents
Web of data
Semantic Web
76. 14 April 2015 Event 76
Cosa sono i Linked Open Data
I LOD sono dati pubblicati sul web in modalità leggibile, interpretabile da una macchina il
cui significato è esplicitamente definito grazie allo standard RDF Resurce Description
Framework
RDF (triple)
soggetto – predicato – oggetto
Dante ha scritto La Divina Commedia
Dante ha scritto La Divina Commedia
http://dbpedia.org/page/Dante_Alighieri
http://dbpedia.org/ontology/writer
http://dbpedia.org/page/Divine_Comedy
http://dbpedia.org/ontology/mov
ement
http://dbpedia.org/page/Dolce_S
til_Novo
77. Standard e LOD
RDF è uno standard W3C per la modellazione e la condivisione della conoscenza
distribuita sulla base di un assunto open-world decentralizzato. Qualsiasi
conoscenza può essere scomposto in triple (3-tuple), comprensiva di soggetto,
predicato, e l'oggetto; in sostanza, RDF è il minimo comune denominatore per lo
scambio di dati tra sistemi.
la tripla contiene due concetti
collegati da una relazione
RDF è un linguaggio semplice per esprimere modelli di dati, che si riferiscono
ad oggetti ("risorse web") e le loro relazioni
OWL aggiunge più il vocabolario per descrivere le proprietà e classi
SPARQL è un linguaggio di protocollo e di query per le origini dati web
semantico
78. RDF è l’acronimo di Resource Description Framework
RDF è un framework per la descrizione delle risorse sul web
RDF è progettato per essere letto e compreso da computer
RDF non è progettato per la visualizzazione di persone
RDF è scritto in XML
RDF è una parte del W3C Semantic Web Activity
RDF è una raccomandazione W3C
Il linguaggio RDF fà parte del Semantic Web del W3C in cui:
- le Informazioni Web hanno significato esatto
- le Informazioni Web possono essere comprese e trattate da computer
- i computer possono integrare le informazioni dal web
Standard e LOD
79. 14 April 2015 Event 79
Linked Open Data: i dataset
Dante Alighieri
Divina Commedia
DB Opere
DB Persone
è autore di
Ciascuna risorsa che
compone la tripla può
appartenere a un diverso
dataset disponibile sul web. Il
meccanismo consente di
collegare i dati presenti in una
fonte dati (link interni) con dati
presenti in una fonte diversa
(link esterni).
Web di dati
80. Le collezioni culturali non sono silos, sono nodi importanti di una
rete. Offrono un contesto importante per le risorse.
Web di dati
82. • Il progetto pilota dati.culturaitalia.it
contiene set di open data aggregati in
CulturaItalia e rilasciati dai partner del
progetto con licenza “CC0 1.0 Universal
Public Domain Dedication”.
• disponibili alcuni dataset di test del Polo
museale fiorentino, catalogo opere
d’arte della Regione Marche, Accademia
S. Cecilia, Digibess, IInternet Culturale,
Michael Italia, e Anagrafe delle
Biblioteche Italiane
dati.culturaItalia, sezione dedicata ai dati aperti e ai
LOD
83. • SPARQL endpoint che rende interrogabili i dati in formato CIDOC-
CRM attraverso::
1) un'interfaccia di interrogazione SPARQL
2) un'interfaccia di interrogazione iSPARQL;
3) una ricerca di testo
• i dati in formato CIDOC sono arricchiti semanticamente :
• con gli authority file del VIAF (Viartual International Authority file: www.viaf.org ) e
con i nomi geografici di GeoNames (www.geonames.org/)
• GeoNames (www.geonames.org/)
• PICO Thesaurus in SKOS
• DCMI Type vocabulary
dati.culturaItalia, sezione dedicata ai dati aperti e ai
LOD
84. • Il CIDOC-CRM (Conceptual Reference Model) è un’ontologia
formale per l’integrazione e lo scambio di informazioni eterogenee
nell’ambito dei Beni Culturali
• Sviluppata dall’International Committee for Documentation (CIDOC)
dell’ Internationa Council of Museums (ICOM) a partire dal 1996 ed
è uno standard internazionale ISO (21127:2006)
Comprende 86 Classi e 136 Proprietà in grado di esprimere
centinaia di formati di (meta)data e permettere l'integrazione fra
archivi eterogenei nell'ambito dei beni culturali
Sviluppato per creare archivi che possano essere compresi dagli
esseri umani ed elaborati dalle macchine
Il CIDOC-CRM
85. • L’OAI Provider rende disponibili metadati in formato XML e RDF
strutturati secondo vari schemi:
– oai-dc (xml): schema OAI-PMH adottato dall’Open Archives
Initiative Protocol for Metadata Harvesting
– pico (xml): PICO Application Profile, il profilo applicativo di
CulturaItalia
– edm (rdf): Europeana Data Model, adottato dal portale
Europeana
– cidoc (rdf): CIDOC - Conceptual Reference Model
nell’implementazione Erlangen CRM / OWL
dati.culturaItalia, sezione dedicata ai dati aperti e ai
LOD
86. Key issues:
– Migliorare la qualità dei dati e fornire un accesso
diretto ai contenuti in modo che l'esperienza utente
può migliorare drasticamente
– Sviluppare una proposta di valore più esplicita per le
istituzioni culturali. Hanno bisogno di essere motivati
a dare il meglio.
– Creazione di nuove competenze in DCH e di nuove
opportunità di lavoro
– Riutilizzo e reperibilità dei contenuti culturali digitali
– Creazione di una Infrastruttura digitale per il
patrimonio culturale e collegamento con le
Infrastrutture di Ricercahttp://labs.europeana.eu/api/linked-open-
data/introduction/
88. CulturaItalia
Aderire a CulturaItalia: Banche dati
Documentazione tecnica
Documenti mapping profilo ICCD e MAG
Download modulo Data provider OAI-
PMH
Software per la validazione del
repository conforme al profilo
applicativo PICO
Documenti tecnici
CulturaItalia
Documentazione tecnica
è un centro nazionale che promuove e coordina le attività di catalogazione e digitalizzazione delle biblioteche italiane
è un organo del Ministero italiano per i Beni e le attività culturali
è responsabile della guida, la produzione, l'aggiornamento e la diffusione delle norme standard per la catalogazione e la digitalizzazione del patrimonio librario.
So this effort resulted in Europeana. We currently aggregate the material from about 3000 institutions around Europe, leading to a database of a little over 30M records. It is always important to keep in mind that we only store metadata, so the descriptive data. Not the actual digitised painting, sculpture, video etc. This will always live on the server of the institution. In the metadata a link is included to this object on the webpage of the institution.
Produrre un sistema che permetta agli utenti di Internet di accedere ad un patrimonio di milioni di oggetti digitali (foto, film, dipinti, suoni, mappe, manoscritti, libri ecc.).
rendendo possibile lo svolgimento di ricerche nel complesso del patrimonio culturale digitale italiano on line distribuito nel territorio (vale a dire, conservato in luoghi differenti da organismi differenti)
CulturaItalia permette agli utenti di Internet di accedere ad un patrimonio di milioni di oggetti digitali (foto, film, dipinti, suoni, mappe, manoscritti, libri ecc.). rendendo possibile lo svolgimento di ricerche nel complesso del patrimonio culturale digitale italiano on line distribuito nel territorio (vale a dire, conservato in luoghi differenti da organismi differenti).
Infatti Per gli utenti non è importante se le fonti per la conoscenza del patrimonio sono conservate da archivi, biblioteche e musei, ma avere l'accesso alle fonti dati che desiderano ed essere in grado di utilizzare queste fonti in modo interdisciplinare.
Image is the dominant type
Text is increasing
Video and sound are still more challenging and costly to digitise with copyright and production issues
Europeana actively tries to increase the video and audio content, which is also reflected in its content strategy.
Un esempio di metadato “classico” è la scheda catalografica. Esistono tuttavia diverse tipologie funzionali: metadati descrittivi, strutturali, amministrativo-gestionali questi ultimi finalizzati in particolar modo alla gestione dei diritti e alla conservazione
Un esame degli standard di metadati descrittivi maggiormente usati in ambito internazionale ha condotto a identificare il Dublin Core come
metadata schema più adatto a rappresentare tipologie così varie di risorse.
diversi schemi di metadati adoperati
diversi schemi logici del db
difformità dei contenuti e dei contesti operativi
The main goals are to promote the various aspects of the Italian culture (heritage, landscape, cinema, music, literature etc.), to give end users an integrated point of access to the Italian cultural heritage, to increase the digitasion of cultural contents and to contribute to the building process of the Europeana by a national and cross-domain aggregator.
So this effort resulted in Europeana. We currently aggregate the material from about 3000 institutions around Europe, leading to a database of a little over 30M records. It is always important to keep in mind that we only store metadata, so the descriptive data. Not the actual digitised painting, sculpture, video etc. This will always live on the server of the institution. In the metadata a link is included to this object on the webpage of the institution.
The i2010 strategy announced the intention to promote and support the creation of a European digital library which aims to foster growth in the information society and media industries.
EDLnet was aimed at building a prototype of a cross-border, cross-domain, user-centred service. It was funded by the European Commission under its eContentplus programme, one of the research and development funding streams of i2010.
The New Renaissance Report by Comite des Sages - about bringing Europe’s cultural heritage online - said ‘All public domain masterpieces should be brought into Europeana’ and that ‘Public funding for digitisation should be conditional on free accessibility through Europeana’.
An aggregator in the context of Europeana is an organisation that collects metadata from a group of data providers and transmits them to Europeana. Aggregators also support the data providers with administration, operations and training.
Europeana aims to create strong partnerships and to support the developments of aggregators on a national level in Europe and of pan-European aggregators representing a specific domain or sector.
Besides getting direct data contributions from national aggregation initiatives, Europeana gets contributions from pan-European aggregators as, for example, EU-funded projects representing a specific segment or sector, like the Euroepan Film Gateway. These projects enable large amounts of data to be provided to Europeana. The aggregators also improve data, solve language issues and develop new technologies.
At a working level, we operate in a network of aggregators. We can’t work directly with 2,200 organisations, so we rely on aggregators to
collect data, harmonise it, and deliver to Europeana.
Aggregators are important because they share a background with the organisations whose content they bring together, so there is close understanding.The aggregation model enables Europeana to collect huge quantities of data from thousands of providers, through only a handful of channels.
The Strategic Plan 2011-2015 separates activity into four tracks.
The Strategic Plan isn’t just a high level document, it translates to the work we carry out on a day-to-day basis and to each individual’s responsibilities.
Aggregate: source content (increasing diversity); expand the network; improve data quality
Facilitate: Strengthen advocacy (e.g. defend public domain); share knowledge among heritage professionals; foster research & development
Distribute: Develop partnerships to deliver content in new ways, upgrade portal, put content in users’ workflow
Engage: Enhance users’ experience; extend social media presence; broker new user/curator relationships (e.g. Europeana 1914-1918 UGC)
Les Miserables: Victor Hugo’s handwritten manuscripts: http://www.europeana.eu/portal/record/9200103/5372912AF66AB529E188218BC1F747E75EB1A18F.html
BnF, public domain
Matisse ‘53 in the form of a double helix’ http://www.europeana.eu/portal/record/9200104/F8D60AB9136C8A59B59DF1CFEC278A6CABA8B0C6.htmlThe Wellcome Library (CC-BY-NC-ND)
‘söprűtánc’ – Hungarian traditional dance http://www.europeana.eu/portal/record/08901/E1A7B01BE4AED87FD239672F4F3941F52262D6B2.html
Hungarian Academy of Sciences Institute for Musicology, public domain
‘Neurologico reggae’ Music album http://www.europeana.eu/portal/record/08901/ADC241BCBF8470988DBA6EEAFCF13F14D88E5534.html
DISMARC – EuropeanaConnect Paid Access
‘Castle of Kavala’ 3D exploration of a Greek castle http://www.europeana.eu/portal/record/2020703/05607B24D15BD516EE2B765F74CDA39C7427F7FB.html
Cultural and Educational Technology Institute - Research Centre Athen CARARE CC-BY-NC-ND
Example used is:
http://preview.europeana.eu/portal/record/90402/174D436CF5C61F8AA999090C98DA48B9C7024087.html
Een vrouw met een kind in een kelderkamer by Pieter de Hooch, Rijksmuseum, public domain
Poisonous nature exhibition includes content from Europeana, http://poisonousnature.biodiversityexhibition.com/
Europeana Fashion portal will go live in May 2013
Data is available as ‘data dumps’ for Linked Open Data initiatives from data.europeana.eu.
Europeana's move to CC0 is a step change in open data access. Releasing data from across the memory organisations of every EU country sets an important new international precedent, a decisive move away from the world of closed and controlled data.
Note that previews can only be used in accordance with the rights information displayed next to them.
HISPANA and Partage Plus both use the Europeana API to include Europeana search results on their own websites
Poisonous nature exhibition includes content from Europeana, http://poisonousnature.biodiversityexhibition.com/
Europeana Fashion portal will go live in May 2013
SILK [89] è uno degli strumenti più utilizzati per fare “record linkage”. È in grado di scoprire
somiglianze (similarity) fra entità appartenenti a diverse sorgenti e materializzare i collegamenti in nuovi
dataset RDF.
1. The Europeana Data Exchange Agreement (DEA) structures the relationship of Europeana and its data providers. It details the exchange whereby data providers receive back enriched metadata as well as access to other metadata of interest. It establishes rules for updating and deleting metadata stored by Europeana and deals with issues such as liability and removal of data at the request of third parties.
2. The Creative Commons Zero Universal Public Domain Dedication (CC0 waiver). The CC0 waiver is a legal tool that has been developed by Creative Commons for making data available without restrictions on re-use. This means that anyone can use the metadata published by Europeana for any purpose without any restrictions whatsoever.
3. The Europeana Data Use Guidelines. These guidelines make best practice requests to users of the metadata. The Data Use Guidelines deal with issues like attribution and Data integrity.
4. The Europeana terms for user contributions. These terms apply to end users who contribute content to Europeana, so that Europeana can use content provided by its users and integrate it with other Europeana-held content and data.
5. The EDM rights field of the Europeana Data Model. The Europeana Data Model Specifies how data needs to be formatted so that Europeana can use it. This specification includes rights information relating to digital objects that are made available via Europeana.
Poisonous nature exhibition includes content from Europeana, http://poisonousnature.biodiversityexhibition.com/
Europeana Fashion portal will go live in May 2013
Le risorse non vengono duplicate. I contenuti e i diritti su di essi rimangono sotto la responsabilità di chi li crea, gestisce e aggiorna.
But in Europe there is still a huge amount of material not yet digitised. Recent studies show that about 10% of all of Europe’s heritage is currently digitised. And this also very much differs per sector. The AV sector for example is estimated to have only 2%. Now there is of course a question if you want to digitise everything, but for sure we are not there yet
And from this 10%, only 12% can at the moment be found in Europeana, and of those 32 million, less than half can be used by people. So there is still a lot of work to be done.
Il problema dell’interoperabilità
deriva in parte proprio dall'identità: se non si sa come “risolvere” l’identità di una “cosa” fra i diversi
sistemi che ne “parlano”, è molto difficile aggregare le informazioni ad essa relative. Il problema
dell’integrazione fra dati di sistemi diversi è reso ancora più complesso dal fatto che ogni sistema si basa
tipicamente su infrastrutture eterogenee: diversi linguaggi, formati, protocolli, ecc. È possibile, infatti,
che a una stessa “cosa” sistemi differenti assegnino identità differenti. Pertanto, queste andrebbero
allineate per continuare a garantire l'interoperabilità tra sistemi eterogenei.
Il problema dell’interoperabilità
deriva in parte proprio dall'identità: se non si sa come “risolvere” l’identità di una “cosa” fra i diversi
sistemi che ne “parlano”, è molto difficile aggregare le informazioni ad essa relative. Il problema
dell’integrazione fra dati di sistemi diversi è reso ancora più complesso dal fatto che ogni sistema si basa
tipicamente su infrastrutture eterogenee: diversi linguaggi, formati, protocolli, ecc. È possibile, infatti,
che a una stessa “cosa” sistemi differenti assegnino identità differenti. Pertanto, queste andrebbero
allineate per continuare a garantire l'interoperabilità tra sistemi eterogenei.
Le risorse non vengono duplicate. I contenuti e i diritti su di essi rimangono sotto la responsabilità di chi li crea, gestisce e aggiorna.
DBpedia [28], la versione RDF
dei dati contenuti in Wikipedia, occupi una posizione centrale nella nuvola in virtù della vastità e varietà
dei dati che essa contiene. DBpedia costituisce pertanto un importante accentratore attraverso il quale è
possibile la navigazione tra un gran numero di dataset diversi.
L'ontologia consisterà di concetti ("classi"), relazioni ("proprietà") e vincoli di cardinalità
("restrizioni"), oltre a commenti, annotazioni, ecc. I nomi di questi elementi devono essere
appropriati, seguire semplici convenzioni e rispettare gli schemi URI dei Linked Data come per i
dati;
(e) l'ontologia dell'amministrazione così ricostruita diventa ora lo schema di rappresentazione
dei dati, che vengono quindi rifattorizzati in funzione degli elementi definiti nell'ontologia.
Anche in questo caso, ogni dato diventa un'entità con un indirizzo specifico: un'entità riceve il
suo significato dalle relazioni che ha con altre entità o valori simbolici in un grafo.
In linea generale, la scelta di adottare un modello di licenze basate su CC deriva principalmente
dall’esigenza di armonizzare il rilascio di dati aperti con analoghe iniziative di carattere internazionale,
semplificando e promuovendo il riuso dei dati stessi. Le licenze CC, infatti, facilitano la comprensione
dei dati e consentono un loro ampio riuso grazie a un buon grado di permessi.
Per una maggior chiarezza, i vari domini della LOD Cloud sono visualizzati in Figura 1 con colori
diversi. Così, per esempio, il rosa indica l’insieme di dataset scientifici (dominio a cui appartiene per
esempio Uniprot [29] un grande database bioinformatico per le sequenze proteiche di organismi viventi
e virus); il colore giallo indica i dataset geografici (dominio cui appartengono, per esempio,
LinkedGeoData [30] che rende disponibili in RDF le informazioni del progetto OpenStreetMap [31],
GeoNames [32] che rende disponibili più di 6 milioni di toponimi, ecc.). Il colore azzurro chiaro sulla
sinistra rappresenta i dataset relativi al dominio delle pubbliche amministrazioni e vede un
considerevole contributo del Regno Unito. In generale, il sempre crescente numero di dataset presenti
nella LOD Cloud evidenzia l’elevato livello di maturità dell'approccio e i diversi esempi dimostrano i
benefici che si possono conseguire.
Negli ultimi tempi molti paesi hanno adottato politiche di Open Data istituendo portali che fungono da
collettori per i dataset della PA. Il primo e più famoso è stato quello degli Stati Uniti “data.gov” [7] a
cui poi ne sono seguiti molti altri. La prassi di esporre inizialmente i dati in modalità Open lasciando
poi ad altri soggetti l’onere di renderli Linked comincia ad essere superata. Da qualche tempo, infatti,
un numero crescente di amministrazioni, rendendosi conto del valore aggiunto dei Linked Data, si sta
facendo carico del lavoro necessario per pubblicare gli Open Data direttamente in modalità Linked.
SILK [89] è uno degli strumenti più utilizzati per fare “record linkage”. È in grado di scoprire
somiglianze (similarity) fra entità appartenenti a diverse sorgenti e materializzare i collegamenti in nuovi
dataset RDF.
SILK [89] è uno degli strumenti più utilizzati per fare “record linkage”. È in grado di scoprire
somiglianze (similarity) fra entità appartenenti a diverse sorgenti e materializzare i collegamenti in nuovi
dataset RDF.
SILK [89] è uno degli strumenti più utilizzati per fare “record linkage”. È in grado di scoprire
somiglianze (similarity) fra entità appartenenti a diverse sorgenti e materializzare i collegamenti in nuovi
dataset RDF.
SILK [89] è uno degli strumenti più utilizzati per fare “record linkage”. È in grado di scoprire
somiglianze (similarity) fra entità appartenenti a diverse sorgenti e materializzare i collegamenti in nuovi
dataset RDF.
In linea generale, la scelta di adottare un modello di licenze basate su CC deriva principalmente
dall’esigenza di armonizzare il rilascio di dati aperti con analoghe iniziative di carattere internazionale,
semplificando e promuovendo il riuso dei dati stessi. Le licenze CC, infatti, facilitano la comprensione
dei dati e consentono un loro ampio riuso grazie a un buon grado di permessi.