2. Scenario Europeo: Nuova Direttiva Europea
2
#DigitalSingleMarket
In conformità con la GDPR – General Data Protection Regulation
Nuovo nome «Open Data e riutilizzo dell’informazione pubblica» giugno
2019
1. Real time data e API per dati dinamici
2. Tutti i contenuti del settore pubblico acceduti secondo le regole per
l’accesso ai documenti della PA sono liberamente e gratuitamente
disponibili per il riutilizzo
3. Assenza di esclusiva (no data lock in) - obblighi di trasparenza tra
enti pubblici e privati
4. Dati sui trasporti e di pubblica utilità
5. Dati su ricerca finanziata con soldi pubblici
6. High Value Dataset
3. Focus sui dati di pubblica utilità
Articolo 1 Oggetto e ambito di applicazione
1.Al fine di promuovere l'utilizzo di dati aperti e di incentivare l'innovazione nei prodotti e nei servizi,
la presente direttiva detta un complesso di norme minime in materia di riutilizzo e di modalità
pratiche per agevolare il riutilizzo:
a) dei documenti esistenti in possesso degli enti pubblici degli Stati membri;
b) dei documenti esistenti in possesso delle imprese pubbliche:
i) attive nei settori definiti nella direttiva 2014/25/UE (settori: acqua, trasporti, energia, servizi
postali);
ii) che agiscono in qualità di operatori di servizio pubblico a norma dell'articolo 2 del
regolamento (CE) n. 1370/2007;
iii) che agiscono in qualità di vettori aerei che assolvono oneri di servizio pubblico a norma
dell'articolo 16 del regolamento (CE) n. 1008/2008; o
iv) che agiscono in qualità di armatori comunitari che assolvono obblighi di servizio pubblico
a norma dell'articolo 4 del regolamento (CEE) n. 3577/92;
c) dei dati della ricerca, conformemente alle condizioni di cui all'articolo 10
https://eur-lex.europa.eu/legal-content/IT/TXT/PDF/?uri=CELEX:32019L1024&from=EN
4. Dataset di alto valore
4
Dati geospaziali
Dati relativi all'osservazione
della terra e all'ambiente
Dati meteorologici
Dati statistici
Dati relativi alle imprese e alla
proprietà delle imprese
Dati relativi alla mobilità
5. European Data Strategy
«The European data strategy aims to make the EU a leader in a data-
driven society. Creating a single market for data will allow it to flow freely
within the EU and across sectors for the benefit of businesses, researchers
and public administrations.»
In 2021 un cosiddetto «Data Act» sarà disponibile dove incentivare la
collaborazione e la condivisione di dati tra pubblico-privato, tra privato e
privato e tra pubblico e pubblico.
Investimenti su progetti che riguardano i cosiddetti European Data
Spaces - Settori o domini dove l’uso dei dati avrà un impatto sistemico
sull’intero ecosistema e sui cittadini.
https://ec.europa.eu/info/strategy/priorities-2019-2024/europe-fit-digital-age/european-data-strategy_en
6. Scenario normativo italiano
REGIONE CAMPANIA era ULTIMA
Scenario italiano – strategia italia 2025
La prima sfida: società digitale
3 obiettivi principali. Il terzo è così
descritto:
Il patrimonio informativo pubblico e
l’utilizzo e condivisione dei dati da
parte delle amministrazioni e dei
privati è valorizzato e incentivato.
20 + 1 azioni
A08 – Intelligenza artificiale al servizio
dello Stato
A09 – Dati per le città del futuro
A10 – Borghi del Futuro
7. Scenario normativo italiano
REGIONE CAMPANIA era ULTIMA
Codice per l’Amministrazione Digitale – CAD
• Articolo 1 comma 1 lettera l-ter) – definizione di dati aperti
• Articolo 50 comma 1 – messa a disposizione di dati aperti
• Articolo 52 –
• principio open data by default,
• responsabilità dirigenziale,
• capitolati di gara
https://docs.italia.it/italia/piano-triennale-ict/codice-amministrazione-digitale-docs/it/v2018-09-28/
D.Lgs 102/2015 – recepimento direttiva (2013) riutilizzo
informazione del settore pubblico
In corso i lavori per il recepimento della direttiva 2019
https://www.gazzettaufficiale.it/eli/id/2015/07/10/15G00116/sg
Piano Triennale – Capitolo 5 - I dati della
Pubblica Amministrazione (e le ontologie)
https://pianotriennale-ict.italia.it/
Scenario normativo italiano
8. Open Data - articolo 1 del CAD
8
• Disponibile (requisito giuridico): disaggregato,
secondo i termini di una licenza aperta che ne
consenta il riutilizzo, anche per finalità commerciali
• Accessibile (requisito tecnologico): da macchine, in
formato aperto e corredato di metadati
• Gratuito (requisito economico): gratuito o a costi
marginali sostenuti per la riproduzione, messa a
disposizione e divulgazione
9. Open Data – articolo 50 comma 1 del CAD
9
I dati delle pubbliche amministrazioni sono formati, raccolti,
conservati, resi disponibili e accessibili con l’uso delle tecnologie
ICT che ne consentano la fruizionee riutilizzazione[…]
da parte delle altre pubbliche amministrazioni e
dai privati; restano salvi i limiti alla conoscibilità dei dati previsti
dalle leggi e dai regolamenti, le norme in materia di protezione
dei dati personali ed il rispetto della normativa comunitaria in
materia di riutilizzo delle informazioni del settore pubblico
10. Open Data – articolo 52 del CAD
10
I dati e i documenti che le PA pubblicano [..] senza l’espressa adozione di
una licenza [..] si intendono rilasciati come dati di tipo aperto [..] ad
eccezione dei casi in cui la pubblicazione riguardi dati personali del
presente Codice
Nella definizione dei capitolati o degli schemi dei contratti
di appalto relativi a prodotti e servizi che comportino la
formazione, la raccolta e la gestione di dati, le PA prevedono
clausole idonee a consentirne l’utilizzazione in
conformità a quanto previsto dall’articolo 50
Le attività volte a garantire l’accesso telematico e il riutilizzo dei dati [..]
rientrano tra i parametri di valutazione della performance dirigenziale
11. Nelle linee guida AgID del 2014…
https://www.agid.gov.it/sites/default/files/repository_files/linee_guida/patrimoniopubblicolg2014_v0.7finale.pdf
• Fornisce un’indicazione di massima su una clausola
generale da inserire nei capitolati
• Fornisce raccomandazioni su cosa includere come
requisiti distinguendo tra
o servizi che possono generare indirettamente dati
pubblici
o servizi che riguardano specificatamente la
generazione di dati pubblici (e.g., gestione di uno
specifico sistema informativo)
12. Open Data non deve essere confuso con…
Condivisione di dati tra
Pubbliche Amministrazioni
per scopi istituzionali
Può coinvolgere anche dati
personali
(articolo 50 comma 2)
Pubblicazione online di un documento o di un
dato (es. pubblicare un file PDF o un sito web con
ricerca sui dati NON è open data !!)
13. REGIONE CAMPANIA era ULTIMA
Piattaforma
Digitale
Nazionale dei
Dati (PDND)
Piano triennale 2019-2021
14. REGIONE CAMPANIA era ULTIMA
Piattaforma
Digitale
Nazionale dei
Dati (PDND)
Piano triennale 2020-2022 - anticipazioni
In via di finalizzazione
Cambio significativo in certe parti:
• monitoraggio di obiettivi e risultati attesi;
• indicazioni delle azioni da svolgere da parte di
o AgID e altri enti competenti (e.g., Dipartimento per la
Trasformazione Digitale)
o Pubbliche Amministrazioni
Capitolo 2 - Dati delle PA con focus su:
• Interoperabilità e dati aperti dinamici
• Qualità di dati e metadati
• Consapevolezza del ruolo del dato e del suo riutilizzo da parte di
chiunque per qualunque scopo
15. Cosa si può fare se c’è open data
15
http://www.monithon.it/
http://www.ascuoladiopencoesione.it/
con dati aperti di open coesione (focus su turismo
https://opencoesione.gov.it/it/temi/cultura-e-turismo/)
16. Cosa si può fare se c’è open data
16
Sulla base di
eventi pubblici
di tipo sagre
disponibili presso
il catalogo open
data della
regione
Lombardia
17. Cosa si può fare se c’è open data
Sulla base del
dataset degli
agriturismi
presente nel
catalogo dei
dati aperti della
regione
Lombardia
18. Cosa si può fare se c’è open data
Sulla base del
dataset sugli
ostelli presente
nel catalogo dei
dati aperti della
regione
Lombardia
27. Linee guida valorizzazione patrimonio pubblico
Contesto Legale
I dati delle Pubbliche Amministrazioni
I modelli per i dati e per i metadati (DCAT-AP_IT)
Modello operativo e qualità dei dati
Architettura di riferimento per l’informazione del
settore pubblico
Licenze e modelli di costo
Come pubblicare dati aperti e il catalogo
nazionale dei dati
https://docs.italia.it/italia/daf/lg-patrimonio-pubblico/it/stabile/
30. Da dove iniziare? – Modello organizzativo
Diversi percorsi che
si intersecano tra
loro.
Si può iniziare dal
percorso Dati Naviti
per poi intersecare
altri percorsi (Linked
Open Data)
31. Modello organizzativo – selezionare i dati
Guidati dalla domanda
Effettiva disponibilità dei
dati possibilmente
agganciati a sistemi
esistenti
Dare più alta priorità ai
dataset chiave definiti a
livello nazionale / europeo
32. Analisi giuridica - checklist
Diversi aspetti da
verificare per
una corretta
pubblicazione
Privacy/Segretezza
Temporalizzazione
Trasparenza
Accessibilità legale
(licenze)
Esempio:
Il dataset contiene dati personali?
I dati personali permettono l’identificazione
diretta dell’interessato (es. nome, cognomen)?
Esempio:
I dati sono soggetti per legge a restrizioni
temporali di pubblicazione?
Esempio
I dati rientrano nella lista dell’allegato A del
d.lgs. 33/2013?
Esempio
Stai rilasciando i dati di cui possiedi la proprietà
accompagnati da
una licenza?
33. Modello organizzativo – altre fasi del processo
Bonifica Produzione sostenibile di dataset
almeno di livello 3
Metadatazione del dataset
scegliendo la licenza per il riutilizzo Pubblicazione
35. Quali dataset chiave definiti a livello
nazionale?
Individuiamo i dataset
Paniere
dinamico
di dataset
Basi di
dati
chiave
*
36. Basi di dati chiave: quali
36
TRASPORTI (TRAFFICO E MOBILITÀ)
DATI DEL TRAFFICO REAL TIME,
PARCHEGGI, DATI DEL TRASPORTO
PUBBLICO REAL TIME E STATICI, PATENTI
ATTIVE, INCIDENTI, PERIMETRO VARCHI E
ZTL
ISTRUZIONE, CULTURA E SPORT
LUOGHI ED EVENTI CULTURALI, BENI
CULTURALI, GUIDE TURISTICHE,
STRUTTURE RICETTIVE, CAMMINI
REGIONI E CITTÀ
ARCHIVIO STORICO DEI COMUNI,
ANAGRAFE NAZIONALE NUMERI
CIVICI E STRADE URBANE
GIUSTIZIA, SISTEMA
LEGALE, SICUREZZA
PUBBLICA
NORMATTIVA
ECONOMIA E FINANZE
STATISTICHE SU STARTUP E IMPRESE,
CATASTO – OSSERVATORIO MERCATO
IMMOBILIARE
Parzialmente
aperti in alcune
regioni/comuni
Buona
parte aperti
Solo
l’archivio
storico dei
comuni Non aperto
In parte
aperti
37. Paniere dinamico di dataset
37
Doppia componente
nazionale (basi dati centrali)
regionale (basi di dati locali)
38. Paniere dinamico di dataset
38
Esempi di dataset presenti nella componente regionale
• Orari trasporto pubblico regionale
• Aziende esercenti servizi di trasporto pubblico di linea
• Aree protette e rete natura 2000
• Strutture ricettive, Agriturismi
• Sale cinematografiche attive
• Beni demaniali artistici e archeologici
• Presenze turistiche (flussi)
• Elenco strutture commerciali (piccola e grande distribuzione)
• Elenco fattorie didattiche
• Dati sensori meteo
• Impianti sportivi
Per l’Umbria dati sui trasporti e meteo non sono aperti e non lo sono le presenze turistiche, i
beni demaniali artistici, le sale cinematografiche, le fattorie didattiche, le aree protette
39. Dataset relativi al turismo aperti –
situazione regionale
Dataset Numero di regioni che aprono il dataset
Strutture ricettive 13 su 21
Agriturismi 14 su 21
Presenze turistiche (flussi) 8 su 21
Sale cinematografiche 5 su 21
Beni demaniali artistici e archeologici 6 su 21
Fattorie didattiche 5 su 21
Elenco strutture commerciali (piccola e grande
distribuzione)
10 su 21
Impianti sportivi 10 su 21
Dati meteo 9 su 21
Orari trasporto pubblico locale 6 su 21
Aree protette e rete natura 2000 15 su 21
40. Paniere dinamico di dataset
40
Esempi di dataset della componente nazionale
• Infrastrutture e mobilità à Banca dati del Ministero delle
Infrastrutture e dei Trasporti relativa ai dati su infrastrutture,
trasporto e mobilità. Progetto morto
• Eventi e luoghi della cultural à MIBACT attraverso la
piattaforma Linked Open Data (https://dati.beniculturali.it
• Accesso ai luoghi della cultura à non aperto
• Schede di catalogo à MIBACT attraverso progetto Linked Open
Data ArCo
• Classificazioni dei settori di attività delle imprese: Ateco 2007
presente in OntoPiA in Linked Open Data
• Marchi di qualità DOP e IGP à Disciplinari del Ministero
dell’Agricoltura – non aperto
41. Individuiamo i dataset
Esistono già dati aperti sul tema turismo? (Progetto COMSODE –
tutti disponibili anche come Linked Open Data
43. Individuiamo i dataset
Esistono altri dati in vostro possesso sul tema anche
non aperti? Derivano da sistemi informativi esistenti?
44. Individuiamo i dataset
Esistono altri dati in vostro possesso sul tema anche
non aperti? Derivano da sistemi informativi esistenti?
45. Individuiamo i dataset
Esistono altri dati in vostro possesso sul tema anche
non aperti? Derivano da sistemi informativi esistenti?
Licenza aperta CC-BY
I dati per il download sono nel catalogo
open data ma non sembra esplicitato
nel portale
46. Individuiamo i dataset
Turismo valle umbria
Non sembrano esserci
informazioni sulla possibilità
di riutilizzare i dati presenti
nel sito
49. Quali dati delle regioni sul tema?
49
• Codici strutture ricettive
• Capacità strutture ricettive
• Movimenti turistici (flussi - storico)
• Co-visite turistiche sulla base di dati telefonici
Vodafone
• Glossario del turismo
• Istituti e luoghi della cultura
• Schede di catalogazione di opere artistiche
• Quadri orari Trasporto Urbano/Extraurbano
• Fermate e percorsi
53. Quali dati delle regioni sul tema?
• Arrivi e presenze
• Shopping – offerta outlet ed esercizi storici fiorentini
• Cosa fare a Firenze
• Luoghi della cultura (musei, biblioteche, teatri)
• Strutture ricettive
• Uffici informazioni turistiche
• Consolati
• Bagni pubblici
• Fontanelli
• Eventi sistema cultura
• Ristoranti e botteghe
• Taxi
• Esercizi commerciali
• Dati meteo
• Orari trasporto pubblico locale
• Punti di interesse nelle aree naturale protette
• Carsharing
57. Quali dati delle regioni sul tema?
• Punti di interesse
• Esercizi alberghieri e extra alberghieri
• Botteghe storiche
• Ricette tipiche trentine
• Riserve naturali
• Impianti funiviari
• Dimensione media delle unità locali di imprese attive nel settore turismo
• Posti letto in campeggi
• Presenze e arrivi in strutture alberghiere
• Campeggi, rifugi
• Tempo di ricettività turistica
• Eventi
• Prodotti DOP e IGP
• Dati meteo
• Stazioni treno
58. Riassumendo
• Diversi dataset per il settore turismo sono aperti
o Sono aperti in maniera non uniforme su scala nazionale (per gli eventi,
per le strutture ricettive, ecc.)
• I dataset sui flussi turistici alcune regioni li aprono altri no (esempio
Umbria non li ha)
• Diversi dataset del settore turismo sono disponibili secondo le 5 stelle
del modello per i dati (Umbria, Toscana)
o Abilita possibilità di collegare e rendere interoperabili i dati
• Altri dataset di particolare rilevanza (mobilità e meteo) sono più rari
da trovare aperti su scala nazionale
• Esistono soluzioni in riuso che possono facilitare la standardizzazione di
alcuni dati per il turismo producendo i relativi open data (e.g.,
software Open Agenda)
60. Il dato è una rete
“A single road only takes us to places between
two locations; roads real value comes from
being part of a network. Data works in the same
way: it is not just having more data that unlocks
its value, but linking it together. Data is not
individual datasets, it is a network”
60
“I dati hanno valore solo se si combinano
con altri dati. I dataset presi individualmente
hanno uno scarso valore. Solo attraverso la
loro aggregazione possono aprire le
straordinarie possibilità offerte dalle tecniche
di data analysis” - Presidente del Consiglio Conte
– Data Driven Innovation 2019, Roma
61. Passiamo dalle 3 alle 4 e 5 stelle
Se il dato è una rete dobbiamo abilitare i
collegamenti tra i dati rendendoli interoperabili
Dobbiamo quindi passare a dati «linked»
63. Standard del Web Semantico
63
Href link non tipato)
Risorse: Documenti Web
HTML con link non tipati (href)
Interrogazioni più complesse sui dati sono impossibili
64. Interrogazioni complesse
Quali sono le strutture ricettive alberghiere vicino al Duomo di Santa Maria Assunta
in Cielo di Orvieto che hanno un servizio animali e un servizio wifi gratuito?
72. Standard Web Semantico: RDF
72
• Un modello per i dati nel web dove i dati sono espressi
sottoforma di Triple
o Soggetto Predicato Oggetto
• Ogni entità è identificata univocamente da un URI (Uniform
Resource Identifier)
o Il Soggetto e il Predicato hanno sempre un URI
o L’Oggetto può anche essere un valore predefinito (Literale)
• Le triple sono interconnesse quando condividono la stessa
entità
o Il risultato è un grafo interconnesso di triple (Linked Data)
73. Vantaggi del modello RDF
73
• È un modello di rappresentazione dei dati pensato per il Web
• È basato su standard del Web
• Consente nativamente di abilitare l’integrazione tra I dati
• Fornisce un meccanismo per risolvere l’identitià delle cose
o Nativamente fornisce meccanismi per garantire interoperabilità
semantica
• E’ usato insieme al linguaggio per interrogare i dati (i.e.,
SPARQL)
o I dati sono così associati a delle API che facilitano l’interrogazione da
parte delle macchine
74. Facciamo un esempio partendo dalle tabelle
74
ID Nome Cognome Sesso PA di
riferimeto
1 Giorgia Lodi F agid
Codice
IPA
Denominazione
agid Agenzia per l’Italia
Digitale
75. Facciamo un esempio partendo dalle tabelle
Dobbiamo attribuirgli un URI – passo fondamentale nel Web dei dati
ID Nome Cognome Sesso PA di
riferimeto
1 Giorgia Lodi F agid
76. Facciamo un esempio partendo dalle tabelle
Dobbiamo attribuirgli un URI – passo fondamentale nel Web dei dati
https://dati.italia.it/risorsa/persona/1
https://{dominio}/{tipo}/{di cosa parliamo}/{codice univoco}
ID Nome Cognome Sesso PA di
riferimeto
1 Giorgia Lodi F agid
77. Facciamo un esempio partendo dalle tabelle
Nel Web dei dati si definiscono i tipi.
https://dati.italia.it/risorsa/persona/1 cos’è?
ID Nome Cognome Sesso PA di
riferimeto
1 Giorgia Lodi F agid
78. Facciamo un esempio partendo dalle tabelle
E’ una persona
Nel Web dei dati si definiscono i tipi.
https://dati.italia.it/risorsa/persona/1 cos’è?
ID Nome Cognome Sesso PA di
riferimeto
1 Giorgia Lodi F agid
79. Facciamo un esempio partendo dalle tabelle
E’ una persona
Nel Web dei dati si definiscono i tipi.
https://dati.italia.it/risorsa/persona/1 cos’è?
Concetto definito in un’ontologia (in questo caso delle persone)
ID Nome Cognome Sesso PA di
riferimeto
1 Giorgia Lodi F agid
80. Facciamo un esempio partendo dalle tabelle
https://dati.italia.it/risorsa/persona/1 è definito come
<https://dati.italia.it/risorsa/persona/1>
<http://www.w3.org/1999/02/22-rdf-syntax-ns#type>
<https://w3id.org/italia/onto/CPV/Person>
ID Nome Cognome Sesso PA di
riferimeto
1 Giorgia Lodi F agid
81. Facciamo un esempio partendo dalle tabelle
https://dati.italia.it/risorsa/persona/1 è definito come
<https://dati.italia.it/risorsa/persona/1>
<http://www.w3.org/1999/02/22-rdf-syntax-ns#type>
<https://w3id.org/italia/onto/CPV/Person>
ID Nome Cognome Sesso PA di
riferimeto
1 Giorgia Lodi F agid
Tripla
83. In RDF
ID Nome Cognome Sesso PA di
riferimeto
1 Giorgia Lodi F agid
@prefix cpv: <https://w3id.org/italia/onto/CPV/> .
<https://dati.italia.it/risorsa/persona/1>
a cpv:Person ;
cpv:familyName "Lodi";
cpv:givenName "Giorgia" ;
… .
84. Codice
IPA
Denominazione
agid Agenzia per l’Italia
Digitale
@prefix cov: <https://w3id.org/italia/onto/COV/> .
<https://dati.italia.it/risorsa/pubblica-amministrazione/agid>
a cov:PublicOrganization ;
cov:legalName "Agenzia per l’Italia Digitale";
…. .
E’ una organizzazione (pubblica)
Ontologia delle organizzazioni (pubbliche e
private)
Facciamo un esempio partendo dalle tabelle
85. @prefix cpv: <https://w3id.org/italia/onto/COV/> .
@prefix cpv: <https://w3id.org/italia/onto/CPV/> .
@prefix org: <http://www.w3.org/ns/org#> .
<https://dati.italia.it/risorsa/persona/1>
a cpv:Person ;
cpv:familyName "Lodi";
cpv:givenName "Giorgia" ;
org:memberOf <https://dati.italia.it/risorsa/pubblica-amministrazione/agid> .
<https://dati.italia.it/risorsa/pubblica-amministrazione/agid >
a cov:PublicOrganization ;
cov:legalName "Agenzia per l’Italia Digitale» .
Colleghiamo i due oggetti
Definizione oggetto
persona
Definizione oggetto
organizzazione
86. RDF – grafo della conoscenza (linked data)
<https://dati.italia.it/risorsa/persona/1>
<https://dati.italia.it/risorsa/pubblica-amministrazione/agid>
org:MemberOf
<https://dbpedia.org/resource/Roma>
clv:hasSpatialCoverage
<https://www.agid.gov.it>
foaf:homepage
cov:residentIn
Si forma così un enorme grafo distribuito nel web che può essere acceduto
da chiunque per qualunque scopo
87. RDF - serializzazioni
• Diversi formati o serializzazioni
o N-triples – formato molto prolisso con URI tutti esplicitati
per soggetto predicato e oggetto (quando non
literale)
o RDF/Turtle – formato compatto a oggetti (slide
precedenti)
o RDF/XML – sintassi simile a XML
o JSON-LD – JSON per rappresentare dati a grafo
88. Come li interroghiamo?
• Attraverso uno standard chiamato SPARQL
• SPARQL è supportato da cosiddetti SPARQL endpoint
ovvero sistemi di gestione di dati complessi che
consentono di interrogare grafi
• Negli endpoint i dataset RDF sono memorizzati in Triple
store
o Più diffusi: Virtuoso, BlazeGraph , Fuseki
89. SPARQL
#Dichiarazione dei prefissi
PREFIX cov: https://w3id.org/italia/onto/COV/
#Definizione delle variabili che contengono il risultato che si vuole ottenere
SELECT ?x ?y ?z
#Grafo da interrogare
FROM …
FROM NAMED …
#Triple PATTERN MATCHING
WHERE { …}
#Modificatori (GROUP BY, HAVING, ORDER BY, …)
102. 10
2
Cos’è OntoPiA e a cosa serve
• Definisce un linguaggio comune per l’interscambio di dati
(interoperabilità semantica)
• Definisce un modello formale, elaborabile da dispositivi digitali
e leggibile da umani (i.e., superamento della logica delle
specifiche scritte in soli file PDF!)
• Apre la strada alla creazione di dati nativamente collegati,
i.e., fornisce gli schemi dati per creare, interrogare il “grafo
della conoscenza” (knowledge graph) della PA italiana
103. • ONTOLOGIA: una specifica formale ed
esplicita di rappresentazione
(concettualizzazione) condivisa di un
dominio di conoscenza, definita sulla
base di requisiti specifici
• VOCABOLARIO CONTROLLATO: una serie di
termini e codici standard predefiniti e
autorizzati, preselezionati al fine di
indicizzare e recuperare informazioni
.
10
3
10
3
OntoPiA- rete di ontologie e vocabolari controllati
104. OntoPiA – perché?
FACILITARE LO SVILUPPO DI NUOVI
SISTEMI INFORMATIVI
AGEVOLARE LO
SCAMBIO DI DATI
ABILITARE L’INTEGRAZIONE TRA
DATI PROVENIENTI DA SORGENTI
DIVERSE
STANDARDIZZARE I DATI
(APERTI)
FACILITARE L’IMPLEMENTAZIONE DELLA DATA
PORTABILITY (GDPR)
105. 10
5
10
5
OntoPiA – dal punto di vista tecnico
Basata su standard del Web
Semantico (standard dei livelli 4, 5
stelle)
Sono disponibili in diverse serializzazioni
dello standard RDF, modello per la
rappresentazione dei dati nel Web
106. OntoPiA e gli ecosistemi del piano triennale
FINANZA PUBBLICA SVILUPPO E
SOSTENIBILITÀ
INFRASTRUTTURA E
LOGISTICA - MOBILITÀ
BENI CULTURALI TURISMO SMART LANDSCAPE
109. • COLLABORAZIONE CON CENTRI DI RICERCA
STLab – Semantic Technologies Laboratory
del CNR, Sapienza Università di Roma
• COLLABORAZIONE CON PUBBLICHE AMMINISTRAZIONI
e.g.,ISTAT, MIBACT, Regione Piemonte,
ANAC, Comuni di Palermo, Udine e Cagliari,
Provincia Autonoma di Trento, Consorzio dei
Comuni Trentini, diversi Comuni del FVG
• COINVOLGIMENTO DEGLI UTENTI FINALI
Disponibile su Github: chiunque può SEMPRE
commentare e/o proporre cambiamenti e
correzioni
https://github.com/italia/daf-ontologie-vocabolari-controllati
.
10
9
10
9
OntoPiA- coinvolgimento PA e utenti
110. OntoPiA – metodologia di sviluppo
3 ELEMENTI CARDINE
• Rispetto costante dei principi FAIR
• Politica per la gestione degli URI ben definita
o 3 macro tipi: «onto», «controlled-vocabulary», «data»
o URI in inglese persistente e neutri, gestiti con servizio esterno:
w3id.org – URI redirect per gestire anche content-negotiation
• Modellazione basata su «ontology design pattern» con
o riutilizzo indiretto di ontologie del Web Semantico
o utilizzo diretto delle ontologie della rete OntoPiA
111. 11
1
OntoPiA e i principi del modello FAIR
• Findable: si usano URI permanenti per identificare concetti e relazioni nella
rete di ontologie e termini nei vocabolari controllati. Ontologie e vocabolari
metadatati con relativi profili di metadatazione
• Accessible: si utilizzano protocolli standard aperti per l’accesso sul Web (i.e.
HTTP(S)) e per l’interrogazione dei dati (i.e. SPARQL). Multilinguismo e
navigazione via web delle ontologie e dei vocabolari
• Interoperable: si utilizzano protocolli standard aperti per modellare i dati i.e.
RDF e OWL (più serializzazioni per aumentare la pletora di riutilizzatori)
• Reusable: tutte le ontologie e i vocabolari controllati sono pubblici, rilasciati
secondo una licenza aperta (CC-BY 4.0) e sono collegati ad altre ontologie
standard (de facto) disponibili nel Web dei Dati
112. Ontologie esterne
• SKOS à per tesauri e sistemi di classificazione della conoscenza
• schema.org à ontologia degli OTT standard de facto usata in ambito SEO. Il
knolwedge graph di google è basato su schema.org
• Good Relations à ontologia standard de facto per il mondo e-commerce
• RDF Data Cube à ontologia standard del W3C per rappresentare cubi
multidimensionali; ideale per le statistiche
• Core Vocabulary Europei (Core Public Service, Core Business, Core Person, Core
Public Event, Core Location, Core Public Organization)
• Dublin Core à ontologia di metadatazione di documenti e dati
• Accommodation ontology à ontologia sulle strutture ricettive dello stesso
autore di Good Relations
• The Simple Event Model ontology à ontologia per modellare eventi in diversi
domini
• POI Data model à modello proposto dal W3C
• Tourpedia ontology à ontologia del progetto Tourpedia, il Dbpedia del turismo
114. Vocabolari controllati - modellazione
• I vocabolari sono modellati con un’ontologia standard e
particolarmente stabile del W3C, i.e., SKOS
o SKOS definisce un «Concetto» e uno «Schema di Concetti» e le
possibili relazioni di gerarchia tra loro
• I vocabolari si collegano semanticamente anche alle ontologie di
OntoPiA
o Un elemento del vocabolario è di tipo «Concetto»
dell’ontologia SKOS ma anche del tipo definita in una qualche
ontologia di OntoPiA
ü e.g., vocabolario controllato strutture ricettive: ogni
elemento è un «Concetto» ma anche di tipo «tipologia
struttura ricettiva» definito nella relativa ontologia
121. Vocabolario controllato tipologie strutture ricettive
• 4 livelli. Il primo livello è così composto:
o Struttura alberghiera e paraalberghiera
ü e.g., Albergo/Hotel, Motel, Albergo diffuso, Dimora storica, ecc.
o Struttura extraalberghiera
ü e.g., Struttura complementare (e.g., Casa per ferie, Colonia, ecc.),
Alloggio privato in affitto (e.g., Bed & Breakfast a conduzione familiare,
ecc.)
o Struttura ricettiva all’aperto
ü e.g., Parco Vacanze, Stabilimento balneare, ecc.
o Struttura di mero supporto (i.e., Area di sosta)
• Creato sulla base di
• Codice del Turismo
• Classificazione ISTAT derivante da questionari
• Leggi regionali
124. Vocabolario controllato tipologie di eventi
3 livelli con il primo
livello che consiiste
delle seguenti voci:
• Evento Culturale
• Evento Sociale
• Evento Politico
• Evento d’affari
/commerciale
• Evento sportivo
127. Progetto: Atlante dei cammini in open data
Partecipanti
• MIBACT (parte turismo);
• Regioni: Regione Puglia; Regione Umbria (dott.ssa Antonella Tiranti); Regione Liguria;
Coordinamento Regioni da parte della Regione Abruzzo
• Analisi, sviluppo modelli dati e prototipazione a cura del Laboratorio di Tecnologie
Semantiche dell’Istituto di Scienze e Tecnologie della Cognizione (ISTC) del CNR
Obiettivo principale
• Realizzazione di un modello concettuale aperto che valorizzi l’intento dell’Atlante dei
Cammini di fornire una visione d’insieme uniforme della rete di percorsi, comprendendo le
loro connessioni e attraversamenti regionali da rendere disponibile come (linked) open data
Principali risultati ottenuti
• Sviluppo del modello Atlante dei cammini nell’ecosistema OntoPiA così da abilitare
connessioni di modello e dati con altri settori (strutture ricettive, beni culturali, ecc.)
• Prototipo di modulo web per l’immissione dei dati standardizzata su scala nazionale
131. Conclusioni
• Individuate delle ontologie nazionali di OntoPiA che
potrebbero essere usate per la creazione di Linked Open
Data per il turismo
• Individuati vocabolari controllati che possono essere usati
per standardizzare categorizzazioni usate nel settore
turismo
• Discusso di progetti che possono non solo supportare nella
produzione di dati aperti di qualità ma anche nella
creazione di contenuti web standardizzati