SlideShare a Scribd company logo
1 of 38
Download to read offline
OPEN DATA
“STATO DELL’ARTE”
“The best way to get value from
data is to give it away..[..]..Lets join
together
and share our data”
Dicembre 2011 - Nuova OpenData Strategy
Neelie Kroes, Vice-Presidente Commissione europea per l’Agenda digitale.

...L’Europa corre veloce

Marzo 2012- ePSI

platform Conference

Taking re-use to the next level

“Practical example of OpenData reuse and grass roots
support and experience play an important role here..
[..]..
Go out and make the case for OpenData more
strongly!”
Le direttive dalla Digital Agenda di Dicembre 2011
Aggiornamento direttive 2003 sul riuso del PSI
Rendere accessibili e riutilizzabili i contenuti documentali della PA.
Rendere i dati in formato machine readable (RDF, JSON, XML).
Creazione di un data portal della commissione europea.

Aggiornamento delle direttive dalla ePSI conference 2012
Tutti i dati resi disponibili dal PSI devono poter essere riutilizzabili per uso
commerciale e non commerciale.
Gli stati membri devono introdurre un sistema di supervisione e
regolamentazione al fine di rispettare le direttive UE sul riuso nei tempi
stabiliti.
Lo scopo delle direttive sarà esteso alle informazioni contenute nelle
digital libraries, musei e archivi.
IL RIUSO COME CRITERIO
OBIETTIVO:

“VALUTARE LA
QUALITÀ DEI DATASET
PUBBLICATI”

Open
(Government Data)
Tutti le tipologie di dati di
interesse pubblico

“VALUTARE LA QUALITÀ
DEI PROCESSI DI
GOVERNANCE”

(Open Government)
Data
Tutti le tipologie di dati che
contribuiscono alla
trasparenza delle
amministrazioni
COME VALUTA L’UNIONE EUROPEA ?

Il riuso negli indicatori di punteggio:
Implementazione delle direttive EU

Dati delle amministrazioni Locali

Sviluppo dei formati

Pratiche di riuso

Eventi ed attività correlate
QUALE
VALUTAZIONE
PER ITALIA?
L’ITALIA NON VA MALE !
8° POSIZIONE
Qualche dettaglio sulla valutazione degli
OpenData in Italia
Dal punto di vista del punteggio non
siamo lontani dai paesi già avviati in
materia di open government (UK).

Implementazione delle direttive EU
Sviluppo dei formati
Eventi ed attività correlate

Cosa migliorare?
Rilascio dei dati delle amministrazioni Locali

Per migliorare il riuso implementare i
formati non basta !

Pratiche di riuso
Qualche idea?
La correlazione tra pratiche di riuso e rilascio dei dataset degli enti
locali suggerisce di implementare un piano di rilascio OpenData a
partire dal modello degli Enti pubblici più importanti.
“Interestingly the INPS data website explicitly refers to
the EU PSI Directive as the reason for publishing data for
re-use.”
“..continuous dialogue between data holders and
re-users is needed, as we are learning how to do
this by doing. The INPS data release is a good step
forward, and creates appetite for more.”
Liberare i dati
Perchè le linee guida sono importanti
?

Il lavoro sugli OpenData è collaborativo.
E’ necessario individuare le tappe del processo.
E’ necessario che la metodologia sia condivisa.
MA...
Da dove partire?

E i metadati?

Quali dati vanno
aperti?

Come produrre un
dataset di qualità?

Come mettere insieme i pezzi?
STOP !!
Il modello
INPS
1- Analisi di dominio e individuazione dei dati
2 - Analisi tipologica dei dati
3 - Preparazione dei dati
4 - Definizione dei formati
5 - Definizione dei metadati
6 - Attribuzione della licenza
ANALISI DI DOMINIO
INDIVIDUAZIONE DEI DATI

Obiettivo?
identificare i contenuti già esposti dall’istituto all’interno delle aree
di pubblicazione al fine di identificare i dati.

INPS.IT
Individuare subito i dati che possono
essere aperti ...

Sottosezioni
1.Relazioni annuali
2.Bilanci sociali
3.Osservatorio statistico
4.Statistiche della previdenza
5.Rapporto sulla coesione sociale
Ma XLS non è un pò poco
Si,	 ma..
Abbiamo	 sempre	 bisogno
	 di	 dati	 grezzi	 da	 cui	 partire
La	 definizione	 del	 formato	 è	 
un	 processo	 graduale	 e	 in	 itinere.
Possiamo	 sempre	 implementare	 
il	 formato	 una	 volta	 pubblicati	 i	 dati.
ANALISI TIPOLOGICA
DEI DATI
Di che tipo sono i dati (XLS) che abbiamo trovato?
Obiettivo?
Distinguere in maniera efficace dati grezzi dai dati già manipolati:
Dati Grezzi

Dati Statistici
(già manipolati)
PREPARAZIONE DEI DATI
Obiettivo?
Poichè molte delle fonti dei dati presentano le informazioni in maniera non strutturata
è opportuno effettuare un’operazione di pulizia riguardante la struttura
delle tabelle e il contenuto delle stesse.
DEFINIZIONE DEI FORMATI
Obiettivo?
Se in prima battuta cerchiamo dati raw dobbiamo anche pensare di implementare
successivamente formati non proprietari come:

★ : testo ( PDF, TXT )
★ ★ : struttura proprietaria ( XLS )
★ ★ ★: struttura aperta ( CSV,XML )
★ ★ ★ ★: struttura con URL e URI

Livello di apertura

★ ★ ★ ★ ★: Linked Data ( RDF + Link )
DEFINIZIONE DEI METADATI
Obiettivo?
Lo step successivo nella creazione degli Open Data è la definizione e la
creazione di metadati, cioè informazioni che descrivono uno o un
insieme di dati.
Tali informazioni rappresentano delle proprietà più significative fissate e
consentono la ricerca e il recupero dei dati stessi con lo scopo di
migliorarne la visibilità e facilitarne l’accesso.

Alcuni importanti standard per i metadati

• ISO/IEC 11179
• ISO 15836 Dublin Core
•W3C SKOS, W3C RDF/OWL
La creazione e l’implementazione dei metadati
richiede attenzione alle risorse informative che tali
metadati devono riflettere. Molta attenzione deve
essere data alla qualità, perchè un pessimo metadato
è peggio dell’assenza di metadati.
Per tale ragioni sono stati creati opportuni metadati
per descrivere al meglio i dati INPS.

Metadati Sintattici
Descr ivono il dato attr aver so le sue
caratteristiche strutturali, in cui sono comprese
le informazioni sul processo di creazione,
organizzazione e pubblicazione. Tali metadati
non aggiungono informazioni sul contenuto del
dataset.

•

Titolo: titolo dei dati

•

Data di pubblicazione: Questa informazione riguarda la data di pubblicazione del dato
all’interno del portale/minisito OpenData Inps.

•
•
•
•
•

Formato: l’estensione del file (.pdf; .xls; .rdf; .doc)

•

Fonte: opzionale, chi ha prodotto il dato (Direzione, altro soggetto)

Licenza : il tipo di licenza a cui è legato il dato
Dimensione in byte: la dimensione fisica del dato
Identificativo : numero progressivo univoco del dato
Link: (URL-permanent link-, link annidati, short URL)
Metadati Semantici
Descrivono il dato attraverso le sue
caratteristiche semantiche, ovvero
le informazioni sul contenuto. Tali
aspetti consentono di individuare
univocamente la risorse.

•

Copertura spaziale: rappresenta il riferimento geografico del dato (coverage=area geografica:
Internazionale, Europeo, Nazionale, Regionale, Provinciale, Comunale)

•

Copertura temporale: rappresenta l’estensione temporale del dato (es. ante 2000, 2001-2005,
2006-2011, 2012-)

•

Livello di lavorazione del dato: grezzo, statistica, bilancio.

•

Tags: parole chiave dell’argomento principale

•

Area di pubblicazione: a sezione in cui viene pubblicato all’interno del portale Inps.it.

•

Descrizione: un breve abstract del dato

•

Data di aggiornamento: mostra ogni quanto il dato viene tenuto aggiornato.

•

Argomento trattato: il soggetto semantico del dato
Dal dato al metadato...

Definiamo così nel
complesso la modalità
di fruizione dei dati
attraverso le
informazioni che li
descrivono.
ATTRIBUZIONE DELLA
LICENZA
Obiettivo?
Scegliere una licenza che consenta all’utente un riuso più facile e libero
possibile
La IODL 2.0 prevede che l’utente possa
liberamente:
1-Consultare, estrarre,copiare e pubblicare i dati
2-Creare un lavoro derivato integrando diversi
dataset.

..rispetto alla IODL 1.0?
Non prevede l’obbligo
dell’utente di pubblicare o
condividere i lavori con la
stessa licenza. E’ chiesto solo di
indicare la fonte!
....Perchè la
semantica?

Aiutare gli utenti
Mettere in relazione i dati
Lavoriamo sui metadati semantici!
Cosa possiamo farci?
Una volta definiti i metadati semantici, questi sono utilizzati per la creazione
delle faccette per il motore di ricerca. Le faccette rappresentano i diversi aspetti
o dimensioni attraverso i quali si può descrivere una stessa risorsa.
Motore a faccette

Selezionando una faccetta, si riducono i dataset trovati;
selezionandone più di una si opererà una intersezione tra i
dati, riducendo ancora di più fino a trovare esattamente
quanto cercato.
Query expansion
La modalità di ricerca Query expansion consente
di interrogare il sistema utilizzando il linguaggio
naturale, piuttosto che inserire parole chiave che
l’utente potrebbe non conoscere.
In questo modo il raggiungimento delle risorse
sarà notevolmente facilitato per tutte le categorie
di utenti (dai più esperti ai meno esperti)

Ad esempio: supponiamo che l’utente digiti
la query “centri per le cure termali”.
Utilizzando la query expansion, nonostante
la stringa inserita non sia presente nelle
descrizioni dei dati, l’utente sarà indirizzato
al dato “Cure forme vie respiratorie elenco alberghi convenzionati per la
stagione termale”.
Arricchire semanticamente i dati
significa stabilire uno standard di qualità
dei dataset in vista dei
Linked Open Data.
Fare linked open data consente di abbattere
le barriere fisiche tra i dati.

connettere e
condividere dataset
attraverso standard
già implementati
La qualità dei dataset pubblicati costituisce una
buona pratica OpenData!

Più i dati sono ricchi di
informazioni ed esposti
in modo preciso
maggiore sarà il riuso
che se ne potrà fare.
Buona pratica
Un esempio applicativo
Dati sugli attraversamenti stradali
(integrazione)
Dati sugli incidenti stradali

Dal dato all’informazione
Gli Open Data Linked possono essere facilmente accessibili
da persone e applicazioni (via mashup) per i più diversi scopi

ma soprattutto...
- consentono di passare dal dato all’informazione IL RIUSO COME CRITERIO DI VALUTAZIONE

Riuso nella PA: maggior

controllo del territorio con più semplicità

Riuso privato: informazioni
Riuso commerciale: sviluppo

ai cittadini, maggiore trasparenza

di applicazioni più intelligenti e integrate
Il modello

OPEN DATA
Un modello di qualità per lo sviluppo OpenData in Italia
Un modello per le PA locali

Grazie a tutti !
Filippo D’Angelo
filippo.dangelo@inps.it

More Related Content

What's hot

Presentazione piattaforma semantica per gestione della conoscenza (scuole)
Presentazione piattaforma semantica per gestione della conoscenza (scuole)Presentazione piattaforma semantica per gestione della conoscenza (scuole)
Presentazione piattaforma semantica per gestione della conoscenza (scuole)Matteo Busanelli
 
Valorizzare le IDT conformi agli standard OGC® per produrre Linked Open Data ...
Valorizzare le IDT conformi agli standard OGC® per produrre Linked Open Data ...Valorizzare le IDT conformi agli standard OGC® per produrre Linked Open Data ...
Valorizzare le IDT conformi agli standard OGC® per produrre Linked Open Data ...Planetek Italia Srl
 
Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)Open Data Support
 
OntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italianaOntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italianaGiorgia Lodi
 
Open Data: un cantiere aperto verso l'Open Data Day 2014
Open Data: un cantiere aperto verso l'Open Data Day 2014Open Data: un cantiere aperto verso l'Open Data Day 2014
Open Data: un cantiere aperto verso l'Open Data Day 2014FPA
 
Forme e gradi di apertura dei dati: i nuovi alfabeti dell’Open Biblio tra sci...
Forme e gradi di apertura dei dati: i nuovi alfabeti dell’Open Biblio tra sci...Forme e gradi di apertura dei dati: i nuovi alfabeti dell’Open Biblio tra sci...
Forme e gradi di apertura dei dati: i nuovi alfabeti dell’Open Biblio tra sci...Università di Padova
 
INPS Open Data a ITN 2012
INPS Open Data a ITN 2012INPS Open Data a ITN 2012
INPS Open Data a ITN 2012gattopardi
 
Research Data Management e politiche europee sui dati
Research Data Management e politiche europee sui dati Research Data Management e politiche europee sui dati
Research Data Management e politiche europee sui dati OpenAIRE
 
Le risorse elettroniche per la ricerca-Garanzini
Le risorse elettroniche per la ricerca-GaranziniLe risorse elettroniche per la ricerca-Garanzini
Le risorse elettroniche per la ricerca-Garanzinibibliobioing
 
Le risorse elettroniche per la ricerca-Cirulli
Le risorse elettroniche per la ricerca-CirulliLe risorse elettroniche per la ricerca-Cirulli
Le risorse elettroniche per la ricerca-Cirullibibliobioing
 
Open Science: l’importante figura del Data Curator
Open Science: l’importante figura del Data CuratorOpen Science: l’importante figura del Data Curator
Open Science: l’importante figura del Data CuratorOpenAIRE
 
OntoPiA la rete di ontologie e vocabolari controllati per la pubblica amminis...
OntoPiA la rete di ontologie e vocabolari controllati per la pubblica amminis...OntoPiA la rete di ontologie e vocabolari controllati per la pubblica amminis...
OntoPiA la rete di ontologie e vocabolari controllati per la pubblica amminis...Giorgia Lodi
 
FAIR DATA e Action Plan
FAIR DATA e Action PlanFAIR DATA e Action Plan
FAIR DATA e Action PlanOpenAIRE
 
Open Data come strumento per i cittadini
Open Data come strumento per i cittadiniOpen Data come strumento per i cittadini
Open Data come strumento per i cittadiniCarmine De Fusco
 

What's hot (20)

Presentazione piattaforma semantica per gestione della conoscenza (scuole)
Presentazione piattaforma semantica per gestione della conoscenza (scuole)Presentazione piattaforma semantica per gestione della conoscenza (scuole)
Presentazione piattaforma semantica per gestione della conoscenza (scuole)
 
Valorizzare le IDT conformi agli standard OGC® per produrre Linked Open Data ...
Valorizzare le IDT conformi agli standard OGC® per produrre Linked Open Data ...Valorizzare le IDT conformi agli standard OGC® per produrre Linked Open Data ...
Valorizzare le IDT conformi agli standard OGC® per produrre Linked Open Data ...
 
Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)
 
OntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italianaOntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italiana
 
Open Data: un cantiere aperto verso l'Open Data Day 2014
Open Data: un cantiere aperto verso l'Open Data Day 2014Open Data: un cantiere aperto verso l'Open Data Day 2014
Open Data: un cantiere aperto verso l'Open Data Day 2014
 
Open Data for KnowDive Group
Open Data for KnowDive GroupOpen Data for KnowDive Group
Open Data for KnowDive Group
 
About open data
About open dataAbout open data
About open data
 
Forme e gradi di apertura dei dati: i nuovi alfabeti dell’Open Biblio tra sci...
Forme e gradi di apertura dei dati: i nuovi alfabeti dell’Open Biblio tra sci...Forme e gradi di apertura dei dati: i nuovi alfabeti dell’Open Biblio tra sci...
Forme e gradi di apertura dei dati: i nuovi alfabeti dell’Open Biblio tra sci...
 
INPS Open Data a ITN 2012
INPS Open Data a ITN 2012INPS Open Data a ITN 2012
INPS Open Data a ITN 2012
 
Research Data Management e politiche europee sui dati
Research Data Management e politiche europee sui dati Research Data Management e politiche europee sui dati
Research Data Management e politiche europee sui dati
 
Presentazione sce
Presentazione scePresentazione sce
Presentazione sce
 
Le risorse elettroniche per la ricerca-Garanzini
Le risorse elettroniche per la ricerca-GaranziniLe risorse elettroniche per la ricerca-Garanzini
Le risorse elettroniche per la ricerca-Garanzini
 
Le risorse elettroniche per la ricerca-Cirulli
Le risorse elettroniche per la ricerca-CirulliLe risorse elettroniche per la ricerca-Cirulli
Le risorse elettroniche per la ricerca-Cirulli
 
Open Science: l’importante figura del Data Curator
Open Science: l’importante figura del Data CuratorOpen Science: l’importante figura del Data Curator
Open Science: l’importante figura del Data Curator
 
Dati, cataloghi e Web
Dati, cataloghi e WebDati, cataloghi e Web
Dati, cataloghi e Web
 
Open Data in Trentino
Open Data in TrentinoOpen Data in Trentino
Open Data in Trentino
 
Lezione5 banche dati_2010-2011
Lezione5 banche dati_2010-2011Lezione5 banche dati_2010-2011
Lezione5 banche dati_2010-2011
 
OntoPiA la rete di ontologie e vocabolari controllati per la pubblica amminis...
OntoPiA la rete di ontologie e vocabolari controllati per la pubblica amminis...OntoPiA la rete di ontologie e vocabolari controllati per la pubblica amminis...
OntoPiA la rete di ontologie e vocabolari controllati per la pubblica amminis...
 
FAIR DATA e Action Plan
FAIR DATA e Action PlanFAIR DATA e Action Plan
FAIR DATA e Action Plan
 
Open Data come strumento per i cittadini
Open Data come strumento per i cittadiniOpen Data come strumento per i cittadini
Open Data come strumento per i cittadini
 

Similar to Formez Opendata Inps - webinar 29 marzo 2012

Opendata inps
Opendata inps Opendata inps
Opendata inps gattopardi
 
Open data INPS
Open data INPS Open data INPS
Open data INPS DatiGovIT
 
Linked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di TomasoLinked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di TomasoCELI
 
Open data per inail presentazione Forum PA - maggio 2012
Open data per inail    presentazione Forum PA - maggio 2012Open data per inail    presentazione Forum PA - maggio 2012
Open data per inail presentazione Forum PA - maggio 2012Pietro Monti
 
Il progetto Open Data in Trentino
Il progetto Open Data in TrentinoIl progetto Open Data in Trentino
Il progetto Open Data in Trentinodatitrentinoit
 
The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)Imola Informatica
 
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...Data Driven Innovation
 
Scaling the open data concept to 13000 public administrations (Andrea Carlini...
Scaling the open data concept to 13000 public administrations (Andrea Carlini...Scaling the open data concept to 13000 public administrations (Andrea Carlini...
Scaling the open data concept to 13000 public administrations (Andrea Carlini...Data Driven Innovation
 
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1Giuly Bonello
 
Esperienza open data della provincia di Roma
Esperienza open data della provincia di RomaEsperienza open data della provincia di Roma
Esperienza open data della provincia di RomaDatiGovIT
 
DBpedia nel contesto Linked Data
DBpedia nel contesto Linked DataDBpedia nel contesto Linked Data
DBpedia nel contesto Linked DataAndrea Casagrande
 
Opendata, licenze & formati, scoprirli & usarli
Opendata, licenze & formati, scoprirli & usarliOpendata, licenze & formati, scoprirli & usarli
Opendata, licenze & formati, scoprirli & usarliFrancesco Passantino
 
Basi di dati e gis n
Basi di dati e gis nBasi di dati e gis n
Basi di dati e gis nimartini
 
Business Intelligence & Analytics
Business Intelligence & AnalyticsBusiness Intelligence & Analytics
Business Intelligence & AnalyticsDavide Mauri
 
Open Data in Trentino - SOD13
Open Data in Trentino - SOD13Open Data in Trentino - SOD13
Open Data in Trentino - SOD13Marco Combetto
 
La filiera integrata dei dati pubblici. Od2016 cagliari - B
La filiera integrata dei dati pubblici. Od2016 cagliari - BLa filiera integrata dei dati pubblici. Od2016 cagliari - B
La filiera integrata dei dati pubblici. Od2016 cagliari - BSergio Agostinelli
 
Sistemi Informativi Statistici
Sistemi Informativi StatisticiSistemi Informativi Statistici
Sistemi Informativi StatisticiVincenzo Patruno
 
Lodlive - browsing the web of data
Lodlive - browsing the web of dataLodlive - browsing the web of data
Lodlive - browsing the web of dataLodlive
 
Po Fesr 2014-2020 e gli Open Data
Po Fesr 2014-2020 e gli Open DataPo Fesr 2014-2020 e gli Open Data
Po Fesr 2014-2020 e gli Open DataDaniele Mondello
 
La gestione logica dei dati come chiave del successo per Data Scientist e Bus...
La gestione logica dei dati come chiave del successo per Data Scientist e Bus...La gestione logica dei dati come chiave del successo per Data Scientist e Bus...
La gestione logica dei dati come chiave del successo per Data Scientist e Bus...Denodo
 

Similar to Formez Opendata Inps - webinar 29 marzo 2012 (20)

Opendata inps
Opendata inps Opendata inps
Opendata inps
 
Open data INPS
Open data INPS Open data INPS
Open data INPS
 
Linked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di TomasoLinked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di Tomaso
 
Open data per inail presentazione Forum PA - maggio 2012
Open data per inail    presentazione Forum PA - maggio 2012Open data per inail    presentazione Forum PA - maggio 2012
Open data per inail presentazione Forum PA - maggio 2012
 
Il progetto Open Data in Trentino
Il progetto Open Data in TrentinoIl progetto Open Data in Trentino
Il progetto Open Data in Trentino
 
The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)
 
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
 
Scaling the open data concept to 13000 public administrations (Andrea Carlini...
Scaling the open data concept to 13000 public administrations (Andrea Carlini...Scaling the open data concept to 13000 public administrations (Andrea Carlini...
Scaling the open data concept to 13000 public administrations (Andrea Carlini...
 
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1
 
Esperienza open data della provincia di Roma
Esperienza open data della provincia di RomaEsperienza open data della provincia di Roma
Esperienza open data della provincia di Roma
 
DBpedia nel contesto Linked Data
DBpedia nel contesto Linked DataDBpedia nel contesto Linked Data
DBpedia nel contesto Linked Data
 
Opendata, licenze & formati, scoprirli & usarli
Opendata, licenze & formati, scoprirli & usarliOpendata, licenze & formati, scoprirli & usarli
Opendata, licenze & formati, scoprirli & usarli
 
Basi di dati e gis n
Basi di dati e gis nBasi di dati e gis n
Basi di dati e gis n
 
Business Intelligence & Analytics
Business Intelligence & AnalyticsBusiness Intelligence & Analytics
Business Intelligence & Analytics
 
Open Data in Trentino - SOD13
Open Data in Trentino - SOD13Open Data in Trentino - SOD13
Open Data in Trentino - SOD13
 
La filiera integrata dei dati pubblici. Od2016 cagliari - B
La filiera integrata dei dati pubblici. Od2016 cagliari - BLa filiera integrata dei dati pubblici. Od2016 cagliari - B
La filiera integrata dei dati pubblici. Od2016 cagliari - B
 
Sistemi Informativi Statistici
Sistemi Informativi StatisticiSistemi Informativi Statistici
Sistemi Informativi Statistici
 
Lodlive - browsing the web of data
Lodlive - browsing the web of dataLodlive - browsing the web of data
Lodlive - browsing the web of data
 
Po Fesr 2014-2020 e gli Open Data
Po Fesr 2014-2020 e gli Open DataPo Fesr 2014-2020 e gli Open Data
Po Fesr 2014-2020 e gli Open Data
 
La gestione logica dei dati come chiave del successo per Data Scientist e Bus...
La gestione logica dei dati come chiave del successo per Data Scientist e Bus...La gestione logica dei dati come chiave del successo per Data Scientist e Bus...
La gestione logica dei dati come chiave del successo per Data Scientist e Bus...
 

Formez Opendata Inps - webinar 29 marzo 2012

  • 2. “STATO DELL’ARTE” “The best way to get value from data is to give it away..[..]..Lets join together and share our data” Dicembre 2011 - Nuova OpenData Strategy Neelie Kroes, Vice-Presidente Commissione europea per l’Agenda digitale. ...L’Europa corre veloce Marzo 2012- ePSI platform Conference Taking re-use to the next level “Practical example of OpenData reuse and grass roots support and experience play an important role here.. [..].. Go out and make the case for OpenData more strongly!”
  • 3. Le direttive dalla Digital Agenda di Dicembre 2011 Aggiornamento direttive 2003 sul riuso del PSI Rendere accessibili e riutilizzabili i contenuti documentali della PA. Rendere i dati in formato machine readable (RDF, JSON, XML). Creazione di un data portal della commissione europea. Aggiornamento delle direttive dalla ePSI conference 2012 Tutti i dati resi disponibili dal PSI devono poter essere riutilizzabili per uso commerciale e non commerciale. Gli stati membri devono introdurre un sistema di supervisione e regolamentazione al fine di rispettare le direttive UE sul riuso nei tempi stabiliti. Lo scopo delle direttive sarà esteso alle informazioni contenute nelle digital libraries, musei e archivi.
  • 4. IL RIUSO COME CRITERIO OBIETTIVO: “VALUTARE LA QUALITÀ DEI DATASET PUBBLICATI” Open (Government Data) Tutti le tipologie di dati di interesse pubblico “VALUTARE LA QUALITÀ DEI PROCESSI DI GOVERNANCE” (Open Government) Data Tutti le tipologie di dati che contribuiscono alla trasparenza delle amministrazioni
  • 5. COME VALUTA L’UNIONE EUROPEA ? Il riuso negli indicatori di punteggio: Implementazione delle direttive EU Dati delle amministrazioni Locali Sviluppo dei formati Pratiche di riuso Eventi ed attività correlate
  • 7. L’ITALIA NON VA MALE ! 8° POSIZIONE
  • 8. Qualche dettaglio sulla valutazione degli OpenData in Italia Dal punto di vista del punteggio non siamo lontani dai paesi già avviati in materia di open government (UK). Implementazione delle direttive EU Sviluppo dei formati Eventi ed attività correlate Cosa migliorare? Rilascio dei dati delle amministrazioni Locali Per migliorare il riuso implementare i formati non basta ! Pratiche di riuso
  • 10. La correlazione tra pratiche di riuso e rilascio dei dataset degli enti locali suggerisce di implementare un piano di rilascio OpenData a partire dal modello degli Enti pubblici più importanti.
  • 11. “Interestingly the INPS data website explicitly refers to the EU PSI Directive as the reason for publishing data for re-use.” “..continuous dialogue between data holders and re-users is needed, as we are learning how to do this by doing. The INPS data release is a good step forward, and creates appetite for more.”
  • 13. Perchè le linee guida sono importanti ? Il lavoro sugli OpenData è collaborativo. E’ necessario individuare le tappe del processo. E’ necessario che la metodologia sia condivisa.
  • 14. MA... Da dove partire? E i metadati? Quali dati vanno aperti? Come produrre un dataset di qualità? Come mettere insieme i pezzi?
  • 17. 1- Analisi di dominio e individuazione dei dati 2 - Analisi tipologica dei dati 3 - Preparazione dei dati 4 - Definizione dei formati 5 - Definizione dei metadati 6 - Attribuzione della licenza
  • 18. ANALISI DI DOMINIO INDIVIDUAZIONE DEI DATI Obiettivo? identificare i contenuti già esposti dall’istituto all’interno delle aree di pubblicazione al fine di identificare i dati. INPS.IT
  • 19. Individuare subito i dati che possono essere aperti ... Sottosezioni 1.Relazioni annuali 2.Bilanci sociali 3.Osservatorio statistico 4.Statistiche della previdenza 5.Rapporto sulla coesione sociale
  • 20. Ma XLS non è un pò poco Si, ma.. Abbiamo sempre bisogno di dati grezzi da cui partire La definizione del formato è un processo graduale e in itinere. Possiamo sempre implementare il formato una volta pubblicati i dati.
  • 21. ANALISI TIPOLOGICA DEI DATI Di che tipo sono i dati (XLS) che abbiamo trovato? Obiettivo? Distinguere in maniera efficace dati grezzi dai dati già manipolati:
  • 23. PREPARAZIONE DEI DATI Obiettivo? Poichè molte delle fonti dei dati presentano le informazioni in maniera non strutturata è opportuno effettuare un’operazione di pulizia riguardante la struttura delle tabelle e il contenuto delle stesse.
  • 24. DEFINIZIONE DEI FORMATI Obiettivo? Se in prima battuta cerchiamo dati raw dobbiamo anche pensare di implementare successivamente formati non proprietari come: ★ : testo ( PDF, TXT ) ★ ★ : struttura proprietaria ( XLS ) ★ ★ ★: struttura aperta ( CSV,XML ) ★ ★ ★ ★: struttura con URL e URI Livello di apertura ★ ★ ★ ★ ★: Linked Data ( RDF + Link )
  • 25. DEFINIZIONE DEI METADATI Obiettivo? Lo step successivo nella creazione degli Open Data è la definizione e la creazione di metadati, cioè informazioni che descrivono uno o un insieme di dati. Tali informazioni rappresentano delle proprietà più significative fissate e consentono la ricerca e il recupero dei dati stessi con lo scopo di migliorarne la visibilità e facilitarne l’accesso. Alcuni importanti standard per i metadati • ISO/IEC 11179 • ISO 15836 Dublin Core •W3C SKOS, W3C RDF/OWL
  • 26. La creazione e l’implementazione dei metadati richiede attenzione alle risorse informative che tali metadati devono riflettere. Molta attenzione deve essere data alla qualità, perchè un pessimo metadato è peggio dell’assenza di metadati. Per tale ragioni sono stati creati opportuni metadati per descrivere al meglio i dati INPS. Metadati Sintattici Descr ivono il dato attr aver so le sue caratteristiche strutturali, in cui sono comprese le informazioni sul processo di creazione, organizzazione e pubblicazione. Tali metadati non aggiungono informazioni sul contenuto del dataset. • Titolo: titolo dei dati • Data di pubblicazione: Questa informazione riguarda la data di pubblicazione del dato all’interno del portale/minisito OpenData Inps. • • • • • Formato: l’estensione del file (.pdf; .xls; .rdf; .doc) • Fonte: opzionale, chi ha prodotto il dato (Direzione, altro soggetto) Licenza : il tipo di licenza a cui è legato il dato Dimensione in byte: la dimensione fisica del dato Identificativo : numero progressivo univoco del dato Link: (URL-permanent link-, link annidati, short URL)
  • 27. Metadati Semantici Descrivono il dato attraverso le sue caratteristiche semantiche, ovvero le informazioni sul contenuto. Tali aspetti consentono di individuare univocamente la risorse. • Copertura spaziale: rappresenta il riferimento geografico del dato (coverage=area geografica: Internazionale, Europeo, Nazionale, Regionale, Provinciale, Comunale) • Copertura temporale: rappresenta l’estensione temporale del dato (es. ante 2000, 2001-2005, 2006-2011, 2012-) • Livello di lavorazione del dato: grezzo, statistica, bilancio. • Tags: parole chiave dell’argomento principale • Area di pubblicazione: a sezione in cui viene pubblicato all’interno del portale Inps.it. • Descrizione: un breve abstract del dato • Data di aggiornamento: mostra ogni quanto il dato viene tenuto aggiornato. • Argomento trattato: il soggetto semantico del dato
  • 28. Dal dato al metadato... Definiamo così nel complesso la modalità di fruizione dei dati attraverso le informazioni che li descrivono.
  • 29. ATTRIBUZIONE DELLA LICENZA Obiettivo? Scegliere una licenza che consenta all’utente un riuso più facile e libero possibile La IODL 2.0 prevede che l’utente possa liberamente: 1-Consultare, estrarre,copiare e pubblicare i dati 2-Creare un lavoro derivato integrando diversi dataset. ..rispetto alla IODL 1.0? Non prevede l’obbligo dell’utente di pubblicare o condividere i lavori con la stessa licenza. E’ chiesto solo di indicare la fonte!
  • 30. ....Perchè la semantica? Aiutare gli utenti Mettere in relazione i dati
  • 31. Lavoriamo sui metadati semantici! Cosa possiamo farci? Una volta definiti i metadati semantici, questi sono utilizzati per la creazione delle faccette per il motore di ricerca. Le faccette rappresentano i diversi aspetti o dimensioni attraverso i quali si può descrivere una stessa risorsa.
  • 32. Motore a faccette Selezionando una faccetta, si riducono i dataset trovati; selezionandone più di una si opererà una intersezione tra i dati, riducendo ancora di più fino a trovare esattamente quanto cercato.
  • 33. Query expansion La modalità di ricerca Query expansion consente di interrogare il sistema utilizzando il linguaggio naturale, piuttosto che inserire parole chiave che l’utente potrebbe non conoscere. In questo modo il raggiungimento delle risorse sarà notevolmente facilitato per tutte le categorie di utenti (dai più esperti ai meno esperti) Ad esempio: supponiamo che l’utente digiti la query “centri per le cure termali”. Utilizzando la query expansion, nonostante la stringa inserita non sia presente nelle descrizioni dei dati, l’utente sarà indirizzato al dato “Cure forme vie respiratorie elenco alberghi convenzionati per la stagione termale”.
  • 34. Arricchire semanticamente i dati significa stabilire uno standard di qualità dei dataset in vista dei Linked Open Data. Fare linked open data consente di abbattere le barriere fisiche tra i dati. connettere e condividere dataset attraverso standard già implementati
  • 35. La qualità dei dataset pubblicati costituisce una buona pratica OpenData! Più i dati sono ricchi di informazioni ed esposti in modo preciso maggiore sarà il riuso che se ne potrà fare.
  • 36. Buona pratica Un esempio applicativo Dati sugli attraversamenti stradali (integrazione) Dati sugli incidenti stradali Dal dato all’informazione
  • 37. Gli Open Data Linked possono essere facilmente accessibili da persone e applicazioni (via mashup) per i più diversi scopi ma soprattutto... - consentono di passare dal dato all’informazione IL RIUSO COME CRITERIO DI VALUTAZIONE Riuso nella PA: maggior controllo del territorio con più semplicità Riuso privato: informazioni Riuso commerciale: sviluppo ai cittadini, maggiore trasparenza di applicazioni più intelligenti e integrate
  • 38. Il modello OPEN DATA Un modello di qualità per lo sviluppo OpenData in Italia Un modello per le PA locali Grazie a tutti ! Filippo D’Angelo filippo.dangelo@inps.it