SlideShare a Scribd company logo
1 of 29
Download to read offline
#opendata
licenze & formati, scoprirli & usarli
Consorzio ARCA
Palermo, 19 dicembre 2014
Francesco Passantino
fpassantino@gmail.com
about.me/fpassantino
about.me/fpassantino
Dal 1990 Ricercatore, Consulente e Formatore
nelle Tecnologie dell’Informazione e della
Comunicazione. Ho fondato e lavorato per
diverse Startup. Valutatore di imprese per
banche ed altri enti.
Ho fondato il Google Developer Group di
Palermo e co-fondato il progetto Sementor.
Sono Ambassador del progetto Working
Capital di Telecom Italia e della Maker Faire
Rome. Organizzo Palermo Startup Weekend e
CoderDojo Palermo.
Svolgo attività di Digital Strategist, con
specializzazione in servizi Social Local Mobile.
2
Programma
• Come ridurre al minimo i rischi per la
comprensione delle licenze e dei formati dati
• Come scoprire e utilizzare i dati aperti
LICENZE E FORMATI
#opendata licenze e formati, scoprirli ed usarli
The Open Definition
http://opendefinition.org/
Italian Open Data License (IODL)
• E’ la licenza “aperta” creata allo scopo precipuo di dare
a tutte le Amministrazioni uno strumento chiaro e
certificato, in grado di facilitare la diffusione e il
riutilizzo dell’informazione del settore pubblico.
• L’uso di questa licenza prevede che l’utente possa
liberamente:
– consultare, estrarre, scaricare, copiare, pubblicare,
distribuire e trasmettere le informazioni;
– creare un lavoro derivato, per esempio attraverso la
combinazione con altre informazioni (cosiddetto mash-up),
includendole in un prodotto o sviluppando un’applicazione
informatica che le utilizzi come base dati.
http://www.formez.it/iodl/
http://lifehacker.com/understand-creative-commons-licensing-with-this-chart-1614149185
Understand Creative Commons
Licensing With This Chart 1/2
Understand Creative Commons
Licensing With This Chart 2/2
Esplora le licenze Creative Commons
http://creativecommons.org/choose/?lang=it
Licenze a confronto
Fonte: Agenzia per l'Italia Digitale, Linee guida nazionali per la valorizzazione del patrimonio informativo pubblico (edizione 2013)
Esempi
Open by default
• Dal 19 marzo 2013 tutti i dati e documenti che
le pubbliche amministrazioni pubblicano con
qualsiasi modalità, senza l’espressa adozione
di una licenza d’uso, si intendono rilasciati
come dati aperti
Formati di pubblicazione 1/2
Nome (Acronimo) - Descrizione Tipo di Dato Estensio
ne
Comma Separated Value (CSV): Formato testuale per l'interscambio di
tabelle, le cui righe corrispondono a record e i cui valori delle singole
colonne sono separati da una virgola (o punto e virgola)
Dato
tabellare
.csv
Geographic Markup Language (GML): Formato XML utile allo scambio di
dati territoriali di tipo vettoriale
Dato
geografico
vettoriale
.gml
GeoJSON: E’ un formato di testo aperto, per la codifica di oggetti
geografici e dei correlati attributi non spaziali, scritto in JSON (JavaScript
Object Notation).
Dato
geografico
vettoriale
geojson,
.topojso
n, o
.json
Keyhole Markup Language (KML): Formato basato su XML creato per
gestire dati territoriali in tre dimensioni.
Dato
geografico
vettoriale
.kml
Open Document Format per dati tabellari (ODS): Formato per
l'archiviazione e lo scambio di fogli di calcolo
Dato
tabellare
.ods
Formati di pubblicazione 2/2
Nome (Acronimo) - Descrizione Tipo di Dato Estensi
one
Resource Description Framework (RDF): Basato su XML, e' lo strumento
base proposto da World Wide Web Consortium (W3C) per la codifica, lo
scambio e il riutilizzo di metadati strutturati e consente l'interoperabilità tra
applicazioni che si scambiano informazioni sul Web
Dato
strutturato
.rdf
ESRI Shapefile (SHP): Lo Shapefile ESRI è un popolare formato vettoriale per
sistemi informativi geografici. Il dato geografico viene distribuito
normalmente attraverso tre o quattro files (se indicato il sistema di
riferimento delle coordinate). Il formato è stato rilasciato da ESRI come
formato (quasi) aperto
Dato
geografico
vettoriale
.shp,
.shx, .
dbf, .prj
Tab Separated Value (TSV): Formato testuale per l'interscambio di tabelle, le
cui righe corrispondono a record e i cui valori delle singole colonne sono
separati da un carattere di tabulazione
Dato
tabellare
.tsv
Extensible Markup Language (XML): E' un formato di markup, ovvero basato
su un meccanismo che consente di definire e controllare il significato degli
elementi contenuti in un documento o in un testo attraverso delle etichette
(markup)
Dato
strutturato
.xml
Catalogazione dei set di dati
con il metodo delle stelle
Per distinguere i diversi formati utilizzabili nella
codifica dei set di dati, è stato proposto in seno
al W3C (proposta di Tim Berners Lee, Presidente
del W3C e ideatore del World Wide Web ) un
modello di catalogazione che li classifica in base
alle loro caratteristiche su una scala di valori da
1 (una stella) a 5 (cinque stelle).
Modello per i dati di tipo aperto
Fonte: Agenda Nazionale per la valorizzazione del patrimonio informativo
Una Stella
• È il livello base, costituito da file non strutturati: ad
esempio un’immagine in formato grezzo (formati come
.gif, .jpg, .png), un documento in formato Microsoft
Word, un file in formato Adobe Pdf.
• Una sola stella indica la semplice disponibilità di una
informazione e di un dato on line, in un formato
qualsiasi, purché distribuito con licenza aperta. I dati
distribuiti in questo formato sono leggibili e stampabili
dagli utenti, possono essere conservati localmente su
un PC e sono semplici da pubblicare. Tuttavia non sono
un formato aperto in quanto non è possibile effettuare
su di essi alcuna elaborazione.
Due Stelle
• Questo livello indica dati strutturati ma codificati con
un formato proprietario. Ad esempio un documento in
formato Microsoft Excel.
• Due stelle indicano, oltre alle possibilità offerte dai dati
contraddistinti da una sola stella, la possibilità di
effettuare elaborazioni sui dati, a patto di disporre del
software necessario a gestire un file codificato con un
formato proprietario. I dati caratterizzati dalle due
stelle non sono un formato aperto in quanto per
elaborarli è necessario un software proprietario,
tuttavia di norma possono essere convertiti – essendo
dati strutturati – in dati aperti.
Tre Stelle
• Questo livello indica dati strutturati e codificati in
un formato non proprietario. Ad esempio il
formato .csv (Comma Separated Values) al posto
– ad esempio – del formato Microsoft Excel
utilizzato nel caso precedente.
• Tre stelle indicano, oltre alle possibilità offerte dai
dati contraddistinti da due sole stelle, la
possibilità di effettuare elaborazioni sui dati senza
esser costretti ad utilizzare software proprietario.
Quello caratterizzato dalle tre stelle è il formato
più semplice di dati aperti.
Quattro Stelle
• Questo livello indica dati strutturati e codificati in un formato non
proprietario che sono dotati di un URI che li rende indirizzabili sulla rete e
quindi utilizzabili direttamente online, attraverso l’inclusione in una
struttura basata sul modello RDF (Resource Description Framework) .
• Quattro stelle indicano quindi il fatto che il singolo dato di un dataset,
disponibile on line in un formato aperto (tipicamente XML/RDF) può
essere richiamato attraverso un’URL (Uniform Resource Locator) specifico.
• Ciò consente di puntare al dato o ad un insieme di dati da una
applicazione o accedervi dall’interno di un programma che può poi
elaborarlo in vari modi.
• Si pensi, ad esempio, a un dataset contenente gli indirizzi dei monumenti
di una città opportunamente codificati: da qualsiasi software – finanche
dal browser – è possibile collegarsi all’URL che indica il singolo
monumento, potendolo ad esempio georeferenziare su una mappa.
Cinque Stelle
• Questo livello indica quelli che vengono definiti Linked Open Data (LOD). Quei dati
aperti, cioè, che – dal punto di vista del formato – oltre a rispondere alle
caratteristiche indicate al punto precedente (classificazione a quattro stelle)
presentano anche, nella struttura del dataset, collegamenti ad altri dataset. In altri
termini, grazie al ricorso al già citato modello di descrizione dei dati RDF, è
possibile collegare dinamicamente tra loro più dataset, incrociando così
informazioni provenienti da fonti diverse, eventualmente gestite da diverse
Amministrazioni.
• Si pensi ad esempio al caso del dataset contenente gli indirizzi dei monumenti di
una città alla quale si è fatto riferimento in precedenza. Tale dataset, pubblicato
dall’Amministrazione A, potrebbe essere collegato al dataset di un altro Ente –
l’Amministrazione B – che dispone dell’archivio delle opere d’arte presenti
all’interno di ogni monumento. In questo caso un sistema software potrebbe,
dopo aver chiesto all’utente i suoi gusti e le sue preferenze in fatto di arte,
strutturare un percorso georeferenziando i monumenti a partire dalle informazioni
presenti nel dataset disponibile presso l’Amministazione A, dopo averli
preselezionati in base alle opere d’arte in essi contenute, identificate nel dataset
dell’Amministrazione B.
Linked Open Data
• I Linked Open Data, quindi, consentono di combinare i
contenuti di dataset diversi grazie a costrutti formali
formulati secondo il modello RDF in uno dei diversi
formati esistenti (XML/RDF, N3, ecc…).
• Ciò aumenta esponenzialmente il valore dei dataset
reciprocamente correlati, consentendo il passaggio dal
livello dei dati a quello dell’informazione e quindi a
quello della conoscenza e fornendo così un quadro di
contesto strutturato a partire dalla correlazione di
informazioni provenienti da fonti diverse.
http://lodlive.it/
SCOPRIRLI ED USARLI
#opendata licenze e formati, scoprirli ed usarli
Come importare i dati
Funzione Descrizione
IMPORTDATA La funzione ImportData recupera informazioni da un
file CSV o TSV.
IMPORTFEED Recupera le informazioni da un feed di dati.
IMPORTHTML La funzione ImportHTML consente di importare i
dati in una tabella o elenco particolare da una
pagina HTML
IMPORTXML Recupera le informazioni da un file XML.
24https://support.google.com/drive/table/25273?hl=it
Tabelle Pivot
Conteggio di DataRilevazione Etichette di colonna
Etichette di riga 2009 2010 2011 2012 2013 Totale complessivo
Agrigento 3.314 3.502 3.230 2.652 2.466 15.164
Caltanissetta 1.901 1.874 1.824 1.510 1.562 8.671
Catania 8.160 8.535 8.166 7.661 7.370 39.892
Enna 1.567 1.418 1.332 1.250 1.139 6.706
Messina 5.540 5.351 5.075 4.628 3.936 24.530
Palermo 8.274 8.363 7.809 7.126 6.619 38.191
Ragusa 4.277 4.403 3.906 3.362 3.006 18.954
Siracusa 3.269 3.097 2.905 2.533 2.487 14.291
Trapani 3.695 3.704 3.556 3.131 2.903 16.989
Totale complessivo 39.997 40.247 37.803 33.853 31.488 183.388
http://dati.inail.it/opendata/elements1/DatiConCadenzaSemestraleInfortuniSicilia
Fonti dati 1/2
• http://www.comune.palermo.it/opendata.php
• http://pti.regione.sicilia.it/portal/page/portal/PIR_POR
TALE/PIR_Iniziative/PIR_OpenDataSicilia
• http://www.dati.gov.it/catalog/dataset
• http://it-city.census.okfn.org/
• http://www.istat.it/it/
• http://open-data.europa.eu/en/data/
• http://www.data.gov/
• http://data.gov.uk/
Fonti dati 2/2
• http://opengovernmentdata.org/data/catalogues
• http://index.okfn.org/
• http://datahub.io/
• http://getthedata.org/
• https://www.freebase.com/
• http://www.wikidata.org/
• http://www.google.com/publicdata/directory
ALTRI SPUNTI
#opendata licenze e formati, scoprirli ed usarli
Studiate!
• OpenDataSicilia.it
http://opendatasicilia.it/
• Corso online
http://www.ahref.eu/it/biblioteca
/data-journalism-1/data-
journalism-e-visualizzazione-
grafica-dei-dati-il-corso
• Manuale
http://opendatahandbook.org/it/
• OpenBilanci
http://www.openbilanci.it/
• Handbook
http://datajournalismhandbook.o
rg/
• School of data
http://schoolofdata.org/handboo
k/
http://schoolofdata.org/online-
resources/
• DataNinja
http://www.dataninja.it/
• OpenCoesione
http://www.opencoesione.gov.it/

More Related Content

What's hot

What's hot (10)

RDA e Linked data: un binomio naturale
RDA e Linked data: un binomio naturaleRDA e Linked data: un binomio naturale
RDA e Linked data: un binomio naturale
 
Data protocol e Widget
Data protocol e WidgetData protocol e Widget
Data protocol e Widget
 
Linked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di TomasoLinked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di Tomaso
 
2015-06 Roberto Boselli, Dal dato non strutturato alle ontologie
2015-06 Roberto Boselli, Dal dato non strutturato alle ontologie2015-06 Roberto Boselli, Dal dato non strutturato alle ontologie
2015-06 Roberto Boselli, Dal dato non strutturato alle ontologie
 
Open Data 4 Hackaton - Preparation for Hackaton Ict Days 2014 #opendata #ictd...
Open Data 4 Hackaton - Preparation for Hackaton Ict Days 2014 #opendata #ictd...Open Data 4 Hackaton - Preparation for Hackaton Ict Days 2014 #opendata #ictd...
Open Data 4 Hackaton - Preparation for Hackaton Ict Days 2014 #opendata #ictd...
 
Ricostruire le famiglie editoriali: FRBR per la storia delle case editrici at...
Ricostruire le famiglie editoriali: FRBR per la storia delle case editrici at...Ricostruire le famiglie editoriali: FRBR per la storia delle case editrici at...
Ricostruire le famiglie editoriali: FRBR per la storia delle case editrici at...
 
Il Portale Semantico nel progetto TEMART
Il Portale Semantico nel progetto TEMARTIl Portale Semantico nel progetto TEMART
Il Portale Semantico nel progetto TEMART
 
Enel Opencompany
Enel OpencompanyEnel Opencompany
Enel Opencompany
 
5a. Linked Data
5a. Linked Data5a. Linked Data
5a. Linked Data
 
Linee guida web PA: formati, licenze, classificazione, open data
Linee guida web PA: formati, licenze, classificazione, open dataLinee guida web PA: formati, licenze, classificazione, open data
Linee guida web PA: formati, licenze, classificazione, open data
 

Viewers also liked

Claudia Spinnato: I GIS: provincia di nessuna disciplina
Claudia Spinnato:   I GIS: provincia di nessuna disciplinaClaudia Spinnato:   I GIS: provincia di nessuna disciplina
Claudia Spinnato: I GIS: provincia di nessuna disciplina
Francesco Passantino
 
Barrotta: Interoperabilità e implementazione di servizi webgis all'interno di...
Barrotta: Interoperabilità e implementazione di servizi webgis all'interno di...Barrotta: Interoperabilità e implementazione di servizi webgis all'interno di...
Barrotta: Interoperabilità e implementazione di servizi webgis all'interno di...
Francesco Passantino
 

Viewers also liked (12)

openDCN: una piattaforma open source per l’e-participation
openDCN: una piattaforma open source per l’e-participationopenDCN: una piattaforma open source per l’e-participation
openDCN: una piattaforma open source per l’e-participation
 
Miti e verita’ sullo start up
Miti e verita’ sullo start upMiti e verita’ sullo start up
Miti e verita’ sullo start up
 
Claudia Spinnato: I GIS: provincia di nessuna disciplina
Claudia Spinnato:   I GIS: provincia di nessuna disciplinaClaudia Spinnato:   I GIS: provincia di nessuna disciplina
Claudia Spinnato: I GIS: provincia di nessuna disciplina
 
Presentazione delle attività del CoderDojo Palermo
Presentazione delle attività del CoderDojo PalermoPresentazione delle attività del CoderDojo Palermo
Presentazione delle attività del CoderDojo Palermo
 
Like, tecnologie in azione
Like, tecnologie in azioneLike, tecnologie in azione
Like, tecnologie in azione
 
Non è roba da hackers trovare le risorse nel territorio (osm&fvg)
Non è roba da hackers trovare le risorse nel territorio (osm&fvg)Non è roba da hackers trovare le risorse nel territorio (osm&fvg)
Non è roba da hackers trovare le risorse nel territorio (osm&fvg)
 
Come aderire alla rete F.A.R.O.
Come aderire alla rete F.A.R.O.Come aderire alla rete F.A.R.O.
Come aderire alla rete F.A.R.O.
 
Google per la formazione
Google per la formazioneGoogle per la formazione
Google per la formazione
 
Barrotta: Interoperabilità e implementazione di servizi webgis all'interno di...
Barrotta: Interoperabilità e implementazione di servizi webgis all'interno di...Barrotta: Interoperabilità e implementazione di servizi webgis all'interno di...
Barrotta: Interoperabilità e implementazione di servizi webgis all'interno di...
 
Introduzione al "Pensiero computazionale"
Introduzione al "Pensiero computazionale"Introduzione al "Pensiero computazionale"
Introduzione al "Pensiero computazionale"
 
Strategie Digitali per l’Online Advertising
Strategie Digitali per l’Online AdvertisingStrategie Digitali per l’Online Advertising
Strategie Digitali per l’Online Advertising
 
FormezPA - OpenData nelle PA di piccole e medie dimensioni - Esempi
FormezPA - OpenData nelle PA di piccole e medie dimensioni - EsempiFormezPA - OpenData nelle PA di piccole e medie dimensioni - Esempi
FormezPA - OpenData nelle PA di piccole e medie dimensioni - Esempi
 

Similar to Opendata, licenze & formati, scoprirli & usarli

Formez Opendata Inps - webinar 29 marzo 2012
Formez Opendata Inps - webinar 29 marzo 2012Formez Opendata Inps - webinar 29 marzo 2012
Formez Opendata Inps - webinar 29 marzo 2012
INPSDG
 
2d. lezione ss bd e standard
2d. lezione ss bd e standard2d. lezione ss bd e standard
2d. lezione ss bd e standard
Mau-Messenger
 
OpenGeoData Italia 2014 - Piergiorgio Cipriano "Modelli dati per stradari e n...
OpenGeoData Italia 2014 - Piergiorgio Cipriano "Modelli dati per stradari e n...OpenGeoData Italia 2014 - Piergiorgio Cipriano "Modelli dati per stradari e n...
OpenGeoData Italia 2014 - Piergiorgio Cipriano "Modelli dati per stradari e n...
giovannibiallo
 
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
INPSDG
 
OpenGeoData Italia 2014 - Piergiorgio Cipriano "Infrastrutture di dati territ...
OpenGeoData Italia 2014 - Piergiorgio Cipriano "Infrastrutture di dati territ...OpenGeoData Italia 2014 - Piergiorgio Cipriano "Infrastrutture di dati territ...
OpenGeoData Italia 2014 - Piergiorgio Cipriano "Infrastrutture di dati territ...
giovannibiallo
 
Information Technology Law
Information Technology LawInformation Technology Law
Information Technology Law
Alessandro Abate
 
Sistemi Informativi Statistici
Sistemi Informativi StatisticiSistemi Informativi Statistici
Sistemi Informativi Statistici
Vincenzo Patruno
 
ODDI 2013 DCAT per descrivere gli Open Data della PA
ODDI 2013 DCAT per descrivere gli Open Data della PAODDI 2013 DCAT per descrivere gli Open Data della PA
ODDI 2013 DCAT per descrivere gli Open Data della PA
Matteo Busanelli
 
Il sistema informativo statistico sulla popolazione e le statistiche demograf...
Il sistema informativo statistico sulla popolazione e le statistiche demograf...Il sistema informativo statistico sulla popolazione e le statistiche demograf...
Il sistema informativo statistico sulla popolazione e le statistiche demograf...
Vincenzo Patruno
 

Similar to Opendata, licenze & formati, scoprirli & usarli (20)

Formez Opendata Inps - webinar 29 marzo 2012
Formez Opendata Inps - webinar 29 marzo 2012Formez Opendata Inps - webinar 29 marzo 2012
Formez Opendata Inps - webinar 29 marzo 2012
 
Open Data for KnowDive Group
Open Data for KnowDive GroupOpen Data for KnowDive Group
Open Data for KnowDive Group
 
Lodlive - browsing the web of data
Lodlive - browsing the web of dataLodlive - browsing the web of data
Lodlive - browsing the web of data
 
2d. lezione ss bd e standard
2d. lezione ss bd e standard2d. lezione ss bd e standard
2d. lezione ss bd e standard
 
OpenGeoData Italia 2014 - Piergiorgio Cipriano "Modelli dati per stradari e n...
OpenGeoData Italia 2014 - Piergiorgio Cipriano "Modelli dati per stradari e n...OpenGeoData Italia 2014 - Piergiorgio Cipriano "Modelli dati per stradari e n...
OpenGeoData Italia 2014 - Piergiorgio Cipriano "Modelli dati per stradari e n...
 
V. Patruno, A. Capezzuoli - Data protocol e Widget
V. Patruno, A. Capezzuoli - Data protocol e WidgetV. Patruno, A. Capezzuoli - Data protocol e Widget
V. Patruno, A. Capezzuoli - Data protocol e Widget
 
OntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italianaOntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italiana
 
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
 
Esperienza open data della provincia di Roma
Esperienza open data della provincia di RomaEsperienza open data della provincia di Roma
Esperienza open data della provincia di Roma
 
couchbase mobile
couchbase mobilecouchbase mobile
couchbase mobile
 
OpenGeoData Italia 2014 - Piergiorgio Cipriano "Infrastrutture di dati territ...
OpenGeoData Italia 2014 - Piergiorgio Cipriano "Infrastrutture di dati territ...OpenGeoData Italia 2014 - Piergiorgio Cipriano "Infrastrutture di dati territ...
OpenGeoData Italia 2014 - Piergiorgio Cipriano "Infrastrutture di dati territ...
 
Information Technology Law
Information Technology LawInformation Technology Law
Information Technology Law
 
MongoDB SpringFramework Meeting september 2009
MongoDB SpringFramework Meeting september 2009MongoDB SpringFramework Meeting september 2009
MongoDB SpringFramework Meeting september 2009
 
JSON-LD
JSON-LDJSON-LD
JSON-LD
 
Open Data: un cantiere aperto verso l'Open Data Day 2014
Open Data: un cantiere aperto verso l'Open Data Day 2014Open Data: un cantiere aperto verso l'Open Data Day 2014
Open Data: un cantiere aperto verso l'Open Data Day 2014
 
Sistemi Informativi Statistici
Sistemi Informativi StatisticiSistemi Informativi Statistici
Sistemi Informativi Statistici
 
ODDI 2013 DCAT per descrivere gli Open Data della PA
ODDI 2013 DCAT per descrivere gli Open Data della PAODDI 2013 DCAT per descrivere gli Open Data della PA
ODDI 2013 DCAT per descrivere gli Open Data della PA
 
ALIADA
ALIADAALIADA
ALIADA
 
The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)
 
Il sistema informativo statistico sulla popolazione e le statistiche demograf...
Il sistema informativo statistico sulla popolazione e le statistiche demograf...Il sistema informativo statistico sulla popolazione e le statistiche demograf...
Il sistema informativo statistico sulla popolazione e le statistiche demograf...
 

More from Francesco Passantino

Obiettivi E Finalita del Progetto FARO
Obiettivi E Finalita del Progetto FAROObiettivi E Finalita del Progetto FARO
Obiettivi E Finalita del Progetto FARO
Francesco Passantino
 
Lillo: GIS e ricerca faunistica: alcune applicazioni in Sicilia
Lillo: GIS e ricerca faunistica: alcune applicazioni in SiciliaLillo: GIS e ricerca faunistica: alcune applicazioni in Sicilia
Lillo: GIS e ricerca faunistica: alcune applicazioni in Sicilia
Francesco Passantino
 
Tulone: Monitoraggio della qualità delle acque marine a partire da dati teler...
Tulone: Monitoraggio della qualità delle acque marine a partire da dati teler...Tulone: Monitoraggio della qualità delle acque marine a partire da dati teler...
Tulone: Monitoraggio della qualità delle acque marine a partire da dati teler...
Francesco Passantino
 
Russell: Geomatica per la ricerca, prevenzione e ricognizione archeologica
Russell: Geomatica per la ricerca, prevenzione e ricognizione archeologicaRussell: Geomatica per la ricerca, prevenzione e ricognizione archeologica
Russell: Geomatica per la ricerca, prevenzione e ricognizione archeologica
Francesco Passantino
 
Luzzu: Impiego di sistemi acustici e tecnologie avanzate per lo studio dei fo...
Luzzu: Impiego di sistemi acustici e tecnologie avanzate per lo studio dei fo...Luzzu: Impiego di sistemi acustici e tecnologie avanzate per lo studio dei fo...
Luzzu: Impiego di sistemi acustici e tecnologie avanzate per lo studio dei fo...
Francesco Passantino
 
D Argenio/Sarazzi: Uso di micro UAV per il rilevamento a bassa quota
D Argenio/Sarazzi: Uso di micro UAV per il rilevamento a bassa quotaD Argenio/Sarazzi: Uso di micro UAV per il rilevamento a bassa quota
D Argenio/Sarazzi: Uso di micro UAV per il rilevamento a bassa quota
Francesco Passantino
 
Mugavero: Tecnologie geospaziali per la sicurezza territoriale a servizio del...
Mugavero: Tecnologie geospaziali per la sicurezza territoriale a servizio del...Mugavero: Tecnologie geospaziali per la sicurezza territoriale a servizio del...
Mugavero: Tecnologie geospaziali per la sicurezza territoriale a servizio del...
Francesco Passantino
 
Burgio: GIS: Validità e Limiti della Nuova Epidemiologia
Burgio: GIS: Validità e Limiti della Nuova EpidemiologiaBurgio: GIS: Validità e Limiti della Nuova Epidemiologia
Burgio: GIS: Validità e Limiti della Nuova Epidemiologia
Francesco Passantino
 
Madeddu: GIS: Validità e Limiti della Nuova Epidemiologia
Madeddu: GIS: Validità e Limiti della Nuova EpidemiologiaMadeddu: GIS: Validità e Limiti della Nuova Epidemiologia
Madeddu: GIS: Validità e Limiti della Nuova Epidemiologia
Francesco Passantino
 

More from Francesco Passantino (20)

Game Coding for Kids
Game Coding for KidsGame Coding for Kids
Game Coding for Kids
 
Innovazione e cultura per la crescita della Sicilia - Intervento di Francesco...
Innovazione e cultura per la crescita della Sicilia - Intervento di Francesco...Innovazione e cultura per la crescita della Sicilia - Intervento di Francesco...
Innovazione e cultura per la crescita della Sicilia - Intervento di Francesco...
 
Palermo in openstreetmap free and open data
Palermo in openstreetmap free and open dataPalermo in openstreetmap free and open data
Palermo in openstreetmap free and open data
 
Startup: Terminologia, Ecosistema, Palermo
Startup: Terminologia, Ecosistema, PalermoStartup: Terminologia, Ecosistema, Palermo
Startup: Terminologia, Ecosistema, Palermo
 
Google Maps Mobile
Google Maps MobileGoogle Maps Mobile
Google Maps Mobile
 
Strumenti Google per gli Open Data
Strumenti Google per gli Open Data Strumenti Google per gli Open Data
Strumenti Google per gli Open Data
 
Bootcamp Startup Weekend Palermo
Bootcamp Startup Weekend PalermoBootcamp Startup Weekend Palermo
Bootcamp Startup Weekend Palermo
 
I nuovi abitanti della rete
I nuovi abitanti della reteI nuovi abitanti della rete
I nuovi abitanti della rete
 
Obiettivi E Finalita del Progetto FARO
Obiettivi E Finalita del Progetto FAROObiettivi E Finalita del Progetto FARO
Obiettivi E Finalita del Progetto FARO
 
Storia Del Progetto Faro
Storia Del Progetto FaroStoria Del Progetto Faro
Storia Del Progetto Faro
 
Home GISDay Palermo 2009
Home GISDay Palermo 2009Home GISDay Palermo 2009
Home GISDay Palermo 2009
 
Lillo: GIS e ricerca faunistica: alcune applicazioni in Sicilia
Lillo: GIS e ricerca faunistica: alcune applicazioni in SiciliaLillo: GIS e ricerca faunistica: alcune applicazioni in Sicilia
Lillo: GIS e ricerca faunistica: alcune applicazioni in Sicilia
 
Tulone: Monitoraggio della qualità delle acque marine a partire da dati teler...
Tulone: Monitoraggio della qualità delle acque marine a partire da dati teler...Tulone: Monitoraggio della qualità delle acque marine a partire da dati teler...
Tulone: Monitoraggio della qualità delle acque marine a partire da dati teler...
 
Russell: Geomatica per la ricerca, prevenzione e ricognizione archeologica
Russell: Geomatica per la ricerca, prevenzione e ricognizione archeologicaRussell: Geomatica per la ricerca, prevenzione e ricognizione archeologica
Russell: Geomatica per la ricerca, prevenzione e ricognizione archeologica
 
Luzzu: Impiego di sistemi acustici e tecnologie avanzate per lo studio dei fo...
Luzzu: Impiego di sistemi acustici e tecnologie avanzate per lo studio dei fo...Luzzu: Impiego di sistemi acustici e tecnologie avanzate per lo studio dei fo...
Luzzu: Impiego di sistemi acustici e tecnologie avanzate per lo studio dei fo...
 
Gibilaro: Geografia Giudiziaria
Gibilaro: Geografia GiudiziariaGibilaro: Geografia Giudiziaria
Gibilaro: Geografia Giudiziaria
 
D Argenio/Sarazzi: Uso di micro UAV per il rilevamento a bassa quota
D Argenio/Sarazzi: Uso di micro UAV per il rilevamento a bassa quotaD Argenio/Sarazzi: Uso di micro UAV per il rilevamento a bassa quota
D Argenio/Sarazzi: Uso di micro UAV per il rilevamento a bassa quota
 
Mugavero: Tecnologie geospaziali per la sicurezza territoriale a servizio del...
Mugavero: Tecnologie geospaziali per la sicurezza territoriale a servizio del...Mugavero: Tecnologie geospaziali per la sicurezza territoriale a servizio del...
Mugavero: Tecnologie geospaziali per la sicurezza territoriale a servizio del...
 
Burgio: GIS: Validità e Limiti della Nuova Epidemiologia
Burgio: GIS: Validità e Limiti della Nuova EpidemiologiaBurgio: GIS: Validità e Limiti della Nuova Epidemiologia
Burgio: GIS: Validità e Limiti della Nuova Epidemiologia
 
Madeddu: GIS: Validità e Limiti della Nuova Epidemiologia
Madeddu: GIS: Validità e Limiti della Nuova EpidemiologiaMadeddu: GIS: Validità e Limiti della Nuova Epidemiologia
Madeddu: GIS: Validità e Limiti della Nuova Epidemiologia
 

Opendata, licenze & formati, scoprirli & usarli

  • 1. #opendata licenze & formati, scoprirli & usarli Consorzio ARCA Palermo, 19 dicembre 2014 Francesco Passantino fpassantino@gmail.com about.me/fpassantino
  • 2. about.me/fpassantino Dal 1990 Ricercatore, Consulente e Formatore nelle Tecnologie dell’Informazione e della Comunicazione. Ho fondato e lavorato per diverse Startup. Valutatore di imprese per banche ed altri enti. Ho fondato il Google Developer Group di Palermo e co-fondato il progetto Sementor. Sono Ambassador del progetto Working Capital di Telecom Italia e della Maker Faire Rome. Organizzo Palermo Startup Weekend e CoderDojo Palermo. Svolgo attività di Digital Strategist, con specializzazione in servizi Social Local Mobile. 2
  • 3. Programma • Come ridurre al minimo i rischi per la comprensione delle licenze e dei formati dati • Come scoprire e utilizzare i dati aperti
  • 4. LICENZE E FORMATI #opendata licenze e formati, scoprirli ed usarli
  • 6. Italian Open Data License (IODL) • E’ la licenza “aperta” creata allo scopo precipuo di dare a tutte le Amministrazioni uno strumento chiaro e certificato, in grado di facilitare la diffusione e il riutilizzo dell’informazione del settore pubblico. • L’uso di questa licenza prevede che l’utente possa liberamente: – consultare, estrarre, scaricare, copiare, pubblicare, distribuire e trasmettere le informazioni; – creare un lavoro derivato, per esempio attraverso la combinazione con altre informazioni (cosiddetto mash-up), includendole in un prodotto o sviluppando un’applicazione informatica che le utilizzi come base dati. http://www.formez.it/iodl/
  • 9. Esplora le licenze Creative Commons http://creativecommons.org/choose/?lang=it
  • 10. Licenze a confronto Fonte: Agenzia per l'Italia Digitale, Linee guida nazionali per la valorizzazione del patrimonio informativo pubblico (edizione 2013)
  • 12. Open by default • Dal 19 marzo 2013 tutti i dati e documenti che le pubbliche amministrazioni pubblicano con qualsiasi modalità, senza l’espressa adozione di una licenza d’uso, si intendono rilasciati come dati aperti
  • 13. Formati di pubblicazione 1/2 Nome (Acronimo) - Descrizione Tipo di Dato Estensio ne Comma Separated Value (CSV): Formato testuale per l'interscambio di tabelle, le cui righe corrispondono a record e i cui valori delle singole colonne sono separati da una virgola (o punto e virgola) Dato tabellare .csv Geographic Markup Language (GML): Formato XML utile allo scambio di dati territoriali di tipo vettoriale Dato geografico vettoriale .gml GeoJSON: E’ un formato di testo aperto, per la codifica di oggetti geografici e dei correlati attributi non spaziali, scritto in JSON (JavaScript Object Notation). Dato geografico vettoriale geojson, .topojso n, o .json Keyhole Markup Language (KML): Formato basato su XML creato per gestire dati territoriali in tre dimensioni. Dato geografico vettoriale .kml Open Document Format per dati tabellari (ODS): Formato per l'archiviazione e lo scambio di fogli di calcolo Dato tabellare .ods
  • 14. Formati di pubblicazione 2/2 Nome (Acronimo) - Descrizione Tipo di Dato Estensi one Resource Description Framework (RDF): Basato su XML, e' lo strumento base proposto da World Wide Web Consortium (W3C) per la codifica, lo scambio e il riutilizzo di metadati strutturati e consente l'interoperabilità tra applicazioni che si scambiano informazioni sul Web Dato strutturato .rdf ESRI Shapefile (SHP): Lo Shapefile ESRI è un popolare formato vettoriale per sistemi informativi geografici. Il dato geografico viene distribuito normalmente attraverso tre o quattro files (se indicato il sistema di riferimento delle coordinate). Il formato è stato rilasciato da ESRI come formato (quasi) aperto Dato geografico vettoriale .shp, .shx, . dbf, .prj Tab Separated Value (TSV): Formato testuale per l'interscambio di tabelle, le cui righe corrispondono a record e i cui valori delle singole colonne sono separati da un carattere di tabulazione Dato tabellare .tsv Extensible Markup Language (XML): E' un formato di markup, ovvero basato su un meccanismo che consente di definire e controllare il significato degli elementi contenuti in un documento o in un testo attraverso delle etichette (markup) Dato strutturato .xml
  • 15. Catalogazione dei set di dati con il metodo delle stelle Per distinguere i diversi formati utilizzabili nella codifica dei set di dati, è stato proposto in seno al W3C (proposta di Tim Berners Lee, Presidente del W3C e ideatore del World Wide Web ) un modello di catalogazione che li classifica in base alle loro caratteristiche su una scala di valori da 1 (una stella) a 5 (cinque stelle).
  • 16. Modello per i dati di tipo aperto Fonte: Agenda Nazionale per la valorizzazione del patrimonio informativo
  • 17. Una Stella • È il livello base, costituito da file non strutturati: ad esempio un’immagine in formato grezzo (formati come .gif, .jpg, .png), un documento in formato Microsoft Word, un file in formato Adobe Pdf. • Una sola stella indica la semplice disponibilità di una informazione e di un dato on line, in un formato qualsiasi, purché distribuito con licenza aperta. I dati distribuiti in questo formato sono leggibili e stampabili dagli utenti, possono essere conservati localmente su un PC e sono semplici da pubblicare. Tuttavia non sono un formato aperto in quanto non è possibile effettuare su di essi alcuna elaborazione.
  • 18. Due Stelle • Questo livello indica dati strutturati ma codificati con un formato proprietario. Ad esempio un documento in formato Microsoft Excel. • Due stelle indicano, oltre alle possibilità offerte dai dati contraddistinti da una sola stella, la possibilità di effettuare elaborazioni sui dati, a patto di disporre del software necessario a gestire un file codificato con un formato proprietario. I dati caratterizzati dalle due stelle non sono un formato aperto in quanto per elaborarli è necessario un software proprietario, tuttavia di norma possono essere convertiti – essendo dati strutturati – in dati aperti.
  • 19. Tre Stelle • Questo livello indica dati strutturati e codificati in un formato non proprietario. Ad esempio il formato .csv (Comma Separated Values) al posto – ad esempio – del formato Microsoft Excel utilizzato nel caso precedente. • Tre stelle indicano, oltre alle possibilità offerte dai dati contraddistinti da due sole stelle, la possibilità di effettuare elaborazioni sui dati senza esser costretti ad utilizzare software proprietario. Quello caratterizzato dalle tre stelle è il formato più semplice di dati aperti.
  • 20. Quattro Stelle • Questo livello indica dati strutturati e codificati in un formato non proprietario che sono dotati di un URI che li rende indirizzabili sulla rete e quindi utilizzabili direttamente online, attraverso l’inclusione in una struttura basata sul modello RDF (Resource Description Framework) . • Quattro stelle indicano quindi il fatto che il singolo dato di un dataset, disponibile on line in un formato aperto (tipicamente XML/RDF) può essere richiamato attraverso un’URL (Uniform Resource Locator) specifico. • Ciò consente di puntare al dato o ad un insieme di dati da una applicazione o accedervi dall’interno di un programma che può poi elaborarlo in vari modi. • Si pensi, ad esempio, a un dataset contenente gli indirizzi dei monumenti di una città opportunamente codificati: da qualsiasi software – finanche dal browser – è possibile collegarsi all’URL che indica il singolo monumento, potendolo ad esempio georeferenziare su una mappa.
  • 21. Cinque Stelle • Questo livello indica quelli che vengono definiti Linked Open Data (LOD). Quei dati aperti, cioè, che – dal punto di vista del formato – oltre a rispondere alle caratteristiche indicate al punto precedente (classificazione a quattro stelle) presentano anche, nella struttura del dataset, collegamenti ad altri dataset. In altri termini, grazie al ricorso al già citato modello di descrizione dei dati RDF, è possibile collegare dinamicamente tra loro più dataset, incrociando così informazioni provenienti da fonti diverse, eventualmente gestite da diverse Amministrazioni. • Si pensi ad esempio al caso del dataset contenente gli indirizzi dei monumenti di una città alla quale si è fatto riferimento in precedenza. Tale dataset, pubblicato dall’Amministrazione A, potrebbe essere collegato al dataset di un altro Ente – l’Amministrazione B – che dispone dell’archivio delle opere d’arte presenti all’interno di ogni monumento. In questo caso un sistema software potrebbe, dopo aver chiesto all’utente i suoi gusti e le sue preferenze in fatto di arte, strutturare un percorso georeferenziando i monumenti a partire dalle informazioni presenti nel dataset disponibile presso l’Amministazione A, dopo averli preselezionati in base alle opere d’arte in essi contenute, identificate nel dataset dell’Amministrazione B.
  • 22. Linked Open Data • I Linked Open Data, quindi, consentono di combinare i contenuti di dataset diversi grazie a costrutti formali formulati secondo il modello RDF in uno dei diversi formati esistenti (XML/RDF, N3, ecc…). • Ciò aumenta esponenzialmente il valore dei dataset reciprocamente correlati, consentendo il passaggio dal livello dei dati a quello dell’informazione e quindi a quello della conoscenza e fornendo così un quadro di contesto strutturato a partire dalla correlazione di informazioni provenienti da fonti diverse. http://lodlive.it/
  • 23. SCOPRIRLI ED USARLI #opendata licenze e formati, scoprirli ed usarli
  • 24. Come importare i dati Funzione Descrizione IMPORTDATA La funzione ImportData recupera informazioni da un file CSV o TSV. IMPORTFEED Recupera le informazioni da un feed di dati. IMPORTHTML La funzione ImportHTML consente di importare i dati in una tabella o elenco particolare da una pagina HTML IMPORTXML Recupera le informazioni da un file XML. 24https://support.google.com/drive/table/25273?hl=it
  • 25. Tabelle Pivot Conteggio di DataRilevazione Etichette di colonna Etichette di riga 2009 2010 2011 2012 2013 Totale complessivo Agrigento 3.314 3.502 3.230 2.652 2.466 15.164 Caltanissetta 1.901 1.874 1.824 1.510 1.562 8.671 Catania 8.160 8.535 8.166 7.661 7.370 39.892 Enna 1.567 1.418 1.332 1.250 1.139 6.706 Messina 5.540 5.351 5.075 4.628 3.936 24.530 Palermo 8.274 8.363 7.809 7.126 6.619 38.191 Ragusa 4.277 4.403 3.906 3.362 3.006 18.954 Siracusa 3.269 3.097 2.905 2.533 2.487 14.291 Trapani 3.695 3.704 3.556 3.131 2.903 16.989 Totale complessivo 39.997 40.247 37.803 33.853 31.488 183.388 http://dati.inail.it/opendata/elements1/DatiConCadenzaSemestraleInfortuniSicilia
  • 26. Fonti dati 1/2 • http://www.comune.palermo.it/opendata.php • http://pti.regione.sicilia.it/portal/page/portal/PIR_POR TALE/PIR_Iniziative/PIR_OpenDataSicilia • http://www.dati.gov.it/catalog/dataset • http://it-city.census.okfn.org/ • http://www.istat.it/it/ • http://open-data.europa.eu/en/data/ • http://www.data.gov/ • http://data.gov.uk/
  • 27. Fonti dati 2/2 • http://opengovernmentdata.org/data/catalogues • http://index.okfn.org/ • http://datahub.io/ • http://getthedata.org/ • https://www.freebase.com/ • http://www.wikidata.org/ • http://www.google.com/publicdata/directory
  • 28. ALTRI SPUNTI #opendata licenze e formati, scoprirli ed usarli
  • 29. Studiate! • OpenDataSicilia.it http://opendatasicilia.it/ • Corso online http://www.ahref.eu/it/biblioteca /data-journalism-1/data- journalism-e-visualizzazione- grafica-dei-dati-il-corso • Manuale http://opendatahandbook.org/it/ • OpenBilanci http://www.openbilanci.it/ • Handbook http://datajournalismhandbook.o rg/ • School of data http://schoolofdata.org/handboo k/ http://schoolofdata.org/online- resources/ • DataNinja http://www.dataninja.it/ • OpenCoesione http://www.opencoesione.gov.it/