SlideShare a Scribd company logo
1 of 14
Download to read offline
Big Data e Open Data:
Istruzioni (o quasi) per l’Uso
Monica Scannapieco
Direzione delle Tecnologie Informatiche e della Comunicazione - Istat
Shared Data: Big+Open+Linked+…
Big Data
More
Data

Open
Data

Shared
Data

Linked
Data

More
Sources

More
Stakeholders

More
Context

Social Data
More
Relationships
Source: Gartner

Monica Scannapieco, Smart City Exhibition, 17/10/2013
Tipologie di Sorgenti Big - 1
Data exhaust
Behaviour data & Crowd-sourced data
Sensor data
Tipologie di Sorgenti Big - 2
Data Exhaust
Dati transazionali raccolti in modo passivo
Relativi a transazioni di soggetti fisici ma generati in modo
passivo (ossia non direttamente generati da soggetti fisici)
Esempi :
Log telefonici
Log di transazioni
commerciali
Log di ricerche web
Record ospedalieri
Transazioni bancarie o assicurative
Tipologie di Sorgenti Big - 3
Behaviour data & Crowd-sourced data
Interazioni con news media e social media, job posting
Sono i soggetti fisici a produrre attivamente dati relativi alle
proprie intenzioni, sensazioni o esigenze (anche tramite
dispositivi mobili)
Esempi :
Posts su blog
Messaggi su Twitter
User generated maps
Tipologie di Sorgenti Big - 4
Sensor data
Dati relativi a emissioni di luce, parametri ambientali, traffico, etc.
Dispositivi fisici rilevano in modo remoto (remote sensing)
proprietà di oggetti fisici
Esempi :
Valori relativi all’inquinamento
Numero di veicoli in transito
Disponibilità dei dati
Exhaust data: Google Trends
http://www.google.com/trends/

Alert:
Indice relativo
Problema semantico

Monica Scannapieco, Smart City Exhibition, 17/10/2013
Qualità
Behaviour data: Analisi su social media (Twitter) olandesi
hanno mostrato che circa il 50% dei messaggi sono
‘pointless babble’
[Daas et al., 2012] Twitter as a potential data source for statistics. The Hague/Heerlen: Statistic
Netherlands. Available at: URL=http://www.cbs.nl/NR/rdonlyres/04B7DD23-5443-4F98-B4661C67AAA19527/0/201221x10pub.pd

Data Exhaust: Assessment della qualità del Deep Web
nei domini “Azioni” e “Voli”
Costruzione di Gold Standard
70% valori inconsistenti tre le fonti
70% valori inaccurati wrt gold standard
[Li et al. 2013] Xian Li,Xin Luna Dong,K.B. Lyons,W., D. Srivastava, Truth Finding on the Deep
Web: Is the Problem Solved?, PVLDB 2013

Monica Scannapieco, Smart City Exhibition, 17/10/2013
Ma...anche molte opportunità

Monica Scannapieco, Smart City Exhibition, 17/10/2013
E gli Open Data? 5 Star Model (Tim Berners-Lee)
Come sotto ma collegamenti
tra i dati pubblicati in RDF

Linked
Open
Data

Come sotto ma uso di standard del W3C
(RDF e SPARQL)

Resource
Description
Framework

Come (2) ma con formato non
proprietario (e.g. CSV invece di
excel)

OPEN FORMAT
Disponibile in formato
machine-readable

REUSABLE
Disponibili sul Web
(in qualunque
formato) ma con
una licenza open

OPEN LICENSE

Monica Scannapieco, Smart City Exhibition, 17/10/2013
Open Data in Istat – attuale
Produzione statistica dell’Istat disponibile come
open data
I.stat: Web warehouse dei dati prodotti dall’Istat
nelle varie aree tematiche
LOD

=> http://dati.istat.it/

Formati di esportazione:
CSV
SDMX (Statistical Data
and Metadata eXchange)

RDF

OPEN FORMAT

REUSABLE

OPEN LICENSE

Monica Scannapieco, Smart City Exhibition, 17/10/2013
Open Data in Istat – futuro
Progetti in corso e futuri:
Potenziamento del SEP
attraverso un canale di uscita
RDF
Pubblicazione in RDF delle
classificazioni ufficiali
Use case della pubblicazione in
RDF di dati del Censimento della
Popolazione
Open Data Lab: test, pilot

LOD

RDF

OPEN FORMAT

REUSABLE

OPEN LICENSE

Monica Scannapieco, Smart City Exhibition, 17/10/2013
Affidabilità
“Provenance is the number
one issue that we face when
publishing government data
in data.gov.uk”
John Sheridan, UK National Archives,
data.gov.uk

Definizione operativa
di provenance:
“Provenance of a resource is a
record that describes entities
and processes involved in
producing and delivering or
otherwise influencing that
resource”
(W3C Working group on
provenance)
http://www.w3.org/2011/prov/wiki/Main_
Page

Monica Scannapieco, Smart City Exhibition, 17/10/2013
Conclusioni
Big Data: Tanta informazione potenziale ma
necessità di filtrare, «metadatare», gestire…
Open Data: Iniziative come i LOD strutturano i
dati e semplificano gestione e accesso, ma
stadio ancora iniziale
Domanda: Devono gli operatori della conoscenza
considerare gli shared data come nuova fonte
informativa?
Risposta: Ovviamente si, ma con un vero
«manuale di istruzioni per l’uso» ☺!
Monica Scannapieco, Smart City Exhibition, 17/10/2013

More Related Content

What's hot

Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)Keen Consulting
 
Open Data 4 Startups
Open Data 4 StartupsOpen Data 4 Startups
Open Data 4 Startupsmzaglio
 
Introduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiIntroduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiVincenzo Manzoni
 
Le tecnologie dei Big Data
Le tecnologie dei Big DataLe tecnologie dei Big Data
Le tecnologie dei Big DataVincenzo Manzoni
 
Big data e pubblica amministrazione
Big data e pubblica amministrazioneBig data e pubblica amministrazione
Big data e pubblica amministrazioneGianfranco Andriola
 
Introduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiIntroduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiVincenzo Manzoni
 
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...Data Driven Innovation
 
Scaling the open data concept to 13000 public administrations (Andrea Carlini...
Scaling the open data concept to 13000 public administrations (Andrea Carlini...Scaling the open data concept to 13000 public administrations (Andrea Carlini...
Scaling the open data concept to 13000 public administrations (Andrea Carlini...Data Driven Innovation
 
Reinventing experience: dai dati alla progettazione
Reinventing experience: dai dati alla progettazioneReinventing experience: dai dati alla progettazione
Reinventing experience: dai dati alla progettazioneData Driven Innovation
 
Big Data Confederation: toward the local urban data market place (Renzo Taffa...
Big Data Confederation: toward the local urban data market place (Renzo Taffa...Big Data Confederation: toward the local urban data market place (Renzo Taffa...
Big Data Confederation: toward the local urban data market place (Renzo Taffa...Data Driven Innovation
 
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...Free Your Talent
 
Data Driven UX - Come lo facciamo
Data Driven UX - Come lo facciamoData Driven UX - Come lo facciamo
Data Driven UX - Come lo facciamonois3
 
Data Driven UX - From Social networks to target audience
Data Driven UX - From Social networks to target audienceData Driven UX - From Social networks to target audience
Data Driven UX - From Social networks to target audienceData Driven Innovation
 
Smau Milano 2016 - Robert Braga
Smau Milano 2016 - Robert BragaSmau Milano 2016 - Robert Braga
Smau Milano 2016 - Robert BragaSMAU
 
Innovazione Open Data Innovazione organizzativa Gestione del cambiamento
Innovazione  Open Data  Innovazione organizzativa Gestione del cambiamentoInnovazione  Open Data  Innovazione organizzativa Gestione del cambiamento
Innovazione Open Data Innovazione organizzativa Gestione del cambiamentodatitrentinoit
 

What's hot (20)

Big Data
Big DataBig Data
Big Data
 
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
 
Open Data 4 Startups
Open Data 4 StartupsOpen Data 4 Startups
Open Data 4 Startups
 
Introduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiIntroduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei dati
 
Big data-simonetta
Big data-simonettaBig data-simonetta
Big data-simonetta
 
Le tecnologie dei Big Data
Le tecnologie dei Big DataLe tecnologie dei Big Data
Le tecnologie dei Big Data
 
La salute e i big data
La salute e i big dataLa salute e i big data
La salute e i big data
 
Appunti di big data
Appunti di big dataAppunti di big data
Appunti di big data
 
Big data e pubblica amministrazione
Big data e pubblica amministrazioneBig data e pubblica amministrazione
Big data e pubblica amministrazione
 
Introduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiIntroduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei dati
 
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
 
Scaling the open data concept to 13000 public administrations (Andrea Carlini...
Scaling the open data concept to 13000 public administrations (Andrea Carlini...Scaling the open data concept to 13000 public administrations (Andrea Carlini...
Scaling the open data concept to 13000 public administrations (Andrea Carlini...
 
Open data
Open dataOpen data
Open data
 
Reinventing experience: dai dati alla progettazione
Reinventing experience: dai dati alla progettazioneReinventing experience: dai dati alla progettazione
Reinventing experience: dai dati alla progettazione
 
Big Data Confederation: toward the local urban data market place (Renzo Taffa...
Big Data Confederation: toward the local urban data market place (Renzo Taffa...Big Data Confederation: toward the local urban data market place (Renzo Taffa...
Big Data Confederation: toward the local urban data market place (Renzo Taffa...
 
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
 
Data Driven UX - Come lo facciamo
Data Driven UX - Come lo facciamoData Driven UX - Come lo facciamo
Data Driven UX - Come lo facciamo
 
Data Driven UX - From Social networks to target audience
Data Driven UX - From Social networks to target audienceData Driven UX - From Social networks to target audience
Data Driven UX - From Social networks to target audience
 
Smau Milano 2016 - Robert Braga
Smau Milano 2016 - Robert BragaSmau Milano 2016 - Robert Braga
Smau Milano 2016 - Robert Braga
 
Innovazione Open Data Innovazione organizzativa Gestione del cambiamento
Innovazione  Open Data  Innovazione organizzativa Gestione del cambiamentoInnovazione  Open Data  Innovazione organizzativa Gestione del cambiamento
Innovazione Open Data Innovazione organizzativa Gestione del cambiamento
 

Similar to M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso

Verso una Spatial Data Science Seminario 29-11-2017
Verso una Spatial Data Science Seminario 29-11-2017Verso una Spatial Data Science Seminario 29-11-2017
Verso una Spatial Data Science Seminario 29-11-2017Giuliana Bonello
 
Smart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of ThingsSmart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of ThingsCSI Piemonte
 
Dagli Open ai big data nel comune di Firenze
Dagli Open ai big data nel comune di FirenzeDagli Open ai big data nel comune di Firenze
Dagli Open ai big data nel comune di FirenzeConfindustriaFirenze
 
Ecosistemi digitali in Lombardia
Ecosistemi digitali in LombardiaEcosistemi digitali in Lombardia
Ecosistemi digitali in LombardiaMarco Panebianco
 
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...Data Driven Innovation
 
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1Giuly Bonello
 
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 2
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 2Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 2
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 2Giuly Bonello
 
S. De Francisci, Open Data nella statistica ufficiale: ruolo, opportunità e i...
S. De Francisci, Open Data nella statistica ufficiale: ruolo, opportunità e i...S. De Francisci, Open Data nella statistica ufficiale: ruolo, opportunità e i...
S. De Francisci, Open Data nella statistica ufficiale: ruolo, opportunità e i...Istituto nazionale di statistica
 
Linked Open Data. Definizioni, esempi, esperienze pisane
Linked Open Data. Definizioni, esempi, esperienze pisaneLinked Open Data. Definizioni, esempi, esperienze pisane
Linked Open Data. Definizioni, esempi, esperienze pisaneFrancesca Di Donato
 
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...OpenGeoDataItalia
 
Dati pubblici per l'ambiente e la resilienza in città
Dati pubblici per l'ambiente e la resilienza in cittàDati pubblici per l'ambiente e la resilienza in città
Dati pubblici per l'ambiente e la resilienza in cittàSnpambiente
 
Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)Open Data Support
 
Apps4Italy, il contest italiano sugli Open Data
Apps4Italy, il contest italiano sugli Open DataApps4Italy, il contest italiano sugli Open Data
Apps4Italy, il contest italiano sugli Open DataVincenzo Patruno
 
Open Data: l'esperienza del Piemonte
Open Data: l'esperienza del PiemonteOpen Data: l'esperienza del Piemonte
Open Data: l'esperienza del PiemonteComune di Bologna
 
Big data analytics vaccari oct2013
Big data analytics vaccari oct2013Big data analytics vaccari oct2013
Big data analytics vaccari oct2013Carlo Vaccari
 
Big Data Vs. Open Data
Big Data Vs.  Open Data Big Data Vs.  Open Data
Big Data Vs. Open Data Consulthinkspa
 
ContrattiPubblici.org - Seminario ANCI - Roma - SAA2017
ContrattiPubblici.org - Seminario ANCI - Roma - SAA2017ContrattiPubblici.org - Seminario ANCI - Roma - SAA2017
ContrattiPubblici.org - Seminario ANCI - Roma - SAA2017Synapta
 
Open data, informazioni accessibili a tutti
Open data, informazioni accessibili a tuttiOpen data, informazioni accessibili a tutti
Open data, informazioni accessibili a tuttiStefano Sabatini
 

Similar to M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso (20)

Verso una Spatial Data Science Seminario 29-11-2017
Verso una Spatial Data Science Seminario 29-11-2017Verso una Spatial Data Science Seminario 29-11-2017
Verso una Spatial Data Science Seminario 29-11-2017
 
Smart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of ThingsSmart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of Things
 
Dagli Open ai big data nel comune di Firenze
Dagli Open ai big data nel comune di FirenzeDagli Open ai big data nel comune di Firenze
Dagli Open ai big data nel comune di Firenze
 
Ecosistemi digitali in Lombardia
Ecosistemi digitali in LombardiaEcosistemi digitali in Lombardia
Ecosistemi digitali in Lombardia
 
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
Come la PDND supporta il pattern Data Hub: il caso di ANAC (Stefano Fuligni, ...
 
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 1
 
Presentazione sce
Presentazione scePresentazione sce
Presentazione sce
 
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 2
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 2Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 2
Presentazione CSI Piemonte - Fossano 11 dicembre 2014 - parte 2
 
S. De Francisci, Open Data nella statistica ufficiale: ruolo, opportunità e i...
S. De Francisci, Open Data nella statistica ufficiale: ruolo, opportunità e i...S. De Francisci, Open Data nella statistica ufficiale: ruolo, opportunità e i...
S. De Francisci, Open Data nella statistica ufficiale: ruolo, opportunità e i...
 
Linked Open Data. Definizioni, esempi, esperienze pisane
Linked Open Data. Definizioni, esempi, esperienze pisaneLinked Open Data. Definizioni, esempi, esperienze pisane
Linked Open Data. Definizioni, esempi, esperienze pisane
 
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
Le prospettive dell'Open Data - Francesco Tortorelli (Agenzia dell’Italia Dig...
 
I luoghi degli "open data"
I luoghi degli "open data"I luoghi degli "open data"
I luoghi degli "open data"
 
Dati pubblici per l'ambiente e la resilienza in città
Dati pubblici per l'ambiente e la resilienza in cittàDati pubblici per l'ambiente e la resilienza in città
Dati pubblici per l'ambiente e la resilienza in città
 
Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)Open Data Support onsite training in Italy (Italian)
Open Data Support onsite training in Italy (Italian)
 
Apps4Italy, il contest italiano sugli Open Data
Apps4Italy, il contest italiano sugli Open DataApps4Italy, il contest italiano sugli Open Data
Apps4Italy, il contest italiano sugli Open Data
 
Open Data: l'esperienza del Piemonte
Open Data: l'esperienza del PiemonteOpen Data: l'esperienza del Piemonte
Open Data: l'esperienza del Piemonte
 
Big data analytics vaccari oct2013
Big data analytics vaccari oct2013Big data analytics vaccari oct2013
Big data analytics vaccari oct2013
 
Big Data Vs. Open Data
Big Data Vs.  Open Data Big Data Vs.  Open Data
Big Data Vs. Open Data
 
ContrattiPubblici.org - Seminario ANCI - Roma - SAA2017
ContrattiPubblici.org - Seminario ANCI - Roma - SAA2017ContrattiPubblici.org - Seminario ANCI - Roma - SAA2017
ContrattiPubblici.org - Seminario ANCI - Roma - SAA2017
 
Open data, informazioni accessibili a tutti
Open data, informazioni accessibili a tuttiOpen data, informazioni accessibili a tutti
Open data, informazioni accessibili a tutti
 

More from Istituto nazionale di statistica

More from Istituto nazionale di statistica (20)

Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
14a Conferenza Nazionale di Statisticacnstatistica14
14a Conferenza Nazionale di Statisticacnstatistica1414a Conferenza Nazionale di Statisticacnstatistica14
14a Conferenza Nazionale di Statisticacnstatistica14
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 

M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso

  • 1. Big Data e Open Data: Istruzioni (o quasi) per l’Uso Monica Scannapieco Direzione delle Tecnologie Informatiche e della Comunicazione - Istat
  • 2. Shared Data: Big+Open+Linked+… Big Data More Data Open Data Shared Data Linked Data More Sources More Stakeholders More Context Social Data More Relationships Source: Gartner Monica Scannapieco, Smart City Exhibition, 17/10/2013
  • 3. Tipologie di Sorgenti Big - 1 Data exhaust Behaviour data & Crowd-sourced data Sensor data
  • 4. Tipologie di Sorgenti Big - 2 Data Exhaust Dati transazionali raccolti in modo passivo Relativi a transazioni di soggetti fisici ma generati in modo passivo (ossia non direttamente generati da soggetti fisici) Esempi : Log telefonici Log di transazioni commerciali Log di ricerche web Record ospedalieri Transazioni bancarie o assicurative
  • 5. Tipologie di Sorgenti Big - 3 Behaviour data & Crowd-sourced data Interazioni con news media e social media, job posting Sono i soggetti fisici a produrre attivamente dati relativi alle proprie intenzioni, sensazioni o esigenze (anche tramite dispositivi mobili) Esempi : Posts su blog Messaggi su Twitter User generated maps
  • 6. Tipologie di Sorgenti Big - 4 Sensor data Dati relativi a emissioni di luce, parametri ambientali, traffico, etc. Dispositivi fisici rilevano in modo remoto (remote sensing) proprietà di oggetti fisici Esempi : Valori relativi all’inquinamento Numero di veicoli in transito
  • 7. Disponibilità dei dati Exhaust data: Google Trends http://www.google.com/trends/ Alert: Indice relativo Problema semantico Monica Scannapieco, Smart City Exhibition, 17/10/2013
  • 8. Qualità Behaviour data: Analisi su social media (Twitter) olandesi hanno mostrato che circa il 50% dei messaggi sono ‘pointless babble’ [Daas et al., 2012] Twitter as a potential data source for statistics. The Hague/Heerlen: Statistic Netherlands. Available at: URL=http://www.cbs.nl/NR/rdonlyres/04B7DD23-5443-4F98-B4661C67AAA19527/0/201221x10pub.pd Data Exhaust: Assessment della qualità del Deep Web nei domini “Azioni” e “Voli” Costruzione di Gold Standard 70% valori inconsistenti tre le fonti 70% valori inaccurati wrt gold standard [Li et al. 2013] Xian Li,Xin Luna Dong,K.B. Lyons,W., D. Srivastava, Truth Finding on the Deep Web: Is the Problem Solved?, PVLDB 2013 Monica Scannapieco, Smart City Exhibition, 17/10/2013
  • 9. Ma...anche molte opportunità Monica Scannapieco, Smart City Exhibition, 17/10/2013
  • 10. E gli Open Data? 5 Star Model (Tim Berners-Lee) Come sotto ma collegamenti tra i dati pubblicati in RDF Linked Open Data Come sotto ma uso di standard del W3C (RDF e SPARQL) Resource Description Framework Come (2) ma con formato non proprietario (e.g. CSV invece di excel) OPEN FORMAT Disponibile in formato machine-readable REUSABLE Disponibili sul Web (in qualunque formato) ma con una licenza open OPEN LICENSE Monica Scannapieco, Smart City Exhibition, 17/10/2013
  • 11. Open Data in Istat – attuale Produzione statistica dell’Istat disponibile come open data I.stat: Web warehouse dei dati prodotti dall’Istat nelle varie aree tematiche LOD => http://dati.istat.it/ Formati di esportazione: CSV SDMX (Statistical Data and Metadata eXchange) RDF OPEN FORMAT REUSABLE OPEN LICENSE Monica Scannapieco, Smart City Exhibition, 17/10/2013
  • 12. Open Data in Istat – futuro Progetti in corso e futuri: Potenziamento del SEP attraverso un canale di uscita RDF Pubblicazione in RDF delle classificazioni ufficiali Use case della pubblicazione in RDF di dati del Censimento della Popolazione Open Data Lab: test, pilot LOD RDF OPEN FORMAT REUSABLE OPEN LICENSE Monica Scannapieco, Smart City Exhibition, 17/10/2013
  • 13. Affidabilità “Provenance is the number one issue that we face when publishing government data in data.gov.uk” John Sheridan, UK National Archives, data.gov.uk Definizione operativa di provenance: “Provenance of a resource is a record that describes entities and processes involved in producing and delivering or otherwise influencing that resource” (W3C Working group on provenance) http://www.w3.org/2011/prov/wiki/Main_ Page Monica Scannapieco, Smart City Exhibition, 17/10/2013
  • 14. Conclusioni Big Data: Tanta informazione potenziale ma necessità di filtrare, «metadatare», gestire… Open Data: Iniziative come i LOD strutturano i dati e semplificano gestione e accesso, ma stadio ancora iniziale Domanda: Devono gli operatori della conoscenza considerare gli shared data come nuova fonte informativa? Risposta: Ovviamente si, ma con un vero «manuale di istruzioni per l’uso» ☺! Monica Scannapieco, Smart City Exhibition, 17/10/2013