SlideShare a Scribd company logo
1 of 16
QUALITY AND METHODOLOGY
Istat | DCME/MEA
Istat, 05.05.2021
VERSO LE TRUSTED SMART STATISTICS.
PROSPETTIVE DI SVILUPPO E RISULTATI DEL ESSNET BIG DATA PILOTS II
GABRIELE ASCARI
Il WPK, per sua natura, è stato un work package trasversale, tra i cui scopi vi erano il raccordo e il
consolidamento della conoscenza sviluppata negli altri WP.
Avvio nel WP8 «Methodology» dell’ESSNet Big Data I.
Esperienza di lavoro svolta attraverso tre linee principali di attività:
o Linee guida per l’acquisizione e l’utilizzo dei big data (e lavori correlati)
o Typification matrix
o Ricerca metodologica sull’utilizzo dei big data nella statistica ufficiale
Introduzione
QUALITY AND METHODOLOGY | GABRIELE ASCARI
2
QGBD – Quality guidelines on the acquisition and usage of big data
QUALITY AND METHODOLOGY | GABRIELE ASCARI
3
La struttura
fonte: QGBD
o Nella fase di input vengono studiate le modalità di acquisizione del dato grezzo, con particolare rilievo sulla
cooperazione con i fornitori dei dati
o Attraverso la fase di throughput I il dato grezzo viene trasformato in dato statistico. Data la varietà di
tipologia di dati di input, il trattamento viene suddiviso per categoria di dati e per ogni categoria sono
approfonditi il ruolo della classe di dati, il processo di trasformazione e sono fornite specifiche linee guida.
o La seconda fase di throughput, throughput II, riguarda l’uso del dato statistico derivato per la produzione
dell’output. Questa fase è analizzata seguendo il tipo di scopo che viene fatto dei dati ottenuti dalle
trasformazioni precedenti, dalla validazione all’uso come informazione ausiliaria per le stime.
o Alla fase di output non è dedicato un capitolo apposito perché le tipiche fasi di output orientate alla
diffusione non vengono alterate in modo significativo dalla natura delle nuove fonti di dati.
QGBD – Quality guidelines on the acquisition and usage of big data
QUALITY AND METHODOLOGY | GABRIELE ASCARI
4
QGBD – Quality guidelines on the acquisition and usage of big data
QUALITY AND METHODOLOGY | GABRIELE ASCARI
5
Esempio (fase: throughput I; classe: smart meter)
QGBD – Quality guidelines on the acquisition and usage of big data
QUALITY AND METHODOLOGY | GABRIELE ASCARI
6
Esempio (fase: throughput I; classe: smart meter)
Descrizione della classe di dati
Ruolo della classe di dati
Trasformazione dal dato grezzo al dato statistico
QGBD – Quality guidelines on the acquisition and usage of big data
7
Esempio (fase: throughput I; classe: smart meter)
Linee guida per la classe di dati
(suddivise per aspetti di qualità,
incluse tipologie di errore)
La costruzione della cosiddetta typfication matrix è stata dettata dall’esigenza di comprendere i diversi gradi di
maturità nell’utilizzo di fonti big data, come aiuto agli Istituti di statistica nella pianificazione della strategia per la
loro acquisizione.
Gli aspetti presi in considerazione sono:
o accesso alla fonte dei dati
o metadati
o caratteristiche dei dati
Ciascuno di questi aspetti presenta una descrizione ed è analizzato secondo
o le sfide prospettate
o le procedure per rispondere alle sfide
o gli investimenti richiesti
o una roadmap di implementazione delle procedure
Typification matrix
QUALITY AND METHODOLOGY | GABRIELE ASCARI
8
Typification matrix
QUALITY AND METHODOLOGY | GABRIELE ASCARI
9
Description Challenges Treatments Investment Roadmap
Source
Metadata
Data
Struttura concettuale della typification matrix
fonte: deliverable K7
La matrice è stata compilata per ciascun WP grazie al feedback dei partecipanti.
Pur non essendo uno strumento di valutazione, può essere interpretata come uno strumento di self-
assessment con tre esiti rispetto al grado di maturità di una fonte, a seconda della conoscenza delle procedure
richieste e la possibilità di prevedere i relativi investimenti e roadmap: livello esplorativo, livello di piloting e
livello di implementazione.
La matrice, se sviluppata in modo sufficientemente generalizzabile, può permettere di anticipare problemi e
colli di bottiglia in fase esplorativa di una nuova fonte di dati, nonché l’identificazione di «building blocks»
comuni ad alcune fasi del processo.
Typification matrix
QUALITY AND METHODOLOGY | GABRIELE ASCARI
10
Le premesse per l’analisi metodologica svolta nel WPK si basano sull’osservazione che la letteratura corrente
nell’ambito della statistica ufficiale si concentra su dati di indagine e dati amministrativi.
L’approccio data-driven è nuovo per gli Istituti di Statistica.
L’osservazione del lavoro svolto negli altri WP ha permesso di identificare delle fasi, o «building blocks»,
comuni a molti processi utilizzatori di big data:
o selezione e riduzione (delle dimensionalità)
o estrazione dell’informazione
o creazione del frame
o inferenza
L’analisi della metodologia si è svolta approfondendo queste linee, portando alla fine alla formulazione di
domande di ricerca ancora aperte.
Metodologia
QUALITY AND METHODOLOGY | GABRIELE ASCARI
11
Metodologia
QUALITY AND METHODOLOGY | GABRIELE ASCARI
12
I quattro passi per la produzione statistica basata su big data
fonte: deliverable K10
o L’analisi si è svolta collegandosi alle Linee guida da un lato e alla Typification matrix dall’altro
o Si è evidenziato il collegamento con l’architettura BREAL (Big Data Reference Architecture and Layers)
o Due report principali come output: uno seguendo le macrofasi del processo (Input, Throughput I e II), uno
secondo gli step descritti in precedenza, con individuazione delle aree di esplorazione per il futuro.
Metodologia
QUALITY AND METHODOLOGY | GABRIELE ASCARI
13
Alcune aree di ricerca individuate per il futuro:
o Linking tra i big data e le fonti tradizionali
o Differenze tra la popolazione obiettivo e la popolazione di interesse
o Differenze tra le definizioni tra i big data e le variabili di interesse
o Validazione, trasparenza, ottimizzazione dei modelli di deep learning in particolare e data science in
generale
o Evoluzione delle condizioni per l’accesso ai dati
Metodologia
QUALITY AND METHODOLOGY | GABRIELE ASCARI
14
Partecipanti Istat al WPK
Tiziana Tuoto
Gabriele Ascari
Giovanna Brancato
Loredana Di Consiglio
Paolo Righi
QUALITY AND METHODOLOGY | GABRIELE ASCARI
15
Grazie per l’attenzione
gabascari@istat.it

More Related Content

What's hot

Open gov per la trasparenza delle politiche pubbliche
Open gov per la trasparenza delle politiche pubblicheOpen gov per la trasparenza delle politiche pubbliche
Open gov per la trasparenza delle politiche pubblicheLuigi Reggi
 
G. Di Bella, L'interoperabilità conviene: documentare la qualità dei dati amm...
G. Di Bella, L'interoperabilità conviene: documentare la qualità dei dati amm...G. Di Bella, L'interoperabilità conviene: documentare la qualità dei dati amm...
G. Di Bella, L'interoperabilità conviene: documentare la qualità dei dati amm...Istituto nazionale di statistica
 
Webinar Agid - intervento OpenCUP
Webinar Agid - intervento OpenCUP  Webinar Agid - intervento OpenCUP
Webinar Agid - intervento OpenCUP OpenCUP
 
M. Trentini, I censimenti permanenti come occasione per la statistica locale
M. Trentini, I censimenti permanenti come occasione per la statistica locale M. Trentini, I censimenti permanenti come occasione per la statistica locale
M. Trentini, I censimenti permanenti come occasione per la statistica locale Istituto nazionale di statistica
 
R. Monducci, Fonti statistiche integrate e metodologie di stima per la valut...
R. Monducci,  Fonti statistiche integrate e metodologie di stima per la valut...R. Monducci,  Fonti statistiche integrate e metodologie di stima per la valut...
R. Monducci, Fonti statistiche integrate e metodologie di stima per la valut...Istituto nazionale di statistica
 
La filiera integrata dei dati pubblici. Od2016 cagliari - B
La filiera integrata dei dati pubblici. Od2016 cagliari - BLa filiera integrata dei dati pubblici. Od2016 cagliari - B
La filiera integrata dei dati pubblici. Od2016 cagliari - BSergio Agostinelli
 
I dati aperti delle regioni. Od2016 cagliari-22-09-16 - A
I dati aperti delle regioni. Od2016 cagliari-22-09-16 - AI dati aperti delle regioni. Od2016 cagliari-22-09-16 - A
I dati aperti delle regioni. Od2016 cagliari-22-09-16 - ASergio Agostinelli
 
I. Diaco, R. Carbini, "Verso il Programma statistico nazionale del futuro" Fo...
I. Diaco, R. Carbini, "Verso il Programma statistico nazionale del futuro" Fo...I. Diaco, R. Carbini, "Verso il Programma statistico nazionale del futuro" Fo...
I. Diaco, R. Carbini, "Verso il Programma statistico nazionale del futuro" Fo...Istituto nazionale di statistica
 
M. Fedeli, Tecnologie e processi IT a supporto della trasparenza
M. Fedeli, Tecnologie e processi IT a supporto della trasparenza  M. Fedeli, Tecnologie e processi IT a supporto della trasparenza
M. Fedeli, Tecnologie e processi IT a supporto della trasparenza Istituto nazionale di statistica
 

What's hot (20)

14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
Open gov per la trasparenza delle politiche pubbliche
Open gov per la trasparenza delle politiche pubblicheOpen gov per la trasparenza delle politiche pubbliche
Open gov per la trasparenza delle politiche pubbliche
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
G. Di Bella, L'interoperabilità conviene: documentare la qualità dei dati amm...
G. Di Bella, L'interoperabilità conviene: documentare la qualità dei dati amm...G. Di Bella, L'interoperabilità conviene: documentare la qualità dei dati amm...
G. Di Bella, L'interoperabilità conviene: documentare la qualità dei dati amm...
 
Webinar Agid - intervento OpenCUP
Webinar Agid - intervento OpenCUP  Webinar Agid - intervento OpenCUP
Webinar Agid - intervento OpenCUP
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
M. Trentini, I censimenti permanenti come occasione per la statistica locale
M. Trentini, I censimenti permanenti come occasione per la statistica locale M. Trentini, I censimenti permanenti come occasione per la statistica locale
M. Trentini, I censimenti permanenti come occasione per la statistica locale
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
R. Monducci, Fonti statistiche integrate e metodologie di stima per la valut...
R. Monducci,  Fonti statistiche integrate e metodologie di stima per la valut...R. Monducci,  Fonti statistiche integrate e metodologie di stima per la valut...
R. Monducci, Fonti statistiche integrate e metodologie di stima per la valut...
 
La filiera integrata dei dati pubblici. Od2016 cagliari - B
La filiera integrata dei dati pubblici. Od2016 cagliari - BLa filiera integrata dei dati pubblici. Od2016 cagliari - B
La filiera integrata dei dati pubblici. Od2016 cagliari - B
 
I dati aperti delle regioni. Od2016 cagliari-22-09-16 - A
I dati aperti delle regioni. Od2016 cagliari-22-09-16 - AI dati aperti delle regioni. Od2016 cagliari-22-09-16 - A
I dati aperti delle regioni. Od2016 cagliari-22-09-16 - A
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
I. Diaco, R. Carbini, "Verso il Programma statistico nazionale del futuro" Fo...
I. Diaco, R. Carbini, "Verso il Programma statistico nazionale del futuro" Fo...I. Diaco, R. Carbini, "Verso il Programma statistico nazionale del futuro" Fo...
I. Diaco, R. Carbini, "Verso il Programma statistico nazionale del futuro" Fo...
 
A. Greco, Un nuovo toolkit a supporto della diffusione
A. Greco, Un nuovo toolkit a supporto della diffusioneA. Greco, Un nuovo toolkit a supporto della diffusione
A. Greco, Un nuovo toolkit a supporto della diffusione
 
M. Fedeli, Tecnologie e processi IT a supporto della trasparenza
M. Fedeli, Tecnologie e processi IT a supporto della trasparenza  M. Fedeli, Tecnologie e processi IT a supporto della trasparenza
M. Fedeli, Tecnologie e processi IT a supporto della trasparenza
 

Similar to Verso le trusted smart statistics - prospettive di sviluppo e risultati del essnet big data pilots II

S. Montagna E. Manna L. Brondi - Le integrazioni delle fonti per il sistem...
S. Montagna  E. Manna  L. Brondi - Le integrazioni delle fonti per  il sistem...S. Montagna  E. Manna  L. Brondi - Le integrazioni delle fonti per  il sistem...
S. Montagna E. Manna L. Brondi - Le integrazioni delle fonti per il sistem...Istituto nazionale di statistica
 
Seminario Di Data Mining
Seminario Di Data MiningSeminario Di Data Mining
Seminario Di Data Miningvaluccia84
 
Risk Data Aggregation e qualità dei dati - Controlli e KQI
Risk Data Aggregation e qualità dei dati - Controlli e KQIRisk Data Aggregation e qualità dei dati - Controlli e KQI
Risk Data Aggregation e qualità dei dati - Controlli e KQIAlberto Scavino
 
Smau Bologna 2018 - INAIL pt.2
Smau Bologna 2018 - INAIL pt.2Smau Bologna 2018 - INAIL pt.2
Smau Bologna 2018 - INAIL pt.2SMAU
 
Mirella Paglialunga, Il progetto di miglioramento e la rendicontazione sociale
Mirella Paglialunga, Il progetto di miglioramento e la rendicontazione socialeMirella Paglialunga, Il progetto di miglioramento e la rendicontazione sociale
Mirella Paglialunga, Il progetto di miglioramento e la rendicontazione socialesepulvi
 
Slide tesi v10
Slide tesi v10Slide tesi v10
Slide tesi v10bellomo86
 
L'adattamento come strategia vincente di replicazione
L'adattamento come strategia vincente di replicazioneL'adattamento come strategia vincente di replicazione
L'adattamento come strategia vincente di replicazionebellomo86
 
G. Barcaroli - Il modello di Business Architecture dell’Istat
 G. Barcaroli - Il modello di Business Architecture dell’Istat G. Barcaroli - Il modello di Business Architecture dell’Istat
G. Barcaroli - Il modello di Business Architecture dell’IstatIstituto nazionale di statistica
 
Scheda profilo wsp g3- gim-v1.0
Scheda profilo wsp g3- gim-v1.0Scheda profilo wsp g3- gim-v1.0
Scheda profilo wsp g3- gim-v1.0big-gim
 
L’esperienza del telelavoro in Istat
L’esperienza del telelavoro in Istat L’esperienza del telelavoro in Istat
L’esperienza del telelavoro in Istat FPA
 
Six Sigma_form SPC to Lean mgmt
Six Sigma_form SPC to Lean mgmtSix Sigma_form SPC to Lean mgmt
Six Sigma_form SPC to Lean mgmtMattia Bardella
 
S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati
S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati
S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati Istituto nazionale di statistica
 
Continual service improvement tutorial
Continual service improvement tutorialContinual service improvement tutorial
Continual service improvement tutorialAndrea Praitano
 
Big data e nuova conoscenza aziendale_Paolo Pasini_Summit Italia 2013
Big data e nuova conoscenza aziendale_Paolo Pasini_Summit Italia 2013Big data e nuova conoscenza aziendale_Paolo Pasini_Summit Italia 2013
Big data e nuova conoscenza aziendale_Paolo Pasini_Summit Italia 2013Pragma Management Systems S.r.l.
 
Ricerca e innovazione: elementi di metodo e merito da un lavoro di valutazion...
Ricerca e innovazione: elementi di metodo e merito da un lavoro di valutazion...Ricerca e innovazione: elementi di metodo e merito da un lavoro di valutazion...
Ricerca e innovazione: elementi di metodo e merito da un lavoro di valutazion...OpenCoesione
 
La supply-chain come elemento strategico: l'approccio 2A
La supply-chain come elemento strategico: l'approccio 2ALa supply-chain come elemento strategico: l'approccio 2A
La supply-chain come elemento strategico: l'approccio 2AMCS Consulting
 
Ldb Ri-scosse_Danilo Santoro, La progettazione in campo culturale
Ldb Ri-scosse_Danilo Santoro, La progettazione in campo culturaleLdb Ri-scosse_Danilo Santoro, La progettazione in campo culturale
Ldb Ri-scosse_Danilo Santoro, La progettazione in campo culturalelaboratoridalbasso
 

Similar to Verso le trusted smart statistics - prospettive di sviluppo e risultati del essnet big data pilots II (20)

S. Montagna E. Manna L. Brondi - Le integrazioni delle fonti per il sistem...
S. Montagna  E. Manna  L. Brondi - Le integrazioni delle fonti per  il sistem...S. Montagna  E. Manna  L. Brondi - Le integrazioni delle fonti per  il sistem...
S. Montagna E. Manna L. Brondi - Le integrazioni delle fonti per il sistem...
 
Seminario Di Data Mining
Seminario Di Data MiningSeminario Di Data Mining
Seminario Di Data Mining
 
Risk Data Aggregation e qualità dei dati - Controlli e KQI
Risk Data Aggregation e qualità dei dati - Controlli e KQIRisk Data Aggregation e qualità dei dati - Controlli e KQI
Risk Data Aggregation e qualità dei dati - Controlli e KQI
 
Smau Bologna 2018 - INAIL pt.2
Smau Bologna 2018 - INAIL pt.2Smau Bologna 2018 - INAIL pt.2
Smau Bologna 2018 - INAIL pt.2
 
Mirella Paglialunga, Il progetto di miglioramento e la rendicontazione sociale
Mirella Paglialunga, Il progetto di miglioramento e la rendicontazione socialeMirella Paglialunga, Il progetto di miglioramento e la rendicontazione sociale
Mirella Paglialunga, Il progetto di miglioramento e la rendicontazione sociale
 
Slide tesi v10
Slide tesi v10Slide tesi v10
Slide tesi v10
 
L'adattamento come strategia vincente di replicazione
L'adattamento come strategia vincente di replicazioneL'adattamento come strategia vincente di replicazione
L'adattamento come strategia vincente di replicazione
 
G. Barcaroli - Il modello di Business Architecture dell’Istat
 G. Barcaroli - Il modello di Business Architecture dell’Istat G. Barcaroli - Il modello di Business Architecture dell’Istat
G. Barcaroli - Il modello di Business Architecture dell’Istat
 
Scheda profilo wsp g3- gim-v1.0
Scheda profilo wsp g3- gim-v1.0Scheda profilo wsp g3- gim-v1.0
Scheda profilo wsp g3- gim-v1.0
 
L’esperienza del telelavoro in Istat
L’esperienza del telelavoro in Istat L’esperienza del telelavoro in Istat
L’esperienza del telelavoro in Istat
 
Six Sigma_form SPC to Lean mgmt
Six Sigma_form SPC to Lean mgmtSix Sigma_form SPC to Lean mgmt
Six Sigma_form SPC to Lean mgmt
 
S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati
S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati
S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati
 
Continual service improvement tutorial
Continual service improvement tutorialContinual service improvement tutorial
Continual service improvement tutorial
 
IPABCmonitor Il concept dello strumento e prospettive di mercato
IPABCmonitor Il concept dello strumento e prospettive di mercatoIPABCmonitor Il concept dello strumento e prospettive di mercato
IPABCmonitor Il concept dello strumento e prospettive di mercato
 
Big data e nuova conoscenza aziendale_Paolo Pasini_Summit Italia 2013
Big data e nuova conoscenza aziendale_Paolo Pasini_Summit Italia 2013Big data e nuova conoscenza aziendale_Paolo Pasini_Summit Italia 2013
Big data e nuova conoscenza aziendale_Paolo Pasini_Summit Italia 2013
 
Ricerca e innovazione: elementi di metodo e merito da un lavoro di valutazion...
Ricerca e innovazione: elementi di metodo e merito da un lavoro di valutazion...Ricerca e innovazione: elementi di metodo e merito da un lavoro di valutazion...
Ricerca e innovazione: elementi di metodo e merito da un lavoro di valutazion...
 
La supply-chain come elemento strategico: l'approccio 2A
La supply-chain come elemento strategico: l'approccio 2ALa supply-chain come elemento strategico: l'approccio 2A
La supply-chain come elemento strategico: l'approccio 2A
 
02 consulenza t0104
02 consulenza t010402 consulenza t0104
02 consulenza t0104
 
S. Gazzelloni, I comuni e il censimento permanente
S. Gazzelloni, I comuni e il censimento permanenteS. Gazzelloni, I comuni e il censimento permanente
S. Gazzelloni, I comuni e il censimento permanente
 
Ldb Ri-scosse_Danilo Santoro, La progettazione in campo culturale
Ldb Ri-scosse_Danilo Santoro, La progettazione in campo culturaleLdb Ri-scosse_Danilo Santoro, La progettazione in campo culturale
Ldb Ri-scosse_Danilo Santoro, La progettazione in campo culturale
 

More from Istituto nazionale di statistica

More from Istituto nazionale di statistica (20)

Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
14a Conferenza Nazionale di Statisticacnstatistica14
14a Conferenza Nazionale di Statisticacnstatistica1414a Conferenza Nazionale di Statisticacnstatistica14
14a Conferenza Nazionale di Statisticacnstatistica14
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 

Recently uploaded

Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxLorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxlorenzodemidio01
 
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.giuliofiorerm
 
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxLorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxlorenzodemidio01
 
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaXI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaStefano Lariccia
 
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaXIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaStefano Lariccia
 
San Giorgio e la leggenda del drago.pptx
San Giorgio e la leggenda del drago.pptxSan Giorgio e la leggenda del drago.pptx
San Giorgio e la leggenda del drago.pptxMartin M Flynn
 
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxLorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxlorenzodemidio01
 
Lorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxLorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxlorenzodemidio01
 

Recently uploaded (8)

Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxLorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
 
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
 
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxLorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
 
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaXI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
 
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaXIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
 
San Giorgio e la leggenda del drago.pptx
San Giorgio e la leggenda del drago.pptxSan Giorgio e la leggenda del drago.pptx
San Giorgio e la leggenda del drago.pptx
 
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxLorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
 
Lorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxLorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptx
 

Verso le trusted smart statistics - prospettive di sviluppo e risultati del essnet big data pilots II

  • 1. QUALITY AND METHODOLOGY Istat | DCME/MEA Istat, 05.05.2021 VERSO LE TRUSTED SMART STATISTICS. PROSPETTIVE DI SVILUPPO E RISULTATI DEL ESSNET BIG DATA PILOTS II GABRIELE ASCARI
  • 2. Il WPK, per sua natura, è stato un work package trasversale, tra i cui scopi vi erano il raccordo e il consolidamento della conoscenza sviluppata negli altri WP. Avvio nel WP8 «Methodology» dell’ESSNet Big Data I. Esperienza di lavoro svolta attraverso tre linee principali di attività: o Linee guida per l’acquisizione e l’utilizzo dei big data (e lavori correlati) o Typification matrix o Ricerca metodologica sull’utilizzo dei big data nella statistica ufficiale Introduzione QUALITY AND METHODOLOGY | GABRIELE ASCARI 2
  • 3. QGBD – Quality guidelines on the acquisition and usage of big data QUALITY AND METHODOLOGY | GABRIELE ASCARI 3 La struttura fonte: QGBD
  • 4. o Nella fase di input vengono studiate le modalità di acquisizione del dato grezzo, con particolare rilievo sulla cooperazione con i fornitori dei dati o Attraverso la fase di throughput I il dato grezzo viene trasformato in dato statistico. Data la varietà di tipologia di dati di input, il trattamento viene suddiviso per categoria di dati e per ogni categoria sono approfonditi il ruolo della classe di dati, il processo di trasformazione e sono fornite specifiche linee guida. o La seconda fase di throughput, throughput II, riguarda l’uso del dato statistico derivato per la produzione dell’output. Questa fase è analizzata seguendo il tipo di scopo che viene fatto dei dati ottenuti dalle trasformazioni precedenti, dalla validazione all’uso come informazione ausiliaria per le stime. o Alla fase di output non è dedicato un capitolo apposito perché le tipiche fasi di output orientate alla diffusione non vengono alterate in modo significativo dalla natura delle nuove fonti di dati. QGBD – Quality guidelines on the acquisition and usage of big data QUALITY AND METHODOLOGY | GABRIELE ASCARI 4
  • 5. QGBD – Quality guidelines on the acquisition and usage of big data QUALITY AND METHODOLOGY | GABRIELE ASCARI 5 Esempio (fase: throughput I; classe: smart meter)
  • 6. QGBD – Quality guidelines on the acquisition and usage of big data QUALITY AND METHODOLOGY | GABRIELE ASCARI 6 Esempio (fase: throughput I; classe: smart meter) Descrizione della classe di dati Ruolo della classe di dati Trasformazione dal dato grezzo al dato statistico
  • 7. QGBD – Quality guidelines on the acquisition and usage of big data 7 Esempio (fase: throughput I; classe: smart meter) Linee guida per la classe di dati (suddivise per aspetti di qualità, incluse tipologie di errore)
  • 8. La costruzione della cosiddetta typfication matrix è stata dettata dall’esigenza di comprendere i diversi gradi di maturità nell’utilizzo di fonti big data, come aiuto agli Istituti di statistica nella pianificazione della strategia per la loro acquisizione. Gli aspetti presi in considerazione sono: o accesso alla fonte dei dati o metadati o caratteristiche dei dati Ciascuno di questi aspetti presenta una descrizione ed è analizzato secondo o le sfide prospettate o le procedure per rispondere alle sfide o gli investimenti richiesti o una roadmap di implementazione delle procedure Typification matrix QUALITY AND METHODOLOGY | GABRIELE ASCARI 8
  • 9. Typification matrix QUALITY AND METHODOLOGY | GABRIELE ASCARI 9 Description Challenges Treatments Investment Roadmap Source Metadata Data Struttura concettuale della typification matrix fonte: deliverable K7
  • 10. La matrice è stata compilata per ciascun WP grazie al feedback dei partecipanti. Pur non essendo uno strumento di valutazione, può essere interpretata come uno strumento di self- assessment con tre esiti rispetto al grado di maturità di una fonte, a seconda della conoscenza delle procedure richieste e la possibilità di prevedere i relativi investimenti e roadmap: livello esplorativo, livello di piloting e livello di implementazione. La matrice, se sviluppata in modo sufficientemente generalizzabile, può permettere di anticipare problemi e colli di bottiglia in fase esplorativa di una nuova fonte di dati, nonché l’identificazione di «building blocks» comuni ad alcune fasi del processo. Typification matrix QUALITY AND METHODOLOGY | GABRIELE ASCARI 10
  • 11. Le premesse per l’analisi metodologica svolta nel WPK si basano sull’osservazione che la letteratura corrente nell’ambito della statistica ufficiale si concentra su dati di indagine e dati amministrativi. L’approccio data-driven è nuovo per gli Istituti di Statistica. L’osservazione del lavoro svolto negli altri WP ha permesso di identificare delle fasi, o «building blocks», comuni a molti processi utilizzatori di big data: o selezione e riduzione (delle dimensionalità) o estrazione dell’informazione o creazione del frame o inferenza L’analisi della metodologia si è svolta approfondendo queste linee, portando alla fine alla formulazione di domande di ricerca ancora aperte. Metodologia QUALITY AND METHODOLOGY | GABRIELE ASCARI 11
  • 12. Metodologia QUALITY AND METHODOLOGY | GABRIELE ASCARI 12 I quattro passi per la produzione statistica basata su big data fonte: deliverable K10
  • 13. o L’analisi si è svolta collegandosi alle Linee guida da un lato e alla Typification matrix dall’altro o Si è evidenziato il collegamento con l’architettura BREAL (Big Data Reference Architecture and Layers) o Due report principali come output: uno seguendo le macrofasi del processo (Input, Throughput I e II), uno secondo gli step descritti in precedenza, con individuazione delle aree di esplorazione per il futuro. Metodologia QUALITY AND METHODOLOGY | GABRIELE ASCARI 13
  • 14. Alcune aree di ricerca individuate per il futuro: o Linking tra i big data e le fonti tradizionali o Differenze tra la popolazione obiettivo e la popolazione di interesse o Differenze tra le definizioni tra i big data e le variabili di interesse o Validazione, trasparenza, ottimizzazione dei modelli di deep learning in particolare e data science in generale o Evoluzione delle condizioni per l’accesso ai dati Metodologia QUALITY AND METHODOLOGY | GABRIELE ASCARI 14
  • 15. Partecipanti Istat al WPK Tiziana Tuoto Gabriele Ascari Giovanna Brancato Loredana Di Consiglio Paolo Righi QUALITY AND METHODOLOGY | GABRIELE ASCARI 15