Convegno Scientifico Firenze 7 novembre 2016
Il valore dei dati: l’Istat da 90 anni al servizio del Paese -
L’evoluzione dell’utilizzo delle fonti amministrative può essere narrata attraverso diverse fasi evolutive. In primo luogo si è passati da meri obiettivi di conteggio a obiettivi descrittivi e interpretativi dei fenomeni, da uno sguardo a ogni fonte presa singolarmente all’integrazione fra fonti e infine dalla sola analisi aggregata all’analisi dei dati individuali a livello micro. Un simile percorso ha riguardato anche i dati di censimento che, inoltre, da fonte periodica si sta evolvendo verso una fonte di tipo permanente, che mette a disposizione i dati velocemente e integrandosi con le fonti amministrative e di indagine.
Ogni indagine non è più «un’isola» ma può essere connessa con altre indagini, in un auspicio di fonti di tipo panel. Le diverse fonti socio-demografiche possono essere unite attraverso procedure di record linkage tramite parole chiave e questa tecnica porta a riduzione dei costi, dei tempi e del fastidio statistico per i rispondenti. Le innovazioni che questo quadro riflette rappresentano sfide complesse che l’ISTAT e il SISTAN tutto si trovano a affrontare e che si possono sintetizzare nel modo seguente: (i) la Demografia rappresenta la griglia di riferimento del disegno delle politiche sociali (previdenziali, assistenziali, familiari...); (ii) Esiste un forte incremento della domanda di informazione da parte dei policy maker; (iii) Il micro-dato (dato elementare riferito al singolo individuo) diventa strumento essenziale per la valutazione dell’impatto delle politiche. Da notare il cambio di paradigma che ha avuto luogo negli studi di popolazione e che va sviluppandosi assieme alle fonti e alla loro integrazione. Tale mutamento si compone degli aspetti seguenti che formano un quadro in continua evoluzione: a) Dalla demografia descrittiva (demographic analysis) a una demografia che interpreta i fenomeni e ricerca le causalità (population studies); b) dall’approccio macro/trasversale all’approccio micro/longitudinale; c) dagli individui al corso di vita per studiare il mutamento dei fenomeni e le loro determinanti.
Silvana Salvini, I dati socio-demografici: fonti amministrative, censimento permanente e indagini
1. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
Silvana Salvini
Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) «G.Parenti»
«I dati socio-demografici: fonti«I dati socio-demografici: fonti
amministrative, censimentoamministrative, censimento
permanente e indagini»permanente e indagini»
Il valore dei dati: L’Istat da 90 anni al servizioIl valore dei dati: L’Istat da 90 anni al servizio
del Paesedel Paese
Università di Firenze – Polo delle Scienze SocialiUniversità di Firenze – Polo delle Scienze Sociali
2. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
• L’utilizzo delle fonti amministrative in passato
- Obiettivi di conteggio
- Fonti disgiunte
- Analisi aggregata
• Il censimento nel passato
- Obiettivi di conteggio e di valutazione strutturale
(a diversi livelli territoriali)
- I dati «ritardati»
- Fonte isolata
- Analisi trasversale
• Le indagini
- Ogni indagine «un’isola»
Le fonti statistiche tra continuità e innovazione:
ieri…
3. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
• L’utilizzo attuale delle fonti amministrative
- Linkage fra fonti
(amministrative fra loro, amministrative
con censimento e indagini)
- Analisi aggregata e individuale
• Il censimento del 2011 con le sue innovazioni
- Obiettivi di conteggio a livello disaggregato territoriale
- Più veloce rilascio dei dati
- Link censimento-registri
- Link censimento-indagini
- Analisi trasversale e longitudinale
• Le indagini
- Collegamento fra indagini, analisi
longitudinale retrospettiva e
analisi delle biografie retrospettive
Le fonti statistiche tra continuità e innovazione:
oggi…
4. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
• L’utilizzo futuro delle fonti amministrative
- Linkage fra fonti (amministrative fra loro,
amministrative con censimento e indagini)
- Analisi individuale e aggregata
• Il censimento permanente
- Link censimento-registri
- Link censimento-indagini
• Le indagini future
- Indagini panel fatte per l’analisi longitudinale
• Il futuro delle statistiche demografiche
- I registri
- I micro-dati
- I big data
Le fonti statistiche tra continuità e innovazione:
…e domani
LINK CENSIMENTO
INDAGINI
5. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
• Scopo dell’integrazione dei dati è quello di combinare dati
contenuti in più fonti ma che fanno riferimento a:
• (1) Una stessa unità statistica Record linkage
• (2) Unità statistiche con profili simili Matching Statistico
• Vantaggio: possibilità di studiare relazioni altrimenti non
indagabili con i dati a disposizione.
• Rispetto alla conduzione di una nuova indagine l’integrazione dei
dati consente:
• La riduzione dei costi;
• La riduzione dei tempi;
• La riduzione del “respondent burden”.
• Una coppia di record contenuta in dataset differenti viene
classificata come appartenente ad una stessa unità statistica a
seconda delle realizzazioni registrate nella/e variabile/i chiave
• Requisito minimo: almeno una variabile in comune nei due
dataset
Una digressione: il record linkage
7. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
• Demografia come base informativa per il disegno delle politiche
sociali [previdenziali, assistenziali, familiari...]
• Forte incremento della domanda di informazione da parte dei
policy maker.
• Il micro-dato [dato elementare riferito al singolo individuo]
diventa strumento essenziale per la valutazione dell’impatto delle
politiche.
Cambio di paradigma (Santini, 1999; Alleva, 2016)
• Dalla demografia descrittiva (demographic analysis) a una
demografia che interpreta i fenomeni e ricerca le causalità
(population studies).
• Dall’approccio macro/trasversale all’approccio
micro/longitudinale.
• Dagli individui al corso di vita per studiare il mutamento
e le sue determinanti.
Le sfide attuali affrontate dall’ISTAT e dall’intero
SISTAN
8. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
• Studio dei cambiamenti sociali attraverso
l’analisi delle biografie.
• Studio dei fattori che influiscono sulle biografie.
• L’analisi dinamica dei comportamenti e dei
contesti
• Le indagini campionarie sono divenute sempre
più costose. I tassi di risposta sono in
diminuzione ed è necessario contenere il fastidio
statistico sui rispondenti (Prati, 2016).
• La digitalizzazione dei dati amministrativi e il
miglioramento delle tecniche di matching fra i
dati permettono di fare maggiore ricorso alle
fonti amministrative.
• Le nuove tecnologie hanno aumentato la
capacità di archiviare, processare e analizzare
quantità sempre maggiori di dati
Le conseguenze in termini di raccolta e uso di dati
9. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
La capacità di estrare informazioni dai dati è legata alla
integrazione di fonti diverse. La statistica e le statistiche devono
fornire informazioni, che portano alla conoscenza dei fenomeni e
che aiutano gli operatori a prendere decisioni
Integrazione delle fonti
Survey
Fonti
amministrative
Questo è un processo
intrapreso da molti Istituti
di statistica dei paesi
avanzati
10. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
• Il sistema dei Registri deriva dall’utilizzo di fonti
amministrative, magari arricchite con indagini (Prati, 2016)
• Il Registro Base degli Individui e delle Famiglie (RBI) ha i
seguenti obiettivi:
1) Di riferimento per tutte le statistiche ufficiali sulla
popolazione, censimento permanente e statistiche
demografiche;
2) Di assicurazione della coerenza fra i conteggi di stock al
tempo t e al tempo t+n e i flussi delle dinamica
demografica del periodo t-(t+n)
3) Di garanzia delle informazioni per la policy
4) Di contributo al miglioramento della qualità delle fonti
anagrafiche
Il registro degli individui (1)
11. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
FASE I: L’RBI sarà alimentato dai dati anagrafici, che si inseriscono
nell’Anagrafe Virtuale Statistica (ANVIS) i cui vantaggi sono molti.
-Per costruzione assicura la coerenza fra stock e flussi
-Assicura i tempi degli adempimenti europei
-MIDEA – Favorisce il passaggio da macro a micro, da trasversale a
longitudinale. Un recente decreto legislativo semplifica l’accesso ai
micro-dati, che sarà possibile anche da remoto
-SIREAP – per la qualità delle anagrafi
FASE II: integrazione con i dati del Master Sample (MS) con due
rilevazioni, da lista e areale, per giungere a una disaggregazione
territoriale e tematica correggendo gli errori di copertura
FASE III: Integrazione della fase II utilizzando fonti amministrative
non anagrafiche (fiscali, previdenziali, di istruzione…)
Il registro degli individui (2)
12. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
E’ in corso di approvazione il Regolamento Europeo sulle indagini
sociali che definisce le dimensioni sociali che ogni Istituto è tenuto
a rilevare su:
1) Istruzione
2) Reddito e standard di vita
3) Salute
4) Mercato del lavoro
5) Uso ICT
6) Uso del tempo
7) Consumi
Il sistema integrato censimento permanente e
indagini sociali
13. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
• Creazione di basi di dati dei campioni per integrare la qualità del RBI
• Sfruttamento di tutti i Registri amministrativi
• Miglioramento della qualità anche in termini di tempestività
20172017: Disegno e realizzazione dell’indagine pilota per il MS con
l’obiettivo di verificare la strategia di rilevazione
20182018: (i) Realizzazione del primo impianto del sistema integrato e
produzione delle informazioni multi-dimensionali del Censimento
permanente
(ii) Creazione del database dei micro-dati delle indagini sociali
integrate con l’RBI
Il Censimento permanente
14. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
Il compito arduo dell’ISTATcompito arduo dell’ISTAT prevede:
1)L’utilizzo di dati amministrativi e la loro integrazione al fine di
aumentare il dettaglio di analisi e la qualità delle informazioni
2)Scrivere le storie individuali per analisi di tipo causale tramite le
tecniche di event history analysis
3)Mettere in connessione a livello micro i fenomeni economici e
sociali
4)Continuare a fare indagini per il completamento del quadro
informativo e per analizzare fenomeni specifici
In conclusione…
15. DiSIA
DIPARTIMENTO DI STATISTICA,
INFORMATICA, APPLICAZIONI
"GIUSEPPE PARENTI"
Una riflessione sui big data
Ad esempio:
1)I dati di telefonia mobile aiutano a rilevare i movimenti delle
persone, il pendolarismo, il turismo e l’immigrazione
2)Il progetto Persons & Places utilizza i dati di telefonia mobile
per:
-Stimare la popolazione urbana
-Stimare la mobilità all’interno delle
città
-Pianificare interventi di emergenza
-Valutare i flussi turistici
In conclusione…