SlideShare a Scribd company logo
GIORNATE DELLA RICERCA IN ISTAT | 10-11 NOVEMBRE 2014 
SESSIONE III 
INTEGRAZIONE E USO DEI DATI AMMINISTRATIVI 
PER FINI STATISTICI 
Un’analisi multilivello dell’errore di copertura 
delle anagrafi comunali nel XV Censimento 
della Popolazione e delle Abitazioni 
Relatore: Alessandra Ronconi 
Luca Mancini, Simona Toti e Alessandra Ronconi
Indice 
1. Introduzione 
2. Obiettivi 
3. I dati 
4. Le variabili 
5. I modelli multilivello per la sovra e sottocopertura 
6. I risultati 
7. La ricostruzione del dato censuario 
8. L’errore di copertura stimato vs quello osservato 
9. Conclusioni 
10. Criticità 
Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
Introduzione 
• L’Italia, come numerosi altri paesi europei, dispone di registri di 
popolazione regolarmente aggiornati 
• Ciascun comune italiano gestisce l’anagrafe della popolazione 
residente conosciuta come lista anagrafica comunale o LAC. 
Le LAC hanno avuto un ruolo importante nell’ultima tornata censuaria 
• Il confronto censimento-anagrafe ha evidenziato la presenza, per 
ciascun comune, di una popolazione abitualmente dimorante non 
presente nei registri anagrafici (sottocopertura delle LAC) e di una 
popolazione iscritta in anagrafe ma irreperibile al censimento 
(sovracopertura delle LAC). 
Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
Obiettivi 
• Individuare le determinanti dell’errore di copertura delle LAC, 
definito come scostamento tra la popolazione anagraficamente 
residente e la popolazione obiettivo del censimento 2011, in un dato 
comune. 
• Riprodurre la popolazione obiettivo del censimento a partire da 
quella anagrafica mediante modelli cattura-ricattura dove gli individui 
sono “catturati” la prima volta dalla LAC e la seconda dal censimento 
(Wolter, 1986). 
Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
I dati 
• L’analisi è stata condotta sui comuni italiani considerando tre gruppi 
dimensionali: 1.001-5.000 abitanti, 5.001-10.000 abitanti e 10.001- 
50.000 abitanti. 
• Per ognuna delle tre classi, è stato estratto, dai dati del censimento 
2011, un campione casuale a due stadi, con i comuni come unità di 
primo stadio e gli individui, selezionati con probabilità proporzionale 
alla dimensione della LAC comunale, come unità di secondo stadio. 
Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
Le variabili 
Fattori che determinano l’errore di copertura delle LAC: 
• Le scelte individuali 
• Le caratteristiche del luogo di residenza/dimora abituale 
• La qualità dei registri anagrafici 
Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
Le variabili 
Tab.1 Descrizione delle variabili 
Variabile Modalità e descrizione 
sotto/sovracopertura 1 se l’individuo è sotto/sovracoperto, 0 altrimenti 
sesso 1 femmina, 0 maschio 
cittad 1 straniero, 0 italiano 
monocomponente 1 individuo in famiglia monocomponente, 0 altrimenti 
eta_i 1 individuo nella classe i, 0 altrimenti; i=0-18, 19-40, 41-70, 71+ 
distanza Distanza euclidea (km) del comune dal capoluogo di regione 
lac Numero di individui iscritti nella LAC del comune 
t_cf Tasso di codici fiscali errati o mancanti nella LAC del comune 
t_citt Tasso di cittadini stranieri residenti nel comune 
t_monocomponente Tasso di individui residenti nel comune in famiglia monocomponente 
t_anziani Tasso di individui residenti di età superiore a 70 anni 
t_lavout Tasso di individui residenti che lavorano in altro comune 
cittad*t_citt Interazione tra cittadinanza e tasso di stranieri residenti nel comune 
Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
I modelli multilivello per la sotto e sovra copertura 
Modello di regressione logistica ad effetti misti 
Intercetta aleatoria di comune 
Con Y = sotto/sovra copertura 
Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
Risultati 
Tab.2 Coefficienti di regressione 
SOTTOCOPERTURA SOVRACOPERTURA 
Profilo 1.001-5.000 5.001-10.000 10.001-50.000 1.001-5.000 5.001-10.000 10.001-50.000 
femmina 0,12 0,03 0,00 -0,17 -0,22 -0,24 
eta_1 1,36 0,76 0,96 -0,01 0,13 0,25 
eta_2 0,99 0,92 0,85 0,49 0,50 0,53 
eta_4 -1,30 -1,23 -0,98 -0,53 -0,61 -0,58 
Monocomp. 1,93 1,54 1,69 1,30 1,31 1,18 
cittad 1,78 1,29 1,52 2,58 2,54 2,51 
citXt_citt -5,48 -0,17 -2,20 -1,04 -0,58 -2,32 
t_citt 0,99 -1,31 1,22 0,06 -0,39 1,35 
t_mono 5,38 5,93 6,33 3,60 9,13 3,73 
t_cf 0,03 0,03 0,01 0,04 0,03 -0,01 
t_anziani -5,15 -5,32 -6,18 -4,64 -8,05 -5,33 
T_lavout -0,16 0,66 2,43 -1,64 -2,63 -0,39 
distanza 0,00 0,00 0,00 0,00 0,00 0,00 
lac 0,00 0,00 0,00 0,00 0,00 0,00 
α -6,57 -6,13 -6,60 -4,43 -4,39 -4,46 
sensibilità 0,76 0,72 0,72 0,77 0,76 0,73 
Var(αi) 0,61 0,39 0,25 0,46 0,38 0,35 
N 195.860 194.551 191.433 198.524 198.162 196.203 
n 746 299 247 746 299 247
La ricostruzione del dato censuario 
A partire dal dato LAC si vuole ricostruire la popolazione censita 
dei comuni campionati, riponderando la popolazione anagrafica 
sulla base delle probabilità individuali di sotto e sovracopertura 
predette dal modello. 
Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
L’errore di copertura stimato vs quello osservato 
Grafico1. 푬푪 vs 푬푪 per metodo di stima: comuni con 10.001-50.000 abitanti 
퐸 퐶 = |푁 푖 − 푁푖| 
퐸퐶 = |퐿퐴퐶푖 − 푁푖 | 
Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
Conclusioni 
• La sostanziale sovrapposizione a livello nazionale tra la 
popolazione censita e quella anagrafica ha spinto l’Istat ad utilizzare le 
LAC per l’estrazione dei campioni di tutte le indagini socio-economiche 
a partire dal 2011. 
• L’analisi presentata conferma come alcune categorie di individui 
(i cittadini stranieri, gli individui giovani, i nuclei familiari 
monocomponenti) sono sensibilmente più a rischio di mancata o errata 
copertura nelle LAC. 
• La qualità del dato anagrafico è notevolmente migliorata attraverso 
una opportuna riponderazione della popolazione residente che 
tenga conto dei profili di rischio individuali di sotto e sovracopertura, 
stimati attraverso modelli multilivello 
Istat Working Paper Dalla popolazione residente a quella abitualmente dimorante: 
modelli di previsione a confronto sui dati del censimento 2011. Luca Mancini e Simona Toti 
Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
Criticità 
• Nel presente studio i dati del censimento sono stati considerati come gold 
standard anche se sono noti i problemi di copertura del censimento stesso. 
• Il disegno di campionamento potrebbe essere quello areale per tener conto 
dello scenario disponibile nel caso del censimento 
• L’analisi ha evidenziato il potere predittivo del modello ad effetti misti 
quando la previsione si riferisce agli individui dei comuni campionati. 
La metodologia potrebbe essere applicata anche agli individui dei comuni 
non campionati. 
Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014

More Related Content

Similar to L. Mancini, S. Toti, A. Ronconi - Un’analisi multilivello dell’errore di copertura delle anagrafi comunali nel XV Censimento della Popolazione e delle Abitazioni

A. Bernardini, A. Fasulo, M. D. Terribili - The use of the Hard To Count ind...
A. Bernardini, A. Fasulo, M. D. Terribili -  The use of the Hard To Count ind...A. Bernardini, A. Fasulo, M. D. Terribili -  The use of the Hard To Count ind...
A. Bernardini, A. Fasulo, M. D. Terribili - The use of the Hard To Count ind...
Istituto nazionale di statistica
 
A. Pezone - La qualità delle Liste Anagrafiche Comunali
A. Pezone - La qualità delle Liste Anagrafiche ComunaliA. Pezone - La qualità delle Liste Anagrafiche Comunali
A. Pezone - La qualità delle Liste Anagrafiche Comunali
Istituto nazionale di statistica
 
L'Italia si conta
L'Italia si contaL'Italia si conta
L'Italia si conta
i_pietragalla
 
A.Petrelli, La mortalità nelle "aree interne" : una lettura originale della s...
A.Petrelli, La mortalità nelle "aree interne" : una lettura originale della s...A.Petrelli, La mortalità nelle "aree interne" : una lettura originale della s...
A.Petrelli, La mortalità nelle "aree interne" : una lettura originale della s...
Istituto nazionale di statistica
 
A. Bernardini - I “numeri” della rilevazione
A. Bernardini - I “numeri” della rilevazioneA. Bernardini - I “numeri” della rilevazione
A. Bernardini - I “numeri” della rilevazione
Istituto nazionale di statistica
 
A. Fasulo - Hard To Count Index
A. Fasulo - Hard To Count IndexA. Fasulo - Hard To Count Index
A. Fasulo - Hard To Count Index
Istituto nazionale di statistica
 
Report d3.2 16 luglio 2014
Report d3.2 16 luglio 2014Report d3.2 16 luglio 2014
Report d3.2 16 luglio 2014
OssCom
 
M. Russo - La strategia di campionamento dell’Indagine di copertura del 15° C...
M. Russo - La strategia di campionamento dell’Indagine di copertura del 15° C...M. Russo - La strategia di campionamento dell’Indagine di copertura del 15° C...
M. Russo - La strategia di campionamento dell’Indagine di copertura del 15° C...
Istituto nazionale di statistica
 
M. Simone - I risultati della revisione anagrafica
M. Simone - I risultati della revisione anagraficaM. Simone - I risultati della revisione anagrafica
M. Simone - I risultati della revisione anagrafica
Istituto nazionale di statistica
 
L'accessibilità alle risorse alimentari degli anziani a Milano
L'accessibilità alle risorse alimentari degli anziani a MilanoL'accessibilità alle risorse alimentari degli anziani a Milano
L'accessibilità alle risorse alimentari degli anziani a Milano
Luca Daconto
 
L’utilizzo di indicatori per l’analisi degli scenari socioeconomici territori...
L’utilizzo di indicatori per l’analisi degli scenari socioeconomici territori...L’utilizzo di indicatori per l’analisi degli scenari socioeconomici territori...
L’utilizzo di indicatori per l’analisi degli scenari socioeconomici territori...
Istituto nazionale di statistica
 
L.Calzola, I percorsi evolutivi dei territori italiani
L.Calzola, I percorsi evolutivi dei territori italianiL.Calzola, I percorsi evolutivi dei territori italiani
L.Calzola, I percorsi evolutivi dei territori italiani
Istituto nazionale di statistica
 
A.Mancini, F. Crescenzi - Le prospettive del censimento permanente e le pross...
A.Mancini, F. Crescenzi - Le prospettive del censimento permanente e le pross...A.Mancini, F. Crescenzi - Le prospettive del censimento permanente e le pross...
A.Mancini, F. Crescenzi - Le prospettive del censimento permanente e le pross...Istituto nazionale di statistica
 
M.Misuraca, L'equilibrio demografico e territoriale
M.Misuraca, L'equilibrio demografico e territorialeM.Misuraca, L'equilibrio demografico e territoriale
M.Misuraca, L'equilibrio demografico e territoriale
Istituto nazionale di statistica
 
Un modello di analisi Statistisca per l’individuazione della aree di rigenera...
Un modello di analisi Statistisca per l’individuazione della aree di rigenera...Un modello di analisi Statistisca per l’individuazione della aree di rigenera...
Un modello di analisi Statistisca per l’individuazione della aree di rigenera...
Informatica e Pianificazione Urbana e Territoriale
 
Gfoss2014 direttiva alluvioni_pispico-mo
Gfoss2014 direttiva alluvioni_pispico-moGfoss2014 direttiva alluvioni_pispico-mo
Gfoss2014 direttiva alluvioni_pispico-mo
rocco pispico
 

Similar to L. Mancini, S. Toti, A. Ronconi - Un’analisi multilivello dell’errore di copertura delle anagrafi comunali nel XV Censimento della Popolazione e delle Abitazioni (16)

A. Bernardini, A. Fasulo, M. D. Terribili - The use of the Hard To Count ind...
A. Bernardini, A. Fasulo, M. D. Terribili -  The use of the Hard To Count ind...A. Bernardini, A. Fasulo, M. D. Terribili -  The use of the Hard To Count ind...
A. Bernardini, A. Fasulo, M. D. Terribili - The use of the Hard To Count ind...
 
A. Pezone - La qualità delle Liste Anagrafiche Comunali
A. Pezone - La qualità delle Liste Anagrafiche ComunaliA. Pezone - La qualità delle Liste Anagrafiche Comunali
A. Pezone - La qualità delle Liste Anagrafiche Comunali
 
L'Italia si conta
L'Italia si contaL'Italia si conta
L'Italia si conta
 
A.Petrelli, La mortalità nelle "aree interne" : una lettura originale della s...
A.Petrelli, La mortalità nelle "aree interne" : una lettura originale della s...A.Petrelli, La mortalità nelle "aree interne" : una lettura originale della s...
A.Petrelli, La mortalità nelle "aree interne" : una lettura originale della s...
 
A. Bernardini - I “numeri” della rilevazione
A. Bernardini - I “numeri” della rilevazioneA. Bernardini - I “numeri” della rilevazione
A. Bernardini - I “numeri” della rilevazione
 
A. Fasulo - Hard To Count Index
A. Fasulo - Hard To Count IndexA. Fasulo - Hard To Count Index
A. Fasulo - Hard To Count Index
 
Report d3.2 16 luglio 2014
Report d3.2 16 luglio 2014Report d3.2 16 luglio 2014
Report d3.2 16 luglio 2014
 
M. Russo - La strategia di campionamento dell’Indagine di copertura del 15° C...
M. Russo - La strategia di campionamento dell’Indagine di copertura del 15° C...M. Russo - La strategia di campionamento dell’Indagine di copertura del 15° C...
M. Russo - La strategia di campionamento dell’Indagine di copertura del 15° C...
 
M. Simone - I risultati della revisione anagrafica
M. Simone - I risultati della revisione anagraficaM. Simone - I risultati della revisione anagrafica
M. Simone - I risultati della revisione anagrafica
 
L'accessibilità alle risorse alimentari degli anziani a Milano
L'accessibilità alle risorse alimentari degli anziani a MilanoL'accessibilità alle risorse alimentari degli anziani a Milano
L'accessibilità alle risorse alimentari degli anziani a Milano
 
L’utilizzo di indicatori per l’analisi degli scenari socioeconomici territori...
L’utilizzo di indicatori per l’analisi degli scenari socioeconomici territori...L’utilizzo di indicatori per l’analisi degli scenari socioeconomici territori...
L’utilizzo di indicatori per l’analisi degli scenari socioeconomici territori...
 
L.Calzola, I percorsi evolutivi dei territori italiani
L.Calzola, I percorsi evolutivi dei territori italianiL.Calzola, I percorsi evolutivi dei territori italiani
L.Calzola, I percorsi evolutivi dei territori italiani
 
A.Mancini, F. Crescenzi - Le prospettive del censimento permanente e le pross...
A.Mancini, F. Crescenzi - Le prospettive del censimento permanente e le pross...A.Mancini, F. Crescenzi - Le prospettive del censimento permanente e le pross...
A.Mancini, F. Crescenzi - Le prospettive del censimento permanente e le pross...
 
M.Misuraca, L'equilibrio demografico e territoriale
M.Misuraca, L'equilibrio demografico e territorialeM.Misuraca, L'equilibrio demografico e territoriale
M.Misuraca, L'equilibrio demografico e territoriale
 
Un modello di analisi Statistisca per l’individuazione della aree di rigenera...
Un modello di analisi Statistisca per l’individuazione della aree di rigenera...Un modello di analisi Statistisca per l’individuazione della aree di rigenera...
Un modello di analisi Statistisca per l’individuazione della aree di rigenera...
 
Gfoss2014 direttiva alluvioni_pispico-mo
Gfoss2014 direttiva alluvioni_pispico-moGfoss2014 direttiva alluvioni_pispico-mo
Gfoss2014 direttiva alluvioni_pispico-mo
 

More from Istituto nazionale di statistica

Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
Istituto nazionale di statistica
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
Istituto nazionale di statistica
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
Istituto nazionale di statistica
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
Istituto nazionale di statistica
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
Istituto nazionale di statistica
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
Istituto nazionale di statistica
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
Istituto nazionale di statistica
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
Istituto nazionale di statistica
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
Istituto nazionale di statistica
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
Istituto nazionale di statistica
 
14a Conferenza Nazionale di Statisticacnstatistica14
14a Conferenza Nazionale di Statisticacnstatistica1414a Conferenza Nazionale di Statisticacnstatistica14
14a Conferenza Nazionale di Statisticacnstatistica14
Istituto nazionale di statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
Istituto nazionale di statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
Istituto nazionale di statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
Istituto nazionale di statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
Istituto nazionale di statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
Istituto nazionale di statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
Istituto nazionale di statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
Istituto nazionale di statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
Istituto nazionale di statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
Istituto nazionale di statistica
 

More from Istituto nazionale di statistica (20)

Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
14a Conferenza Nazionale di Statisticacnstatistica14
14a Conferenza Nazionale di Statisticacnstatistica1414a Conferenza Nazionale di Statisticacnstatistica14
14a Conferenza Nazionale di Statisticacnstatistica14
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 

L. Mancini, S. Toti, A. Ronconi - Un’analisi multilivello dell’errore di copertura delle anagrafi comunali nel XV Censimento della Popolazione e delle Abitazioni

  • 1. GIORNATE DELLA RICERCA IN ISTAT | 10-11 NOVEMBRE 2014 SESSIONE III INTEGRAZIONE E USO DEI DATI AMMINISTRATIVI PER FINI STATISTICI Un’analisi multilivello dell’errore di copertura delle anagrafi comunali nel XV Censimento della Popolazione e delle Abitazioni Relatore: Alessandra Ronconi Luca Mancini, Simona Toti e Alessandra Ronconi
  • 2. Indice 1. Introduzione 2. Obiettivi 3. I dati 4. Le variabili 5. I modelli multilivello per la sovra e sottocopertura 6. I risultati 7. La ricostruzione del dato censuario 8. L’errore di copertura stimato vs quello osservato 9. Conclusioni 10. Criticità Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
  • 3. Introduzione • L’Italia, come numerosi altri paesi europei, dispone di registri di popolazione regolarmente aggiornati • Ciascun comune italiano gestisce l’anagrafe della popolazione residente conosciuta come lista anagrafica comunale o LAC. Le LAC hanno avuto un ruolo importante nell’ultima tornata censuaria • Il confronto censimento-anagrafe ha evidenziato la presenza, per ciascun comune, di una popolazione abitualmente dimorante non presente nei registri anagrafici (sottocopertura delle LAC) e di una popolazione iscritta in anagrafe ma irreperibile al censimento (sovracopertura delle LAC). Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
  • 4. Obiettivi • Individuare le determinanti dell’errore di copertura delle LAC, definito come scostamento tra la popolazione anagraficamente residente e la popolazione obiettivo del censimento 2011, in un dato comune. • Riprodurre la popolazione obiettivo del censimento a partire da quella anagrafica mediante modelli cattura-ricattura dove gli individui sono “catturati” la prima volta dalla LAC e la seconda dal censimento (Wolter, 1986). Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
  • 5. I dati • L’analisi è stata condotta sui comuni italiani considerando tre gruppi dimensionali: 1.001-5.000 abitanti, 5.001-10.000 abitanti e 10.001- 50.000 abitanti. • Per ognuna delle tre classi, è stato estratto, dai dati del censimento 2011, un campione casuale a due stadi, con i comuni come unità di primo stadio e gli individui, selezionati con probabilità proporzionale alla dimensione della LAC comunale, come unità di secondo stadio. Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
  • 6. Le variabili Fattori che determinano l’errore di copertura delle LAC: • Le scelte individuali • Le caratteristiche del luogo di residenza/dimora abituale • La qualità dei registri anagrafici Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
  • 7. Le variabili Tab.1 Descrizione delle variabili Variabile Modalità e descrizione sotto/sovracopertura 1 se l’individuo è sotto/sovracoperto, 0 altrimenti sesso 1 femmina, 0 maschio cittad 1 straniero, 0 italiano monocomponente 1 individuo in famiglia monocomponente, 0 altrimenti eta_i 1 individuo nella classe i, 0 altrimenti; i=0-18, 19-40, 41-70, 71+ distanza Distanza euclidea (km) del comune dal capoluogo di regione lac Numero di individui iscritti nella LAC del comune t_cf Tasso di codici fiscali errati o mancanti nella LAC del comune t_citt Tasso di cittadini stranieri residenti nel comune t_monocomponente Tasso di individui residenti nel comune in famiglia monocomponente t_anziani Tasso di individui residenti di età superiore a 70 anni t_lavout Tasso di individui residenti che lavorano in altro comune cittad*t_citt Interazione tra cittadinanza e tasso di stranieri residenti nel comune Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
  • 8. I modelli multilivello per la sotto e sovra copertura Modello di regressione logistica ad effetti misti Intercetta aleatoria di comune Con Y = sotto/sovra copertura Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
  • 9. Risultati Tab.2 Coefficienti di regressione SOTTOCOPERTURA SOVRACOPERTURA Profilo 1.001-5.000 5.001-10.000 10.001-50.000 1.001-5.000 5.001-10.000 10.001-50.000 femmina 0,12 0,03 0,00 -0,17 -0,22 -0,24 eta_1 1,36 0,76 0,96 -0,01 0,13 0,25 eta_2 0,99 0,92 0,85 0,49 0,50 0,53 eta_4 -1,30 -1,23 -0,98 -0,53 -0,61 -0,58 Monocomp. 1,93 1,54 1,69 1,30 1,31 1,18 cittad 1,78 1,29 1,52 2,58 2,54 2,51 citXt_citt -5,48 -0,17 -2,20 -1,04 -0,58 -2,32 t_citt 0,99 -1,31 1,22 0,06 -0,39 1,35 t_mono 5,38 5,93 6,33 3,60 9,13 3,73 t_cf 0,03 0,03 0,01 0,04 0,03 -0,01 t_anziani -5,15 -5,32 -6,18 -4,64 -8,05 -5,33 T_lavout -0,16 0,66 2,43 -1,64 -2,63 -0,39 distanza 0,00 0,00 0,00 0,00 0,00 0,00 lac 0,00 0,00 0,00 0,00 0,00 0,00 α -6,57 -6,13 -6,60 -4,43 -4,39 -4,46 sensibilità 0,76 0,72 0,72 0,77 0,76 0,73 Var(αi) 0,61 0,39 0,25 0,46 0,38 0,35 N 195.860 194.551 191.433 198.524 198.162 196.203 n 746 299 247 746 299 247
  • 10. La ricostruzione del dato censuario A partire dal dato LAC si vuole ricostruire la popolazione censita dei comuni campionati, riponderando la popolazione anagrafica sulla base delle probabilità individuali di sotto e sovracopertura predette dal modello. Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
  • 11. L’errore di copertura stimato vs quello osservato Grafico1. 푬푪 vs 푬푪 per metodo di stima: comuni con 10.001-50.000 abitanti 퐸 퐶 = |푁 푖 − 푁푖| 퐸퐶 = |퐿퐴퐶푖 − 푁푖 | Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
  • 12. Conclusioni • La sostanziale sovrapposizione a livello nazionale tra la popolazione censita e quella anagrafica ha spinto l’Istat ad utilizzare le LAC per l’estrazione dei campioni di tutte le indagini socio-economiche a partire dal 2011. • L’analisi presentata conferma come alcune categorie di individui (i cittadini stranieri, gli individui giovani, i nuclei familiari monocomponenti) sono sensibilmente più a rischio di mancata o errata copertura nelle LAC. • La qualità del dato anagrafico è notevolmente migliorata attraverso una opportuna riponderazione della popolazione residente che tenga conto dei profili di rischio individuali di sotto e sovracopertura, stimati attraverso modelli multilivello Istat Working Paper Dalla popolazione residente a quella abitualmente dimorante: modelli di previsione a confronto sui dati del censimento 2011. Luca Mancini e Simona Toti Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014
  • 13. Criticità • Nel presente studio i dati del censimento sono stati considerati come gold standard anche se sono noti i problemi di copertura del censimento stesso. • Il disegno di campionamento potrebbe essere quello areale per tener conto dello scenario disponibile nel caso del censimento • L’analisi ha evidenziato il potere predittivo del modello ad effetti misti quando la previsione si riferisce agli individui dei comuni campionati. La metodologia potrebbe essere applicata anche agli individui dei comuni non campionati. Un'analisi multilivello dell'errore di copertura, Alessandra Ronconi – 10 Novembre 2014