SlideShare a Scribd company logo
1 of 30
Download to read offline
Una strategia di controllo e correzione e di
editing selettivo basato sui dati amministrativi.
Seminario: “Innovazioni metodologiche e di processo in una rilevazione multi-
source su imprese e istituzioni: la Struttura delle retribuzioni e del costo del
lavoro 2012”
Maria Teresa Buglielli, Ugo Guarnera, Marilena A. Ciarallo, Ciro Baldi
Istat – Aula Magna, 17 febbraio 2015
Indice
1. Schema generale del processo di C&C
2. Dati amministrativi ed editing selettivo
3. Editing deterministico e probabilistico
4. Imputazione mancata risposta totale
5. Macro editing e validazione
6. Conclusioni
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Schema generale del processo di C&C
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Schema generale del processo di C&C
EDITING
SELETTIVO
IMPUTAZIONE
MRT
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
SOSTITUZIONE
CON RACLI
CALIBRAZIONE
RCLRACLI
DATI
CORRETTI
TOTALI
FISSATI
PROBABILISTICODETERMINISTICO
MACROEDITING
VALIDAZIONE
DATI
IMPUTATI
DATI
FINALI
Editing selettivo
• Insieme di tecniche per l’identificazione degli errori influenti
• Obiettivo: dividere l’insieme dei dati in due sottoinsiemi
– un insieme «critico» contenente gli errori potenzialmente
influenti (editing interattivo)
– un insieme contenente record supposti corretti o
contenenti errori non influenti (editing automatico)
• Elementi chiave:
– ordinamento delle unità sulla base di una «funzione
punteggio»
– valore di soglia che determina il numero id unità da
revisionare interattivamente
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Editing selettivo basato su modello a classi latenti
(Selemix)
MSS ha sviluppato un metodo di editing selettivo basato su:
1) modellazione esplicita sia dei dati sia del meccanismo di
errore (via modelli mistura)
2) definizione della funzione punteggio in termini della
differenza tra valore osservato e valore atteso della
distribuzione dei dati veri condizionatamente ai dati
osservati
Questo approccio permette di mettere in relazione la soglia di
errore per la revisione interattiva all’errore residuo atteso nei
dati
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
X Y*
Y
I
modello dati veri
modello d’errore
Il modello
dati amministrativi
dati veri
dati indagine
indicatore d’errore
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Variabili X (RACLI)
• numero dipendenti
• retribuzioni totali
• ore retribuite
Variabili Y (RCL)
• ore retribuite
• ore lavorate
• retribuzioni totali
• ...........
Gli errori potenzialmente influenti sono stati individuati utilizzando diversi
modelli che mettono in relazione le variabili elencate.
Due passi di ES
1. selezione dei record per il ricontatto
2. selezione dei record per la sostituzione dei totali da RACLI
Dati fonte RACLI nell’editing selettivo
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Editing selettivo
Caratteristiche della selezione dei record per ricontatto
 in corsa
 sia a livello di impresa che di unità territoriale
 diversi modelli per le anomalie di ore retribuite e retribuzioni totali
 individuazione errori influenti per sezione di ateco
 retribuzione totale e ore retribuite di fonte amministrativa come
covariate
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Editing selettivo
modello X Y N. outlier % outlier N. influenti
%
influenti
Struttura
retrib.
retrib. RACLI
tredicesima
contributi
TFR
1513 13,39 132 1,17
Ore
Ore retribuite
RACLI
Ore lavorate
e retribuite
RCL
562 4,97 60 0,53
ALL
dipend. ore
retrib, retrib.
totali RACLI
dipendenti,
ore retrib.
retrib. totali
RCL
1309 11,58 170 1,50
Totale
imprese
2363 20,90 281 2,49
Risultati selezione per ricontatto su 11303 imprese
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Outlier e influenti per retribuzione - Sezione N
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Outlier e influenti per retribuzione - Sezione N
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Errore sistematico:
sono le imprese
interinali che hanno
fornito i dati solo per il
personale di staff
Sostituzioni con RACLI
IDEA
I dati di fonte amministrativa forniscono i totali di riferimento per
dipendenti, retribuzioni, ore retribuite
Individuazione delle imprese con due metodi
 editing selettivo
 per raggruppamento di contratti
 a livello di unità territoriale
 per imprese non ricontattate o nuove rispondenti
 confronti deterministici
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Sostituzioni con RACLI - confronti deterministici
 Il numero dei dipendenti se:
 Errore localizzato
 Si migliora l’accostamento delle variabili procapite con RACLI
 I valori delle unità per cui a livello di impresa:
 valori non rientrano in range di accostamento
 imprese non soddisfano i criteri eccezione
 I range di accostamento tengono conto di:
 Dimensione di impresa
 Differenti soglie per le ore
 I criteri eccezione tengono conto di:
 Possibili retribuzioni sopra il massimale imponibile
 Retribuzioni accostate con i bilanci ma non con Racli
(pochissimi casi)
 Unità non misurate bene da RACLI (es. APSP)
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Correzioni deterministiche
• errori sistematici: si manifestano nei dati in modo
consistente in una precisa direzione (retribuzioni per
ferie,…)
Correzioni probabilistiche
• causati da fattori accidentali
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Editing automatico
Metodologia Fellegi-Holt
sviluppata nel 1976 per il trattamento delle variabili qualitative (con edit logici) e
poi estesa al trattamento di variabili quantitative (con edit aritmetici:
disuguaglianze lineari, rapporti, ..)
Principi:
1. Le regole di incompatibilità (edit) devono essere soddisfatti cambiando il
minimo numero di campi (principio del minimo cambiamento).
2. Le regole di imputazione devono essere derivate automaticamente da
quelle di controllo.
3. Le distribuzioni marginali e congiunte dei dati non erronei devono
essere preservate il più possibile.
I. P. Fellegi and D. Holt (1976) ”A Sistematic Approach to Automatic Edit and Imputation”, Journal of the American Statistical
Association, vol 71, n353, 17-35.
Correzioni probabilistiche
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Schema editing automatico
CORREZIONI
DETERMINISTICHE
TOTALI
FISSATI
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
BANFF
CONTROLLO ORE
DATI
VALIDATI
Normali Agricoltura
Cinema
Scuole Marittimi
Soc.sportive
Interinali, …
RETRIBUZIONE
FERIE
ANALISI NOTE
BANFF
STRUTTURA
RETRIBUZIONE
BANFF
ALTRI ONERI
BANFF
APPRENDISTI
DATI
CORRETTI
Normali Agricoltura
Assicurazioni
Cinema
Edilizia Interinali
Soc.sportive
Normali
Contributi alti
Contributi bassi
Metodologia Fellegi-Holt per le variabili quantitative
Software disponibili:
SAS
BANFF insieme di procedure per l'individuazione di outlier e
il controllo e la correzione di variabili numeriche
continue sulla base di edit lineari
Pacchetti R
editrules check e localizzazione sulla base degli edit
HotDeckImputation imputazione col metodo del donatore
VIM imputazione col metodo del donatore
Correzioni probabilistiche
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Alcune correzioni deterministiche
 Riallineamento dati rilevati con ASIA per imprese soggette a
trasformazioni giuridiche
 Problemi legati ai dati per ripartizioni
 alcune correzioni di ripartizione errate
 imprese che hanno centralizzato i valori delle retribuzioni e
costo del lavoro
 Problemi legati a valori non imponibili
 annullamento di valori non imponibili dove ‘impossibili‘
 scambio tra imponibile e non imponibile..
 Azzeramento valori negativi indebiti
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Correzioni deterministiche: le retribuzioni per ferie
 Per circa il 50% delle imprese valori mancanti o implausibilmente
bassi per retribuzioni per ferie, festività e permessi
 Probabilmente a causa delle mancanza dell’informazione dai sistemi
informativi
 come per la nostra busta paga, in cui non c’è conteggio separato
delle ferie
 Numero troppo elevato per una correzione con donatore
 Ricostruzione a partire dalle ore retribuite per ferie, festività e
permessi (novità introdotta nel questionario)
𝑟𝑒𝑡𝑟𝑖𝑏𝑢𝑧𝑖𝑜𝑛𝑖 𝑝𝑒𝑟 𝑓𝑒𝑟𝑖𝑒, 𝑓𝑒𝑠𝑡𝑖𝑣𝑖𝑡à 𝑒 𝑝𝑒𝑟𝑚𝑒𝑠𝑠𝑖
=
𝑟𝑒𝑡𝑟𝑖𝑏𝑢𝑧𝑖𝑜𝑛𝑖 "𝑟𝑒𝑔𝑜𝑙𝑎𝑟𝑖"
𝑛. 𝑜𝑟𝑒 𝑜𝑟𝑑𝑖𝑛𝑎𝑟𝑖𝑒
𝑛. 𝑜𝑟𝑒 𝑟𝑒𝑡𝑟𝑖𝑏𝑢𝑖𝑡𝑒 𝑝𝑒𝑟 𝑓𝑒𝑟𝑖𝑒, 𝑓𝑒𝑠𝑡𝑖𝑣𝑖𝑡à 𝑒 𝑝𝑒𝑟𝑚𝑒𝑠𝑠𝑖
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Correzioni probabilistiche - Edit per BANFF
Tabella EXCEL per la gestione degli Edit
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
 correzioni probabilistiche per sezione di questionario, condizionate
alle correzione precedente
 edit diversi per diversi raggruppamenti di contratti e segnali CIG
 definiti in un file excel e gestiti automaticamente dal programma
SAS
sezione tipo Normali
ore edit oreretft <= 2350 * dipft;
ore edit oreretft >= 1200 * dipft;
ore edit oreretft + oreindmft + orecigft <= 2500 * dipft;
ore edit oreretft + oreindmft + orecigft >= 1400 * dipft;
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Percorso differenziato di C&C in presenza di note
Esempio:’ Nel settore agricolo viene applicato uno sgravio del 68% sui
contributi a carico ditta per le aziende ubicate nelle aree di cui
all’obiettivo 1 della UE’.
Fasi:
 Lettura ed analisi di tutte le note in corrispondenza di valori anomali
(ad es. dell’incidenza contributiva)
 Estrazione di parole chiave (es. sgravio, fiscalizzazione,
agevolazione, decontribuzione…)
 Procedura che fa uso di espressioni regolari per identificare le unità
«da salvare»
 Percorso diversificato nell’ambito delle procedure di C&C
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Analisi delle note presenti sul questionario. Esempi
Rapporto tra oneri sociali e retribuzioni molto alto
a. Elevata incidenza di personale in CIG (importi per TFR e Contributi
sociali versati, e retribuzioni basse)
b. Personale in mobilità che ha usufruito di incentivi all’esodo
c. Imprese che implicano lavori rischiosi e, quindi, soggetti a premi
assicurativi elevati contro gli infortuni sul lavoro
Caso di rapporto tra oneri sociali e retribuzioni molto basso
a. Settori che non prevedono il TFR (Attività artistiche, sportive) e/o con
retribuzioni molto più elevate rispetto ai limiti fissati per la
contribuzione ordinaria.
b. Imprese appartenenti a zone montane o altre aree ‘particolari’ che
beneficiano di agevolazioni contributive per aree svantaggiate.
Analisi delle non risposte
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Ore procapite RACLI – Rispondenti vs Non Rispondenti
Imputazione delle MRT
1. Le variabili principali sono state attribuite da RACLI:
 Dipendenti totali, full-time e part-time, apprendisti
 Ore retribuite totali, full-time e part-time, apprendisti
 Retribuzioni imponibili totali e degli apprendisti
2. Le altre variabili sono attribuite con donatore di minima distanza,
tramite rapporto con le variabili principali
La distanza è calcolata su: retribuzioni imponibili, dipendenti ed ore
retribuite, FT,PT e apprendisti, flag che segnala la situazione di alta CIG
In gruppi formati da imprese con:
 stesso raggruppamento di CCNL
 flag di struttura occupazionale (presenza di tipi di lavoratori -
FT,PT ed apprendisti)
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Controllo degli errori influenti residui
(Macro – Editing)
Macro editing effettuato in maniera Top-down sui seguenti indicatori:
• Ore lavorate per dipendente
• Retribuzioni orarie
• incidenza dei contributi sociali totali rispetto alle retribuzioni;
Scopo: individuare unità ancora affette da possibili errori di misura
ovvero giustificare le anomalie
Fasi:
 Analisi grafica delle distribuzioni di parametri per celle di stima
 Divisione ateco x ripartizione x classe dimensionale
 Selezione di celle «outlier»
 Analisi delle unità all’interno delle celle, partendo dalle più influenti
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Controllo degli errori influenti residui
(Macro – editing)
Selezione degli aggregati outliers
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Controllo degli errori influenti residui
(Macro – editing)
Analisi degli aggregati outliers
• Nell’esempio, Divisione 50 «Trasporto Marittimo e per vie d’acqua».
• Particolare per specificità dovute alla tipologia contrattuale
– molte società beneficiano di riduzioni contributive.
• Dati ritenuti validi
ALTRI ESEMPI DI SETTORI PARTICOLARI:
– Unità appartenenti al settore «Stampa e Servizi connessi alla
stampa» .
• Il CCNL prevede un contributo obbligatorio aggiuntivo ad un
fondo specifico.
• Sezione «R» – gli outliers corrispondono ad alcune società di calcio
(alta retribuzione, bassi contributi).
Riassumendo…il valore aggiunto dell’uso di RACLI
 Confronto di variabili compresenti nell’indagine e nel registro ed
individuazione valori anomali
o Ricontatto delle imprese influenti
o Sostituzione con i valori RACLI per le imprese non influenti
 Imputazione delle MRT
 Gruppi di edits e di imputazione per raggruppamenti di Contratti
collettivi nazionali (CCNL), invece che Ateco. In teoria più
determinanti per le variabili target
 Informazioni più affidabili sulla CIG per differenziare le procedure
di C&C a seconda dell’intensità di CIG
 Es. Edits sulle ore e sui contributi differenziati per imprese ad
alta cig
 Gruppo di imputazione differenziato
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
Grazie
per la pazienza!
Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015

More Related Content

Similar to M.T. Buglielli, U. Guarnera - Una strategia di controllo e correzione e di editing selettivo basato sui dati amministrativi.

C. Baldi, F. Rapiti - Riprogettazione di una rilevazione multi-source su impr...
C. Baldi, F. Rapiti - Riprogettazione di una rilevazione multi-source su impr...C. Baldi, F. Rapiti - Riprogettazione di una rilevazione multi-source su impr...
C. Baldi, F. Rapiti - Riprogettazione di una rilevazione multi-source su impr...Istituto nazionale di statistica
 
C. Baldi, S. PaciniIl - Il molteplice ruolo del registro delle retribuzioni ...
 C. Baldi, S. PaciniIl - Il molteplice ruolo del registro delle retribuzioni ... C. Baldi, S. PaciniIl - Il molteplice ruolo del registro delle retribuzioni ...
C. Baldi, S. PaciniIl - Il molteplice ruolo del registro delle retribuzioni ...Istituto nazionale di statistica
 
S. De santis, S. Cardinaleschi, Il sistema informativo sulla contrattazione d...
S. De santis, S. Cardinaleschi, Il sistema informativo sulla contrattazione d...S. De santis, S. Cardinaleschi, Il sistema informativo sulla contrattazione d...
S. De santis, S. Cardinaleschi, Il sistema informativo sulla contrattazione d...Istituto nazionale di statistica
 
O. Luzi - Le innovazioni metodologiche e nelle fonti per la costruzione del ...
O. Luzi - Le innovazioni metodologiche e nelle fonti  per la costruzione del ...O. Luzi - Le innovazioni metodologiche e nelle fonti  per la costruzione del ...
O. Luzi - Le innovazioni metodologiche e nelle fonti per la costruzione del ...Istituto nazionale di statistica
 
S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati
S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati
S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati Istituto nazionale di statistica
 
C. Ceccarelli, Un quadro d'insieme sugli indicatori della domanda e sul regis...
C. Ceccarelli, Un quadro d'insieme sugli indicatori della domanda e sul regis...C. Ceccarelli, Un quadro d'insieme sugli indicatori della domanda e sul regis...
C. Ceccarelli, Un quadro d'insieme sugli indicatori della domanda e sul regis...Istituto nazionale di statistica
 
M.A. Ciarallo, G. Spera, R. Renzi - Una strategia multi-modale di contatto de...
M.A. Ciarallo, G. Spera, R. Renzi - Una strategia multi-modale di contatto de...M.A. Ciarallo, G. Spera, R. Renzi - Una strategia multi-modale di contatto de...
M.A. Ciarallo, G. Spera, R. Renzi - Una strategia multi-modale di contatto de...Istituto nazionale di statistica
 
A. Golino, L’Indagine mensile sulle G randi I mprese: all’origine degli in...
A. Golino, L’Indagine mensile sulle G randi  I mprese:  all’origine  degli in...A. Golino, L’Indagine mensile sulle G randi  I mprese:  all’origine  degli in...
A. Golino, L’Indagine mensile sulle G randi I mprese: all’origine degli in...Istituto nazionale di statistica
 
A. Golino, L’Indagine mensile sulle Grandi Imprese: all’origine degli indica...
A. Golino, L’Indagine mensile sulle Grandi  Imprese: all’origine degli indica...A. Golino, L’Indagine mensile sulle Grandi  Imprese: all’origine degli indica...
A. Golino, L’Indagine mensile sulle Grandi Imprese: all’origine degli indica...Istituto nazionale di statistica
 
F. Tartamella - La revisione della stima dei redditi da lavoro dipendente
F. Tartamella - La revisione della stima dei redditi da lavoro dipendenteF. Tartamella - La revisione della stima dei redditi da lavoro dipendente
F. Tartamella - La revisione della stima dei redditi da lavoro dipendenteIstituto nazionale di statistica
 
F.Ceccato, E. Cimino, Un focus sul processo di integrazione
F.Ceccato, E. Cimino, Un focus sul processo di integrazione F.Ceccato, E. Cimino, Un focus sul processo di integrazione
F.Ceccato, E. Cimino, Un focus sul processo di integrazione Istituto nazionale di statistica
 
L’obiettivo innovazione nella contrattazione di secondo livello, shock pandem...
L’obiettivo innovazione nella contrattazione di secondo livello, shock pandem...L’obiettivo innovazione nella contrattazione di secondo livello, shock pandem...
L’obiettivo innovazione nella contrattazione di secondo livello, shock pandem...Massimo Resce
 
F.R. Pogelli, D. Tuzi Posizioni lavorative e costo del lavoro nelle imprese...
F.R. Pogelli, D. Tuzi   Posizioni lavorative e costo del lavoro nelle imprese...F.R. Pogelli, D. Tuzi   Posizioni lavorative e costo del lavoro nelle imprese...
F.R. Pogelli, D. Tuzi Posizioni lavorative e costo del lavoro nelle imprese...Istituto nazionale di statistica
 
B. Mazzotta - TAVOLA ROTONDA: Le esigenze informative delle amministrazioni a...
B. Mazzotta - TAVOLA ROTONDA: Le esigenze informative delle amministrazioni a...B. Mazzotta - TAVOLA ROTONDA: Le esigenze informative delle amministrazioni a...
B. Mazzotta - TAVOLA ROTONDA: Le esigenze informative delle amministrazioni a...Istituto nazionale di statistica
 
C. Baldi e C. Casciano, Opportunità e criticità nell’uso del registro dell...
C. Baldi e C. Casciano,  Opportunità e criticità nell’uso del registro dell...C. Baldi e C. Casciano,  Opportunità e criticità nell’uso del registro dell...
C. Baldi e C. Casciano, Opportunità e criticità nell’uso del registro dell...Istituto nazionale di statistica
 
A. Lucarelli, M. Sorrentino, Indicatori trimestrali su posti vacanti e ore l...
A. Lucarelli,  M. Sorrentino, Indicatori trimestrali su posti vacanti e ore l...A. Lucarelli,  M. Sorrentino, Indicatori trimestrali su posti vacanti e ore l...
A. Lucarelli, M. Sorrentino, Indicatori trimestrali su posti vacanti e ore l...Istituto nazionale di statistica
 
A. Zanardi, L'utilizzo dei micro-dati amministrativi: l'esperienza dell'Uffic...
A. Zanardi, L'utilizzo dei micro-dati amministrativi: l'esperienza dell'Uffic...A. Zanardi, L'utilizzo dei micro-dati amministrativi: l'esperienza dell'Uffic...
A. Zanardi, L'utilizzo dei micro-dati amministrativi: l'esperienza dell'Uffic...Istituto nazionale di statistica
 
Istat, Aula Magna 13 settembre 2013 - L’economia non osservata nei conti nazi...
Istat, Aula Magna 13 settembre 2013 - L’economia non osservata nei conti nazi...Istat, Aula Magna 13 settembre 2013 - L’economia non osservata nei conti nazi...
Istat, Aula Magna 13 settembre 2013 - L’economia non osservata nei conti nazi...Istituto nazionale di statistica
 
M. Ciarallo, Le indagini strutturali SES ed LCS: indicatori prodotti e intera...
M. Ciarallo, Le indagini strutturali SES ed LCS: indicatori prodotti e intera...M. Ciarallo, Le indagini strutturali SES ed LCS: indicatori prodotti e intera...
M. Ciarallo, Le indagini strutturali SES ed LCS: indicatori prodotti e intera...Istituto nazionale di statistica
 

Similar to M.T. Buglielli, U. Guarnera - Una strategia di controllo e correzione e di editing selettivo basato sui dati amministrativi. (20)

C. Baldi, F. Rapiti - Riprogettazione di una rilevazione multi-source su impr...
C. Baldi, F. Rapiti - Riprogettazione di una rilevazione multi-source su impr...C. Baldi, F. Rapiti - Riprogettazione di una rilevazione multi-source su impr...
C. Baldi, F. Rapiti - Riprogettazione di una rilevazione multi-source su impr...
 
F. Rapiti, Verso un nuovo paradigma
F. Rapiti, Verso un nuovo paradigmaF. Rapiti, Verso un nuovo paradigma
F. Rapiti, Verso un nuovo paradigma
 
C. Baldi, S. PaciniIl - Il molteplice ruolo del registro delle retribuzioni ...
 C. Baldi, S. PaciniIl - Il molteplice ruolo del registro delle retribuzioni ... C. Baldi, S. PaciniIl - Il molteplice ruolo del registro delle retribuzioni ...
C. Baldi, S. PaciniIl - Il molteplice ruolo del registro delle retribuzioni ...
 
S. De santis, S. Cardinaleschi, Il sistema informativo sulla contrattazione d...
S. De santis, S. Cardinaleschi, Il sistema informativo sulla contrattazione d...S. De santis, S. Cardinaleschi, Il sistema informativo sulla contrattazione d...
S. De santis, S. Cardinaleschi, Il sistema informativo sulla contrattazione d...
 
O. Luzi - Le innovazioni metodologiche e nelle fonti per la costruzione del ...
O. Luzi - Le innovazioni metodologiche e nelle fonti  per la costruzione del ...O. Luzi - Le innovazioni metodologiche e nelle fonti  per la costruzione del ...
O. Luzi - Le innovazioni metodologiche e nelle fonti per la costruzione del ...
 
S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati
S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati
S. De Santis - Un approccio mixed-mode sequenziale all’acquisizione dati
 
C. Ceccarelli, Un quadro d'insieme sugli indicatori della domanda e sul regis...
C. Ceccarelli, Un quadro d'insieme sugli indicatori della domanda e sul regis...C. Ceccarelli, Un quadro d'insieme sugli indicatori della domanda e sul regis...
C. Ceccarelli, Un quadro d'insieme sugli indicatori della domanda e sul regis...
 
M.A. Ciarallo, G. Spera, R. Renzi - Una strategia multi-modale di contatto de...
M.A. Ciarallo, G. Spera, R. Renzi - Una strategia multi-modale di contatto de...M.A. Ciarallo, G. Spera, R. Renzi - Una strategia multi-modale di contatto de...
M.A. Ciarallo, G. Spera, R. Renzi - Una strategia multi-modale di contatto de...
 
A. Golino, L’Indagine mensile sulle G randi I mprese: all’origine degli in...
A. Golino, L’Indagine mensile sulle G randi  I mprese:  all’origine  degli in...A. Golino, L’Indagine mensile sulle G randi  I mprese:  all’origine  degli in...
A. Golino, L’Indagine mensile sulle G randi I mprese: all’origine degli in...
 
A. Golino, L’Indagine mensile sulle Grandi Imprese: all’origine degli indica...
A. Golino, L’Indagine mensile sulle Grandi  Imprese: all’origine degli indica...A. Golino, L’Indagine mensile sulle Grandi  Imprese: all’origine degli indica...
A. Golino, L’Indagine mensile sulle Grandi Imprese: all’origine degli indica...
 
F. Tartamella - La revisione della stima dei redditi da lavoro dipendente
F. Tartamella - La revisione della stima dei redditi da lavoro dipendenteF. Tartamella - La revisione della stima dei redditi da lavoro dipendente
F. Tartamella - La revisione della stima dei redditi da lavoro dipendente
 
F.Ceccato, E. Cimino, Un focus sul processo di integrazione
F.Ceccato, E. Cimino, Un focus sul processo di integrazione F.Ceccato, E. Cimino, Un focus sul processo di integrazione
F.Ceccato, E. Cimino, Un focus sul processo di integrazione
 
L’obiettivo innovazione nella contrattazione di secondo livello, shock pandem...
L’obiettivo innovazione nella contrattazione di secondo livello, shock pandem...L’obiettivo innovazione nella contrattazione di secondo livello, shock pandem...
L’obiettivo innovazione nella contrattazione di secondo livello, shock pandem...
 
F.R. Pogelli, D. Tuzi Posizioni lavorative e costo del lavoro nelle imprese...
F.R. Pogelli, D. Tuzi   Posizioni lavorative e costo del lavoro nelle imprese...F.R. Pogelli, D. Tuzi   Posizioni lavorative e costo del lavoro nelle imprese...
F.R. Pogelli, D. Tuzi Posizioni lavorative e costo del lavoro nelle imprese...
 
B. Mazzotta - TAVOLA ROTONDA: Le esigenze informative delle amministrazioni a...
B. Mazzotta - TAVOLA ROTONDA: Le esigenze informative delle amministrazioni a...B. Mazzotta - TAVOLA ROTONDA: Le esigenze informative delle amministrazioni a...
B. Mazzotta - TAVOLA ROTONDA: Le esigenze informative delle amministrazioni a...
 
C. Baldi e C. Casciano, Opportunità e criticità nell’uso del registro dell...
C. Baldi e C. Casciano,  Opportunità e criticità nell’uso del registro dell...C. Baldi e C. Casciano,  Opportunità e criticità nell’uso del registro dell...
C. Baldi e C. Casciano, Opportunità e criticità nell’uso del registro dell...
 
A. Lucarelli, M. Sorrentino, Indicatori trimestrali su posti vacanti e ore l...
A. Lucarelli,  M. Sorrentino, Indicatori trimestrali su posti vacanti e ore l...A. Lucarelli,  M. Sorrentino, Indicatori trimestrali su posti vacanti e ore l...
A. Lucarelli, M. Sorrentino, Indicatori trimestrali su posti vacanti e ore l...
 
A. Zanardi, L'utilizzo dei micro-dati amministrativi: l'esperienza dell'Uffic...
A. Zanardi, L'utilizzo dei micro-dati amministrativi: l'esperienza dell'Uffic...A. Zanardi, L'utilizzo dei micro-dati amministrativi: l'esperienza dell'Uffic...
A. Zanardi, L'utilizzo dei micro-dati amministrativi: l'esperienza dell'Uffic...
 
Istat, Aula Magna 13 settembre 2013 - L’economia non osservata nei conti nazi...
Istat, Aula Magna 13 settembre 2013 - L’economia non osservata nei conti nazi...Istat, Aula Magna 13 settembre 2013 - L’economia non osservata nei conti nazi...
Istat, Aula Magna 13 settembre 2013 - L’economia non osservata nei conti nazi...
 
M. Ciarallo, Le indagini strutturali SES ed LCS: indicatori prodotti e intera...
M. Ciarallo, Le indagini strutturali SES ed LCS: indicatori prodotti e intera...M. Ciarallo, Le indagini strutturali SES ed LCS: indicatori prodotti e intera...
M. Ciarallo, Le indagini strutturali SES ed LCS: indicatori prodotti e intera...
 

More from Istituto nazionale di statistica

More from Istituto nazionale di statistica (20)

Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
14a Conferenza Nazionale di Statisticacnstatistica14
14a Conferenza Nazionale di Statisticacnstatistica1414a Conferenza Nazionale di Statisticacnstatistica14
14a Conferenza Nazionale di Statisticacnstatistica14
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 

Recently uploaded

San Giorgio e la leggenda del drago.pptx
San Giorgio e la leggenda del drago.pptxSan Giorgio e la leggenda del drago.pptx
San Giorgio e la leggenda del drago.pptxMartin M Flynn
 
Esperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superioreEsperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superiorevaleriodinoia35
 
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla CresimaIL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla CresimaRafael Figueredo
 
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.giuliofiorerm
 
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaXI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaStefano Lariccia
 
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaXIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaStefano Lariccia
 
CON OCCHI DIVERSI - catechesi per candidati alla Cresima
CON OCCHI DIVERSI - catechesi per candidati alla CresimaCON OCCHI DIVERSI - catechesi per candidati alla Cresima
CON OCCHI DIVERSI - catechesi per candidati alla CresimaRafael Figueredo
 
lezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldilezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldivaleriodinoia35
 
Corso di digitalizzazione e reti per segretario amministrativo
Corso di digitalizzazione e reti per segretario amministrativoCorso di digitalizzazione e reti per segretario amministrativo
Corso di digitalizzazione e reti per segretario amministrativovaleriodinoia35
 

Recently uploaded (9)

San Giorgio e la leggenda del drago.pptx
San Giorgio e la leggenda del drago.pptxSan Giorgio e la leggenda del drago.pptx
San Giorgio e la leggenda del drago.pptx
 
Esperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superioreEsperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superiore
 
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla CresimaIL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
 
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
RICERCA_SUGLI ANFIBI PER LA PRIMA MEDIA.
 
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaXI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
 
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaXIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
 
CON OCCHI DIVERSI - catechesi per candidati alla Cresima
CON OCCHI DIVERSI - catechesi per candidati alla CresimaCON OCCHI DIVERSI - catechesi per candidati alla Cresima
CON OCCHI DIVERSI - catechesi per candidati alla Cresima
 
lezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldilezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldi
 
Corso di digitalizzazione e reti per segretario amministrativo
Corso di digitalizzazione e reti per segretario amministrativoCorso di digitalizzazione e reti per segretario amministrativo
Corso di digitalizzazione e reti per segretario amministrativo
 

M.T. Buglielli, U. Guarnera - Una strategia di controllo e correzione e di editing selettivo basato sui dati amministrativi.

  • 1. Una strategia di controllo e correzione e di editing selettivo basato sui dati amministrativi. Seminario: “Innovazioni metodologiche e di processo in una rilevazione multi- source su imprese e istituzioni: la Struttura delle retribuzioni e del costo del lavoro 2012” Maria Teresa Buglielli, Ugo Guarnera, Marilena A. Ciarallo, Ciro Baldi Istat – Aula Magna, 17 febbraio 2015
  • 2. Indice 1. Schema generale del processo di C&C 2. Dati amministrativi ed editing selettivo 3. Editing deterministico e probabilistico 4. Imputazione mancata risposta totale 5. Macro editing e validazione 6. Conclusioni Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 3. Schema generale del processo di C&C Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 4. Schema generale del processo di C&C EDITING SELETTIVO IMPUTAZIONE MRT Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015 SOSTITUZIONE CON RACLI CALIBRAZIONE RCLRACLI DATI CORRETTI TOTALI FISSATI PROBABILISTICODETERMINISTICO MACROEDITING VALIDAZIONE DATI IMPUTATI DATI FINALI
  • 5. Editing selettivo • Insieme di tecniche per l’identificazione degli errori influenti • Obiettivo: dividere l’insieme dei dati in due sottoinsiemi – un insieme «critico» contenente gli errori potenzialmente influenti (editing interattivo) – un insieme contenente record supposti corretti o contenenti errori non influenti (editing automatico) • Elementi chiave: – ordinamento delle unità sulla base di una «funzione punteggio» – valore di soglia che determina il numero id unità da revisionare interattivamente Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 6. Editing selettivo basato su modello a classi latenti (Selemix) MSS ha sviluppato un metodo di editing selettivo basato su: 1) modellazione esplicita sia dei dati sia del meccanismo di errore (via modelli mistura) 2) definizione della funzione punteggio in termini della differenza tra valore osservato e valore atteso della distribuzione dei dati veri condizionatamente ai dati osservati Questo approccio permette di mettere in relazione la soglia di errore per la revisione interattiva all’errore residuo atteso nei dati Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 7. X Y* Y I modello dati veri modello d’errore Il modello dati amministrativi dati veri dati indagine indicatore d’errore Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 8. Variabili X (RACLI) • numero dipendenti • retribuzioni totali • ore retribuite Variabili Y (RCL) • ore retribuite • ore lavorate • retribuzioni totali • ........... Gli errori potenzialmente influenti sono stati individuati utilizzando diversi modelli che mettono in relazione le variabili elencate. Due passi di ES 1. selezione dei record per il ricontatto 2. selezione dei record per la sostituzione dei totali da RACLI Dati fonte RACLI nell’editing selettivo Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 9. Editing selettivo Caratteristiche della selezione dei record per ricontatto  in corsa  sia a livello di impresa che di unità territoriale  diversi modelli per le anomalie di ore retribuite e retribuzioni totali  individuazione errori influenti per sezione di ateco  retribuzione totale e ore retribuite di fonte amministrativa come covariate Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 10. Editing selettivo modello X Y N. outlier % outlier N. influenti % influenti Struttura retrib. retrib. RACLI tredicesima contributi TFR 1513 13,39 132 1,17 Ore Ore retribuite RACLI Ore lavorate e retribuite RCL 562 4,97 60 0,53 ALL dipend. ore retrib, retrib. totali RACLI dipendenti, ore retrib. retrib. totali RCL 1309 11,58 170 1,50 Totale imprese 2363 20,90 281 2,49 Risultati selezione per ricontatto su 11303 imprese Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 11. Outlier e influenti per retribuzione - Sezione N Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 12. Outlier e influenti per retribuzione - Sezione N Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015 Errore sistematico: sono le imprese interinali che hanno fornito i dati solo per il personale di staff
  • 13. Sostituzioni con RACLI IDEA I dati di fonte amministrativa forniscono i totali di riferimento per dipendenti, retribuzioni, ore retribuite Individuazione delle imprese con due metodi  editing selettivo  per raggruppamento di contratti  a livello di unità territoriale  per imprese non ricontattate o nuove rispondenti  confronti deterministici Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 14. Sostituzioni con RACLI - confronti deterministici  Il numero dei dipendenti se:  Errore localizzato  Si migliora l’accostamento delle variabili procapite con RACLI  I valori delle unità per cui a livello di impresa:  valori non rientrano in range di accostamento  imprese non soddisfano i criteri eccezione  I range di accostamento tengono conto di:  Dimensione di impresa  Differenti soglie per le ore  I criteri eccezione tengono conto di:  Possibili retribuzioni sopra il massimale imponibile  Retribuzioni accostate con i bilanci ma non con Racli (pochissimi casi)  Unità non misurate bene da RACLI (es. APSP) Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 15. Correzioni deterministiche • errori sistematici: si manifestano nei dati in modo consistente in una precisa direzione (retribuzioni per ferie,…) Correzioni probabilistiche • causati da fattori accidentali Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015 Editing automatico
  • 16. Metodologia Fellegi-Holt sviluppata nel 1976 per il trattamento delle variabili qualitative (con edit logici) e poi estesa al trattamento di variabili quantitative (con edit aritmetici: disuguaglianze lineari, rapporti, ..) Principi: 1. Le regole di incompatibilità (edit) devono essere soddisfatti cambiando il minimo numero di campi (principio del minimo cambiamento). 2. Le regole di imputazione devono essere derivate automaticamente da quelle di controllo. 3. Le distribuzioni marginali e congiunte dei dati non erronei devono essere preservate il più possibile. I. P. Fellegi and D. Holt (1976) ”A Sistematic Approach to Automatic Edit and Imputation”, Journal of the American Statistical Association, vol 71, n353, 17-35. Correzioni probabilistiche Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 17. Schema editing automatico CORREZIONI DETERMINISTICHE TOTALI FISSATI Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015 BANFF CONTROLLO ORE DATI VALIDATI Normali Agricoltura Cinema Scuole Marittimi Soc.sportive Interinali, … RETRIBUZIONE FERIE ANALISI NOTE BANFF STRUTTURA RETRIBUZIONE BANFF ALTRI ONERI BANFF APPRENDISTI DATI CORRETTI Normali Agricoltura Assicurazioni Cinema Edilizia Interinali Soc.sportive Normali Contributi alti Contributi bassi
  • 18. Metodologia Fellegi-Holt per le variabili quantitative Software disponibili: SAS BANFF insieme di procedure per l'individuazione di outlier e il controllo e la correzione di variabili numeriche continue sulla base di edit lineari Pacchetti R editrules check e localizzazione sulla base degli edit HotDeckImputation imputazione col metodo del donatore VIM imputazione col metodo del donatore Correzioni probabilistiche Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 19. Alcune correzioni deterministiche  Riallineamento dati rilevati con ASIA per imprese soggette a trasformazioni giuridiche  Problemi legati ai dati per ripartizioni  alcune correzioni di ripartizione errate  imprese che hanno centralizzato i valori delle retribuzioni e costo del lavoro  Problemi legati a valori non imponibili  annullamento di valori non imponibili dove ‘impossibili‘  scambio tra imponibile e non imponibile..  Azzeramento valori negativi indebiti Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 20. Correzioni deterministiche: le retribuzioni per ferie  Per circa il 50% delle imprese valori mancanti o implausibilmente bassi per retribuzioni per ferie, festività e permessi  Probabilmente a causa delle mancanza dell’informazione dai sistemi informativi  come per la nostra busta paga, in cui non c’è conteggio separato delle ferie  Numero troppo elevato per una correzione con donatore  Ricostruzione a partire dalle ore retribuite per ferie, festività e permessi (novità introdotta nel questionario) 𝑟𝑒𝑡𝑟𝑖𝑏𝑢𝑧𝑖𝑜𝑛𝑖 𝑝𝑒𝑟 𝑓𝑒𝑟𝑖𝑒, 𝑓𝑒𝑠𝑡𝑖𝑣𝑖𝑡à 𝑒 𝑝𝑒𝑟𝑚𝑒𝑠𝑠𝑖 = 𝑟𝑒𝑡𝑟𝑖𝑏𝑢𝑧𝑖𝑜𝑛𝑖 "𝑟𝑒𝑔𝑜𝑙𝑎𝑟𝑖" 𝑛. 𝑜𝑟𝑒 𝑜𝑟𝑑𝑖𝑛𝑎𝑟𝑖𝑒 𝑛. 𝑜𝑟𝑒 𝑟𝑒𝑡𝑟𝑖𝑏𝑢𝑖𝑡𝑒 𝑝𝑒𝑟 𝑓𝑒𝑟𝑖𝑒, 𝑓𝑒𝑠𝑡𝑖𝑣𝑖𝑡à 𝑒 𝑝𝑒𝑟𝑚𝑒𝑠𝑠𝑖 Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 21. Correzioni probabilistiche - Edit per BANFF Tabella EXCEL per la gestione degli Edit Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015  correzioni probabilistiche per sezione di questionario, condizionate alle correzione precedente  edit diversi per diversi raggruppamenti di contratti e segnali CIG  definiti in un file excel e gestiti automaticamente dal programma SAS sezione tipo Normali ore edit oreretft <= 2350 * dipft; ore edit oreretft >= 1200 * dipft; ore edit oreretft + oreindmft + orecigft <= 2500 * dipft; ore edit oreretft + oreindmft + orecigft >= 1400 * dipft;
  • 22. Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015 Percorso differenziato di C&C in presenza di note Esempio:’ Nel settore agricolo viene applicato uno sgravio del 68% sui contributi a carico ditta per le aziende ubicate nelle aree di cui all’obiettivo 1 della UE’. Fasi:  Lettura ed analisi di tutte le note in corrispondenza di valori anomali (ad es. dell’incidenza contributiva)  Estrazione di parole chiave (es. sgravio, fiscalizzazione, agevolazione, decontribuzione…)  Procedura che fa uso di espressioni regolari per identificare le unità «da salvare»  Percorso diversificato nell’ambito delle procedure di C&C
  • 23. Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015 Analisi delle note presenti sul questionario. Esempi Rapporto tra oneri sociali e retribuzioni molto alto a. Elevata incidenza di personale in CIG (importi per TFR e Contributi sociali versati, e retribuzioni basse) b. Personale in mobilità che ha usufruito di incentivi all’esodo c. Imprese che implicano lavori rischiosi e, quindi, soggetti a premi assicurativi elevati contro gli infortuni sul lavoro Caso di rapporto tra oneri sociali e retribuzioni molto basso a. Settori che non prevedono il TFR (Attività artistiche, sportive) e/o con retribuzioni molto più elevate rispetto ai limiti fissati per la contribuzione ordinaria. b. Imprese appartenenti a zone montane o altre aree ‘particolari’ che beneficiano di agevolazioni contributive per aree svantaggiate.
  • 24. Analisi delle non risposte Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015 Ore procapite RACLI – Rispondenti vs Non Rispondenti
  • 25. Imputazione delle MRT 1. Le variabili principali sono state attribuite da RACLI:  Dipendenti totali, full-time e part-time, apprendisti  Ore retribuite totali, full-time e part-time, apprendisti  Retribuzioni imponibili totali e degli apprendisti 2. Le altre variabili sono attribuite con donatore di minima distanza, tramite rapporto con le variabili principali La distanza è calcolata su: retribuzioni imponibili, dipendenti ed ore retribuite, FT,PT e apprendisti, flag che segnala la situazione di alta CIG In gruppi formati da imprese con:  stesso raggruppamento di CCNL  flag di struttura occupazionale (presenza di tipi di lavoratori - FT,PT ed apprendisti) Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 26. Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015 Controllo degli errori influenti residui (Macro – Editing) Macro editing effettuato in maniera Top-down sui seguenti indicatori: • Ore lavorate per dipendente • Retribuzioni orarie • incidenza dei contributi sociali totali rispetto alle retribuzioni; Scopo: individuare unità ancora affette da possibili errori di misura ovvero giustificare le anomalie Fasi:  Analisi grafica delle distribuzioni di parametri per celle di stima  Divisione ateco x ripartizione x classe dimensionale  Selezione di celle «outlier»  Analisi delle unità all’interno delle celle, partendo dalle più influenti
  • 27. Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015 Controllo degli errori influenti residui (Macro – editing) Selezione degli aggregati outliers
  • 28. Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015 Controllo degli errori influenti residui (Macro – editing) Analisi degli aggregati outliers • Nell’esempio, Divisione 50 «Trasporto Marittimo e per vie d’acqua». • Particolare per specificità dovute alla tipologia contrattuale – molte società beneficiano di riduzioni contributive. • Dati ritenuti validi ALTRI ESEMPI DI SETTORI PARTICOLARI: – Unità appartenenti al settore «Stampa e Servizi connessi alla stampa» . • Il CCNL prevede un contributo obbligatorio aggiuntivo ad un fondo specifico. • Sezione «R» – gli outliers corrispondono ad alcune società di calcio (alta retribuzione, bassi contributi).
  • 29. Riassumendo…il valore aggiunto dell’uso di RACLI  Confronto di variabili compresenti nell’indagine e nel registro ed individuazione valori anomali o Ricontatto delle imprese influenti o Sostituzione con i valori RACLI per le imprese non influenti  Imputazione delle MRT  Gruppi di edits e di imputazione per raggruppamenti di Contratti collettivi nazionali (CCNL), invece che Ateco. In teoria più determinanti per le variabili target  Informazioni più affidabili sulla CIG per differenziare le procedure di C&C a seconda dell’intensità di CIG  Es. Edits sulle ore e sui contributi differenziati per imprese ad alta cig  Gruppo di imputazione differenziato Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015
  • 30. Grazie per la pazienza! Seminario sulla Rilevazione sulla struttura delle retribuzioni e del costo del lavoro 2012 – Istat, 17 febbraio 2015