Autori: Ballin, Bosio, Fardelli, Gargano, Orsini, Pagano, Radini, Scialanca, Vaste. Referente: O. Gargano, Verso il Registro Statistico degli Indirizzi: l'integrazione di archivi amministrativi
B. Mazzotta - TAVOLA ROTONDA: Le esigenze informative delle amministrazioni a...
Similar to Autori: Ballin, Bosio, Fardelli, Gargano, Orsini, Pagano, Radini, Scialanca, Vaste. Referente: O. Gargano, Verso il Registro Statistico degli Indirizzi: l'integrazione di archivi amministrativi
Similar to Autori: Ballin, Bosio, Fardelli, Gargano, Orsini, Pagano, Radini, Scialanca, Vaste. Referente: O. Gargano, Verso il Registro Statistico degli Indirizzi: l'integrazione di archivi amministrativi (20)
Autori: Ballin, Bosio, Fardelli, Gargano, Orsini, Pagano, Radini, Scialanca, Vaste. Referente: O. Gargano, Verso il Registro Statistico degli Indirizzi: l'integrazione di archivi amministrativi
1. Verso il Registro
Statistico degli Indirizzi:
l’integrazione di archivi
amministrativi
Autori: BALLIN, BOSIO, FARDELLI, GARGANO,
ORSINI, PAGANO, RADINI, SCIALANCA, VASTE.
a cura del referente: Orietta GARGANO
Istat – Primo tecnologo
0
2. ① Contesto di riferimento
② Obiettivi
③ Metodologia e processo di costruzione del RSBL-Ind
④ La normalizzazione degli indirizzi
⑤ Indicatori di qualità
⑥ I riferimenti territoriali
⑦ Risultati
⑧ Il ruolo del Codice Univoco Indirizzo nel SIR
⑨ Prospettive future
1
Punti della presentazione
A cura di: Orietta GARGANO
ISTAT - Primo tecnologo
3. 2
A cura di: Orietta GARGANO
ISTAT - Primo tecnologo
2
Contesto di riferimento
Il Sistema Integrato dei Registri (SIR) è uno dei principali asset previsti dal processo di
modernizzazione dell’Istituto. Il SIR è una base «micro fondata» che garantisce una gestione unitaria
delle diverse tematiche (sociali, ambientali, economiche, etc.) ed una integrazione concettuale e
statistica oltre che fisica tra le unità statistiche che lo compongono.
Le principali componenti del SIR sono i Registri Statistici di Base (RSB) , costituiti da unità statistiche
(es. individui, unità economiche, comuni, indirizzi, etc.), connesse fra di loro. Dalle caratteristiche
delle Unità statistiche in ogni indirizzo è possibile identificare una o più popolazioni statistiche (es.
Popolazioni Residenti, Imprese Attive, Comuni Litoranei, etc.)
Registro Statistico Base
dei Luoghi (RSBL)
Registro Statistico Base degli
individui e delle famiglie (RBI)
Registro Statistico Base delle
Unità produttive (RBUP)
4. 3
A cura di Orietta GARGANO
3
Obiettivi
ISTAT - Primo tecnologo
5. ISTAT – Primo tecnologo
4
Metodologia e processo di costruzione del Registro –
Fase 1
Acquisizione e pretrattamento degli indirizzi:
dell’Archivio Nazionale delle Strade e dei
Numeri Civici (ANSC)
delle Liste Anagrafiche Comunali (LAC)
di Anagrafe Tributaria (AT)
Il pretrattamento dei dati che provengono dagli
archivi amministrativi è effettuato con l’ausilio
del Sistema Integrato dei Microdati (SIM)
ANSC Area di
STAGING
ANSC
LAC
ATSIM
Analisi
pretrattamento
A cura di Orietta GARGANO
6. A cura di Orietta GARGANO
ISTAT – Primo tecnologo
5
Metodologia e processo di costruzione del Registro –
Fase 2
Standardizzazione degli indirizzi
Step di riconoscimento e normalizzazione
dell’input tramite una versione
personalizzata del software commerciale
EGON, finalizzata a fornire in output:
o la riconduzione degli indirizzi alla forma
standard,
o un match con gli indirizzi ANSC,
o l’attribuzione dei codici identificativi
univoci EGON del numero civico o della
strada
Area fonti
NORMALIZZATE
ANSC
LAC
AT
Catasto
FASE 2 - Normalizzazione
ANSC
Per velocizzare l’operatività con EGON l’Istat ha
realizzato un’interfaccia che si fa carico di gestire in
maniera strutturata input e output del processo di
normalizzazione
7. A cura di Orietta GARGANO
ISTAT – Primo tecnologo
6
Metodologia e processo di costruzione del Registro –
Fase 3
Analisi dell’output finalizzata alla
Identificazione degli indirizzi per
chiave di linkage (codici identificativi
EGON). Questa identificazione
consente l’integrazione degli indirizzi
che provengono da archivi di diversa
fonte e l’alimentazione del Thesaurus.
Attribuzione del Codice Univoco
Indirizzo (CUI) alla forma ufficiale
dell’indirizzo. Attribuzione sezione di
censimento, coordinate e comune
dichiarato nella fonte.
INDIRIZZI
THESAURUS
FASE 3 – Popolamento della
componente indirizzi di RSBL
NO LINKED
Costruzione ed
Alimentazione
Coordinate
Sezioni
Comuni
Forma ufficiale con
CUI distinti
Diverse forme dell’indirizzo
ufficiale per ogni fonte
Indirizzi non riconosciuti
8. A cura di Orietta GARGANO
ISTAT – Primo tecnolgo
7
Individuazione dell’archivio di riferimento, o master
INDIRIZZI
THESAURUS
NO LINKED
ANSC
SIM LAC
SIM AT
Il processo di caricamento nel
Registro (tabella INDIRIZZI) è
stato effettuato dando
priorità alle fonti:
L’archivio ANSC determina
la forma ufficiale
dell’indirizzo ed è il nucleo
della componente
indirizzi,
Seguono, nel primo
impianto, le fonti LAC e AT
Gli indirizzi ANSC sono confluiti nel Registro nella loro totalità, ne costituiscono il nucleo e sono il
benchmark a cui riferire gli indirizzi che provengono da altri archivi amministrativi
9. A cura di Orietta GARGANO
ISTAT – Primo tecnologo
8
Indicatori di qualità
INDIRIZZI
A = Indirizzo linked
sino al civico
B = Indirizzo linked
sino alla strada (no
civico)
C = Indirizzo non
riconosciuto
Gli Indicatori di
qualità sono
determinati
dall’identificazio
ne dell’indirizzo
nei due insiemi
ANSC ed EGON
AA
AB
BA
BB
CA CB
CC
X , Y
XY = AA: Indirizzi riconosciuti fino al
civico sia in ANSC sia in EGON
XY = CC: Indirizzi scartati ed inseriti
nei no linked
Le diverse composizioni della coppia XY
identificano il livello della qualità
10. A cura di Orietta GARGANO
ISTAT – Primo tecnologo9
I riferimenti territoriali: geocodifica e coordinate (1)
Ad ogni CUI il processo di
normalizzazione può
riuscire ad associare tre
codici di sezioni di
censimento dichiarate da
tre fonti diverse e due
coppie di coordinate
geografiche (fonte: grafi
commerciali)
11. A cura di Orietta GARGANO
ISTAT – Primo tecnologo
10
I riferimenti territoriali: geocodifica e coordinate (2)
12. A cura di Orietta GARGANO
ISTAT – Primo tecnologo
11
Risultati (1)
Gli indirizzi caricati nel Registro e gli indicatori di identificazione associati (indicatori della qualità):
13. A cura di Orietta GARGANO
ISTAT – Primo tecnologo
12
Risultati (2)
Le sezioni di censimento e le coordinate geografiche che qualificano gli indirizzi:
14. A cura di Orietta GARGANO
ISTAT – Primo tecnologo
13
Il ruolo del CUI nel SIR
Nello schema è rappresentata
l’integrazione fisica dei Registri
che avviene tramite
identificazione delle unità
statistiche di ogni registro.
Per la componente Indirizzi
questo ruolo è ricoperto dal
CUI
15. A cura di Orietta GARGANO
ISTAT – Primo tecnologo
14
Prospettive future