D. Aprile, M. Magarò, M. Crea, 30 Novembre - 1 Dicembre 2021 -
Webinar: Innovazioni nell'infrastruttura tecnologica Istat
Titolo: L'Istat per la condivisione delle informazioni. L'infrastruttura tecnologica a supporto della valorizzazione dei registri statistici
Esperimenti_laboratorio di fisica per la scuola superiore
14a Conferenza Nazionale di Statistica
1. Le innovazioni
nell'infrastruttura
tecnologica ISTAT
L'Istat per la condivisione delle informazioni. Un nuovo
importante passo in avanti: l'infrastruttura tecnologica a
supporto della valorizzazione delle informazioni dei registri
Domenico Aprile Mario Magarò
CTER VI Livello | Istat CTER IV Livello | Istat
Mariano Crea
CTER IV Livello | Istat
30.11.2021
2. o Il contesto di riferimento
o L’iniziativa RAF in ISTAT
o L’architettura del RAF
o La dashboard realizzata – area Imprese
o Le sfide affrontate
o Obiettivi raggiunti dal RAF
o Ricadute per l’Istituto
o Sfide future
Indice
2
LE INNOVAZIONI NELL'INFRASTRUTTURA TECNOLOGICA ISTAT | DOMENICO APRILE
3. Il contesto di riferimento
3
Il RAF è la nuova
infrastruttura statistica e tecnologica per la valorizzazione del potenziale informativo dei Registri
dell’Istat
GARANTIRE L’EROGAZIONE DI
SERVIZI AFFIDABILI E DI QUALITÀ
FAVORIRE L’AGILITÀ E LA SEMPLICITÀ
DI ACCESSO AL PATRIMONIO
INFORMATIVO
EFFICACE TIME-TO-MARKET NELLA
COSTITUZIONE DELLE INFORMAZIONI
GRANULARITÀ, FLESSIBILITÀ E
MULTIDIMENSIONALITÀ DEL DATO
ESPORRE CONTENUTI E GESTIRE LA
CONFIDENZIALITA’
PROMUOVERE L’UNIFORMITÀ
TECNOLOGICA
RAF
MIGLIORARE LA USER EXPERIENCE
PER MOLTEPLICI CLASSI DI UTENZA
LE INNOVAZIONI NELL'INFRASTRUTTURA TECNOLOGICA ISTAT | DOMENICO APRILE
4. L’iniziativa RAF in ISTAT
4
INTEGRAZIONE BASE DATI
ARCHITETTURA TECNOLOGICA
METADATI
REGISTRI
COMUNICAZIONE, UTENZA E REGOLE DI
ACCESSO
ARCHITETTURA INFORMATIVA E
METODOLOGICA
SICUREZZA INFORMATICA, ORGANIZZATIVA E
PRIVACY
Il percorso intrapreso nella progettazione e costruzione del RAF ha interessato varie tematiche
trasversali all’interno dell’Istituto che sono state approfondite nell’ambito dei gruppi di lavoro.
La DCIT si è interfacciata con ciascun sottogruppo per recepirne i requisiti e contribuire alla
definizione della soluzione, considerando anche gli aspetti tecnologici
LE INNOVAZIONI NELL'INFRASTRUTTURA TECNOLOGICA ISTAT | DOMENICO APRILE
5. o L’architettura RAF acquisisce i dati provenienti dai Registri
(micro e macrodati) I dati di input vengono strutturati,
aggregati, anonimizzati (no indicazione singola impresa o
cittadino) e messi a disposizione per le elaborazioni
successive.
o I dati dei Registri vengono elaborati ed organizzati in
datamart (tabelle materializzate) su DB Oracle. Tutti i DM
hanno come dimensione in comune il Territorio, Tempo che
definisce gli anni di esercizio, Ateco, ecc..
o Le dimensioni di analisi sono strutturate con uno o più livelli
gerarchici. Le dimensioni sono predisposte per la gestione
del multilinguismo delle relative descrizioni.
o Il catalogo dei metadati mappa tutti gli elementi trattati e
visibili dall’utente finale rispetto a quanto presente sul SUM.
o Il layer di virtualizzazione si occupa di mappare le tabelle dei
datamart (fatti e dimensioni) 1:1 creando delle viste
virtualizzate. Effettua il calcolo degli indicatori da esporre sul
Front End.
o Per ogni misura di analisi su cui è necessario applicare regole
di offuscamento, vengono definite delle soglie di
visualizzazione, che consentono al Front End di applicare
regole di visibilità in base a tali soglie.
o Lo strumento di Front End mette a disposizione i nodi
informativi e dashboard.
L’architettura del RAF
5
RAF – layer integrato
Predisposizione job per l’acquisizione dei dati dai Registri
Dashboarding Self BI Data Discovery
Registri
RTL RBI Frame Territoriale
Frame SBS
RAF_MART_UNITA_LOCALI
SUM
Catalogo
metadati
Data Virtualization
RAF_MART_TERRITORIO
_PRODUTTIVITA
RAF_MART_TERRITORIO
_RESIDENTI
Viste virtualizzate, mapping 1:1 con le
tabelle fatti e dimensioni dei DM
Elaborazione
dati
Modello dati per il FrontEnd
RAF_MART_IMPRESE
LE INNOVAZIONI NELL'INFRASTRUTTURA TECNOLOGICA ISTAT | DOMENICO APRILE
Data Science
6. La dashboard realizzata – area Imprese
6
LE INNOVAZIONI NELL'INFRASTRUTTURA TECNOLOGICA ISTAT | DOMENICO APRILE
7. Le sfide affrontate
7
Integrazione con
SPID/CIE per l’accesso
tramite utenze SPID,
Social e utenti stranieri
(Sistema Utenti ISTAT)
Approfondimenti
sull’accessibilità dello
strumento di Front End
per esposizione
dashboard e self service
BI
Definizione
dell’accountability (profili,
ruoli e utenti)
Realizzazione del layer
virtuale per la gestione di
gerarchie multiple, regole
di priorità, pseudo
anonimizzazione
Integrazione strumenti di
virtualizzazione e di
dashboard ed esecuzione
dei test di vulnerabilità
LE INNOVAZIONI NELL'INFRASTRUTTURA TECNOLOGICA ISTAT | DOMENICO APRILE
8. o Scelta dei prodotti di Data Visualization e Data Science e PoC di approfondimento
o Definizione dell’architettura RAF
o Predisposizione degli ambienti di Data Science, Data Virtualization, ETL, Data Visualization e
integrazione con il sistema di autenticazione unica dell'Istituto (SSO)
o Progettazione e prima realizzazione della base dati del RAF (nodi informativi)
o Predisposizione della base dati per la gestione dei metadati statistici e delle loro peculiarità e gestione
del multilinguismo
o Analisi di accessibilità sullo strumento di Data Visualization e innalzamento del livello di accessibilità
mediante collaborazione con i fornitori
o Mappatura dei profili Istat per l’accesso al front end di data visualization
o Analisi e predisposizione della prima dashboard sulla base dei requisiti
Obiettivi raggiunti
8
LE INNOVAZIONI NELL'INFRASTRUTTURA TECNOLOGICA ISTAT | DOMENICO APRILE
9. o Riuso della piattaforma tecnologica su differenti iniziative con applicazione delle modalità operative,
dell’infrastruttura e dei prodotti su nuovi progetti (ad es. Alert Cov)
o Infrastruttura abilitante alla gestione standardizzata della fase di passaggio dal micro dato validato al
macro dato
o Analisi dei rischi correlata alla integrazione dei dati
o Definizione di un nuovo paradigma di interazione con i dati e informazioni
o Crescente esperienza nella gestione e governance di progettualità multi-disciplinari e trasversali
nell’Istituto
Ricadute per l’Istituto
9
LE INNOVAZIONI NELL'INFRASTRUTTURA TECNOLOGICA ISTAT | DOMENICO APRILE
10. o Messa a disposizione dei nodi informativi senza identificativi
o Gestione degli accessi in base alle regole di confidenzialità e relativo completamento
integrazione con il sistema di autenticazione mediante l’identità digitale
o Porting ETL in ambiente di Data Integration finale con software dedicato
Sfide future
10
LE INNOVAZIONI NELL'INFRASTRUTTURA TECNOLOGICA ISTAT | DOMENICO APRILE
11. Grazie per l’attenzione
Domenico Aprile - aprile@istat.it
Mario Magarò - magaro@istat.it
Mariano Crea - crea@istat.it
Ringraziamenti