Intervento su "Iniziative di Data governance in regione Piemonte" - Seminario del Corso di Rappresentazione dell’InformazioneUniversità degli Studi di Milano – Bicocca
(12/01/2009) - seconda parte
Ascoltare gi utenti per migliorare i servizi ICT su cultura e turismo
Intervento su Data governance (genn 2009) parte 2
1. La raccolta e la conservazione della risorsa dati Caricamento delle informazioni Popolamento delle banche dati Scorrimento dei dati in superficie: accesso via web Scorrimento sotterraneo dei dati : accesso a servizi
2. Modellazione dati e semantica Livello interno alla Regione (sezione Regione) GOVERNO CONTENUTI DIGITALI Basi DatiDecisionali Regole di estrazione, integrazione e validazione dei dati Condivisione Dati PA Basi Dati Operazionali Gestione anagrafiche di riferimento (Master Data Management) Qualità dei dati (massiva e on-line) Gestione della sicurezza e normative sui dati Gestione del ciclo di vita delle informazioni Gestione dati storici Riuso Dati Pubblici Interscambio Metadati Repository, Semantica e Ontologie Certificazione qualità dei dati Regole di fornitura e fruizione dei dati Regole di accesso ai dati Regole condivise di trattamento dati Livello esterno alla PA (sezione pubblica) Portale di Valorizzazione e Accesso ai Dati Pubblici Livello interno alla PA (sezione PA)
3. Top Ontologies contiene solo un insieme molto ristretto di classi di alto livello, generali (ad es. “Entità", “Evento, “Ruolo”, …) non collegate ad alcun dominio particolare. Top-domain Ontologies contiene le classi “core” di tipo generale di un certo dominio (nel nostro caso La Pubblica Amministrazione) che si devono poter interfacciare da un lato con le “top ontologies e dall’altro con le “domain ontologies” (ad es. Soggetto Persona fisica) Domain Ontologies includono solo le classi specifiche di un certo dominio per descrivere un certo dominio in un modo comprensibile (ad es. Paziente, Operatore Sanitario in ambito sanitario). Modellazione dei concetti di alto livello Bene Soggetto Documento Unità organizzativa Territorio Ontologia PA Macroentità Entità Microentità Attributi Soggetto Persona fisica Persona giuridica Identificazione Nascita Residenza Identificazione tributaria Identif. sanitaria Fruizione serv. Sanitari Malattie e stati sanitari … Anagrafica soggetto Localizzazione Sede Nascita impresa … Nome Cognome Comune nascita Data nascita Comune di residenza Indirizzo Data di inizio residenza Codice Fiscale Tessera sanitaria ASL di iscrizione Medico di base Diabete Tossicodipendenze … Denominazione Codice fiscale Partita IVA Comune della sede Indirizzo Data di inizio localizz. Data di inizio attività …
4. Top Ontologies contiene solo un insieme molto ristretto di classi di alto livello, generali (ad es. “Entità", “Evento, “Ruolo”,…) non collegate ad alcun dominio particolare. Top-domain Ontologies contiene le classi “core” di tipo generale di un certo dominio (nel nostro caso La Pubblica Amministrazione) che si devono poter interfacciare da un lato con le “top ontologies e dall’altro con le “domain ontologies” (ad es. Soggetto Persona fisica) Domain Ontologies includono solo le classi specifiche di un certo dominio per descrivere un certo dominio in un modo comprensibile (ad es. Paziente, Operatore Sanitario in ambito sanitario). Modellazione dei concetti di alto livello Bene Soggetto Documento Unità organizzativa Territorio Macro Dominio : Sanità Macroentità Entità Microentità Attributi Soggetto Persona fisica Identificazione Nascita Residenza Identificazione tributaria Identif. sanitaria Fruizione serv. Sanitari Malattie e stati sanitari … Nome Cognome Comune nascita Data nascita Comune di residenza Indirizzo Data di inizio residenza Codice Fiscale Tessera sanitaria ASL di iscrizione Medico di base Diabete Tossicodipendenze …
5. Mappa concettuale dominio Sanità Prestazioni DEA Prescrizioni farmaceutiche Ricoveri Assistibili Strutture Sanitarie Medici di base Scelta e revoca Bene Soggetto Documento Unità organizzativa Territorio Ontologia PA
6. Analisi del sistema di banche dati sanità Cartografia (disordinata) banche dati sanitarie
7. Cartografia (organizzata) banche dati sanitarie Personale sanitario Assistiti Strutture sanitarie Pianificazione Controllo Analisi Epidemiologiche Debito informativo verso lo stato Informazione verso i cittadini Attività Territoriali Attività di Prevenzione Attività Ospedaliera
8. Processi di alimentazione e aggregazione dalle Aziende alla Regione Calcolo Indicatori Dw Prest Dw SDO Dw Farma PA Cedap PA Dati contabili Tempi attesa Dati di produzione Registrazione Ricette Anag. personale Flussi regionali Prest SDO F BAR Cedap FEC TA Presc. Farma Ruoli PA SPI SceRev CNU Scelta Revoca Stipendi
9. Mondo Gestionale Mondo Decisionale CATALOGO DATI E SERVIZI > Banche dati Operazionali Flussi Regionali Organizzazione a piramide dei dati sanitari Piani di attività / Controllo di gestione Sistema Indicatori Cruscotto Direzionale Medico di Base - Budget di distretto Assistito Strutture Data mart Trasversali Farmaceutica Ricoveri Pronto Soccorso Stipendi Ambulatoriale SPIDI Prenotazioni Screening Formazione AssenzePresenze ADI Data mart Settoriali Strutture Sanitarie Personale sanitario - Ruoli Assistibili - BAR Data mart Anagrafici
10. Gestione di anagrafiche Livello interno alla Regione (sezione Regione) GOVERNO CONTENUTI DIGITALI Basi DatiDecisionali Regole di estrazione, integrazione e validazione dei dati Condivisione Dati PA Basi Dati Operazionali Gestione anagrafiche di riferimento (Master Data Management) Qualità dei dati (massiva e on-line) Gestione della sicurezza e normative sui dati Gestione del ciclo di vita delle informazioni Gestione dati storici Riuso Dati Pubblici Interscambio Metadati Repository, Semantica e Ontologie Certificazione qualità dei dati Regole di fornitura e fruizione dei dati Regole di accesso ai dati Regole condivise di trattamento dati Livello esterno alla PA (sezione pubblica) Portale di Valorizzazione e Accesso ai Dati Pubblici Livello interno alla PA (sezione PA)
14. Gestione della qualità dei dati Livello interno alla Regione (sezione Regione) GOVERNO CONTENUTI DIGITALI Basi DatiDecisionali Regole di estrazione, integrazione e validazione dei dati Condivisione Dati PA Basi Dati Operazionali Gestione anagrafiche di riferimento (Master Data Management) Qualità dei dati (massiva e on-line) Gestione della sicurezza e normative sui dati Gestione del ciclo di vita delle informazioni Gestione dati storici Riuso Dati Pubblici Interscambio Metadati Repository, Semantica e Ontologie Certificazione qualità dei dati Regole di fornitura e fruizione dei dati Regole di accesso ai dati Regole condivise di trattamento dati Livello esterno alla PA (sezione pubblica) Portale di Valorizzazione e Accesso ai Dati Pubblici Livello interno alla PA (sezione PA)
15.
16. L’idea di certificazione di qualita’ per i dati S.I. utente delle risorse di A Interfaccia dei servizi Implementazione dei servizi offerti Risorse dati Anagrafe Consistenza Tempestività Flusso dati Sistema A Contratto livelli di servizio (SLA) + Contratto qualità dei dati (QLA) + Certificato di qualità + Ci si attende che questo scenario fornisca motivazioni forti per nuovi investimenti in progetti di qualità dell’informazione
17.
18. Qualità dei dati: assoluta o relativa? La qualità di un dato non è qualcosa di assoluto, ma dipende dall’utilizzo che si vuole fare del dato. Un consumatore per acquistare un prodotto sa l’uso che ne vuole farne e attraverso le “ etichette ” presenti sul prodotto può decidere se è adeguato a tale uso. Qualità dei dati
19.
20. Modelli per l’analisi della qualità Un modello per l’analisi della qualità è un insieme di regole che permette, sulla base dei valori dei metadati associati ad un dato, di: Determinare se un dato è di qualità accettabile o no (Più in generale) quantificare il livello di – buona o cattiva – qualità del dato. In quest’ultimo caso il modello diventa in effetti un modello di classificazione , permettendo di effettuare una classificazione dei dati, suddividendoli (in una scala più o meno fine) in base alla loro maggiore o minore qualità.
21. Vista architetturale di alto livello per il calcolo e il delivery del CQ Servizi SI SI Dati Indicatori di qualita’ SI Certificazione di qualita’ Modelli di decisione Definizione dei criteri di qualita’ Certificato di qualita’ +
22. Avvio la ricerca dati attraverso il catalogo Information Directory Ricerca di una fornitura dati Avvio l’analisi della qualità della fornitura dati che mi interessa Verifico le forniture dati disponibili Scelgo la fornitura dati Voglio verificarne la qualità?
23. A cosa mi servono? L’analisi della qualità: identificazione del contesto d’uso Identifico il contesto d’uso dei dati Nessun contesto si adatta alle mie esigenze? Voglio scegliere io cosa esaminare? Elaboro il modello predefinito Scelgo il modello libero Il contesto d’uso è adeguato ma voglio adattarlo alle mie specifiche esigenze? Scelgo di personalizzare il modello
25. Il livello di qualità dei dati è soddisfacente per l’utilizzo che ne devo fare? L’analisi della qualità: verifica dei risultati e decisione Ho necessità di maggiori dettagli per decidere? Voglio “acquistare” la fornitura? Verifico lo “score” di qualità dei dati ovvero la distribuzione dei dati per livelli di qualità Verifico ciascun criterio analizzato attraverso il certificato di qualità Acquisto l’intera fornitura Acquisto solo i dati che hanno qualità soddisfacente per le mie esigenze
32. Anagrafe Obbligo Formativo: gli obiettivi ed i problemi Obiettivo principale : contenere la dispersione aiutando e orientando il soggetto insolvente agli obblighi di legge, a maturare una scelta formativa (scuola, formazione professionale, apprendistato). Metodo : estrazione periodica di allievi in età di obbligo formativo che risultano non frequentare corsi scolastici, di formazione professionale o di apprendistato. E’ poi compito dei Centri per l’Impiego individuare e contattare i soggetti a rischio ed effettuare tutte le azioni di orientamento previste dalla legge Problemi emersi : numerosi casi di “ falsi dispersi ”!
33.
34.
35.
36.
37.
38.
39.
40.
41.
42. Porting SILP Vercelli Nei processi di porting, sono state integrate numerose funzionalità specifiche di data quality allo scopo di: Asti Cuneo SILP Torino DB Operazionale DB Operazionali ETLq Alessandria Verbania Novara
43.
44.
45. Anagrafe Tributaria Comunale (ATC) - situazione MainFrame Anagrafe Tributaria Comunale – dati anagrafici DEMOGRAFIA Indirizzo di Residenza ANAGRAFE INTEGRATIVA Anagrafica Contribuente Persona Fisica Anagrafica Contribuente Persona Giuridica Domicilio Fiscale Indirizzo di Residenza (soggetti non residenti in Torino) Centralizza le anagrafiche dei contribuenti, persone fisiche e giuridiche, per i diversi sistemi informativi tributari (ICI, TARSU, ICIAP,CIMP, COSAP) e per la divisione commercio (SIAP) Anagrafica Contribuente Residenti Persona Fisica
46.
47.
48.
49.
50.
51.
52.
53. AAEP – il servizio di normalizzazione indirizzi AAEP Batch PL/SQL (giornaliero) Infocamere Tributi Servizio normalizzazione indirizzi (giornaliero) Batch PL/SQL (giornaliero) Risultati: sono stati normalizzati il 99% degli indirizzi e associati ai dati dello stradario regionale l’ 84% degli indirizzi sul totale dei record (2.900.000 ca). INAIL Formazione Professionale Agricoltura
54. Indirizzi AAEP: il match con lo Stradario Unico Regionale AAEP STRADARIO REGIONALE
55.
56. Servizio di Postalizzazione DQ Rules Indirizzi DQ Engine CAP Professional Poste Italiane Stradario Unico Regionale Toponomastica Comune Torino Fonti dati di Riferimento Indirizzi Indirizzi Indirizzi bonificati e strutturati per la spedizione
57.
58.
59. Servizio di Vestizione anagrafica Anagrafiche PF e PG Incomplete Non aggiornate Non corrette DQ Engine DQ Rules PF e PG Anagrafiche PF e PG arricchite e bonificate Servizio Postalizzazione Demografia Comune di Torino Demografia Comuni Piemontesi Infocamere Fonti dati di Riferimento PF e PG
60. Introduzione del “Firewall” di Qualità Fruitore ..n Modello concettuale dei dati Regole di qualità DQ Repository Enterprise DQ server Enterprise Service Broker Modello Metadati di qualità Forma Canonica Descrizione business dei dati Filtro sui dati in base al valore dei metadati DQ Alim 1 Alim 2 Alim 3 Alim ..n Fruitore 1 Fruitore 2 Fruitore 3 DQ Dati + Metadati DQ DQ Firewall DQ DQ DQ DQ Firewall 2 DQ Firewall 3 DQ Firewall ..n Dati DQ Firewall 1
The integrated framework shown in this slide should provide business users with a seamless environment that gives them easy, but secure, access to the business processes, business information, and collaboration tools they need to do their jobs. Furthermore, the framework should make it easy for IT staff to evolve with new developments in information and collaboration technologies, and allow them to install products without the need for significant integration work. An integrated business process, business information, and collaboration framework can be built using best of breed-of-breed tools, using suites of products purchased from multiple vendors, or using an integrated platform supplied by a single vendor. Whereas purchasing best-of-breed products may, in theory, provide the best functionality, experience shows that often this functionality cannot be fully realized because products cannot be seamlessly integrated. Integrating best-of-breed products is complex and resource intensive. This complexity leads to project delays and frustration by business users because products do not work well with each other. Often the most effective solution for the rapid deployment of a smart business is to buy an integrated platform from a single vendor, and integrate any missing features using best-of-breed products. This enables projects to be deployed faster, and provides better functionality and usability for business users. The single platform approach also usually results in a lower total cost of ownership.
Obiettivi del progetto: formalizzare la nozione di certificato di qualita’ dei dati Capire come il certificato interagisce con il client (viene fornito al client e il client lo elabora? In che forma viene fornito al client? Viene utilizzato nell’ambito di un agreement tra il provider e il client per filtrare i dati e fornire solo quelli che raggiungono un livello buono di qualita’? Il client paga di piu’ dati di buona qualita’; il provider paga penali per dati di cattiva qualita’?) Effettuare modelli di stima della qualita’ sulla base degli indicatori contenuti nel certificato Individuare diverse opzioni per il modello di businnes Descrivere un’architettura di supporto al modello Realizzare un prototipo dimostrativo basato sugli ambienti software disponibili presso il CSI Piemonte.
Obiettivi del progetto: formalizzare la nozione di certificato di qualita’ dei dati Capire come il certificato interagisce con il client (viene fornito al client e il client lo elabora? In che forma viene fornito al client? Viene utilizzato nell’ambito di un agreement tra il provider e il client per filtrare i dati e fornire solo quelli che raggiungono un livello buono di qualita’? Il client paga di piu’ dati di buona qualita’; il provider paga penali per dati di cattiva qualita’?) Effettuare modelli di stima della qualita’ sulla base degli indicatori contenuti nel certificato Individuare diverse opzioni per il modello di businnes Descrivere un’architettura di supporto al modello Realizzare un prototipo dimostrativo basato sugli ambienti software disponibili presso il CSI Piemonte.