Gruppo Valorizzazione delle Statistiche Pubbliche  Making Decisions: the role of statistics for knowledge and governance  ...
Obiettivi  Evidenziare fattori di contesto per lincidentalità stradale, con particolare attenzione agli aspetti socio-san...
Fonti dei dati:La rilevazione degli incidenti stradali con lesioni a persone (I)    L’informazione statistica sull’incide...
Fonti dei dati:Rilevazione degli incidenti stradali con lesioni a persone (II) Da: gruppo FAD incidenti stradaliWorkshop S...
Fonti dati:l’indagine su decessi e cause di morte  I dati sulle cause di morte sono raccolti, elaborati e pubblicati corr...
Costruzione dei data set di sperimentazione                        Selezione degli                       eventi relativi a...
Difficoltà nella procedura di integrazioneLa procedura di integrazione presenta alcune difficoltà: non esiste un identifi...
Dettagli sulla procedura di integrazione  Il metodo di abbinamento di tipo probabilistico utilizzato è  basato sul modello...
Strumenti utilizzati: RELAISPer realizzare l’abbinamento è stato utilizzato l’applicativo RELAIS       RELAIS (Record Link...
Il modello di Fellegi Sunter                   Le variabili di match (in numero non inferiore a 3) devono                 ...
Il modello di Fellegi Sunter                     Per i PM * è necessaria una revisione puntualeWorkshop SIS 2012: T.Tuoto,...
Variabili di Match         Cause di morte                                                  Incidenti stradali             ...
Primi risultatiUtilizzando le variabili di match ottenute dalla concatenazione eapplicando il comparatore di stringhe di J...
Primi risultatiLa procedura ha individuato 202 MATCHL’errore stimato dal modello è il seguente: 0,054 mancato abbinamento...
Progetti futuri   Analisi dettagliata dei residui   Cercare di perfezionare l’abbinamento con interventi di       custom...
cWorkshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo                              ...
Workshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo                               ...
Upcoming SlideShare
Loading in...5
×

sisvsp2012sessione3_bruzzone_tuoto_cibella_valentini_pappagallo_baldassarre

259

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
259
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

sisvsp2012sessione3_bruzzone_tuoto_cibella_valentini_pappagallo_baldassarre

  1. 1. Gruppo Valorizzazione delle Statistiche Pubbliche Making Decisions: the role of statistics for knowledge and governance Roma 19-20 aprile 2012Verso un sistema integrato di sorveglianza degli incidenti stradali Tiziana Tuoto Silvia Bruzzone Luca Valentino Giordana Baldassarre Nicoletta Cibella Marilena Pappagallo
  2. 2. Obiettivi  Evidenziare fattori di contesto per lincidentalità stradale, con particolare attenzione agli aspetti socio-sanitari;  fornire una panoramica integrata sui dati riferiti agli incidenti stradali e alle cause di morte che l’Istat rileva correntemente. A tale proposito è stata effettuata l’integrazione tra le due fonti di dati mediante l’utilizzo di tecniche di record linkage;  arricchire le informazioni sulle circostanze di incidente stradale, caratteristiche della strada e dei veicoli con le informazioni mediche sulle cause di morte e anagrafiche per ogni singolo individuo coinvolto;  contribuire all’aggiornamento di sistemi di indicatori su salute pubblica e sicurezza.Workshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 2
  3. 3. Fonti dei dati:La rilevazione degli incidenti stradali con lesioni a persone (I)  L’informazione statistica sull’incidentalità è raccolta dall’Istat mediante una rilevazione totale a cadenza mensile degli incidenti stradali verificatisi sull’intero territorio nazionale che hanno causato lesioni alle persone (morti entro il 30° giorno e feriti).  Il campo di osservazione comprende tutti gli incidenti stradali verbalizzati da un’autorità di polizia, accaduti in aree aperte alla pubblica circolazione e che hanno causato lesioni a persone, morti e/o feriti, con il coinvolgimento di almeno un veicolo. Workshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 3
  4. 4. Fonti dei dati:Rilevazione degli incidenti stradali con lesioni a persone (II) Da: gruppo FAD incidenti stradaliWorkshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 4
  5. 5. Fonti dati:l’indagine su decessi e cause di morte  I dati sulle cause di morte sono raccolti, elaborati e pubblicati correntemente dallIstat;  i dati su decessi e cause di morte vengono raccolti mediante la scheda di morte Istat, predisposta in accordo con lo standard proposto dall’OMS e secondo le raccomandazioni del Ministero della Salute;  per ogni decesso viene rilevato il nome e cognome dell’individuo, e una serie di informazioni socio-demografiche e sanitarie;  nella sezione A della scheda di morte compilata dal medico certificatore, è descritta la sequenza completa delle malattie e le eventuali circostanze traumatiche che hanno condotto al decesso;  i dati considerati in questo studio si riferiscono alla causa di morte iniziale, ossia la causa principale che ha scatenato il processo morboso che ha condotto alla morte.Workshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 5
  6. 6. Costruzione dei data set di sperimentazione Selezione degli eventi relativi alla regione Toscana Anno 2008 Coinvolti in incidenti stradali FeritiCause di morte 321 obsIncidenti stradali 291 obs Cause di Morte Cause di morte non legate ad incidente Decessi per stradale incidente stradaleWorkshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 6
  7. 7. Difficoltà nella procedura di integrazioneLa procedura di integrazione presenta alcune difficoltà: non esiste un identificativo univoco che permette di collegare leentità nelle due fonti; nomi e cognomi dei deceduti sono presenti in entrambe le fontima (specialmente nella rilevazione degli incidenti stradali) sonovariabili soggette ad errori e ad omissioni; alcune variabili, utilizzate come variabili di confronto, siriferiscono ad eventi correlati ma provenienti dalle due diverse fonti(evento incidente ed evento morte); nella fonte degli incidenti stradali nel caso di incidente con più diun decesso non è possibile stabilire la relazione tra le variabili sessoed età e nominativo; non è possibile avere una sovrapposizione esatta delle due fonti.Workshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 7
  8. 8. Dettagli sulla procedura di integrazione Il metodo di abbinamento di tipo probabilistico utilizzato è basato sul modello di Fellegi-Sunter Il metodo probabilistico assegna ad ogni coppia di record una probabilità di rappresentare un MATCH (si definisce un MATCH una coppia di osservazioni che rappresentano la stessa entità). I vantaggi nell’utilizzo di un metodo probabilistico sono principalmente: Eliminare soggettività nella definizione della procedura Avere una valutazione qualitativa del risultato ottenutoWorkshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 8
  9. 9. Strumenti utilizzati: RELAISPer realizzare l’abbinamento è stato utilizzato l’applicativo RELAIS RELAIS (Record Linkage At Istat) è un toolkit sviluppato in ISTAT che raccoglie una collezione di tecniche utili per risolvere problemi di record linkage. Alcune caratteristiche del software: E’ un software open source e si può scaricare liberamente dal sito dell’ISTAT (www.istat.it) Offre un modello decisionale probabilistico basato sulla teoria di Fellegi-Sunter (utilizza l’algoritmo di stima EM) Presenta un’interfaccia intuitiva facile da utilizzare anche per i non esperti Il manuale documenta adeguatamente il software ed i metodi propostiWorkshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 9
  10. 10. Il modello di Fellegi Sunter Le variabili di match (in numero non inferiore a 3) devono avere alto potere identificativo non essere correlateWorkshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 10
  11. 11. Il modello di Fellegi Sunter Per i PM * è necessaria una revisione puntualeWorkshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 11
  12. 12. Variabili di Match Cause di morte Incidenti stradali Data Mese decesso Mese incidente Giorno decesso Giorno incidente Luogo Provincia decesso Provincia incidente Comune decesso Comune incidente Sesso ed Età Età del deceduto Età del coinvolto Sesso del deceduto Sesso del coinvolto Nominativo Nome del deceduto Nome del coinvolto Cognome del deceduto Cognome del coinvoltoWorkshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 12
  13. 13. Primi risultatiUtilizzando le variabili di match ottenute dalla concatenazione eapplicando il comparatore di stringhe di Jaro sulla variabile NOMINATIVO siottiene una stima ottimale in cui le coppie si polarizzano in manierasoddisfacente.Partendo dal numero di casi osservati per la Regione Toscana-Anno 2008:Cause di morte 321 obsIncidenti stradali 291 obsScegliendo le seguenti soglie: TM=0,95 TU=0,5Risultano: 189 coppie in M * (Match) + 14 coppie in PM * (Possible Match)La successiva revisione dei PM suggerisce di accettarne 13 e scartarne 1Workshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 13
  14. 14. Primi risultatiLa procedura ha individuato 202 MATCHL’errore stimato dal modello è il seguente: 0,054 mancato abbinamento 0,002 falso abbinamentoVerifiche a campione sembrano sostanzialmente confermare questirisultati.I residui non abbinati sono: 119 per la fonte Cause di Morte 89 per la fonte Incidenti stradaliWorkshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 14
  15. 15. Progetti futuri  Analisi dettagliata dei residui  Cercare di perfezionare l’abbinamento con interventi di customizzazione (adiacenze nelle età)  Ridurre i residui provando ad effettuare abbinamenti anche per altre regioni e anche per l’anno 2009Workshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 15
  16. 16. cWorkshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 16
  17. 17. Workshop SIS 2012: T.Tuoto, S.Bruzzone, L.Valentino, G.Baldassarre, N.Cibella, M.Pappagallo 17

×