I big data per la medicina di precisione
Gianluigi Zanetti
gianluigi.zanetti@crs4.it
10 Maggio 2018
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 1 / 15
Il settore biomedico sta diventando data-intensive
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 2 / 15
.. precondizione necessaria per la medicina di precisione
Ottimizzare la terapia sul singolo paziente
Diagnosi in grado di
identificare la specifica
pathway patogenica
Integrazione della biologia
data intensive con la
medicina
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 3 / 15
Big data in biomed: grandi, tanti ed eterogenei
“Big Data” è definito da 4V: Volume, Velocità, Varietà e Veracità
Nella ricerca in campo biomedico:
il “quantum” di dato da trattare può essere piuttosto grande
set di vetrini digitali (tipico) 10-40GB
whole genome dataset (tipico) 300GB
acquisizione con un microscopio a foglio di luce 1GB/sec
l’obiettivo è lavorare a scala di popolazione ∼ 106 degli oggetti
sopra (a regime, con dei tempi di processamento compatibili con
attività clinica)
dati estremamente eterogenei con tipologie in continua
evoluzione (da dati *-omici a palestre “intelligenti”)
è critico poter stabilire la “fitness for purpose” dei campioni e
dei dati connessi.
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 4 / 15
BIG big data!
Big Data: Astronomia e Biologia a confronto
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 5 / 15
Esempio: 100K Genomes Project
Verso datasets a livello di popolazione
Un progetto pilota di integrazione profonda della genomica a livello di
sistema sanitario nazionale (NHS).
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 6 / 15
Esempio: The milieu Intérieur project
Dati eterogenei
Stabilire i confini della risposta immune “sana” e valutare come è
controllata dalla genetica, epigenetica e l’ambiente.
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 7 / 15
Dall’individuo alla popolazione e ritorno
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 8 / 15
from Nature Biotechnology 33, 921–924 (2015)
I benefici attesi
La diffusione delle tecnologie e dell’approccio big data nel mondo
della salute dovrebbe rendere possibile (tra gli altri):
Medicina di Precisione – gestione ed analisi di dati *-omici.
migliorare outcomes for individual patients attraverso la
personalizzazione delle diagnosi e del trattamento
migliorare il supporto decisionale dato ai clinici per il trattamento
di processi ciclici.
Automated Serendipity – l’integrazione di sistemi informativi
separati nel flusso clinico permetterà la scoperta di associazioni
clinicalmente rilevanti, il riconoscimento di segnali precoci o di
cambiamenti nella traiettoria della patologia.
miglioramento delle strategie di gestione dei pazienti
miglioramenti nella qualità e sicurezza della cura.
miglioramenti nella efficacia/efficenza del sistema sanitario
now-casting epidemiology
gestione del well-being
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 9 / 15
Tecnologie abilitanti
Biochimica massivamente parallela
Risorse computazionali “infinite”
Computazione ubiqua e pervasiva
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 10 / 15
Biochimica massivamente parallela
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 11 / 15
Risorse computazionali “infinite”
Forte disaccoppiamento della necessità di risorse computazionali
dall’incombenza di doverle gestire;
Tecnologie e approcci provenienti da generici big data.
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 12 / 15
Computazione ubiqua e pervasiva
Raccolta continua, ed a basso cosso, di dati digitali a livello di
processo.
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 13 / 15
Ovviamente, le cose sono più complicate di così
Sfide tecnologiche – +/- difficili ma “puramente tecniche”
utilizzo efficace dei dati contenuti nei sistemi di gestione dati
clinici
analisi dei dati e infrastruttura computazionale
tracciabilità e qualità dei dati (data provenance)
computational modeling e simulazione
Sfide etico–sociali – le cose veramente complicate
il rischio per l’individuo vs i vantaggi per la comunità
costruzione di una rete di fiducia a partire dal consenso dinamico
informato fino alla ricerca (in maniera scalabile)
massimizzare il riuso dei dati e dei risultati già disponibili
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 14 / 15
Grazie per l’attenzione!
Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 15 / 15

I big data per la medicina di precisione

  • 1.
    I big dataper la medicina di precisione Gianluigi Zanetti gianluigi.zanetti@crs4.it 10 Maggio 2018 Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 1 / 15
  • 2.
    Il settore biomedicosta diventando data-intensive Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 2 / 15
  • 3.
    .. precondizione necessariaper la medicina di precisione Ottimizzare la terapia sul singolo paziente Diagnosi in grado di identificare la specifica pathway patogenica Integrazione della biologia data intensive con la medicina Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 3 / 15
  • 4.
    Big data inbiomed: grandi, tanti ed eterogenei “Big Data” è definito da 4V: Volume, Velocità, Varietà e Veracità Nella ricerca in campo biomedico: il “quantum” di dato da trattare può essere piuttosto grande set di vetrini digitali (tipico) 10-40GB whole genome dataset (tipico) 300GB acquisizione con un microscopio a foglio di luce 1GB/sec l’obiettivo è lavorare a scala di popolazione ∼ 106 degli oggetti sopra (a regime, con dei tempi di processamento compatibili con attività clinica) dati estremamente eterogenei con tipologie in continua evoluzione (da dati *-omici a palestre “intelligenti”) è critico poter stabilire la “fitness for purpose” dei campioni e dei dati connessi. Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 4 / 15
  • 5.
    BIG big data! BigData: Astronomia e Biologia a confronto Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 5 / 15
  • 6.
    Esempio: 100K GenomesProject Verso datasets a livello di popolazione Un progetto pilota di integrazione profonda della genomica a livello di sistema sanitario nazionale (NHS). Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 6 / 15
  • 7.
    Esempio: The milieuIntérieur project Dati eterogenei Stabilire i confini della risposta immune “sana” e valutare come è controllata dalla genetica, epigenetica e l’ambiente. Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 7 / 15
  • 8.
    Dall’individuo alla popolazionee ritorno Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 8 / 15 from Nature Biotechnology 33, 921–924 (2015)
  • 9.
    I benefici attesi Ladiffusione delle tecnologie e dell’approccio big data nel mondo della salute dovrebbe rendere possibile (tra gli altri): Medicina di Precisione – gestione ed analisi di dati *-omici. migliorare outcomes for individual patients attraverso la personalizzazione delle diagnosi e del trattamento migliorare il supporto decisionale dato ai clinici per il trattamento di processi ciclici. Automated Serendipity – l’integrazione di sistemi informativi separati nel flusso clinico permetterà la scoperta di associazioni clinicalmente rilevanti, il riconoscimento di segnali precoci o di cambiamenti nella traiettoria della patologia. miglioramento delle strategie di gestione dei pazienti miglioramenti nella qualità e sicurezza della cura. miglioramenti nella efficacia/efficenza del sistema sanitario now-casting epidemiology gestione del well-being Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 9 / 15
  • 10.
    Tecnologie abilitanti Biochimica massivamenteparallela Risorse computazionali “infinite” Computazione ubiqua e pervasiva Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 10 / 15
  • 11.
    Biochimica massivamente parallela GianluigiZanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 11 / 15
  • 12.
    Risorse computazionali “infinite” Fortedisaccoppiamento della necessità di risorse computazionali dall’incombenza di doverle gestire; Tecnologie e approcci provenienti da generici big data. Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 12 / 15
  • 13.
    Computazione ubiqua epervasiva Raccolta continua, ed a basso cosso, di dati digitali a livello di processo. Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 13 / 15
  • 14.
    Ovviamente, le cosesono più complicate di così Sfide tecnologiche – +/- difficili ma “puramente tecniche” utilizzo efficace dei dati contenuti nei sistemi di gestione dati clinici analisi dei dati e infrastruttura computazionale tracciabilità e qualità dei dati (data provenance) computational modeling e simulazione Sfide etico–sociali – le cose veramente complicate il rischio per l’individuo vs i vantaggi per la comunità costruzione di una rete di fiducia a partire dal consenso dinamico informato fino alla ricerca (in maniera scalabile) massimizzare il riuso dei dati e dei risultati già disponibili Gianluigi Zanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 14 / 15
  • 15.
    Grazie per l’attenzione! GianluigiZanetti (CRS4) I big data per la medicina di precisione 10 Maggio 2018 15 / 15