Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Caratterizzazione Entropica di tracciati EEG 
epilettici mediante tecniche di data mining
Ing. Claudio Camuto

1
Obiettivi
E se si trovasse un modo di 
predire le crisi epilettiche 
dall’EEG?

E se si potesse usare anche 
per scoprire ...
L’epilessia breve introduzione
Fasi epilettiche:
«Ictal», che rappresenta l’intervallo durante il quale avviene la crisi e...
La sorgente: il tracciato EEG
«L’elettroencefalogramma (EEG),è una misura del flusso di corrente extracellulare 
che viene...
Strumenti: Il data mining
«Con  il  termine  “data  mining” si  intendono  tutte  quelle  tecniche  atte  ad  estrarre 
in...
Strumenti: Il data mining
Classificazione:
Tecnica per classificare i dati in ingresso rispetto a delle classi predefinite...
Strumenti: Il data mining
Clustering:
Tecnica per raggruppare i dati in ingresso in categorie, dette cluster, in base a 
c...
Strumenti: Le entropie
Le entropie sono funzioni utilizzate per misurare il grado di disordine si un sistema; ne 
esistono...
Strumenti: WEKA
Tool opensource, liberamente utilizzabile, scritto in java, le classi e i metodi sono 
realizzati in modo ...
EEG‐entropie‐mining
Lavoro svolto:
Caricamento  dei dati da file su database;
Utilizzando WEKA: Classificazione fra crisi ...
EEG‐entropie‐mining
Clustering segnale «precrisi» di tutti i campioni – prima crisi

Estrazione del «precrisi» della prima...
EEG‐entropie‐mining
Clustering segnale «precrisi» di tutti i campioni – crisi successive

Estrazione del «precrisi» delle ...
Software
Motivazioni:
Fornire un punto di accesso alle tecniche di mining anche a personale non informatico;
Creare una re...
Software

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
Conclusioni
Conclusioni sui dati elaborati:
Le potenzialità di questa combinazione Mining‐Entropie sono evidenti;
Spesso è...
Grazie per la vostra 
cortese attenzione
Upcoming SlideShare
Loading in …5
×

"Big Data e vissuto quotidiano" - Claudio Camuto per lo Stretto Digitale

646 views

Published on

  • Be the first to comment

"Big Data e vissuto quotidiano" - Claudio Camuto per lo Stretto Digitale

  1. 1. Caratterizzazione Entropica di tracciati EEG  epilettici mediante tecniche di data mining Ing. Claudio Camuto 1
  2. 2. Obiettivi E se si trovasse un modo di  predire le crisi epilettiche  dall’EEG? E se si potesse usare anche  per scoprire i soggetti  epilettici anche se non  hanno mai avuto crisi? Data mining ed  entropie!!!  Vedrai!!! Certo, come no! L’EEG è solo un ammasso di dati  incomprensibili che ti da  informazioni solo quando è troppo tardi!!! Fantascienza!!! E poi son tanti  dati…sono 900000 record a  seduta per paziente! Li  guarderai ad uno ad uno? Data…che? Entro… cosa?  Mah…son un po’ scettico…. Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  3. 3. L’epilessia breve introduzione Fasi epilettiche: «Ictal», che rappresenta l’intervallo durante il quale avviene la crisi epilettica ; «Perictal», che rappresenta ciò che precede e segue la crisi,  rispettivamente «Preictal» e «postictal»; «Interictal», che rappresenta l’intervallo fra una crisi e l’altra. Caratterizzazione tracciato EEG epilettico: Durante le fasi di «interictal» e «perictal» il tracciato è molto, almeno in  apparenza, a quello di un paziente sano; Durante la fase di «ictal» il tracciato diventa molto irregolare Tracciato dell’elettrodo Fp1 di un paziente epilettico, evidenziate le crisi Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  4. 4. La sorgente: il tracciato EEG «L’elettroencefalogramma (EEG),è una misura del flusso di corrente extracellulare  che viene generato dalla somma delle attività di un elevato numero di neuroni» Perché preferirlo ad altri esami: Costituisce un esame semplice da seguire e poco invasivo Fornisce diverse informazioni visibili ad occhio nudo Largamente utilizzato nell’analisi delle dinamiche celebrali Si ritiene che contenga delle informazioni celate utilizzabili a fini  diagnostici Problemi da affrontare: Il segnale è ricavato dalla sovrapposizione dei segnali dei vari strati  attraversati; Presenta degli artefatti, per cui sono necessarie post‐elaborazioni Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  5. 5. Strumenti: Il data mining «Con  il  termine  “data  mining” si  intendono  tutte  quelle  tecniche  atte  ad  estrarre  informazioni  nascoste  da  un  insieme  vasto  di  dati;  tali  informazioni  non  sono  occultate o criptate ma, semplicemente, non direttamente visibili all’utente» Tipi di mining: Descrittivo, descrive e classifica i dati; Predittivo, utilizza le informazioni ricavate dal mining descrittivo per cercare di  predire l’andamento  futuro dei dati; Perche servono? La quantità di dati da analizzare è notevole in quanto un EEG si compone dei segnali  di 21 elettrodi, una seduta dura 30 minuti e il segnale ha una freq. di 500Hz quindi  una sola seduta genera di un solo paziente genera 900000 record di almeno 21  campi Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  6. 6. Strumenti: Il data mining Classificazione: Tecnica per classificare i dati in ingresso rispetto a delle classi predefinite (ovvero  raggruppamenti di oggetti con caratteristiche simili): Utilizzabile solo quando si conoscono già le classi del sistema, per questa ragione  viene chiamato «supervised learning»; Genera un modello dei dati da utilizzare per classificare i nuovi dati; tale modello  è spesso un albero decisionale con struttura IF…ELSE; Necessita di un insieme di dati di apprendimento detto training set per generare  il modello; Necessita di un insieme di dati detto test set per verificare il modello creato. Algoritmo J48: Si tratta di un decision tree; Calcola ad ogni iterazione l’attributo che maggiormente separa i dati, ne crea  quindi una diramazione; procede ricorsivamente sui rami creati; Provvede ad eseguire il pruning dei dati. Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  7. 7. Strumenti: Il data mining Clustering: Tecnica per raggruppare i dati in ingresso in categorie, dette cluster, in base a  caratteristiche comuni, senza conoscere a priori le classi: Utilizzato principalmente quando non si conoscono a priori le classi da creare; Deve essere possibile calcolare la distanza fra due dati; Un dato può appartenere ad un solo cluster, a cui è vicino, e deve essere  distante dagli altri; Non deve essere rilevante l’ordine con cui vengono forniti i dati; Le classi ricavate, con i relativi elementi, non hanno etichetta, bisogna  comprendere ciò che l’algoritmo ha classificato. Algoritmo Simple K‐Means: Dato il numero K di cluster inizialmente crea K cluster scegliendo a caso fra i dati  un elemento da assegnare a ciascuno che diventa temporaneamente il centro; Per ogni dato calcola la sua distanza dal centro del cluster, lo assegna al più vicino e ne ricalcola il centro facendo una media fra i dati del cluster. Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  8. 8. Strumenti: Le entropie Le entropie sono funzioni utilizzate per misurare il grado di disordine si un sistema; ne  esistono varie formulazioni fra cui la più nota è Shannon; sono state provate an Tsallis,  Renyi, Permutation Entropy (al variare degli indici P e M). Perche servono? Dalle analisi effettuate in campo medico si è visto che prima della crisi il cervello che  solitamente è un sistema altamente caotico diventa più «ordinato»; come  meccanismo di sicurezza, per ripristinare il «caos» originale viene generata la crisi e  quindi uno strumento che calcola il livello di disordine è sicuramente utile Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  9. 9. Strumenti: WEKA Tool opensource, liberamente utilizzabile, scritto in java, le classi e i metodi sono  realizzati in modo tale da essere facilmente integrati nel codice di altri software Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  10. 10. EEG‐entropie‐mining Lavoro svolto: Caricamento  dei dati da file su database; Utilizzando WEKA: Classificazione fra crisi e stato normale (test mining); Utilizzando pl/sql e i dati forniti: Estrazione dei «precrisi» dei vari pazienti; Utilizzando pl/sql e i dati forniti: Estrazione degli intervalli fra le «crisi» dei vari  pazienti; Utilizzando WEKA: Clustering  dei vari «precrisi»; Utilizzando WEKA: Clustering  dei vari intervalli fra le «crisi»; Utilizzando WEKA: Confronto sani / epilettici con Clustering a tre classi; Software; Test su altri EEG: Alzheimer. Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  11. 11. EEG‐entropie‐mining Clustering segnale «precrisi» di tutti i campioni – prima crisi Estrazione del «precrisi» della prima crisi, preictal, e analisi con Clustering a due  classi su tutti i pazienti epilettici: I valori calcolati sul campione N. 14 rispetto  alle entropie, in ordine: P1M3,  P1M4,  P2M3,  P2M4 In rosso il segnale, in verde l’esordio crisi, in blu il  segnale classificato in una categoria differente Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  12. 12. EEG‐entropie‐mining Clustering segnale «precrisi» di tutti i campioni – crisi successive Estrazione del «precrisi» delle crisi successive alla prima, interictal, e analisi con  Clustering a due classi su tutti i pazienti epilettici: I valori calcolati sul campione N. 5 rispetto  alle entropie, in ordine: P1M3,  P1M4,  P2M3,  P2M4 In rosso il segnale, in verde l’esordio crisi, in blu il  segnale classificato in una categoria differente Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  13. 13. Software Motivazioni: Fornire un punto di accesso alle tecniche di mining anche a personale non informatico; Creare una rete di utenti in grado di condividere le analisi effettuate e di effettuarne  altre approfondendo e verificando i risultati ottenuti; Estendere le ricerche anche ad altri ambiti (es. Alzheimer). Caratteristiche: Web Application con profilazione utente; Procedure guidate (wizard) per agevolare l’inserimento dei dati, la commissione di  nuove analisi da effettuare, la creazione di grafici; Scheduling delle attività con avviso per e‐mail del completamento per non  sovraccaricare il server (alcune elaborazioni richiedono ore); Generazione grafici png e jpeg; Integrazione delle tecniche di mining di WEKA. Tecnologia: Java + Framework Hibernate + jQuery + jFreeChart + WEKA lib; Oracle + Tomcat. Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  14. 14. Software Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  15. 15. Conclusioni Conclusioni sui dati elaborati: Le potenzialità di questa combinazione Mining‐Entropie sono evidenti; Spesso è stato possibile trovare un segnale prima della crisi interpretabile come  precrisi; Tutti i pazienti vanno analizzati singolarmente per trovare l’entropia e le  caratteristiche del segnale precrisi; In tutti i casi è stato possibile separare pazienti epilettici (senza crisi) da sani. Possibili applicazioni: Se i dati ricavati fossero confermati da un test set maggiore sarebbe possibile  diagnosticare la patologia epilettica anche in pazienti apparentemente sani; Se i dati ricavati fossero confermati sarebbe possibile mettere a punto dei sistemi  in grado di rilevare la crisi prima che si verifichi ed intervenire per evitarla; Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining 
  16. 16. Grazie per la vostra  cortese attenzione

×