Metodi per la elaborazione di immagini per la classificazione di cellule tumorali in pazienti affetti da Leucemia Acuta Linfoblastica
1. Metodi per la elaborazione di immagini per la
classificazione di cellule tumorali in pazienti
affetti da Leucemia Acuta Linfoblastica
UNIVERSITÀ DEGLI STUDI DI MILANO
Facoltà di Scienze Matematiche, Fisiche e Naturali
Corso di Laurea in Informatica
Tesi di laurea di:
Piergiuseppe Lozza
Matricola n: 739850
RELATORE:
Prof. Fabio Scotti
Anno Accademico 2010/2011
CORRELATORE:
Dott. Ruggero Donida Labati
2. Leucemia Acuta Linfoblastica (LAL)
• Causata da proliferazioni incontrollate di Linfociti
(globuli bianchi) non ancora maturi: i Linfoblasti.
• Si manifesta prevalentemente in l’età pediatrica
• Metodi di diagnosi:
– Analisi morfologica
– Esame citochimico
– Immunofenotipizzazione
– Esame citogenetico
– Biologia molecolare
2
3. Obiettivi del lavoro di tesi
• Sviluppo un sistema completo di analisi
morfologica automatica
• Tecniche di elaborazione delle immagini e
intelligenza computazionale
• Ambiente di sviluppo utilizzato: Matlab
3
4. Analisi morfologica
• Basata sulla Classificazione FAB (French American British)
– Tre maggiori sottotipi morfologici: L1, L2, L3
4
L1
piccoli blasti omogenei,
scarso citoplasma
L2
blasti grandi ed eterogenei.
L3
blasti moderatamente
grandi e omogenei.
Sangue di un
individuo sano
5. Stato dell’arte sull’analisi morfologica automatica
5
• Due sistemi completi di analisi morfologica
automatica a confronto struttutai secondo uno
schema comune
– Acquisizione immagini
– Pre-elaborazione
– Identificazione dei Leucociti
– Identificazione dei Linfociti
– Estrazione caratteristiche dai Linfociti
– Classificazione e conteggio
• Altre tecniche in letteratura per la segmentazione
di Leucociti
6. Il sistema di analisi morfologica
automatica proposto
6
8. Metodo di Segmentazione 1 e 2
Segmentazione tramite sogliatura
8
Metodo1: in fase di pre-elaborazione
viene usata la componente blu
dell’immagine per la segmentazione
del nucleo
Metodo2: in fase di pre-elaborazione
viene usata la componente verde
dell’immagine per la segmentazione
del nucleo (come da schema)
9. Metodo di segmentazione 3:
segmentazione tramite partizionamento
9
Miglioramento
dell’immagine
Conversione dello
spazio colore
Esecuzione
algoritmo k-means
Selezione dei
cluster di nucleo e
citoplasma
Segmentazione
del nucleo
Segmentazione
del citoplasma
Segmentazione
cellula
10. Estrazione delle caratteristiche
• Vengono estratte le seguenti 9 caratteristiche
• Le caratteristiche estratte vengono raggruppate
in tre insiemi distinti:
– Fa = 18 features relative a nucleo e cellula;
– Fb = 18 features relative a nucleo e citoplasma;
– Fc = 18 features relative a cellula e citoplasma.
10
1. Media dell’intensità
2. Deviazione standard dell’intensità
3. Area
4. Asse minore
5. Asse maggiore
6. Eccentricità
7. Diametro equivalente
8. Perimetro
9. Solidità
11. Classificazione
• Classificazione delle cellule in due classi
– Cellula sana = +1
– Cellula probabilmente affetta da LAL = -1
• Classificazione con Reti Neutali Feed Forward.
• Addestramento
– Two fold validation
– 10-fold cross validation
11
12. Risultati sperimentali (1/2)
• Test sul dataset ALL-IDB2
– 260 immagini di singoli Leucociti (50% sani e 50% LAL)
• Two fold validation
• 10-fold cross validation
12
Esempi di immagini del
dataset ALL-IDB2
Algo Features Neuroni TP FP TN FN
tipo tipo numero (%) (%) (%) (%) (%) std (%) std (%) std
So Fa 20 43,38 6,92 44,54 5,15 0,15 0,02 14,80 0,35 7,12 0,26
Sa Fa 10 47,54 2,46 47,54 2,46 0,31 0,04 10,23 0,30 5,27 0,22
Sa Fb 10 47,00 3,00 47,23 2,77 0,38 0,04 12,92 0,33 6,65 0,25
Sa Fc 15 48,04 1,96 47,54 2,46 0,23 0,03 10,15 0,30 5,19 0,22
Sp Fa 15 43,77 5,69 44,08 6,46 0,00 0,00 16,69 0,37 8,35 0,28
Sp Fb 10 46,23 3,31 45,00 5,46 0,00 0,00 10,54 0,30 5,27 0,22
Sp Fc 25 45,62 3,38 46,23 4,77 0,00 0,00 9,77 0,30 4,88 0,21
Addestramento Validazione Totale
Algo features
Num.
Neuroni
TP
(%)
TN
(%)
FP
(%)
FN
(%)
Sens.
(%)
Spec.
(%)
Totale
(%)
So Fa 20 49,23 48,46 1,54 0,77 0,98 0,97 2,31
Sa Fa 10 50,00 49,23 0,77 0,00 1,00 0,98 0,77
Sa Fb 20 50,00 48,08 1,92 0,00 1,00 0,96 1,92
Sa Fc 25 48,85 49,23 0,77 1,15 0,98 0,98 1,92
Sp Fa 20 48,46 49,62 0,38 1,54 0,97 0,99 1,92
Sp Fb 15 50,00 49,23 0,77 0,00 1,00 0,98 0,77
Sp Fc 10 50,00 50,00 0,00 0,00 1,00 1,00 0,00
13. Risultati sperimentali (2/2)
• Test sul dataset ALL-IDB1
– 108 immagini; 510 cellule probabili LAL
– Accuratezza della ricerca dei Leucociti:82% (419 cellule identificate)
• ALL-IDB1-A
• ALL-IDB1-B
13
Algo features
Num.
Neuroni
TP
(%)
TN
(%)
FP
(%)
FN
(%)
Sens.
(%)
Spec.
(%)
Totale
(%)
So Fa 20 40,88 54,05 2,61 2,47 0,94 0,95 5,08
Sa Fa 20 41,02 54,32 2,33 2,33 0,95 0,96 4,66
Sa Fb 15 40,33 51,71 4,94 3,02 0,93 0,91 7,96
Sa Fc 10 41,56 55,14 1,51 1,78 0,96 0,97 3,29
Sp Fa 25 40,60 54,46 2,19 2,74 0,94 0,96 4,94
Sp Fb 25 37,17 54,32 2,33 6,17 0,86 0,96 8,50
Sp Fc 25 36,90 53,09 3,57 6,45 0,85 0,94 10,01
Algo features
Num.
Neuroni
TP
(%)
TN
(%)
FP
(%)
FN
(%)
Sens.
(%)
Spec.
(%)
Totale
(%)
So Fa 20 58,64 37,09 1,75 2,52 0,96 0,96 4,27
Sa Fa 25 59,42 36,89 1,94 1,75 0,97 0,95 3,69
Sa Fb 20 58,64 36,89 1,94 2,52 0,96 0,95 4,47
Sa Fc 10 59,61 36,89 1,94 1,55 0,97 0,95 3,50
Sp Fa 25 57,67 36,89 1,94 3,50 0,94 0,95 5,44
Sp Fb 15 59,42 35,73 3,11 1,75 0,97 0,92 4,85
Sp Fc 15 56,70 34,95 3,88 4,47 0,93 0,9 8,35
Esempio di immagini
del dataset ALL-IDB1
14. Conclusioni e possibili sviluppi futuri
• I risultati ottenuti dai metodi di segmentazione
sono soddisfacenti
• Eventuali miglioramenti:
– perfezionando l'algoritmo di ricerca dei Leucociti
• identificazione dei leucociti sui bordi
• calcolo dell'area attorno ad ogni Leucocita
• separazione dei Leucociti sovrapposti
– tramite l’individuazione di indici morfologici
maggiormente distintivi
• Possibilità di utilizzo dell'analisi morfologica
automatica in applicazioni di telemedicina
14
15. Metodi per la elaborazione di immagini
per la classificazione di cellule tumorali
in pazienti affetti
da Leucemia Acuta Linfoblastica
Tesi di laurea di:
Ruggero Donida Labati
Matricola n: 720159
RELATORE:
Prof. Fabio Scotti
Anno Accademico 2010/2011
Grazie per l’attenzione
CORRELATORE:
Dott. Ruggero Donida Labati