In proteomics, two dimensional gel electrophoresis (2–DE) is a separation technique for proteins.
Gel electrophoresis is registered and the final digital image is computer analyzed for protein spots finding; the protein spots can be detected by visual inspection of a digital gel image or by image processing algorithm. On computer image analysis, difficulties arise from image noise, spot saturation and irregular geometric distortions.
Aiming at the automated analysis of large series of 2–DE images, the bottleneck is to solve the two most basic algorithmic problems: identifying protein spots and computing the protein spots map in order to compare it to database or different image.
We developed a robust Analysis of Variance (ANOVA) based algorithm able to excite spot in order to be easy found and separated by classic algorithm as edge detection or watershed.
1. Baker Hughes Confidential
Sistema per l’identificazione
automatica di gruppi proteici
nelle immagini
elettroforetiche
bidimensionali
Prof. Alessandro Mecocci
Ing. Paolo Bussotti Giacomo Veneri
2. Baker Hughes Confidential
Processo elettroforetico
Spot matching
Gel preparation
Classification
Person
Person
Spot classification
A11
AqR
A11
A17
Mel1
AQS
A11
Z1X
(1)
(2)
(3)
(4)
3. Baker Hughes Confidential
Gel Elettroforetico
Peso Molecolare
Punto isoelettrico
Problemi nel gel
•Streaks :rumore correlato
•Saturazione grigi
•Spot overlapping
Eterogeneità
Affidabilità
5. Baker Hughes Confidential
Scopo
1. Preelaborazione: Rimozione delle streaks
1.a Massima Rimozione
1.b Minima perdita
2. Spot Matching: individuazione degli spots
2.a Risoluzione dello spot overlapping
2.b Estrazione degli spots dalle streaks
2.c Massima sensibilità verso gli spots più piccoli
Watershed
Geodesic
Anova CW
Snake
FFT
Minimum
12. Baker Hughes Confidential
Riconoscimento degli Spot
Watershed
Diga
Spot overlapping a sopraffazione
•Thresholding ai vari livelli
• Se il livello superiore contiene
due insiemi viene eratta una diga
spots
13. Baker Hughes Confidential
Watershed Segmentazione
delle streaks
Risolve lo spot overlapping
Non risolve lo spot overlapping a sopraffazione
Segmenta le streaks e descrive male i contorni
16. Baker Hughes Confidential
Cartesiane
Polari
n
i
m
j
j
ij
m
j
j
m
n
y
y
m
y
y
n
F
1 1
2
.
1
2
..
.
))
1
(
/(
)
(
)
1
/(
)
(
Riconoscimento degli Spot
Anova CW
Ogni pixel
(x,y)
Probabiltà che in (x,y) sia
centrato uno spot
m
j
H
e
y
j
ij
j
ij
..
1
0
:
0
17. Baker Hughes Confidential
Riconoscimento degli Spot
Anova CW con Maschera adattiva
Come scegliere R?
Adattivo con il livello di grigio del centro (x,y)
R=50 log(0.31 I(x,y))
19. Baker Hughes Confidential
Anova CW + watershed
Risolve lo spot overlapping
Risolve lo spot overlapping a sopraffazione
Descrive efficientemente i contorni
Tempi più lunghi
20. Baker Hughes Confidential
Gellab II +
Melanie
VComput
Phoretix
Confronto con altro software
Migliore descrizione dei contorni
Nessuna perdita (99.6%)
Maggior tempo di elaborazione
22. Baker Hughes Confidential
Sviluppi Futuri
• Incremento velocità ottimizzando il codice
• Creazione di un software professionale
•Classificazione degli spots
• Comunicazione di nuovi spots mai classificato
• Classificazione del gel
• Ricerca di nuove configurazioni sfruttando
algoritmi genetici