Giacomo Veneri Thesis


Published on

In proteomics, two dimensional gel electrophoresis (2–DE) is a separation technique for proteins.
Gel electrophoresis is registered and the final digital image is computer analyzed for protein spots finding; the protein spots can be detected by visual inspection of a digital gel image or by image processing algorithm. On computer image analysis, difficulties arise from image noise, spot saturation and irregular geometric distortions.
Aiming at the automated analysis of large series of 2–DE images, the bottleneck is to solve the two most basic algorithmic problems: identifying protein spots and computing the protein spots map in order to compare it to database or different image.
We developed a robust Analysis of Variance (ANOVA) based algorithm able to excite spot in order to be easy found and separated by classic algorithm as edge detection or watershed. The implementation is done in a client standalone application called VisualBio.

Published in: Education
  • Be the first to comment

  • Be the first to like this

No Downloads
Total Views
On Slideshare
From Embeds
Number of Embeds
Embeds 0
No embeds

No notes for slide

Giacomo Veneri Thesis

  1. 1. Sistema per l’identificazioneautomatica di gruppi proteici nelle immagini elettroforetiche bidimensionali Prof. Alessandro Mecocci Ing. Paolo Bussotti Giacomo Veneri
  2. 2. Processo elettroforetico (1) (2) Spot matching Gel preparation (4)Person Person A11 Classification Spot classification A17 A11 A11 Z1X (3) AQS Mel1 AqR
  3. 3. Gel Elettroforetico Punto isoelettrico Eterogeneità Eterogeneità Affidabilità Affidabilità Problemi nel gel Problemi nel gel ••Streaks :rumore correlato Streaks :rumore correlato ••Saturazionegrigi Saturazione grigi ••Spot overlapping Spot overlappingPeso Molecolare
  4. 4. Informazioni note a priori Spot = Distribuzione Gaussiana Spot = Distribuzione Gaussiana Spot Grandi = Spot Marcati Spot Grandi = Spot Marcati Streaks costanti lungo le Y Streaks costanti lungo le Y
  5. 5. Scopo FFT1. Preelaborazione: Rimozione delle streaks Minimum1.a Massima Rimozione1.b Minima perdita Watershed Geodesic2. Spot Matching: individuazione degli spots Anova CW2.a Risoluzione dello spot overlapping Snake2.b Estrazione degli spots dalle streaks2.c Massima sensibilità verso gli spots più piccoli
  6. 6. FFT
  7. 7. FFT Elimina le streaks Mantiene intatti gli edge Data l’eterogeneità del gel si richiede un algoritmo più leggero
  8. 8. Min
  9. 9. Min
  10. 10. Min Perdita minima Elimina in modo efficiente le streaks Mantiene intatti gli spots più piccoli Elimina lo sfondo
  11. 11. Profilo
  12. 12. Riconoscimento degli Spot Watershed Diga spotsSpot overlapping a sopraffazione••Thresholdingai vari livelli Thresholding ai vari livelli••Se il livello superiore contiene Se il livello superiore contienedue insiemi viene eratta una diga due insiemi viene eratta una diga
  13. 13. SegmentazioneWatershed delle streaks Risolve lo spot overlapping Non risolve lo spot overlapping a sopraffazione Segmenta le streaks e descrive male i contorni
  14. 14. Geodesic Max. descrizione dei contorni
  15. 15. Geodesic Risolve lo spot overlapping Non risolve lo spot overlapping a sopraffazione Sensitività Descrive efficientemente i contorni estraendo gli massima spots dalle streaks
  16. 16. Riconoscimento degli Spot Anova CW m n∑ ( y. j + y.. ) 2 /( m − 1)yij = µ + β j + eij F= j =1 n mH0 : β j ≠ 0 j = 1..m ∑∑ ( yij + y. j ) 2 /(n(m − 1)) i =1 j =1 Cartesiane Polari Ogni pixel Ogni pixel Probabiltà che in (x,y) sia Probabiltà che in (x,y) sia (x,y) (x,y) centrato uno spot centrato uno spot
  17. 17. Riconoscimento degli SpotAnova CW con Maschera adattiva Come scegliere R?Adattivo con il livello di grigio del centro (x,y)Adattivo con il livello di grigio del centro (x,y) R=50 log(0.31 I(x,y)) R=50 log(0.31 I(x,y))
  18. 18. Anova CW + Edge Log Spot overlapping a sopraffazione Anova CW Watershed
  19. 19. Anova CW + watershed Risolve lo spot overlapping Risolve lo spot overlapping a sopraffazione Descrive efficientemente i contorni Tempi più lunghi
  20. 20. Confronto con altro software Phoretix VComput Migliore descrizione dei contorni Migliore descrizione dei contorni Nessuna perdita (99.6%) Nessuna perdita (99.6%) Maggior tempo di elaborazione Maggior tempo di elaborazioneMelanie Gellab II +
  21. 21. Visual Bio1 Background 1 Background2 Rest Sat. 2 Rest Sat.3 Rest FFT 3 Rest FFT4 Rest Min 4 Rest Min5 Edge Mask 5 Edge Mask6 Edge LoG 6 Edge LoG7 Watershed 7 Watershed8 Snake 8 Snake9 Anova CW 9 Anova CW10 Geodesic 10 GeodesicE EqualizeE Equalize
  22. 22. Sviluppi Futuri• Incremento velocità ottimizzando il codice• Creazione di un software professionale•Classificazione degli spots• Comunicazione di nuovi spots mai classificato• Classificazione del gel• Ricerca di nuove configurazioni sfruttandoalgoritmi genetici
  23. 23. Creazione del gel Punto isoelettrico Ex t1 Ey t2Pesomolecolare