SlideShare a Scribd company logo
1 of 6
Download to read offline
ΔΘΝΙΚΟ ΚΑΙ ΚΑΠΟΓΙ΢ΣΡΙΑΚΟ ΠΑΝΔΠΙ΢ΣΗΜΙΟ ΑΘΗΝΩΝ
΢ΥΟΛΗ ΘΔΣΙΚΩΝ ΔΠΙ΢ΣΗΜΩΝ
ΣΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗ΢ ΚΑΙ ΣΗΛΔΠΙΚΟΙΝΩΝΙΩΝ
ΓΙΑΣΜΗΜΑΣΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΔΣΑΠΣΤΥΙΑΚΧΝ ΢ΠΟΤΓΧΝ
"ΣΔΥΝΟΛΟΓΙΔ΢ ΠΛΗΡΟΦΟΡΙΚΗ΢ ΢ΣΗΝ ΙΑΣΡΙΚΗ ΚΑΙ ΣΗ ΒΙΟΛΟΓΙΑ"
ΓΙΠΛΧΜΑΣΙΚΗ ΔΡΓΑ΢ΙΑ
Ανάπηςξη ολοκληπωμένος πεπιβάλλονηορ ανάλςζηρ
και ηαξινόμηζηρ μαζηογπαθικών εικόνων
Κωνζηανηίνα Υ. Λεβένηη
Δπιβλέπονηερ: Γεώπγιορ ΢πύπος, Δηδηθόο Λεηηνπξγηθόο Δπηζηήκνλαο Α'
ΑΘΗΝΑ
ΓΔΚΔΜΒΡΙΟ΢ 2014
ΓΙΠΛΧΜΑΣΙΚΗ ΔΡΓΑ΢ΙΑ
Ανάπηςξη ολοκληπωμένος πεπιβάλλονηορ ανάλςζηρ
και ηαξινόμηζηρ μαζηογπαθικών εικόνων
Κωνζηανηίνα Υ. Λεβένηη
Α.Μ.: ΠΙΒ 091
ΔΠΙΒΛΔΠΟΝΣΔ΢: Γεώπγιορ ΢πύπος, Δηδηθόο Λεηηνπξγηθόο Δπηζηήκνλαο Α'
ΔΞΔΣΑ΢ΣΙΚΗ ΔΠΙΣΡΟΠΗ: Γεωπγία Οικονόμος, Αλαπιεξώηξηα Καζεγήηξηα
Δμμανοςήλ Αθαναζιάδηρ, Μεηαδηδαθηνξηθόο Δξεπλεηήο
Γεθέκβξηνο 2014
ΠΔΡΙΛΗΦΗ
Ο θαξθίλνο ηνπ καζηνύ είλαη κηα από ηηο ζπρλόηεξεο κνξθέο θαξθίλνπ ζηνλ
γπλαηθείν πιεζπζκό. Η καζηνγξαθία είλαη κηα απνηειεζκαηηθή θαη αζθαιήο
κέζνδνο γηα ηελ αλίρλεπζε θαη δηάγλσζε απηήο ηεο αζζέλεηαο. Ωζηόζν, ε
εξκελεία ησλ καζηνγξαθηώλ ελέρεη ζπρλά δπζθνιίεο γηα ηνπο αθηηλνιόγνπο
πνπ αθνξνύλ παξάγνληεο όπσο ε θαθή πνηόηεηα ηεο εηθόλαο ή ε απξνζεμία
ησλ ίδησλ ησλ γηαηξώλ. Έηζη, ηηο ηειεπηαίεο δεθαεηίεο έρνπλ αλαπηπρζεί
ζπζηήκαηα ππνβνεζνύκελεο δηάγλσζεο (CAD) πνπ παξέρνπλ ζηνπο
αθηηλνιόγνπο κηα δεύηεξε γλώκε γηα λα δηακνξθώζνπλ ηελ ηειηθή ηνπο
δηάγλσζε.
Έλα από ηα ζεκαληηθόηεξα επξήκαηα πνπ ζρεηίδεηαη κε ηνλ θαξθίλν ηνπ
καζηνύ είλαη νη κηθξναζβεζηώζεηο (MCs), κηθξέο δνκέο πνπ δεκηνπξγνύληαη
από ζπγθέληξσζε αιάησλ αζβεζηίνπ θαη εκθαλίδνληαη ζπλήζσο κε ηελ
κνξθή ζπκπιεγκάησλ. Τα επξήκαηα απηά κπνξεί λα είλαη ηόζν θαινήζε όζν
θαη θαθνήζε θαη έρνπλ γίλεη πνιιέο πξνζπάζεηεο γηα λα ηαμηλνκεζνύλ
αλάινγα κε ηα ραξαθηεξηζηηθά ηνπο.
Σηελ παξνύζα δηπισκαηηθή εξγαζία παξνπζηάδνπκε ζπλνιηθά ηε ιεηηνπξγία
ηνπ ζπζηήκαηνο ππνβνεζνύκελεο δηάγλσζεο κε ηελ νλνκαζία Ιππνθξάηεο-
κζη πνπ αλαπηύρζεθε ζην Δξγαζηήξην Πιεξνθνξηθήο ηεο Αθαδεκίαο
Αζελώλ. Τν ζύζηεκα ζηεξίδεηαη ζηελ αλάιπζε θαη αμηνιόγεζε κεκνλσκέλσλ
κηθξναζβεζηώζεσλ, θαζώο θαη αληίζηνηρσλ ζπκπιεγκάησλ. Η πινπνίεζε
γίλεηαη ζε ηέζζεξα ζηάδηα: α) αξρεηνζέηεζε αζζελώλ, β) ρξήζε ηερληθώλ
αλάιπζεο εηθόλαο γηα ηελ εμέηαζε ησλ καζηνγξαθηώλ, γ) αλίρλεπζε θαη
αλάιπζε ησλ κηθξναζβεζηώζεσλ θαη δ) εμαγσγή δηάγλσζεο (θαινήζεηα ή
θαθνήζεηα). Η θάζε ηεο δηάγλσζεο ζηεξίδεηαη ζηνλ αιγόξηζκν κεραληθήο
κάζεζεο ησλ support vector machines (SVM). Η κεζνδνινγία SVM
επηιέρζεθε θαζώο έρεη θαιύηεξα απνηειέζκαηα από άιινπο αιγνξίζκνπο
κεραληθήο κάζεζεο όηαλ εθαξκόδεηαη ζε δεδνκέλα πνπ δελ αλήθνπλ ζην
ζύλνιν εθπαίδεπζεο, ζπλεπώο έρεη κεγαιύηεξε ηθαλόηεηα γελίθεπζεο θαη
βξίζθεη ηαρύηεξα ηελ βέιηηζηε ιύζε.
Σηα πιαίζηα ηεο εξγαζίαο απηήο αλαπηύρζεθε έλα ζπλδπαζηηθό ζρήκα
ηαμηλόκεζεο καζηνγξαθηθώλ εηθόλσλ σο θαινήζεηο ή θαθνήζεηο, ην νπνίν
απνηειείηαη από έλαλ SVM ηαμηλνκεηή θαη έλαλ λέν ηαμηλνκεηή πνπ
δεκηνπξγήζακε. Ο SVM εθπαηδεύεηαη κε έλα κηθξό ζύλνιν ραξαθηεξηζηηθώλ
ησλ κηθξναζβεζηώζεσλ πνπ επειέγεζαλ κεηά από ππνινγηζκνύο. Ο λένο
ηαμηλνκεηήο πξνζθέξεη δπλαηόηεηα θαηεγνξηνπνίεζεο λέσλ καζηνγξαθηθώλ
εηθόλσλ κε βάζε ην πεξηερόκελό ηνπο θαη ζηεξίδεηαη ζηνλ ππνινγηζκό
απνζηάζεσλ αλάκεζα ζην δηάλπζκα ραξαθηεξηζηηθώλ ηεο άγλσζηεο εηθόλαο
θαη ησλ γλσζηώλ εηθόλσλ. Η απόθαζε πξνθύπηεη από ηηο ςήθνπο ησλ
θνληηλόηεξσλ γλσζηώλ εηθόλσλ. Η ηειηθή πξόβιεςε ηεο άγλσζηεο εηθόλαο,
πξνθύπηεη από ηνλ ζπλδπαζκό ησλ πξνβιέςεσλ ησλ δπν ηαμηλνκεηώλ, κε
εθαξκνγή ελόο απινύ θαλόλα.
Δπίζεο, επηθαηξνπνηήζεθε ε βάζε MIRACLE ώζηε λα είλαη δπλαηή ε
δηαζύλδεζε κε ην κεηαζρεκαηηζκέλν ζύζηεκα ηνπ Ιππνθξάηε-κζη πνπ
ιεηηνπξγεί ζε πεξηβάιινλ Java γηα λα είλαη πξνζηηό σο πξνο ηε ρξήζε ηνπ.
Σην ηέινο ηεο εξγαζίαο, παξνπζηάδεηαη κηα νινθιεξσκέλε ιύζε γηα ηελ
ππνβνήζεζε ηεο καζηνγξαθηθήο δηάγλσζεο, καδί κε ηελ αμηνιόγεζή ηεο,
θαζώο θαη ηα ζπκπεξάζκαηα πνπ πξνέθπςαλ από όιε απηή ηε κειέηε.
ΘΔΜΑΣΙΚΗ ΠΔΡΙΟΥΗ: Δπεμεξγαζία Δηθόλαο, Αλάιπζε Δηθόλαο, Ταμηλόκεζε
καζηνγξαθηθήο εηθόλαο, Υπνινγηζηηθή Υπνβνεζνύκελε Γηάγλσζε
ΛΔΞΔΙ΢ ΚΛΔΙΓΙΑ: Ταμηλόκεζε, Απεηθνληζηηθά Δπξήκαηα, Αιγόξηζκνο SVM,
Content-based Αιγόξηζκνο, DDSM Database, Καινήζεηα, Καθνήζεηα,
Ιππνθξάηεο-κζη, Σύζηεκα CAD
ABSTRACT
Breast cancer is one of the most common cancers in the female population.
Mammography is an effective and safe method to detect and diagnose this
disease. However, the interpretation of mammograms often involves
difficulties for the radiologists that depend on factors such as bad quality of
the images, or human fatigue. Hence, during the last decades Computer
Aided Diagnosis (CAD) systems have been developed that provide
radiologists a second opinion to help them form their final diagnosis.
One of the most important findings related to breast cancer is
Microcalcifications (MCs), small structures that are created from concentrated
calcium salts and usually appear in the form of clusters. These findings can
be either benign or malignant and many efforts have been made to classify
them according to their features.
In this master thesis we present the functionality of the CAD system named
Hippoctates-mst that has been developed at the Informatics Laboratory of the
Academy of Athens. The system is based on the analysis and evaluation of
both single microcalcifications and clusters of MCs. The implementation is
done in four steps: a) patient’s archive analysis, b) image analysis techniques
for the examination of mammographies, c) detection and analysis of MCs and
d) final diagnosis (benign or malignant). The diagnosis phase that we have
used is the one based on the machine learning algorithm of support vector
machines (SVM).
During this project a combined classification scheme has been developed in
order to classify mammographic images as benign or malignant. This scheme
consists of an SVM classifier and a new classifier that we have created. The
SVM is trained with a small group of MCs features that were selected after
numerous calculations. The other classifier provides the ability to categorize
new mammograms based on their content and relies on the calculation of
distances between the feature vector of the unknown image and the known
images. The decision is based on majority voting regarding the nearest known
images. The final prediction arises from the combination of the predictions of
the two classifiers by applying a simple rule.
In addition, the MIRACLE database has been updated so that it can be
connected with the transformed CAD system Hippocrates-mst operating in
Java platform in order to become easily accessible.
At the end of this master thesis, we present a full solution for the assistance of
mammographic diagnosis, along with its validation and the related
conclusions.
SUBJECT AREA: Image processing, Image analysis, Mammographic image
classification, Computer Aided Diagnosis
KEYWORDS: Classification, Image findings, SVM Algorithm, Content-based
Algorithm, DDSM Database, Benign, Malignant, Hippokrates-mst, CAD
system

More Related Content

Viewers also liked

Μελέτη της τρωτότητας των βόρειων ακτών του Δυτικού Κορινθιακού Κόλπου (Αντίρ...
Μελέτη της τρωτότητας των βόρειων ακτών του Δυτικού Κορινθιακού Κόλπου (Αντίρ...Μελέτη της τρωτότητας των βόρειων ακτών του Δυτικού Κορινθιακού Κόλπου (Αντίρ...
Μελέτη της τρωτότητας των βόρειων ακτών του Δυτικού Κορινθιακού Κόλπου (Αντίρ...Hellenic Centre for Marine Research
 
η βιοποικιλοτητα του κορινθιακου κολπου και η μοναδικοτητα των δελφινιων του
η βιοποικιλοτητα του κορινθιακου κολπου και η μοναδικοτητα των δελφινιων τουη βιοποικιλοτητα του κορινθιακου κολπου και η μοναδικοτητα των δελφινιων του
η βιοποικιλοτητα του κορινθιακου κολπου και η μοναδικοτητα των δελφινιων τουkalotina
 
10ο Πανελλήνιο Συμπόσιο Ωκεανογραφίας & Αλιείας
10ο Πανελλήνιο Συμπόσιο Ωκεανογραφίας & Αλιείας10ο Πανελλήνιο Συμπόσιο Ωκεανογραφίας & Αλιείας
10ο Πανελλήνιο Συμπόσιο Ωκεανογραφίας & ΑλιείαςHellenic Centre for Marine Research
 
Περιβαλλοντική επισκόπηση του όρμου και της λιμνοθάλασσας Βιβαρίου (Αργολικός...
Περιβαλλοντική επισκόπηση του όρμου και της λιμνοθάλασσας Βιβαρίου (Αργολικός...Περιβαλλοντική επισκόπηση του όρμου και της λιμνοθάλασσας Βιβαρίου (Αργολικός...
Περιβαλλοντική επισκόπηση του όρμου και της λιμνοθάλασσας Βιβαρίου (Αργολικός...Hellenic Centre for Marine Research
 
περιηγηση στην ιστορια της χαλκιδας (1)
περιηγηση στην ιστορια της χαλκιδας (1)περιηγηση στην ιστορια της χαλκιδας (1)
περιηγηση στην ιστορια της χαλκιδας (1)Eleni Tsaroucha
 
Η ΠΑΡΑΛΙΑ ΜΑΣ- ΒΛΑΧΑΝΤΩΝΗ ΓΕΩΡΓΙΑ
Η ΠΑΡΑΛΙΑ ΜΑΣ- ΒΛΑΧΑΝΤΩΝΗ ΓΕΩΡΓΙΑΗ ΠΑΡΑΛΙΑ ΜΑΣ- ΒΛΑΧΑΝΤΩΝΗ ΓΕΩΡΓΙΑ
Η ΠΑΡΑΛΙΑ ΜΑΣ- ΒΛΑΧΑΝΤΩΝΗ ΓΕΩΡΓΙΑAlexandra Tsigkou
 
CT computer aided diagnosis system
CT computer aided diagnosis systemCT computer aided diagnosis system
CT computer aided diagnosis systemAboul Ella Hassanien
 
4. Αθήνα από τη βασιλεία στην αριστοκρατία
4. Αθήνα   από τη βασιλεία στην αριστοκρατία4. Αθήνα   από τη βασιλεία στην αριστοκρατία
4. Αθήνα από τη βασιλεία στην αριστοκρατίαKvarnalis75
 

Viewers also liked (10)

Μελέτη της τρωτότητας των βόρειων ακτών του Δυτικού Κορινθιακού Κόλπου (Αντίρ...
Μελέτη της τρωτότητας των βόρειων ακτών του Δυτικού Κορινθιακού Κόλπου (Αντίρ...Μελέτη της τρωτότητας των βόρειων ακτών του Δυτικού Κορινθιακού Κόλπου (Αντίρ...
Μελέτη της τρωτότητας των βόρειων ακτών του Δυτικού Κορινθιακού Κόλπου (Αντίρ...
 
η βιοποικιλοτητα του κορινθιακου κολπου και η μοναδικοτητα των δελφινιων του
η βιοποικιλοτητα του κορινθιακου κολπου και η μοναδικοτητα των δελφινιων τουη βιοποικιλοτητα του κορινθιακου κολπου και η μοναδικοτητα των δελφινιων του
η βιοποικιλοτητα του κορινθιακου κολπου και η μοναδικοτητα των δελφινιων του
 
10ο Πανελλήνιο Συμπόσιο Ωκεανογραφίας & Αλιείας
10ο Πανελλήνιο Συμπόσιο Ωκεανογραφίας & Αλιείας10ο Πανελλήνιο Συμπόσιο Ωκεανογραφίας & Αλιείας
10ο Πανελλήνιο Συμπόσιο Ωκεανογραφίας & Αλιείας
 
Mymmo
MymmoMymmo
Mymmo
 
Περιβαλλοντική επισκόπηση του όρμου και της λιμνοθάλασσας Βιβαρίου (Αργολικός...
Περιβαλλοντική επισκόπηση του όρμου και της λιμνοθάλασσας Βιβαρίου (Αργολικός...Περιβαλλοντική επισκόπηση του όρμου και της λιμνοθάλασσας Βιβαρίου (Αργολικός...
Περιβαλλοντική επισκόπηση του όρμου και της λιμνοθάλασσας Βιβαρίου (Αργολικός...
 
περιηγηση στην ιστορια της χαλκιδας (1)
περιηγηση στην ιστορια της χαλκιδας (1)περιηγηση στην ιστορια της χαλκιδας (1)
περιηγηση στην ιστορια της χαλκιδας (1)
 
Η ΠΑΡΑΛΙΑ ΜΑΣ- ΒΛΑΧΑΝΤΩΝΗ ΓΕΩΡΓΙΑ
Η ΠΑΡΑΛΙΑ ΜΑΣ- ΒΛΑΧΑΝΤΩΝΗ ΓΕΩΡΓΙΑΗ ΠΑΡΑΛΙΑ ΜΑΣ- ΒΛΑΧΑΝΤΩΝΗ ΓΕΩΡΓΙΑ
Η ΠΑΡΑΛΙΑ ΜΑΣ- ΒΛΑΧΑΝΤΩΝΗ ΓΕΩΡΓΙΑ
 
Breast cancer
Breast cancerBreast cancer
Breast cancer
 
CT computer aided diagnosis system
CT computer aided diagnosis systemCT computer aided diagnosis system
CT computer aided diagnosis system
 
4. Αθήνα από τη βασιλεία στην αριστοκρατία
4. Αθήνα   από τη βασιλεία στην αριστοκρατία4. Αθήνα   από τη βασιλεία στην αριστοκρατία
4. Αθήνα από τη βασιλεία στην αριστοκρατία
 

Similar to thesis.PDF

Δρ. Αθανάσιος Ν. Χαλαζωνίτης, 3rd Health Innovation Conference
Δρ. Αθανάσιος Ν. Χαλαζωνίτης, 3rd Health Innovation ConferenceΔρ. Αθανάσιος Ν. Χαλαζωνίτης, 3rd Health Innovation Conference
Δρ. Αθανάσιος Ν. Χαλαζωνίτης, 3rd Health Innovation ConferenceStarttech Ventures
 
4 ερμηνευτικά κριτήρια σε gram αρνητικά βακτήρια
4 ερμηνευτικά κριτήρια σε gram αρνητικά βακτήρια4 ερμηνευτικά κριτήρια σε gram αρνητικά βακτήρια
4 ερμηνευτικά κριτήρια σε gram αρνητικά βακτήριαEKMED
 
Eκπαίδευση για τον Kόσμο
Eκπαίδευση για τον KόσμοEκπαίδευση για τον Kόσμο
Eκπαίδευση για τον Kόσμοvathakou
 
δελτιο τυπου.συναντηση με θεοχαρη
δελτιο τυπου.συναντηση με θεοχαρηδελτιο τυπου.συναντηση με θεοχαρη
δελτιο τυπου.συναντηση με θεοχαρηdakekavalas
 

Similar to thesis.PDF (8)

Δρ. Αθανάσιος Ν. Χαλαζωνίτης, 3rd Health Innovation Conference
Δρ. Αθανάσιος Ν. Χαλαζωνίτης, 3rd Health Innovation ConferenceΔρ. Αθανάσιος Ν. Χαλαζωνίτης, 3rd Health Innovation Conference
Δρ. Αθανάσιος Ν. Χαλαζωνίτης, 3rd Health Innovation Conference
 
4 ερμηνευτικά κριτήρια σε gram αρνητικά βακτήρια
4 ερμηνευτικά κριτήρια σε gram αρνητικά βακτήρια4 ερμηνευτικά κριτήρια σε gram αρνητικά βακτήρια
4 ερμηνευτικά κριτήρια σε gram αρνητικά βακτήρια
 
PAR
PARPAR
PAR
 
Bles ενδείξεις και περιορισμοί
Bles ενδείξεις και περιορισμοίBles ενδείξεις και περιορισμοί
Bles ενδείξεις και περιορισμοί
 
7 8
7 87 8
7 8
 
Eκπαίδευση για τον Kόσμο
Eκπαίδευση για τον KόσμοEκπαίδευση για τον Kόσμο
Eκπαίδευση για τον Kόσμο
 
δελτιο τυπου.συναντηση με θεοχαρη
δελτιο τυπου.συναντηση με θεοχαρηδελτιο τυπου.συναντηση με θεοχαρη
δελτιο τυπου.συναντηση με θεοχαρη
 
Fragkopoulou_Katerina_Master thesis
Fragkopoulou_Katerina_Master thesisFragkopoulou_Katerina_Master thesis
Fragkopoulou_Katerina_Master thesis
 

thesis.PDF

  • 1. ΔΘΝΙΚΟ ΚΑΙ ΚΑΠΟΓΙ΢ΣΡΙΑΚΟ ΠΑΝΔΠΙ΢ΣΗΜΙΟ ΑΘΗΝΩΝ ΢ΥΟΛΗ ΘΔΣΙΚΩΝ ΔΠΙ΢ΣΗΜΩΝ ΣΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗ΢ ΚΑΙ ΣΗΛΔΠΙΚΟΙΝΩΝΙΩΝ ΓΙΑΣΜΗΜΑΣΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΔΣΑΠΣΤΥΙΑΚΧΝ ΢ΠΟΤΓΧΝ "ΣΔΥΝΟΛΟΓΙΔ΢ ΠΛΗΡΟΦΟΡΙΚΗ΢ ΢ΣΗΝ ΙΑΣΡΙΚΗ ΚΑΙ ΣΗ ΒΙΟΛΟΓΙΑ" ΓΙΠΛΧΜΑΣΙΚΗ ΔΡΓΑ΢ΙΑ Ανάπηςξη ολοκληπωμένος πεπιβάλλονηορ ανάλςζηρ και ηαξινόμηζηρ μαζηογπαθικών εικόνων Κωνζηανηίνα Υ. Λεβένηη Δπιβλέπονηερ: Γεώπγιορ ΢πύπος, Δηδηθόο Λεηηνπξγηθόο Δπηζηήκνλαο Α' ΑΘΗΝΑ ΓΔΚΔΜΒΡΙΟ΢ 2014
  • 2. ΓΙΠΛΧΜΑΣΙΚΗ ΔΡΓΑ΢ΙΑ Ανάπηςξη ολοκληπωμένος πεπιβάλλονηορ ανάλςζηρ και ηαξινόμηζηρ μαζηογπαθικών εικόνων Κωνζηανηίνα Υ. Λεβένηη Α.Μ.: ΠΙΒ 091 ΔΠΙΒΛΔΠΟΝΣΔ΢: Γεώπγιορ ΢πύπος, Δηδηθόο Λεηηνπξγηθόο Δπηζηήκνλαο Α' ΔΞΔΣΑ΢ΣΙΚΗ ΔΠΙΣΡΟΠΗ: Γεωπγία Οικονόμος, Αλαπιεξώηξηα Καζεγήηξηα Δμμανοςήλ Αθαναζιάδηρ, Μεηαδηδαθηνξηθόο Δξεπλεηήο Γεθέκβξηνο 2014
  • 3. ΠΔΡΙΛΗΦΗ Ο θαξθίλνο ηνπ καζηνύ είλαη κηα από ηηο ζπρλόηεξεο κνξθέο θαξθίλνπ ζηνλ γπλαηθείν πιεζπζκό. Η καζηνγξαθία είλαη κηα απνηειεζκαηηθή θαη αζθαιήο κέζνδνο γηα ηελ αλίρλεπζε θαη δηάγλσζε απηήο ηεο αζζέλεηαο. Ωζηόζν, ε εξκελεία ησλ καζηνγξαθηώλ ελέρεη ζπρλά δπζθνιίεο γηα ηνπο αθηηλνιόγνπο πνπ αθνξνύλ παξάγνληεο όπσο ε θαθή πνηόηεηα ηεο εηθόλαο ή ε απξνζεμία ησλ ίδησλ ησλ γηαηξώλ. Έηζη, ηηο ηειεπηαίεο δεθαεηίεο έρνπλ αλαπηπρζεί ζπζηήκαηα ππνβνεζνύκελεο δηάγλσζεο (CAD) πνπ παξέρνπλ ζηνπο αθηηλνιόγνπο κηα δεύηεξε γλώκε γηα λα δηακνξθώζνπλ ηελ ηειηθή ηνπο δηάγλσζε. Έλα από ηα ζεκαληηθόηεξα επξήκαηα πνπ ζρεηίδεηαη κε ηνλ θαξθίλν ηνπ καζηνύ είλαη νη κηθξναζβεζηώζεηο (MCs), κηθξέο δνκέο πνπ δεκηνπξγνύληαη από ζπγθέληξσζε αιάησλ αζβεζηίνπ θαη εκθαλίδνληαη ζπλήζσο κε ηελ κνξθή ζπκπιεγκάησλ. Τα επξήκαηα απηά κπνξεί λα είλαη ηόζν θαινήζε όζν θαη θαθνήζε θαη έρνπλ γίλεη πνιιέο πξνζπάζεηεο γηα λα ηαμηλνκεζνύλ αλάινγα κε ηα ραξαθηεξηζηηθά ηνπο. Σηελ παξνύζα δηπισκαηηθή εξγαζία παξνπζηάδνπκε ζπλνιηθά ηε ιεηηνπξγία ηνπ ζπζηήκαηνο ππνβνεζνύκελεο δηάγλσζεο κε ηελ νλνκαζία Ιππνθξάηεο- κζη πνπ αλαπηύρζεθε ζην Δξγαζηήξην Πιεξνθνξηθήο ηεο Αθαδεκίαο Αζελώλ. Τν ζύζηεκα ζηεξίδεηαη ζηελ αλάιπζε θαη αμηνιόγεζε κεκνλσκέλσλ κηθξναζβεζηώζεσλ, θαζώο θαη αληίζηνηρσλ ζπκπιεγκάησλ. Η πινπνίεζε γίλεηαη ζε ηέζζεξα ζηάδηα: α) αξρεηνζέηεζε αζζελώλ, β) ρξήζε ηερληθώλ αλάιπζεο εηθόλαο γηα ηελ εμέηαζε ησλ καζηνγξαθηώλ, γ) αλίρλεπζε θαη αλάιπζε ησλ κηθξναζβεζηώζεσλ θαη δ) εμαγσγή δηάγλσζεο (θαινήζεηα ή θαθνήζεηα). Η θάζε ηεο δηάγλσζεο ζηεξίδεηαη ζηνλ αιγόξηζκν κεραληθήο κάζεζεο ησλ support vector machines (SVM). Η κεζνδνινγία SVM επηιέρζεθε θαζώο έρεη θαιύηεξα απνηειέζκαηα από άιινπο αιγνξίζκνπο κεραληθήο κάζεζεο όηαλ εθαξκόδεηαη ζε δεδνκέλα πνπ δελ αλήθνπλ ζην ζύλνιν εθπαίδεπζεο, ζπλεπώο έρεη κεγαιύηεξε ηθαλόηεηα γελίθεπζεο θαη βξίζθεη ηαρύηεξα ηελ βέιηηζηε ιύζε. Σηα πιαίζηα ηεο εξγαζίαο απηήο αλαπηύρζεθε έλα ζπλδπαζηηθό ζρήκα ηαμηλόκεζεο καζηνγξαθηθώλ εηθόλσλ σο θαινήζεηο ή θαθνήζεηο, ην νπνίν απνηειείηαη από έλαλ SVM ηαμηλνκεηή θαη έλαλ λέν ηαμηλνκεηή πνπ δεκηνπξγήζακε. Ο SVM εθπαηδεύεηαη κε έλα κηθξό ζύλνιν ραξαθηεξηζηηθώλ ησλ κηθξναζβεζηώζεσλ πνπ επειέγεζαλ κεηά από ππνινγηζκνύο. Ο λένο ηαμηλνκεηήο πξνζθέξεη δπλαηόηεηα θαηεγνξηνπνίεζεο λέσλ καζηνγξαθηθώλ εηθόλσλ κε βάζε ην πεξηερόκελό ηνπο θαη ζηεξίδεηαη ζηνλ ππνινγηζκό απνζηάζεσλ αλάκεζα ζην δηάλπζκα ραξαθηεξηζηηθώλ ηεο άγλσζηεο εηθόλαο θαη ησλ γλσζηώλ εηθόλσλ. Η απόθαζε πξνθύπηεη από ηηο ςήθνπο ησλ θνληηλόηεξσλ γλσζηώλ εηθόλσλ. Η ηειηθή πξόβιεςε ηεο άγλσζηεο εηθόλαο,
  • 4. πξνθύπηεη από ηνλ ζπλδπαζκό ησλ πξνβιέςεσλ ησλ δπν ηαμηλνκεηώλ, κε εθαξκνγή ελόο απινύ θαλόλα. Δπίζεο, επηθαηξνπνηήζεθε ε βάζε MIRACLE ώζηε λα είλαη δπλαηή ε δηαζύλδεζε κε ην κεηαζρεκαηηζκέλν ζύζηεκα ηνπ Ιππνθξάηε-κζη πνπ ιεηηνπξγεί ζε πεξηβάιινλ Java γηα λα είλαη πξνζηηό σο πξνο ηε ρξήζε ηνπ. Σην ηέινο ηεο εξγαζίαο, παξνπζηάδεηαη κηα νινθιεξσκέλε ιύζε γηα ηελ ππνβνήζεζε ηεο καζηνγξαθηθήο δηάγλσζεο, καδί κε ηελ αμηνιόγεζή ηεο, θαζώο θαη ηα ζπκπεξάζκαηα πνπ πξνέθπςαλ από όιε απηή ηε κειέηε. ΘΔΜΑΣΙΚΗ ΠΔΡΙΟΥΗ: Δπεμεξγαζία Δηθόλαο, Αλάιπζε Δηθόλαο, Ταμηλόκεζε καζηνγξαθηθήο εηθόλαο, Υπνινγηζηηθή Υπνβνεζνύκελε Γηάγλσζε ΛΔΞΔΙ΢ ΚΛΔΙΓΙΑ: Ταμηλόκεζε, Απεηθνληζηηθά Δπξήκαηα, Αιγόξηζκνο SVM, Content-based Αιγόξηζκνο, DDSM Database, Καινήζεηα, Καθνήζεηα, Ιππνθξάηεο-κζη, Σύζηεκα CAD
  • 5. ABSTRACT Breast cancer is one of the most common cancers in the female population. Mammography is an effective and safe method to detect and diagnose this disease. However, the interpretation of mammograms often involves difficulties for the radiologists that depend on factors such as bad quality of the images, or human fatigue. Hence, during the last decades Computer Aided Diagnosis (CAD) systems have been developed that provide radiologists a second opinion to help them form their final diagnosis. One of the most important findings related to breast cancer is Microcalcifications (MCs), small structures that are created from concentrated calcium salts and usually appear in the form of clusters. These findings can be either benign or malignant and many efforts have been made to classify them according to their features. In this master thesis we present the functionality of the CAD system named Hippoctates-mst that has been developed at the Informatics Laboratory of the Academy of Athens. The system is based on the analysis and evaluation of both single microcalcifications and clusters of MCs. The implementation is done in four steps: a) patient’s archive analysis, b) image analysis techniques for the examination of mammographies, c) detection and analysis of MCs and d) final diagnosis (benign or malignant). The diagnosis phase that we have used is the one based on the machine learning algorithm of support vector machines (SVM). During this project a combined classification scheme has been developed in order to classify mammographic images as benign or malignant. This scheme consists of an SVM classifier and a new classifier that we have created. The SVM is trained with a small group of MCs features that were selected after numerous calculations. The other classifier provides the ability to categorize new mammograms based on their content and relies on the calculation of distances between the feature vector of the unknown image and the known images. The decision is based on majority voting regarding the nearest known images. The final prediction arises from the combination of the predictions of the two classifiers by applying a simple rule. In addition, the MIRACLE database has been updated so that it can be connected with the transformed CAD system Hippocrates-mst operating in Java platform in order to become easily accessible. At the end of this master thesis, we present a full solution for the assistance of mammographic diagnosis, along with its validation and the related conclusions. SUBJECT AREA: Image processing, Image analysis, Mammographic image classification, Computer Aided Diagnosis
  • 6. KEYWORDS: Classification, Image findings, SVM Algorithm, Content-based Algorithm, DDSM Database, Benign, Malignant, Hippokrates-mst, CAD system