Εντοπισμός του Image Inpainting με Μεθόδους Τεχνητής Νοημοσύνης

Εντοπισμός της διαδικασίας inpainting
σε εικόνες με μεθόδους τεχνητής
νοημοσύνης
Aριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης
Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Παπαδόπουλος Σταύρος 8697
Επιβλέπων: Αν. Καθηγητής Ανδρέας Λ. Συμεωνίδης
Συνεπιβλέποντες: Δρ. Συμεών Παπαδόπουλος, Δρ. Γεώργιος Κορδοπάτης-Ζήλος
Ημερομηνία: 12/11/2021

Τι είναι το image inpainting;

Καλή και κακή χρήση του image
inpainting

Σκοπός της διπλωματικής εργασίας
• Μέθοδοι εντοπισμού του inpainting σε εικόνες

• Υλοποίηση ενός CNN για εντοπισμό του inpainting

• Εκπαίδευση με τυχαίες ή σημασιολογικές μασκες;

Γνώσεις που αποκτήθηκαν
• Aνάλυση ερευνητικών εργασιών (Analysis of Research Papers)
• Mελέτη και υλοποίηση μοντέλων μηχανικής μάθησης (Machine Learning Models)
• Δεξιότητες αντικειμενοστραφή προγραμματισμού (Python)
• Kατανόηση τoυ library Pytorch
• Ανάλυση, επεξεργασία και περιγραφή δεδομένων

Μεθοδολογία: Eντοπισμός των
Inpainted σημείων μιας εικόνας

Διαχωρισμός των συνόλων δεδομένων σε
εκπαίδευσης, επικύρωσης και ελέγχου.
• Πηγές δεδομένων: DEFACTO Object Removal Dataset (25k εικόνες), Diverse Inpainting Dataset (DID) (10Κ εικόνες)
• Περίπτωση Α: Σύνολο εκπαίδευσης και επικύρωσης από DEFACTO
• 90% από το DEFACTO (συν. 24Κ εικόνες)
• Το 90% (21.600 εικόνες) χρησιμοποιήθηκε ως σύνολο εκπαίδευσης
• Το 10% (2.400 εικόνες) χρησιμοποιήθηκε ως σύνολο επικύρωσης
• Περίπτωση Β: Σύνολο εκπαίδευσης και επικύρωσης από το DID
• 90% από το DID (συν. 9Κ εικόνες)
• Το 90% (8.100 εικόνες) χρησιμοποιήθηκε ως σύνολο εκπαίδευσης
• Το 10% (900 εικόνες) χρησιμοποιήθηκε ως σύνολο επικύρωσης
• Σύνολο ελέγχου: 2000 εικόνες από DEFACTO και DID
• 1000 από DEFACTO
• 1000 από DID

Προτεινόμενες Αρχιτεκτονικές
• ΗP-FCN
• Τμήμα προ-επεξεργασίας με ΗP φίλτρα
• Τμήμα εξαγωγής χαρακτηριστικών
• Τμήμα πρόβλεψης κλάσης σε επίπεδο εικονοστοιχείων
• ΗRNet
• Tμήμα προ-επεξεργασίας
• Τμήμα παράλληλων συνελίξεων πολλαπλών αναλύσεων
• Τμήμα επαναλαμβανόμενων συγχωνεύσεων πολλαπλών αναλύσεων
• Τμήμα τελικής αναπαράστασης

Εκπαίδευση Μοντέλων
• Υλοποίηση και εκπαίδευση 8 δικτύων βασισμένα σε 2 state-of-the-art αρχιτεκτονικές.
• 2 σύνολα ρυθμίσεων εκπαίδευσης
• Περίπτωση Α
• 10 εποχές (Epochs)
• Ρυθμός εκπαίδευσης (learning rate) μειώνεται στο μίσο μετά από κάθε εποχή
• Adam optimizer
• Binary Cross Entropy (BCE) ως συνάρτηση απώλειας (loss function)
• Περίπτωση B
• 50 εποχές (Epochs)
• Ρυθμός εκπαίδευσης (learning rate) μειώνεται στο μίσο μετά από κάθε εποχή (για εποχή >30)
• Adam optimizer
• Binary Cross Entropy (BCE) ως συνάρτηση απώλειας (loss function)

Πειράματα & Αποτελέσματα
• Έλεγχος 8 δικτύων βασισμένα σε 2 state-of-the-art αρχιτεκτονικές
• Σύνολο ελέγχου: Mεικτό σύνολο (2000 εικόνες από DID & DEFACTO)
• Μετρικές απόδοσης: ΑUC και ΙoU
• Εντοπισμός Ιnpainting
• Eίσοδος: Έγχρωμη εικόνα I από σύνολο ελέγχου (mxnx3)
• Έξοδος: Μάσκα πρόβλεψης (mxnx1) Mo.
• Τιμή κατωφλιού: Χρησιμοποιήθηκαν τρεις διαφορετικές τιμές κατωφλιού (0.5, 0.65, 0.7).

Παράδειγμαεκτέλεσηςτουαλγορίθμου

Eκτιμήσεις τoυ μοντέλου hp_did_10 για
τιμή κατωφλιού ίση με 0.65

Ποσοτική μέτρηση της απόδοσης των
μοντέλων κατά τη διαδικασία του ελέγχου
Aρχιτεκτονική Train Set Epochs AUC IoU 50 IoU 65 IoU 70
HP-FCN DID 10 72.30% 8.79% 61.59% 70.29%
HP-FCN DEFACTO 10 67.72% 8.79% 70.24% 70.22%
HRNET DID 10 66.46% 47.34% 58.44% 61.97%
HRNET DEFACTO 10 62.80% 69.88% 69.88% 69.89%
HP-FCN DID 50 77.5% 9.89% 54.18% 61.59%
HP-FCN DEFACTO 50 70.83% 8.80% 70.99% 70.87%
HRNET DID 50 66.41% 43.50% 50.54% 53.32%
HRNET DEFACTO 50 65.45% 70.40% 70.39% 70.38%

Συμπεράσματα
• Εκπαίδευση με τυχαίες ή σημασιολογικές μασκες; Τυχαιες
• Σύγκριση με βάση τη μετρική AUC
• Εξήγηση: Τυχαίες μάσκες μπορούν να αποτελέσουν βασικά δομικά τμήματα των σημασιολογικών
μασκών
•
Aρχιτεκτονική Train Set Epochs AUC
HP-FCN DID 10 72.30%
HP-FCN DEFACTO 10 67.72%
HP-FCN DID 50 77.5%
HRNET DID 10 66.46%
HRNET DEFACTO 10 62.80%
HRNET DID 50 66.41%

• Το ΗP-FCN έχει καλύτερη επίδοση απο το HRNet όταν προσαρμόζεται καταλλήλως το threshold
• Εξήγηση: Οφείλεται στο pre-processing που κάνει στην εικόνα
Aρχιτεκτονικ Train Set Epochs AUC IoU 65 IoU 70
HP-FCN DID 10 72.30% 61.59% 70.29%
HRNET DID 10 66.46% 58.44% 61.97%
HP-FCN DEFACTO 10 67.72% 70.24% 70.22%
HRNET DEFACTO 10 62.80% 69.88% 69.89

• Το ΗP-FCN έχει καλύτερη επίδοση απο το HRNet όταν προσαρμόζεται καταλλήλως το threshold
• Εξήγηση: Οφείλεται στο pre-processing που κάνει στην εικόνα
HP-FCN DID 50 77.5% 54.18% 61.59%
HRNET DID 50 66.41% 50.54% 53.32%
HP-FCN DEFACTO 50 70.83% 70.99% 70.87%
HRNET DEFACTO 50 65.45% 70.39% 70.38%

• Το 2ο σύνολο ρυθμίσεων βελτίωσε τα αποτελέσματα
• Εξήγηση: Περισσότερες εποχές -> ποιοτικότερη εκμάθηση των χαρακτηριστικών των μασκών.
Aρχιτεκτονικ Train Set Epochs AUC
HP-FCN DID 10 72.30%
HP-FCN DID 50 77.5%
HRNET DID 10 66.46%
HRNET DID 50 66.41%

Μελλοντική Εργασία
• Η δημιουργία ενός ποιοτικότερου συνόλου δεδομένων
• Ικανού Μεγέθους
• Διάφορες τεχνικές inpainting
• Ποικιλία μασκών
• Χρήση ισχυρότερου υπολογιστικού συστήματος
• Μεγαλύτερο batch size
• Αποφυγή rescaling
• Μείωση χρόνου εκπαίδευσης
• Ρύθμιση υπερπαραμέτρων δικτύου

Εντοπισμός του Image Inpainting με Μεθόδους Τεχνητής Νοημοσύνης

Recommended

Recommended

More Related Content

What's hot

What's hot (14)

Similar to Εντοπισμός του Image Inpainting με Μεθόδους Τεχνητής Νοημοσύνης

Similar to Εντοπισμός του Image Inpainting με Μεθόδους Τεχνητής Νοημοσύνης (20)

More from ISSEL

More from ISSEL (20)

Εντοπισμός του Image Inpainting με Μεθόδους Τεχνητής Νοημοσύνης