Ελένη Νησιώτη

ISSEL
ISSELISSEL
Αυτοματοποιήμενος Αναλυτής Δεδομένων
Εκπόνηση Ελένη Νησιώτη 7737
Επίβλεψη Επίκ. Καθ. Ανδρέας Συμεωνίδης
Συνεπίβλεψη Δρ. Κυριάκος Χατζηδημητρίου
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης
Πολυτεχνική Σχολή
Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Εργαστήριο Επεξεργασίας Πληροφορίας και Υπολογισμών
29 Μαρτίου 2017
Εισαγωγή
0
Ο προβληματισμός
To 75% ενός πειράματος μηχανικής μάθησης αφιερώνεται στην
προετοιμασία της εφαρμογής του αλγορίθμου και το 15% στα
βήματα που την ακολουθούν. Το μεγαλύτερο μέρος της έρευνας
επικεντρώνεται στο ενδιάμεσο 10% …
— Rich Caruana, ICML 2015
Ανάγκη για επέκταση της τρέχουσας έρευνας σε χρονοβόρα
στάδια της διαδικασίας εφαρμογής μηχανικής μάθησης που
μέχρι τώρα γίνονταν χειροκίνητα.
1
Η αναγκαιότητα της μεταφερσιμότητας
Πρόβλημα → ML → Λύση
Πρόβλημα → ML → Λύση
Πρόβλημα → ML → Λύση
Πρόβλημα → ML → Λύση
Πρόβλημα → ML → Λύση
Πρόβλημα → ML → Λύση
2
Η εξέλιξη του ML ...
Ο προγραμματισμός στοχεύει στην αυτοματοποίηση, η μηχανική
μάθηση στην αυτοματοποίηση της αυτοματοποίησης και η
αυτοματοποιημένη μηχανική μάθηση στην αυτοματοποίηση του να
αυτοματοποιείς την αυτοματοποίηση.
— Matthew Mayo, KDnuggets 2017
Το νέο στάδιο στην εξέλιξη της μηχανικής μάθησης στοχεύει
στη δημιουργία μετα-γνώσης για την αυτοματοποίηση της
ίδιας της διαδικασίας της μάθησης και όχι μεμονωμένων
προβλημάτων.
3
... στην επιστήμη του AutoML
Απαρχές Unica, MarketSwitch, KXEN
Πεδία Εφαρμογής Προ-επεξεργασία, Επιλογή αλ-
γορίθμου, Ρύθμιση μοντέλου
Σύγχρονα Εργαλεία Auto-WEKA, Microsoft Azure,
caret, HPOlib, Google AutoML
4
Το προτεινόμενο σύστημα
Ένας αυτοματοποιημένος αναλυτής δεδομένων για
προβλήματα δυαδικής ταξινόμησης με εμπειρία παλαιότερων
πειραμάτων και κατανοητή έξοδο.
• Αυτόματος σχηματισμός βέλτιστου ensemble
• Ενσωμάτωση μετα-μάθησης για ρύθμιση μοντέλου
• Παραγωγή επεξηγηματικού report για το χρήστη
5
Μεθοδολογία
No free lunch theorem
Αν λάβουμε υπόψιν όλες τις πιθανές κατανομές δημιουργίας
δεδομένων, τότε κάθε αλγόριθμος μηχανικής μάθησης επιδεικνύει
κατά μέσο όρο το ίδιο σφάλμα στην πρόβλεψη άγνωστων
παραδειγμάτων.
— David Wolpert, 1996
Είναι αδύνατη η εύρεση ενός γενικά βέλτιστου αλγορίθμου.
Ένα εργαλείο βελτιστοποίησης γενικής φύσης προβλημάτων
οφείλει να εξερευνήσει το χώρο των πιθανών μηχανισμών
δημιουργίας δεδομένων και να προσφέρει προσαρμοσμένες
λύσεις. 6
Ρύθμιση μοντέλου: σύγχρονες τεχνικές βελτιστοποίησης
Πλεγματική
χρονοβόρα
ισοπίθανη
αντιμετώπιση
Τυχαία
naive
Bayesian
χρονοβόρα
intuitive
7
Ρύθμιση μοντέλου: επισκόπηση
Οι σύγχρονες τεχνικές:
• είναι χρονοβόρες
• δεν μπορεί να αποδειχθούν γενικά βέλτιστες
• είναι ad-hoc
8
Μετα-μάθηση
Σκοπός Δημιουργία μετα-γνώσης από πειρά-
ματα μηχανικής μάθησης
Τρόπος Εξαγωγή μετα-χαρακτηριστικών των
σετ δεδομένων, τα οποία περιέχουν
ουσιώδη πληροφορία
Εφαρμογή Πρόβλεψη βέλτιστων υπερ-
παραμέτρων αλγορίθμου μηχανικής
μάθησης
9
Mετα-χαρακτηριστικά
Πίνακας 1: Λίστα μετα-χαρακτηριστικών μετά από εφαρμογή
φιλτραρίσματος στα 100 σετ δεδομένων εκπαίδευσης
Άθροισμα αθροισμάτων Τυπική απόκλιση επιπέδων
Άθροισμα μέγιστων τιμών Κυρτότητα επιπέδων
Μέση τιμή τυπικών αποκλίσεων Λοξότητα επιπέδων
Μέση τιμή ελαχίστων τιμών Πλήθος χαρακτηριστικών
Μέση τιμή κυρτοτήτων Λογάριθμος πλήθους χαρακτηριστικών
Μέση τιμή λοξοτήτων Πλήθος παραδειγμάτων
Τυπική απόκλιση ελαχίστων τιμών Λογάριθμος πλήθους παραδειγμάτων
Ελάχιστη τιμή μέσων τιμών Ποσοστό αγνώστων τιμών
Ελάχιστη τιμή τυπικών αποκλίσεων Πλήθος αριθμητικών χαρακτηριστικών
Ελάχιστη τιμή ελαχίστων τιμών Πλήθος κατηγορικών χαρακτηριστικών
Ελάχιστη τιμή μεγίστων τιμών Μέγιστη πιθανότητα κλάσης
Ελάχιστη τιμή λοξοτήτων Μέση τιμή πιθανοτήτων κλάσης
Κυρτότητα ελαχίστων τιμών Ποσοστό PC για 95% διακύμανση
Κυρτότητα μεγίστων τιμών Κυρτότητα πρώτης PC
Λοξότητα λοξοτήτων Λοξότητα PC
Άθροισμα επιπέδων
10
Ensembles
Μεταξύ ανταγωνιζομένων υποθέσεων πρέπει να επιλέγεται η
απλούστερη.
— Το ξυράφι του Occam
Ο συνδυασμός σωστών λύσεων σε ένα πρόβλημα, δε μπορεί παρά
να λύνει το πρόβλημα τουλάχιστον εξίσου καλά.
— Επίκουρος
Μία αναγκαία και ικανή συνθήκη για να είναι μία συλλογή μοντέλων
πιο ακριβής από τα μοντέλα που την απαρτίζουν είναι αυτά να είναι
ακριβή και ετερογενή.
— Dietterich 11
Ensembles από αποθήκες μοντέλων
Πρόβλημα Παρουσία πολλών, ετερογενών και εν-
δεχομένως κακής ποιότητας μοντέ-
λων
Στόχος Υπολογιστικά εφικτή τεχνική σχημα-
τισμού συλλογής των αποδοτικότε-
ρων μοντέλων με αποφυγή υπερ-
προσαρμογής
12
Ensembles με προς τα εμπρός επιλογή μοντέλων
Συγκέντρωση
μοντέλων
Αρχικοποίηση
συλλογής
με Ν μοντέλα
Δειγματοληψία
με
αντικατάσταση
Αξιολόγηση
μοντέλων
δείγματος
Προσθήκη
καλύτερου
μοντέλου
OK?
OXI
A B
A: αποφυγή υπερ-προσαρμογής σε μικρές αποθήκες
Β: αποφυγή υπερ-προσαρμογής σε μεγάλες αποθήκες και
αναγκαστικής συμπερίληψης κακών μοντέλων
13
Αρχιτεκτονική Συστήματος
Υποσύστημα εκπαίδευσης
Σκοπός: Εκπαίδευση HyperParameterPrediction (HPP) μοντέλων
Αποθήκη
datasets
optimizer
mfExtractor
Αποθήκη
μετα-δεδομένων
metaLearner HPP-Μοντέλα
1. optimizer: Bελτιστοποίηση υπερ-παραμέτρων
2. mfExtractor: Eξαγωγή μετα-χαρακτηριστικών
3. metaLearner: Eκπαίδευση HPP μοντέλων
14
Υποσύστημα πειράματος
Σκοπός: Παραγωγή βέλτιστου ensemble για δεδομένο πρόβλημα
Dataset
preprocessor
mfExtractor optimizer classifier1
classifier2
classifier3
ensembler evaluator
1. preprocessor:
Προεπεξεργασία
2. mfExtractor: Eξαγωγή
μετα-χαρακτηριστικών
3. optimizer: Ρύθμιση
μοντέλων
5. classifieri: Εκπαίδευση
μοντέλου
6. ensembler:
Σχηματισμός ensemble
7. evaluator: Aξιολόγηση 15
Πειραματικά Αποτελέσματα
Περιγραφή πειραμάτων
Συλλογή
125 σετ
δεδομένων
Καθαρισμός
σετ
δεδομένων
Datasets
Datasets
Εκπαίδευσης
Datasets
Ελέγχου
Eκπαίδευση
HPP μοντέλων
με 10-fold cv
Αξιολόγηση
HPP μοντέλων
με loocv
HPP
μοντέλα
Εκτέλεση
πειραμάτων
Αξιολόγηση
πειραμάτων
16
Αξιολόγηση HPP μοντέλων
Αξιολόγηση HPP μοντέλου για πρόβλεψη υπερ-παραμέτρου
size για το ΑΝΝ μοντέλο
1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 22
3.04.05.06.07.08.09.0
Dataset Index
Size
prediction
class
17
Αξιολόγηση HPP μοντέλων: συμπεράσματα
Από τα πειράματά μας προκύπτει ότι:
• τα HPP μοντέλα δεν προβλέπουν επακριβώς τις βέλτιστες
υπερ-παραμέτρους.
• η χρήση διαστημάτων πρόβλεψης οδηγεί σχεδόν πάντα
στη συμπερίληψη της σωστής τιμής.
18
Αξιολόγηση συστήματος: σύγκριση με πλεγματική αναζήτηση
0.25
0.50
0.75
1.00
1.0 1.1 1.2 1.3
t
P
algorithm
knnGrid
nnetGrid
treeGrid
ensembleGrid
automl
Performance profile plot
19
Αξιολόγηση συστήματος: σύγκριση με Bayesian βελτιστοποί-
ηση
0.25
0.50
0.75
1.00
1.0 1.1 1.2 1.3 1.4
t
P
algorithm
knnTpe
nnetTpe
treeTpe
ensembleTpe
automl
Performance profile plot
20
Αξιολόγηση συστήματος: συμπεράσματα
Με βάση τα διαγράμματα προφίλ απόδοσης και τα στατιστικά
τεστ που εφαρμόσαμε μπορούμε να συμπεράνουμε ότι:
• το σύστημά μας είναι αποδοτικότερο από όλα τα μοντέλα
που ρυθμίστηκαν με πλεγματική αναζήτηση
• το σύστημά μας είναι αποδοτικότερο από όλα τα μοντέλα
που ρυθμίστηκαν με bayesian βελτιστοποίηση, εκτός από
τα CART δέντρα.
21
Μελλοντικές επεκτάσεις
Βελτίωση μοντέλων μετα-μάθησης:
• εύρεση νέων μετα-χαρακτηριστικών
• πειραματισμός με μεταβλητά διαστήματα εμπιστοσύνης
Περαιτέρω παραλληλοποίηση των embarassingly parallel
διαδικασιών:
• βελτιστοποίηση υπερ-παραμέτρων (διαστήματα πρόβλεψης)
Ενσωμάτωση διεπαφών αυτοματοποίησης για:
• συλλογή σετ δεδομένων
• εκπαίδευση μετα-μοντέλων
• χρήση ευριστικών κανόνων
22
?
22
1 of 28

Recommended

Alexandros Delitzas Diploma Thesis presentation by
Alexandros Delitzas Diploma Thesis presentationAlexandros Delitzas Diploma Thesis presentation
Alexandros Delitzas Diploma Thesis presentationISSEL
271 views34 slides
Ανάλυση αθλητικών επιδόσεων με τη χρήση του συστήματος REMEDES by
Ανάλυση αθλητικών επιδόσεων με τη χρήση του συστήματος REMEDESΑνάλυση αθλητικών επιδόσεων με τη χρήση του συστήματος REMEDES
Ανάλυση αθλητικών επιδόσεων με τη χρήση του συστήματος REMEDESISSEL
91 views39 slides
Gougousis Dimitris: Development of an automated machine learning system for p... by
Gougousis Dimitris: Development of an automated machine learning system for p...Gougousis Dimitris: Development of an automated machine learning system for p...
Gougousis Dimitris: Development of an automated machine learning system for p...Manos Tsardoulias
63 views33 slides
ΧΡΗΣΗ ΤΕΧΝΙΚΩΝ ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ ΔΗΜΟΓΡΑΦΙΚ... by
ΧΡΗΣΗ ΤΕΧΝΙΚΩΝ ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ ΔΗΜΟΓΡΑΦΙΚ...ΧΡΗΣΗ ΤΕΧΝΙΚΩΝ ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ ΔΗΜΟΓΡΑΦΙΚ...
ΧΡΗΣΗ ΤΕΧΝΙΚΩΝ ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ ΔΗΜΟΓΡΑΦΙΚ...ISSEL
53 views25 slides
Giannopoulos Nikolaos: Ανάπτυξη Τεχνικών Εξατομίκευσης Διαφημιστικών Προβολών... by
Giannopoulos Nikolaos: Ανάπτυξη Τεχνικών Εξατομίκευσης Διαφημιστικών Προβολών...Giannopoulos Nikolaos: Ανάπτυξη Τεχνικών Εξατομίκευσης Διαφημιστικών Προβολών...
Giannopoulos Nikolaos: Ανάπτυξη Τεχνικών Εξατομίκευσης Διαφημιστικών Προβολών...Manos Tsardoulias
87 views31 slides
Παρουσίαση θεμάτων διπλωματικών 2010 by
Παρουσίαση θεμάτων διπλωματικών 2010Παρουσίαση θεμάτων διπλωματικών 2010
Παρουσίαση θεμάτων διπλωματικών 2010ISSEL
530 views36 slides

More Related Content

Similar to Ελένη Νησιώτη

Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V... by
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...ISSEL
93 views32 slides
Όλγα Βρούσγου by
Όλγα Βρούσγου Όλγα Βρούσγου
Όλγα Βρούσγου ISSEL
102 views28 slides
Γεροκώστα by
ΓεροκώσταΓεροκώστα
ΓεροκώσταISSEL
119 views33 slides
Basketball data analytics via Machine Learning techniques using the REMEDES s... by
Basketball data analytics via Machine Learning techniques using the REMEDES s...Basketball data analytics via Machine Learning techniques using the REMEDES s...
Basketball data analytics via Machine Learning techniques using the REMEDES s...ISSEL
144 views39 slides
Understanding the importance of demographic background for the website aesth... by
Understanding the importance of demographic background  for the website aesth...Understanding the importance of demographic background  for the website aesth...
Understanding the importance of demographic background for the website aesth...ISSEL
105 views25 slides
Αλεξάνδρα Μπαλτζή 7485 by
Αλεξάνδρα Μπαλτζή 7485Αλεξάνδρα Μπαλτζή 7485
Αλεξάνδρα Μπαλτζή 7485ISSEL
194 views32 slides

Similar to Ελένη Νησιώτη(20)

Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V... by ISSEL
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
ISSEL93 views
Όλγα Βρούσγου by ISSEL
Όλγα Βρούσγου Όλγα Βρούσγου
Όλγα Βρούσγου
ISSEL102 views
Γεροκώστα by ISSEL
ΓεροκώσταΓεροκώστα
Γεροκώστα
ISSEL119 views
Basketball data analytics via Machine Learning techniques using the REMEDES s... by ISSEL
Basketball data analytics via Machine Learning techniques using the REMEDES s...Basketball data analytics via Machine Learning techniques using the REMEDES s...
Basketball data analytics via Machine Learning techniques using the REMEDES s...
ISSEL144 views
Understanding the importance of demographic background for the website aesth... by ISSEL
Understanding the importance of demographic background  for the website aesth...Understanding the importance of demographic background  for the website aesth...
Understanding the importance of demographic background for the website aesth...
ISSEL105 views
Αλεξάνδρα Μπαλτζή 7485 by ISSEL
Αλεξάνδρα Μπαλτζή 7485Αλεξάνδρα Μπαλτζή 7485
Αλεξάνδρα Μπαλτζή 7485
ISSEL194 views
Georgia Pantalona by ISSEL
Georgia PantalonaGeorgia Pantalona
Georgia Pantalona
ISSEL168 views
Bagia Rousopoulou by ISSEL
Bagia RousopoulouBagia Rousopoulou
Bagia Rousopoulou
ISSEL272 views
Σχεδίαση και ανάπτυξη συστήματος αξιολόγησης της αισθητικής διαδικτυακών εφαρ... by ISSEL
Σχεδίαση και ανάπτυξη συστήματος αξιολόγησης της αισθητικής διαδικτυακών εφαρ...Σχεδίαση και ανάπτυξη συστήματος αξιολόγησης της αισθητικής διαδικτυακών εφαρ...
Σχεδίαση και ανάπτυξη συστήματος αξιολόγησης της αισθητικής διαδικτυακών εφαρ...
ISSEL356 views
Maria - Christina Maniou Diploma Thesis Presentation by ISSEL
Maria - Christina Maniou Diploma Thesis PresentationMaria - Christina Maniou Diploma Thesis Presentation
Maria - Christina Maniou Diploma Thesis Presentation
ISSEL101 views
Efarm Grafeiou - Ekpaid logism by Tassos Matos
Efarm Grafeiou - Ekpaid logismEfarm Grafeiou - Ekpaid logism
Efarm Grafeiou - Ekpaid logism
Tassos Matos398 views
VET4SBO Level 2 module 2 - unit 1 - v0.9 gr by Karel Van Isacker
VET4SBO Level 2   module 2 - unit 1 - v0.9 grVET4SBO Level 2   module 2 - unit 1 - v0.9 gr
VET4SBO Level 2 module 2 - unit 1 - v0.9 gr
Ιωάννη Α. Ζαφειρίου by ISSEL
Ιωάννη Α. ΖαφειρίουΙωάννη Α. Ζαφειρίου
Ιωάννη Α. Ζαφειρίου
ISSEL115 views
Σχεδίαση και ανάπτυξη Μηχανισμού Αυτοματοποίησης παραγωγής Λογισμικού Ελέγχου... by ISSEL
Σχεδίαση και ανάπτυξη Μηχανισμού Αυτοματοποίησης παραγωγής Λογισμικού Ελέγχου...Σχεδίαση και ανάπτυξη Μηχανισμού Αυτοματοποίησης παραγωγής Λογισμικού Ελέγχου...
Σχεδίαση και ανάπτυξη Μηχανισμού Αυτοματοποίησης παραγωγής Λογισμικού Ελέγχου...
ISSEL73 views
Design and Implementation of a Mechanism that automates the generation of Sof... by ISSEL
Design and Implementation of a Mechanism that automates the generation of Sof...Design and Implementation of a Mechanism that automates the generation of Sof...
Design and Implementation of a Mechanism that automates the generation of Sof...
ISSEL132 views
Control of a nonlinear non affine discrete system using neural networks and ... by Panagiotis Petsagkourakis
Control of a nonlinear non affine discrete system using neural networks and  ...Control of a nonlinear non affine discrete system using neural networks and  ...
Control of a nonlinear non affine discrete system using neural networks and ...
προσομοιωση, μοντελοποιηση by lelman
προσομοιωση, μοντελοποιησηπροσομοιωση, μοντελοποιηση
προσομοιωση, μοντελοποιηση
lelman1.5K views
Punctual fault identification through Machine Learning techniques by ISSEL
Punctual fault identification through Machine Learning techniquesPunctual fault identification through Machine Learning techniques
Punctual fault identification through Machine Learning techniques
ISSEL64 views
Έγκαιρη ταυτοποίηση βλαβών με αλγόριθμους Μηχανικής Mάθησης by ISSEL
Έγκαιρη ταυτοποίηση βλαβών με αλγόριθμους Μηχανικής MάθησηςΈγκαιρη ταυτοποίηση βλαβών με αλγόριθμους Μηχανικής Mάθησης
Έγκαιρη ταυτοποίηση βλαβών με αλγόριθμους Μηχανικής Mάθησης
ISSEL77 views

More from ISSEL

Camera-based localization of annotated objects in indoor environments by
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsISSEL
12 views38 slides
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ... by
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...ISSEL
6 views38 slides
Design and implementation of an automation mechanism to automatically develop... by
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...ISSEL
4 views17 slides
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ... by
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ISSEL
6 views17 slides
Static Analysis of Python code and Identification of Potential Security Vulne... by
Static Analysis of Python code and Identification of Potential Security Vulne...Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...ISSEL
8 views16 slides
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ... by
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...ISSEL
26 views27 slides

More from ISSEL(20)

Camera-based localization of annotated objects in indoor environments by ISSEL
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environments
ISSEL12 views
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ... by ISSEL
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
ISSEL6 views
Design and implementation of an automation mechanism to automatically develop... by ISSEL
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...
ISSEL4 views
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ... by ISSEL
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ISSEL6 views
Static Analysis of Python code and Identification of Potential Security Vulne... by ISSEL
Static Analysis of Python code and Identification of Potential Security Vulne...Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...
ISSEL8 views
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ... by ISSEL
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
ISSEL26 views
Design and Development of an Authorization and Access Control Mechanism for C... by ISSEL
Design and Development of an Authorization and Access Control Mechanism for C...Design and Development of an Authorization and Access Control Mechanism for C...
Design and Development of an Authorization and Access Control Mechanism for C...
ISSEL13 views
Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο... by ISSEL
Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο...Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο...
Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο...
ISSEL19 views
Analysis and profiling of developer profiles using data mining techniques fro... by ISSEL
Analysis and profiling of developer profiles using data mining techniques fro...Analysis and profiling of developer profiles using data mining techniques fro...
Analysis and profiling of developer profiles using data mining techniques fro...
ISSEL3 views
Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση... by ISSEL
Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση...Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση...
Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση...
ISSEL8 views
TOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEM by ISSEL
TOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEMTOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEM
TOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEM
ISSEL3 views
ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ... by ISSEL
ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ...ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ...
ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ...
ISSEL11 views
System Development for Prediction of Static Analysis Metrics of Source Code by ISSEL
System Development for Prediction of Static Analysis Metrics of Source CodeSystem Development for Prediction of Static Analysis Metrics of Source Code
System Development for Prediction of Static Analysis Metrics of Source Code
ISSEL6 views
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ... by ISSEL
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
ISSEL11 views
Micro Front-ends and Microservices Architecture in Web Application Development by ISSEL
Micro Front-ends and Microservices Architecture in Web Application DevelopmentMicro Front-ends and Microservices Architecture in Web Application Development
Micro Front-ends and Microservices Architecture in Web Application Development
ISSEL8 views
Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ... by ISSEL
Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ...Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ...
Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ...
ISSEL19 views
Indoor localization using wireless networks by ISSEL
Indoor localization using wireless networksIndoor localization using wireless networks
Indoor localization using wireless networks
ISSEL5 views
Εντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύων by ISSEL
Εντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύωνΕντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύων
Εντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύων
ISSEL10 views
Design and implementation of a big data architecture for storage, real-time p... by ISSEL
Design and implementation of a big data architecture for storage, real-time p...Design and implementation of a big data architecture for storage, real-time p...
Design and implementation of a big data architecture for storage, real-time p...
ISSEL9 views
Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ... by ISSEL
Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ...Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ...
Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ...
ISSEL16 views

Recently uploaded

Politexneio_2023.pptx by
Politexneio_2023.pptxPolitexneio_2023.pptx
Politexneio_2023.pptx36dimperist
37 views6 slides
Μνημεία Παγκόσμιας Πολιτιστικής Κληρονομιάς ΛΑΠΜΠΟΥΚ by
Μνημεία Παγκόσμιας Πολιτιστικής Κληρονομιάς ΛΑΠΜΠΟΥΚΜνημεία Παγκόσμιας Πολιτιστικής Κληρονομιάς ΛΑΠΜΠΟΥΚ
Μνημεία Παγκόσμιας Πολιτιστικής Κληρονομιάς ΛΑΠΜΠΟΥΚDimitra Mylonaki
17 views39 slides
Ομάδα 3 Βριλήσσια.pdf by
Ομάδα 3 Βριλήσσια.pdfΟμάδα 3 Βριλήσσια.pdf
Ομάδα 3 Βριλήσσια.pdfChrisa Kokorikou
54 views6 slides
ΟΜΑΔΑ 1η- ΠΕΝΤΕΛΗ(ΠΑΛΑΙΑ).pdf by
ΟΜΑΔΑ 1η- ΠΕΝΤΕΛΗ(ΠΑΛΑΙΑ).pdfΟΜΑΔΑ 1η- ΠΕΝΤΕΛΗ(ΠΑΛΑΙΑ).pdf
ΟΜΑΔΑ 1η- ΠΕΝΤΕΛΗ(ΠΑΛΑΙΑ).pdfChrisa Kokorikou
54 views5 slides
ΕΞΕ - 136784 - 2023 - Υποβολή δικαιολογητικών για προφορική ή γραπτή εξέταση ... by
ΕΞΕ - 136784 - 2023 - Υποβολή δικαιολογητικών για προφορική ή γραπτή εξέταση ...ΕΞΕ - 136784 - 2023 - Υποβολή δικαιολογητικών για προφορική ή γραπτή εξέταση ...
ΕΞΕ - 136784 - 2023 - Υποβολή δικαιολογητικών για προφορική ή γραπτή εξέταση ...2lykkomo
533 views7 slides
Dikaiomata_2023.pptx by
Dikaiomata_2023.pptxDikaiomata_2023.pptx
Dikaiomata_2023.pptx41dimperisteriou
339 views33 slides

Recently uploaded(20)

Politexneio_2023.pptx by 36dimperist
Politexneio_2023.pptxPolitexneio_2023.pptx
Politexneio_2023.pptx
36dimperist37 views
Μνημεία Παγκόσμιας Πολιτιστικής Κληρονομιάς ΛΑΠΜΠΟΥΚ by Dimitra Mylonaki
Μνημεία Παγκόσμιας Πολιτιστικής Κληρονομιάς ΛΑΠΜΠΟΥΚΜνημεία Παγκόσμιας Πολιτιστικής Κληρονομιάς ΛΑΠΜΠΟΥΚ
Μνημεία Παγκόσμιας Πολιτιστικής Κληρονομιάς ΛΑΠΜΠΟΥΚ
Dimitra Mylonaki17 views
ΟΜΑΔΑ 1η- ΠΕΝΤΕΛΗ(ΠΑΛΑΙΑ).pdf by Chrisa Kokorikou
ΟΜΑΔΑ 1η- ΠΕΝΤΕΛΗ(ΠΑΛΑΙΑ).pdfΟΜΑΔΑ 1η- ΠΕΝΤΕΛΗ(ΠΑΛΑΙΑ).pdf
ΟΜΑΔΑ 1η- ΠΕΝΤΕΛΗ(ΠΑΛΑΙΑ).pdf
Chrisa Kokorikou54 views
ΕΞΕ - 136784 - 2023 - Υποβολή δικαιολογητικών για προφορική ή γραπτή εξέταση ... by 2lykkomo
ΕΞΕ - 136784 - 2023 - Υποβολή δικαιολογητικών για προφορική ή γραπτή εξέταση ...ΕΞΕ - 136784 - 2023 - Υποβολή δικαιολογητικών για προφορική ή γραπτή εξέταση ...
ΕΞΕ - 136784 - 2023 - Υποβολή δικαιολογητικών για προφορική ή γραπτή εξέταση ...
2lykkomo533 views
ΚΑΤΑΝΑΛΩΤΙΣΜΟΣ. by ssuser43d27b
ΚΑΤΑΝΑΛΩΤΙΣΜΟΣ.ΚΑΤΑΝΑΛΩΤΙΣΜΟΣ.
ΚΑΤΑΝΑΛΩΤΙΣΜΟΣ.
ssuser43d27b35 views
Γυμνάσιο Κεραμωτής: Διδακτική επίσκεψη στο Ίδρυμα Ορμύλια 28.11.2023 by gymkeram
Γυμνάσιο Κεραμωτής: Διδακτική επίσκεψη στο Ίδρυμα Ορμύλια 28.11.2023Γυμνάσιο Κεραμωτής: Διδακτική επίσκεψη στο Ίδρυμα Ορμύλια 28.11.2023
Γυμνάσιο Κεραμωτής: Διδακτική επίσκεψη στο Ίδρυμα Ορμύλια 28.11.2023
gymkeram63 views
ΟΔΗΓΙΕΣ ΚΑΤΑΘΕΣΗΣ ΑΠΟΓΡΑΦΗΣ-3-4 (1).pdf by ssuser369a35
ΟΔΗΓΙΕΣ ΚΑΤΑΘΕΣΗΣ ΑΠΟΓΡΑΦΗΣ-3-4 (1).pdfΟΔΗΓΙΕΣ ΚΑΤΑΘΕΣΗΣ ΑΠΟΓΡΑΦΗΣ-3-4 (1).pdf
ΟΔΗΓΙΕΣ ΚΑΤΑΘΕΣΗΣ ΑΠΟΓΡΑΦΗΣ-3-4 (1).pdf
ssuser369a3517 views
Ενεργώ ως Πολίτης - Δράση "Είναι όλα τα λεμόνια ίδια;" by gymkeram
Ενεργώ ως Πολίτης - Δράση "Είναι όλα τα λεμόνια ίδια;"Ενεργώ ως Πολίτης - Δράση "Είναι όλα τα λεμόνια ίδια;"
Ενεργώ ως Πολίτης - Δράση "Είναι όλα τα λεμόνια ίδια;"
gymkeram13 views
ίδρυμα Λασκαρίδη 22-11-23.pptx by psipsa
ίδρυμα Λασκαρίδη 22-11-23.pptxίδρυμα Λασκαρίδη 22-11-23.pptx
ίδρυμα Λασκαρίδη 22-11-23.pptx
psipsa14 views
ΔΙΑΧΕΙΡΙΣΗ ΚΡΙΣΕΩΝ-ΣΥΜΒΟΥΛΟΣ ΣΧΟΛΙΚΗΣ ΖΩΗΣ by ssuser43d27b
ΔΙΑΧΕΙΡΙΣΗ ΚΡΙΣΕΩΝ-ΣΥΜΒΟΥΛΟΣ ΣΧΟΛΙΚΗΣ ΖΩΗΣΔΙΑΧΕΙΡΙΣΗ ΚΡΙΣΕΩΝ-ΣΥΜΒΟΥΛΟΣ ΣΧΟΛΙΚΗΣ ΖΩΗΣ
ΔΙΑΧΕΙΡΙΣΗ ΚΡΙΣΕΩΝ-ΣΥΜΒΟΥΛΟΣ ΣΧΟΛΙΚΗΣ ΖΩΗΣ
ssuser43d27b36 views
Παιδιά εθισμένα σε socialmedia, βιντεοπαιχνίδια. by ssuser43d27b
Παιδιά εθισμένα σε socialmedia, βιντεοπαιχνίδια.Παιδιά εθισμένα σε socialmedia, βιντεοπαιχνίδια.
Παιδιά εθισμένα σε socialmedia, βιντεοπαιχνίδια.
ssuser43d27b31 views
ΧΡΙΣΤΟΥΓΕΝΝΑ ΣΕ ΟΛΟΝ ΤΟΝ ΚΟΣΜΟ.pptx by ssuser86b52c
ΧΡΙΣΤΟΥΓΕΝΝΑ ΣΕ ΟΛΟΝ ΤΟΝ ΚΟΣΜΟ.pptxΧΡΙΣΤΟΥΓΕΝΝΑ ΣΕ ΟΛΟΝ ΤΟΝ ΚΟΣΜΟ.pptx
ΧΡΙΣΤΟΥΓΕΝΝΑ ΣΕ ΟΛΟΝ ΤΟΝ ΚΟΣΜΟ.pptx
ssuser86b52c16 views
Παγκόσμια Ημέρα Ατόμων με Αναπηρία.pptx by 7gymnasiokavalas
Παγκόσμια Ημέρα Ατόμων με Αναπηρία.pptxΠαγκόσμια Ημέρα Ατόμων με Αναπηρία.pptx
Παγκόσμια Ημέρα Ατόμων με Αναπηρία.pptx
7gymnasiokavalas14 views
ΠΡΟΓΡΑΜΜΑ_ΤΕΛΙΚΟ_01.12.2023.pdf by 2lykkomo
ΠΡΟΓΡΑΜΜΑ_ΤΕΛΙΚΟ_01.12.2023.pdfΠΡΟΓΡΑΜΜΑ_ΤΕΛΙΚΟ_01.12.2023.pdf
ΠΡΟΓΡΑΜΜΑ_ΤΕΛΙΚΟ_01.12.2023.pdf
2lykkomo944 views
Ο ΑΪ ΒΑΣΙΛΗΣ ΣΤΙΣ ΔΙΑΦΟΡΕΣ ΧΩΡΕΣ ΜΕΡΟΣ Β.pptx by ssuser86b52c
Ο ΑΪ ΒΑΣΙΛΗΣ ΣΤΙΣ ΔΙΑΦΟΡΕΣ ΧΩΡΕΣ ΜΕΡΟΣ Β.pptxΟ ΑΪ ΒΑΣΙΛΗΣ ΣΤΙΣ ΔΙΑΦΟΡΕΣ ΧΩΡΕΣ ΜΕΡΟΣ Β.pptx
Ο ΑΪ ΒΑΣΙΛΗΣ ΣΤΙΣ ΔΙΑΦΟΡΕΣ ΧΩΡΕΣ ΜΕΡΟΣ Β.pptx
ssuser86b52c12 views
Ο ΑΪ ΒΑΣΙΛΗΣ ΣΤΙΣ ΔΙΑΦΟΡΕΣ ΧΩΡΕΣ.pptx by ssuser86b52c
Ο ΑΪ ΒΑΣΙΛΗΣ ΣΤΙΣ ΔΙΑΦΟΡΕΣ ΧΩΡΕΣ.pptxΟ ΑΪ ΒΑΣΙΛΗΣ ΣΤΙΣ ΔΙΑΦΟΡΕΣ ΧΩΡΕΣ.pptx
Ο ΑΪ ΒΑΣΙΛΗΣ ΣΤΙΣ ΔΙΑΦΟΡΕΣ ΧΩΡΕΣ.pptx
ssuser86b52c10 views
Σχολές, Σπουδές & Πανελλαδικές 2024 by EmployEdu
Σχολές, Σπουδές & Πανελλαδικές 2024Σχολές, Σπουδές & Πανελλαδικές 2024
Σχολές, Σπουδές & Πανελλαδικές 2024
EmployEdu32 views

Ελένη Νησιώτη

  • 1. Αυτοματοποιήμενος Αναλυτής Δεδομένων Εκπόνηση Ελένη Νησιώτη 7737 Επίβλεψη Επίκ. Καθ. Ανδρέας Συμεωνίδης Συνεπίβλεψη Δρ. Κυριάκος Χατζηδημητρίου Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εργαστήριο Επεξεργασίας Πληροφορίας και Υπολογισμών 29 Μαρτίου 2017
  • 3. Ο προβληματισμός To 75% ενός πειράματος μηχανικής μάθησης αφιερώνεται στην προετοιμασία της εφαρμογής του αλγορίθμου και το 15% στα βήματα που την ακολουθούν. Το μεγαλύτερο μέρος της έρευνας επικεντρώνεται στο ενδιάμεσο 10% … — Rich Caruana, ICML 2015 Ανάγκη για επέκταση της τρέχουσας έρευνας σε χρονοβόρα στάδια της διαδικασίας εφαρμογής μηχανικής μάθησης που μέχρι τώρα γίνονταν χειροκίνητα. 1
  • 4. Η αναγκαιότητα της μεταφερσιμότητας Πρόβλημα → ML → Λύση Πρόβλημα → ML → Λύση Πρόβλημα → ML → Λύση Πρόβλημα → ML → Λύση Πρόβλημα → ML → Λύση Πρόβλημα → ML → Λύση 2
  • 5. Η εξέλιξη του ML ... Ο προγραμματισμός στοχεύει στην αυτοματοποίηση, η μηχανική μάθηση στην αυτοματοποίηση της αυτοματοποίησης και η αυτοματοποιημένη μηχανική μάθηση στην αυτοματοποίηση του να αυτοματοποιείς την αυτοματοποίηση. — Matthew Mayo, KDnuggets 2017 Το νέο στάδιο στην εξέλιξη της μηχανικής μάθησης στοχεύει στη δημιουργία μετα-γνώσης για την αυτοματοποίηση της ίδιας της διαδικασίας της μάθησης και όχι μεμονωμένων προβλημάτων. 3
  • 6. ... στην επιστήμη του AutoML Απαρχές Unica, MarketSwitch, KXEN Πεδία Εφαρμογής Προ-επεξεργασία, Επιλογή αλ- γορίθμου, Ρύθμιση μοντέλου Σύγχρονα Εργαλεία Auto-WEKA, Microsoft Azure, caret, HPOlib, Google AutoML 4
  • 7. Το προτεινόμενο σύστημα Ένας αυτοματοποιημένος αναλυτής δεδομένων για προβλήματα δυαδικής ταξινόμησης με εμπειρία παλαιότερων πειραμάτων και κατανοητή έξοδο. • Αυτόματος σχηματισμός βέλτιστου ensemble • Ενσωμάτωση μετα-μάθησης για ρύθμιση μοντέλου • Παραγωγή επεξηγηματικού report για το χρήστη 5
  • 9. No free lunch theorem Αν λάβουμε υπόψιν όλες τις πιθανές κατανομές δημιουργίας δεδομένων, τότε κάθε αλγόριθμος μηχανικής μάθησης επιδεικνύει κατά μέσο όρο το ίδιο σφάλμα στην πρόβλεψη άγνωστων παραδειγμάτων. — David Wolpert, 1996 Είναι αδύνατη η εύρεση ενός γενικά βέλτιστου αλγορίθμου. Ένα εργαλείο βελτιστοποίησης γενικής φύσης προβλημάτων οφείλει να εξερευνήσει το χώρο των πιθανών μηχανισμών δημιουργίας δεδομένων και να προσφέρει προσαρμοσμένες λύσεις. 6
  • 10. Ρύθμιση μοντέλου: σύγχρονες τεχνικές βελτιστοποίησης Πλεγματική χρονοβόρα ισοπίθανη αντιμετώπιση Τυχαία naive Bayesian χρονοβόρα intuitive 7
  • 11. Ρύθμιση μοντέλου: επισκόπηση Οι σύγχρονες τεχνικές: • είναι χρονοβόρες • δεν μπορεί να αποδειχθούν γενικά βέλτιστες • είναι ad-hoc 8
  • 12. Μετα-μάθηση Σκοπός Δημιουργία μετα-γνώσης από πειρά- ματα μηχανικής μάθησης Τρόπος Εξαγωγή μετα-χαρακτηριστικών των σετ δεδομένων, τα οποία περιέχουν ουσιώδη πληροφορία Εφαρμογή Πρόβλεψη βέλτιστων υπερ- παραμέτρων αλγορίθμου μηχανικής μάθησης 9
  • 13. Mετα-χαρακτηριστικά Πίνακας 1: Λίστα μετα-χαρακτηριστικών μετά από εφαρμογή φιλτραρίσματος στα 100 σετ δεδομένων εκπαίδευσης Άθροισμα αθροισμάτων Τυπική απόκλιση επιπέδων Άθροισμα μέγιστων τιμών Κυρτότητα επιπέδων Μέση τιμή τυπικών αποκλίσεων Λοξότητα επιπέδων Μέση τιμή ελαχίστων τιμών Πλήθος χαρακτηριστικών Μέση τιμή κυρτοτήτων Λογάριθμος πλήθους χαρακτηριστικών Μέση τιμή λοξοτήτων Πλήθος παραδειγμάτων Τυπική απόκλιση ελαχίστων τιμών Λογάριθμος πλήθους παραδειγμάτων Ελάχιστη τιμή μέσων τιμών Ποσοστό αγνώστων τιμών Ελάχιστη τιμή τυπικών αποκλίσεων Πλήθος αριθμητικών χαρακτηριστικών Ελάχιστη τιμή ελαχίστων τιμών Πλήθος κατηγορικών χαρακτηριστικών Ελάχιστη τιμή μεγίστων τιμών Μέγιστη πιθανότητα κλάσης Ελάχιστη τιμή λοξοτήτων Μέση τιμή πιθανοτήτων κλάσης Κυρτότητα ελαχίστων τιμών Ποσοστό PC για 95% διακύμανση Κυρτότητα μεγίστων τιμών Κυρτότητα πρώτης PC Λοξότητα λοξοτήτων Λοξότητα PC Άθροισμα επιπέδων 10
  • 14. Ensembles Μεταξύ ανταγωνιζομένων υποθέσεων πρέπει να επιλέγεται η απλούστερη. — Το ξυράφι του Occam Ο συνδυασμός σωστών λύσεων σε ένα πρόβλημα, δε μπορεί παρά να λύνει το πρόβλημα τουλάχιστον εξίσου καλά. — Επίκουρος Μία αναγκαία και ικανή συνθήκη για να είναι μία συλλογή μοντέλων πιο ακριβής από τα μοντέλα που την απαρτίζουν είναι αυτά να είναι ακριβή και ετερογενή. — Dietterich 11
  • 15. Ensembles από αποθήκες μοντέλων Πρόβλημα Παρουσία πολλών, ετερογενών και εν- δεχομένως κακής ποιότητας μοντέ- λων Στόχος Υπολογιστικά εφικτή τεχνική σχημα- τισμού συλλογής των αποδοτικότε- ρων μοντέλων με αποφυγή υπερ- προσαρμογής 12
  • 16. Ensembles με προς τα εμπρός επιλογή μοντέλων Συγκέντρωση μοντέλων Αρχικοποίηση συλλογής με Ν μοντέλα Δειγματοληψία με αντικατάσταση Αξιολόγηση μοντέλων δείγματος Προσθήκη καλύτερου μοντέλου OK? OXI A B A: αποφυγή υπερ-προσαρμογής σε μικρές αποθήκες Β: αποφυγή υπερ-προσαρμογής σε μεγάλες αποθήκες και αναγκαστικής συμπερίληψης κακών μοντέλων 13
  • 18. Υποσύστημα εκπαίδευσης Σκοπός: Εκπαίδευση HyperParameterPrediction (HPP) μοντέλων Αποθήκη datasets optimizer mfExtractor Αποθήκη μετα-δεδομένων metaLearner HPP-Μοντέλα 1. optimizer: Bελτιστοποίηση υπερ-παραμέτρων 2. mfExtractor: Eξαγωγή μετα-χαρακτηριστικών 3. metaLearner: Eκπαίδευση HPP μοντέλων 14
  • 19. Υποσύστημα πειράματος Σκοπός: Παραγωγή βέλτιστου ensemble για δεδομένο πρόβλημα Dataset preprocessor mfExtractor optimizer classifier1 classifier2 classifier3 ensembler evaluator 1. preprocessor: Προεπεξεργασία 2. mfExtractor: Eξαγωγή μετα-χαρακτηριστικών 3. optimizer: Ρύθμιση μοντέλων 5. classifieri: Εκπαίδευση μοντέλου 6. ensembler: Σχηματισμός ensemble 7. evaluator: Aξιολόγηση 15
  • 21. Περιγραφή πειραμάτων Συλλογή 125 σετ δεδομένων Καθαρισμός σετ δεδομένων Datasets Datasets Εκπαίδευσης Datasets Ελέγχου Eκπαίδευση HPP μοντέλων με 10-fold cv Αξιολόγηση HPP μοντέλων με loocv HPP μοντέλα Εκτέλεση πειραμάτων Αξιολόγηση πειραμάτων 16
  • 22. Αξιολόγηση HPP μοντέλων Αξιολόγηση HPP μοντέλου για πρόβλεψη υπερ-παραμέτρου size για το ΑΝΝ μοντέλο 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 22 3.04.05.06.07.08.09.0 Dataset Index Size prediction class 17
  • 23. Αξιολόγηση HPP μοντέλων: συμπεράσματα Από τα πειράματά μας προκύπτει ότι: • τα HPP μοντέλα δεν προβλέπουν επακριβώς τις βέλτιστες υπερ-παραμέτρους. • η χρήση διαστημάτων πρόβλεψης οδηγεί σχεδόν πάντα στη συμπερίληψη της σωστής τιμής. 18
  • 24. Αξιολόγηση συστήματος: σύγκριση με πλεγματική αναζήτηση 0.25 0.50 0.75 1.00 1.0 1.1 1.2 1.3 t P algorithm knnGrid nnetGrid treeGrid ensembleGrid automl Performance profile plot 19
  • 25. Αξιολόγηση συστήματος: σύγκριση με Bayesian βελτιστοποί- ηση 0.25 0.50 0.75 1.00 1.0 1.1 1.2 1.3 1.4 t P algorithm knnTpe nnetTpe treeTpe ensembleTpe automl Performance profile plot 20
  • 26. Αξιολόγηση συστήματος: συμπεράσματα Με βάση τα διαγράμματα προφίλ απόδοσης και τα στατιστικά τεστ που εφαρμόσαμε μπορούμε να συμπεράνουμε ότι: • το σύστημά μας είναι αποδοτικότερο από όλα τα μοντέλα που ρυθμίστηκαν με πλεγματική αναζήτηση • το σύστημά μας είναι αποδοτικότερο από όλα τα μοντέλα που ρυθμίστηκαν με bayesian βελτιστοποίηση, εκτός από τα CART δέντρα. 21
  • 27. Μελλοντικές επεκτάσεις Βελτίωση μοντέλων μετα-μάθησης: • εύρεση νέων μετα-χαρακτηριστικών • πειραματισμός με μεταβλητά διαστήματα εμπιστοσύνης Περαιτέρω παραλληλοποίηση των embarassingly parallel διαδικασιών: • βελτιστοποίηση υπερ-παραμέτρων (διαστήματα πρόβλεψης) Ενσωμάτωση διεπαφών αυτοματοποίησης για: • συλλογή σετ δεδομένων • εκπαίδευση μετα-μοντέλων • χρήση ευριστικών κανόνων 22
  • 28. ? 22