ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
Στεργιάδης Εμμανουήλ
1. Κλιμακούμενη πλατφόρμα κατασκευής
και επέκτασης φυλογενετικών προφίλ με
χρήση Πλέγματος Υπολογιστών
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης
Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Επεξεργασία Πληροφοριών και Υπολογισμών (ΕΠΥ)
Intelligent Systems and Software Engineering Lab (ISSEL)
Επιβλέπων καθηγητής : Περικλής Α Μήτκας
Εμμανουήλ Στεργιάδης
2. ΣΤΟΧΟΣ ΤΗΣ ΕΡΓΑΣΙΑΣ
• Ευθυγράμμιση ακολουθιών
• Φυλογενετικά προφίλ
Σε εύλογο χρόνο Επεκτασιμότητα
Χρειαζόμαστε μια διανεμημένη υποδομή
Εικόνα από : http://www.nature.com/articles/nmicrobiol201648
3. ΑΝΑΓΚΗ ΓΙΑ ΕΠΕΚΤΑΣΙΜΟΤΗΤΑ
1. Μείωση του κόστους παραγωγής βιολογικών
δεδομένων
2. Μείωση του κόστους αποθήκευσης δεδομένων
3. Εγγενής πολυπλοκότητα βασικών αλγορίθμων
Ως αποτέλεσμα:
• Η βιοπληροφορική είναι πλέον Big Data Domain
Εικόνα από : http://www.nature.com/journal/v498
4. ΕΥΘΥΓΡΑΜΜΙΣΗ ΑΚΟΛΟΥΘΙΩΝ
Ομοιότητες στη σύσταση μπορεί να σχετίζονται:
1. Με παρόμοια λειτουργία
2. Με εξελικτική σχέση
Δυστυχώς είναι υπολογιστικά απαιτητική:
• Brute Force -> εκθετικός χρόνος
• Research + Industry standard NCBI - BLAST
Εικόνες από : http://petang.cgu.edu.tw/Bioinfomatics/
5. ΦΥΛΟΓΕΝΕΤΙΚΑ ΠΡΟΦΙΛ
Τύποι προφίλ:
• Δυαδικά
• Επεκταμένα
• BBH
Συμπληρώνουν την απλή ευθυγράμμιση ακολουθιών διότι υποδεικνύουν:
• Συμμετοχή πρωτεϊνών σε κοινά μεταβολικά μονοπάτια
• Συγγενικές σχέσεις μεταξύ ειδών και οικογενειών
Εικόνα από : https://www.researchgate.net/publication/256608800
6. Best-Bidirectional Hits (BΒΗ) ΠΡΟΦΙΛ
• Ισχυρότερη ένδειξη υπέρ της εξελικτικής συσχέτισης
δύο οργανισμών
• Αλγοριθμικά πιο πολύπλοκο να κατασκευαστούν
Εικόνα από : http://www.nmpdr.org/FIG/BidirectionalBestHit
A B
Γ
Ε
Δ
7. GRID
Πλεονεκτήματα της υποδομής:
• Επεκτάσιμο χάρη στη διανεμημένη φύση του
• Αντιμετώπιση σφαλμάτων at runtime
Μειονεκτήματα:
• Μειωμένος έλεγχος στη δρομολόγηση
• Ανομοιογένεια υπολογιστικών πόρων
Εικόνα από : http://www.lpds.sztaki.hu/gasuc
13. ΠΟΛΥΠΛΟΚΟΤΗΤΑ
• BLAST: 𝑂
𝑁
𝑃
∗ 𝑀
Παράγει 𝚨 <
Ν
P
∗ M ομολογίες
• Κατασκευή Προφίλ: 𝑂 𝐴
constant για κάθε ομολογία:
1 increment για απλά
1 έλεγχος ως προς running best για BBH
• Συνδυασμός BBH: 𝑂(𝐵)
ένα list access για κάθε βέλτιστη ομολογία
Όπου
P: πλήθος υπολογιστικών κόμβων
Ν: ακολουθίες αρχείων query
M: ακολουθίες βάσης
Α: πλήθος ομολογιών που παράγει ο BLAST
B << A: πλήθος βέλτιστων ομολογιών
15. ΕΞΟΔΟΣ
Απλή ώστε να είναι:
1. Αναγνώσιμη από το χρήστη
2. Μπορεί να αποτελέσει
είσοδο για επόμενο στάδιο
Μέγεθος Ν * Κ: Ένα διάνυσμα για κάθε ακολουθία με ένα στοιχείο για κάθε οργανισμό της βάσης
Για εύκολη οπτικοποίηση κάνουμε collapse σε επίπεδο οργανισμού: Μέγεθος K * K
16. ΑΠΟΤΕΛΕΣΜΑΤΑ
Σε μεγαλύτερες αναλύσεις ο χρόνος
δρομολόγησης εμφανίζει
διακύμανση, άρα δεν μπορούμε να
εγγυηθούμε ότι η σειρά υποβολής
είναι βέλτιστη.
Ωστόσο παραμένει αρκετά καλή
17. ΑΝΟΜΟΙΟΓΕΝΕΙΑ ΠΟΡΩΝ
Προφανώς τα μηχανήματα στον κόμβο του
AΠΘ είναι καλύτερα από αυτά της
Αφροδίτης
afroditi.hellasgrid
grid.auth
18. ΑΝΟΜΟΙΟΓΕΝΕΙΑ ΠΡΟΒΛΗΜΑΤΟΣ
Όλα τα jobs έχουν τρέξει στον κόμβο
afroditi.hellasgrid.gr στην
Αθήνα.
Ωστόσο ακόμη και σε μηχανήματα της
ίδιας ισχύος βλέπουμε έντονη
διακύμανση στο χρόνο εκτέλεσης
Το πλήθος ακολουθιών όπως και το
μέσο μήκος κάθε ακολουθίας
εμφανίζει μεγάλη διακύμανση
19. ΕΠΕΚΤΑΣΗ ΠΡΟΦΙΛ
Τμήμα 1 Δημιουργία νέων προφίλ
Τμήμα 2 Επέκταση υπαρχόντων
Πλεονεκτήματα
• Ο μέγιστος χρόνος εκτέλεσης
για μία εργασία μειώθηκε στο
μισό
• Συνολική επιτάχυνση κατά ~ 10
ώρες
22. ΕΥΧΑΡΙΣΤΗΡΙΕΣ/ΔΗΜΟΣΙΕΥΣΕΙΣ
• Ευχαριστώ θερμά:
• τον καθηγητή Περικλή Α. Μήτκα
• τον μεταδιδακτορικό ερευνητή Φώτη Ε. Ψωμόπουλο
• τον υποψήφιο διδάκτορα Αθανάσιο Κιντσάκη
• Δημοσίευση:
• Emmanouil Stergiadis, Athanassios M. Kintsakis, Fotis E. Psomopoulos and Pericles A.
Mitkas, "A scalable Grid Computing framework for extensible phylogenetic profile
construction", 5th Mining Humanistic Data Workshop (MHDW2016) in conjunction
with the 12th International Conference on Artificial Intelligence Applications and
Innovations (AIAI 2016), Thessaloniki, Greece, September 16-18, 2016, pages 8.