Bug Fix Time Classification on Open Source Repositories

ISSEL
ISSELISSEL
Πολυτεχνική Σχολή
Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών
Τομέας Ηλεκτρονικής & Υπολογιστών
Διπλωματική Εργασία
Εργαστήριο Επεξεργασίας Πληροφορίας
και Τεχνολογίας Λογισμικού (ISSEL)
Επίβλεψη
Αναπληρωτής Καθηγητής Ανδρέας Λ.Συμεωνίδης
Μεταδιδακτορικός Ερευνητής Δρ. Διαμαντόπουλος
Θεμιστοκλής
Εκπόνηση
Ζηκόπης Ευάγγελος
ΑΕΜ: 8808
Ταξινόμηση Σφαλμάτων από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση το Χρόνο Επιδιόρθωσής τους
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους
2
Δομή Παρουσίασης
Συμπεράσματα &
Μελλοντική εργασία
Συμπεράσματα &
Μελλοντική Εργασία
Ε Εισαγωγή
Αποτελέσματα & Αξιολόγηση
Εισαγωγή
Περιγραφή
• Κατακόρυφη αύξηση απαιτήσεων
• Νέα πρότυπα εργασίας ομάδων λογισμικού
• ‘Έλλειψη αυτοματοποιημένων διαδικασιών σχετικά με την ανάπτυξη λογισμικού
• Αδυναμία δημιουργίας αντιπροσωπευτικού χρονοδιαγράμματος ολοκλήρωσης
έργου
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 4
Σκοπός
• Συμβολή στην αυτοματοποίηση της διαχείρισης ομάδων ανάπτυξης λογισμικού
• Εκμετάλλευση όλης της διαθέσιμης πληροφορίας που κρύβει ένα Issue Report
• Εξαγωγή συμπερασμάτων σχετικά με τα έργα ανοιχτού κώδικα
Ορισμός Προβλήματος
Η σχεδίαση ενός συστήματος το οποίο ταξινομεί τα σφάλματα λογισμικού ενός συγκεκριμένου
αποθετηρίου, ανάλογα με τον εκτιμώμενο χρόνο επιδιόρθωσής τους
GitHub Issue Report
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 5
1
1 Τίτλος
2
2 Κατάσταση
3
3 Περιγραφή
4
4 Υπεύθυνος
5
5 Labels
6 6 Συνδεδεμένα Commits
7
7 Σχόλια
Μεθοδολογία
Αρχιτεκτονική Συστήματος
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους
7
Συλλογή & Προεπεξεργασία Δεδομένων
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 8
Κανόνες Επιλογής Issues από τη Βάση Δεδομένων
Είναι σε κατάσταση closed
Έχει διαθέσιμες ημερομηνίες στις
οποίες άνοιξε / έκλεισε
Έχει συμπληρωμένα τα πεδία
τίτλος, περιγραφή, labels, assignee
Το αποθετήριο έχει από 50 έως
5000 έγκυρα issues
01
02
03
04
Προεπεξεργασία Συλλεγμένων Issues
Προεπεξεργασία &
Προετοιμασία κειμένου
για εφαρμογή τεχνικών
εξόρυξης δεδομένων
Εφαρμογή μετασχηματισμού
Z-Score για απομάκρυνση
θορύβου
Διατήρηση μόνο όσων έχουν
κλείσει ή αναφερθεί σε commits ή
έχουν σχόλια
Διαχωρισμός των
issues σε κλάσεις
Διαχωρισμός σε σετ
εκπαίδευσης /
αξιολόγησης
Ανάλυση Υπομοντέλων
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 9
Υπομοντέλα Τίτλου & Περιγραφής
“ Υπάρχει σύνδεση μεταξύ της λεκτικής περιγραφής ενός
σφάλματος και του χρόνου επιδιόρθωσής του; ”
Επεξεργασία λεκτικών δεδομένων για αύξηση
αποδοτικότητας
Διανυσματοποίηση με τον μετασχηματισμό TF-IDF (Term
Frequency – Inverse Document Frequency)
𝑡𝑓 − 𝑖𝑑𝑓 𝑤, 𝐷 = 𝑡𝑓 𝑤, 𝐷 × log
𝐶
1 + 𝐷 ∈ 𝐶: 𝑤 ∈ 𝐷
Εκπαίδευση Naïve Bayes ταξινομητή
𝑃 𝑥𝑖 𝑐 =
𝑡𝑓𝑖𝑑𝑓 𝑥𝑖, 𝑐 + 1
𝑡𝑓𝑖𝑑𝑓 𝑐 + |𝑉|
Σχεδίαση ξεχωριστών μοντέλων για τίτλο και περιγραφή
Ανάλυση Υπομοντέλων
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους
10
“ Μπορούμε να προβλέψουμε τον χρόνο στον οποίο θα
διορθώσει ένα σφάλμα κάποιος μηχανικός με βάση το
ιστορικό του; ”
Υπομοντέλο Assignee
Συγκέντρωση των issues που έχει επιλύσει στο
παρελθόν ο συγκεκριμένος χρήστης
Μέτρηση της συχνότητας εμφάνισης αυτών των
issues σε κάθε κλάση
Εξαγωγή σκορ συμμετοχής του χρήστη σε κάθε
κλάση (σκορ στο διάστημα [0,1])
Ανάλυση Υπομοντέλων
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 11
“ Πόσο γρήγορα επιλύονται τα σφάλματα που
χαρακτηρίζονται από συγκεκριμένο label; ”
Υπομοντέλο Labels
Απομόνωση των issues που έχουν κάποιο από τα
labels του εξεταζόμενου issue
Δημιουργία ευρετηρίου για κάθε ένα από τα labels
του εξεταζόμενου issue
Εξαγωγή τελικού σκορ συμμετοχής σε κάθε κλάση
από τη σύνθεση των επιμέρους σκορ κάθε label
Σύνθεση Υπομοντέλων
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 12
Άθροιση & Μέσος Όρος των επιμέρους Σκορ
Class 0 – Fast Class 1– Medium Class 2 - Slow
Title Score 0.22 0.35 0.43
Body Score 0.36 0.25 0.39
Labels Score 0.4 0.6 0
Assignee Score 0.4 0.5 0.1
Final Score 0.345 0.425 0.23
Εξαγωγή των σκορ συμμετοχής σε κάθε κλάση
Άθροιση και Κανονικοποίηση του τελικού σκορ συμμετοχής
του εξεταζόμενου issue σε κάθε κλάση
Σύνθεση Υπομοντέλων
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 13
“ Υπάρχει πιο έξυπνος τρόπος σύνθεσης των
επιμέρους σκορ σε κάθε αποθετήριο; ”
Βελτιστοποιημένη Σύνθεση των
επιμέρους Σκορ
Χρήση του εικονιζόμενου νευρωνικού δικτύου
Εύρεση του συνδυασμού βαρών που βελτιστοποιεί την
ταξινόμηση των issues
Είσοδος Νευρωνικού:
𝑋 = 𝑇𝑖𝑡𝑙𝑒𝑆𝑐𝑜𝑟𝑒, 𝐵𝑜𝑑𝑦𝑆𝑐𝑜𝑟𝑒, 𝐿𝑎𝑏𝑒𝑙𝑠𝑆𝑐𝑜𝑟𝑒, 𝐴𝑠𝑠𝑖𝑔𝑛𝑒𝑒𝑆𝑐𝑜𝑟𝑒
Έξοδος: Βαθμός συμμετοχής ([0,1]) του issue σε κάθε κλάση
Αποτελέσματα & Αξιολόγηση
Διαδικασία Εκπαίδευσης & Αξιολόγησης
Τελικό Σύνολο Δεδομένων
11500 issues από 26 δημοφιλή έργα στο GitHub
Εκπαίδευση Συστήματος
• Αναλογία συνόλων εκπαίδευσης αξιολόγησης 70/30
• Σετ αξιολόγησης από τα πιο πρόσφατα issues κάθε έργου
• Αυξητική Μάθηση
Συνδυασμοί που Αξιολογήθηκαν
1. Title + Body
2. Title + Body + Labels
3. Title + Body + Labels + Assignee
4. Optimized Model
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 15
Αποτελέσματα Δυαδικής Ταξινόμησης
Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους
16
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Binary Classification Accuracy Plot
Title + Body Title + Body + Labels Title + Body + Labels + Assignee Optimized
12%
23%
27%
38%
Best Result per Submodels
Combination
Title + Body
Title + Body + Labels
Title + Body + Labels + Assignee
Optimized
Αποτελέσματα Δυαδικής Ταξινόμησης
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους
17
Αποτελέσματα Ταξινόμησης Τριών Κλάσεων
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους
18
0
0.1
0.2
0.3
0.4
0.5
0.6
3 Class Classification Accuracy
Title + Body Title + Body + Labels Title + Body + Labels + Assignee Optimized
Αποτελέσματα Ταξινόμησης Τριών Κλάσεων
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους
19
Συμπεράσματα
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους
20
1
Τα συγκεκριμένα χαρακτηριστικά που αναλύθηκαν μπορούν να
οδηγήσουν στην πρόβλεψη του χρόνου διόρθωσης σφαλμάτων
2
Η βέλτιστη σύνθεση των υπομοντέλων μπορεί να αυξήσει την
προβλεπτική ικανότητα του συστήματος
3
Το σύστημα αποδίδει πολύ καλά για δυαδική ταξινόμηση, έχοντας
παρόμοια απόδοση με άλλες βιβλιογραφικές έρευνες
4
• Αναλύοντας ξεχωριστά τα υπομοντέλα, το χαρακτηριστικό των labels είχε
τη μεγαλύτερη συσχέτιση με το εξεταζόμενο πρόβλημα
Μελλοντική Εργασία
Απρίλιος, 2021
Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού
Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους
21
1. Δοκιμή του συστήματος σε δεδομένα από διαφορετικές πλατφόρμες
διαδικτυακών αποθετηρίων
2. Σχεδίαση του υπομοντέλου ανάλυσης κειμένων με πιο εξειδικευμένες
τεχνικές
3. Τροποποίηση του συστήματος για προσέγγιση και υπολογισμό του χρόνου
διόρθωσης σφαλμάτων
4. Ανάπτυξη διαδικτυακής εφαρμογής ή ενός GitHub plugin για ταξινόμηση
σφαλμάτων σε πραγματικό χρόνο
Σας Ευχαριστώ!
Ευχαριστώ τον Αν. Καθηγητή Ανδρέα Συμεωνίδη
Ευχαριστώ τον Δρ. Θεμιστοκλή Διαμαντόπουλο
Ευχαριστώ για το χρόνο σας!
Ερωτήσεις ;
1 of 23

Recommended

Zikopis Evangelos Thesis Presentation by
Zikopis Evangelos Thesis PresentationZikopis Evangelos Thesis Presentation
Zikopis Evangelos Thesis PresentationISSEL
118 views23 slides
Galegalidou Christiana Thesis Presentation by
Galegalidou Christiana Thesis PresentationGalegalidou Christiana Thesis Presentation
Galegalidou Christiana Thesis PresentationISSEL
170 views27 slides
Matsoukas Vasileios Thesis Presentation by
Matsoukas Vasileios Thesis PresentationMatsoukas Vasileios Thesis Presentation
Matsoukas Vasileios Thesis PresentationISSEL
54 views29 slides
Analyzing code bugs based on method call graphs by
Analyzing code bugs based on method call graphsAnalyzing code bugs based on method call graphs
Analyzing code bugs based on method call graphsISSEL
72 views29 slides
Ανάλυση σφαλµάτων κώδικα µε βάση τον γράφο κλήσεων συναρτήσεων by
Ανάλυση σφαλµάτων κώδικα µε βάση τον γράφο κλήσεων συναρτήσεωνΑνάλυση σφαλµάτων κώδικα µε βάση τον γράφο κλήσεων συναρτήσεων
Ανάλυση σφαλµάτων κώδικα µε βάση τον γράφο κλήσεων συναρτήσεωνISSEL
65 views29 slides
Telecom Customer Churn Prediction AssessmentCustomer Churn i.docx by
Telecom Customer Churn Prediction AssessmentCustomer Churn i.docxTelecom Customer Churn Prediction AssessmentCustomer Churn i.docx
Telecom Customer Churn Prediction AssessmentCustomer Churn i.docxjacqueliner9
5 views4 slides

More Related Content

Similar to Bug Fix Time Classification on Open Source Repositories

KunalMehta_Resume by
KunalMehta_ResumeKunalMehta_Resume
KunalMehta_ResumeKunal Mehta
307 views7 slides
AUTOMATED ESSAY SCORING SYSTEM USING MULTI-MODEL MACHINE LEARNING by
AUTOMATED ESSAY SCORING SYSTEM USING MULTI-MODEL MACHINE LEARNINGAUTOMATED ESSAY SCORING SYSTEM USING MULTI-MODEL MACHINE LEARNING
AUTOMATED ESSAY SCORING SYSTEM USING MULTI-MODEL MACHINE LEARNINGValerie Felton
3 views9 slides
Abstract - Mining Source Code Change Patterns from Open-Source Repositories by
Abstract - Mining Source Code Change Patterns from Open-Source Repositories Abstract - Mining Source Code Change Patterns from Open-Source Repositories
Abstract - Mining Source Code Change Patterns from Open-Source Repositories ISSEL
66 views26 slides
Εξαγωγή Προτύπων Αλλαγών Κώδικα από Αποθετήρια Ανοικτού Λογισμικού by
Εξαγωγή Προτύπων Αλλαγών Κώδικα από Αποθετήρια Ανοικτού ΛογισμικούΕξαγωγή Προτύπων Αλλαγών Κώδικα από Αποθετήρια Ανοικτού Λογισμικού
Εξαγωγή Προτύπων Αλλαγών Κώδικα από Αποθετήρια Ανοικτού ΛογισμικούISSEL
46 views26 slides
2cee Master Cocomo20071 by
2cee Master Cocomo200712cee Master Cocomo20071
2cee Master Cocomo20071CS, NcState
466 views18 slides
Excellence In Excel Presentation by
Excellence In Excel PresentationExcellence In Excel Presentation
Excellence In Excel Presentationcynosure76
2.4K views67 slides

Similar to Bug Fix Time Classification on Open Source Repositories(20)

KunalMehta_Resume by Kunal Mehta
KunalMehta_ResumeKunalMehta_Resume
KunalMehta_Resume
Kunal Mehta307 views
AUTOMATED ESSAY SCORING SYSTEM USING MULTI-MODEL MACHINE LEARNING by Valerie Felton
AUTOMATED ESSAY SCORING SYSTEM USING MULTI-MODEL MACHINE LEARNINGAUTOMATED ESSAY SCORING SYSTEM USING MULTI-MODEL MACHINE LEARNING
AUTOMATED ESSAY SCORING SYSTEM USING MULTI-MODEL MACHINE LEARNING
Valerie Felton3 views
Abstract - Mining Source Code Change Patterns from Open-Source Repositories by ISSEL
Abstract - Mining Source Code Change Patterns from Open-Source Repositories Abstract - Mining Source Code Change Patterns from Open-Source Repositories
Abstract - Mining Source Code Change Patterns from Open-Source Repositories
ISSEL66 views
Εξαγωγή Προτύπων Αλλαγών Κώδικα από Αποθετήρια Ανοικτού Λογισμικού by ISSEL
Εξαγωγή Προτύπων Αλλαγών Κώδικα από Αποθετήρια Ανοικτού ΛογισμικούΕξαγωγή Προτύπων Αλλαγών Κώδικα από Αποθετήρια Ανοικτού Λογισμικού
Εξαγωγή Προτύπων Αλλαγών Κώδικα από Αποθετήρια Ανοικτού Λογισμικού
ISSEL46 views
2cee Master Cocomo20071 by CS, NcState
2cee Master Cocomo200712cee Master Cocomo20071
2cee Master Cocomo20071
CS, NcState466 views
Excellence In Excel Presentation by cynosure76
Excellence In Excel PresentationExcellence In Excel Presentation
Excellence In Excel Presentation
cynosure762.4K views
Industrial project and machine scheduling with Constraint Programming by Philippe Laborie
Industrial project and machine scheduling with Constraint ProgrammingIndustrial project and machine scheduling with Constraint Programming
Industrial project and machine scheduling with Constraint Programming
Philippe Laborie859 views
How to downscope your EBS upgrade project by panayaofficial
How to downscope your EBS upgrade projectHow to downscope your EBS upgrade project
How to downscope your EBS upgrade project
panayaofficial436 views
Towards effective bug triage with software by Nexgen Technology
Towards effective bug triage with softwareTowards effective bug triage with software
Towards effective bug triage with software
Nexgen Technology 2.1K views
Ryan-Symposium-v5 by Kevin Ryan
Ryan-Symposium-v5Ryan-Symposium-v5
Ryan-Symposium-v5
Kevin Ryan193 views
Statistical debuging for programs written in dynamic programming language ruby by Adeel Akhter
Statistical debuging for programs written in dynamic programming language   rubyStatistical debuging for programs written in dynamic programming language   ruby
Statistical debuging for programs written in dynamic programming language ruby
Adeel Akhter451 views
Predicting Employee Attrition by Shruti Mohan
Predicting Employee AttritionPredicting Employee Attrition
Predicting Employee Attrition
Shruti Mohan7.4K views
Bayesian Optimization for Balancing Metrics in Recommender Systems by Viral Gupta
Bayesian Optimization for Balancing Metrics in Recommender SystemsBayesian Optimization for Balancing Metrics in Recommender Systems
Bayesian Optimization for Balancing Metrics in Recommender Systems
Viral Gupta98 views
Software Measurement: Lecture 1. Measures and Metrics by Programeter
Software Measurement: Lecture 1. Measures and MetricsSoftware Measurement: Lecture 1. Measures and Metrics
Software Measurement: Lecture 1. Measures and Metrics
Programeter18.5K views
Trahan by NASAPMC
TrahanTrahan
Trahan
NASAPMC11.5K views
Job Failure Analysis in Mainframes Production Support by inventionjournals
Job Failure Analysis in Mainframes Production SupportJob Failure Analysis in Mainframes Production Support
Job Failure Analysis in Mainframes Production Support
IRJET- Deep Learning Model to Predict Hardware Performance by IRJET Journal
IRJET- Deep Learning Model to Predict Hardware PerformanceIRJET- Deep Learning Model to Predict Hardware Performance
IRJET- Deep Learning Model to Predict Hardware Performance
IRJET Journal11 views
IRJET- Analysis of PV Fed Vector Controlled Induction Motor Drive by IRJET Journal
IRJET- Analysis of PV Fed Vector Controlled Induction Motor DriveIRJET- Analysis of PV Fed Vector Controlled Induction Motor Drive
IRJET- Analysis of PV Fed Vector Controlled Induction Motor Drive
IRJET Journal21 views

More from ISSEL

Camera-based localization of annotated objects in indoor environments by
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsISSEL
12 views38 slides
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ... by
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...ISSEL
6 views38 slides
Design and implementation of an automation mechanism to automatically develop... by
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...ISSEL
4 views17 slides
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ... by
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ISSEL
6 views17 slides
Static Analysis of Python code and Identification of Potential Security Vulne... by
Static Analysis of Python code and Identification of Potential Security Vulne...Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...ISSEL
7 views16 slides
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ... by
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...ISSEL
26 views27 slides

More from ISSEL(20)

Camera-based localization of annotated objects in indoor environments by ISSEL
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environments
ISSEL12 views
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ... by ISSEL
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
ISSEL6 views
Design and implementation of an automation mechanism to automatically develop... by ISSEL
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...
ISSEL4 views
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ... by ISSEL
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ISSEL6 views
Static Analysis of Python code and Identification of Potential Security Vulne... by ISSEL
Static Analysis of Python code and Identification of Potential Security Vulne...Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...
ISSEL7 views
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ... by ISSEL
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
ISSEL26 views
Design and Development of an Authorization and Access Control Mechanism for C... by ISSEL
Design and Development of an Authorization and Access Control Mechanism for C...Design and Development of an Authorization and Access Control Mechanism for C...
Design and Development of an Authorization and Access Control Mechanism for C...
ISSEL13 views
Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο... by ISSEL
Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο...Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο...
Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο...
ISSEL19 views
Analysis and profiling of developer profiles using data mining techniques fro... by ISSEL
Analysis and profiling of developer profiles using data mining techniques fro...Analysis and profiling of developer profiles using data mining techniques fro...
Analysis and profiling of developer profiles using data mining techniques fro...
ISSEL3 views
Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση... by ISSEL
Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση...Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση...
Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση...
ISSEL8 views
TOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEM by ISSEL
TOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEMTOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEM
TOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEM
ISSEL3 views
ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ... by ISSEL
ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ...ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ...
ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ...
ISSEL11 views
System Development for Prediction of Static Analysis Metrics of Source Code by ISSEL
System Development for Prediction of Static Analysis Metrics of Source CodeSystem Development for Prediction of Static Analysis Metrics of Source Code
System Development for Prediction of Static Analysis Metrics of Source Code
ISSEL6 views
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ... by ISSEL
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
ISSEL11 views
Micro Front-ends and Microservices Architecture in Web Application Development by ISSEL
Micro Front-ends and Microservices Architecture in Web Application DevelopmentMicro Front-ends and Microservices Architecture in Web Application Development
Micro Front-ends and Microservices Architecture in Web Application Development
ISSEL8 views
Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ... by ISSEL
Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ...Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ...
Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ...
ISSEL19 views
Indoor localization using wireless networks by ISSEL
Indoor localization using wireless networksIndoor localization using wireless networks
Indoor localization using wireless networks
ISSEL5 views
Εντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύων by ISSEL
Εντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύωνΕντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύων
Εντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύων
ISSEL10 views
Design and implementation of a big data architecture for storage, real-time p... by ISSEL
Design and implementation of a big data architecture for storage, real-time p...Design and implementation of a big data architecture for storage, real-time p...
Design and implementation of a big data architecture for storage, real-time p...
ISSEL9 views
Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ... by ISSEL
Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ...Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ...
Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ...
ISSEL16 views

Recently uploaded

Art of Writing Research article slide share.pptx by
Art of Writing Research article slide share.pptxArt of Writing Research article slide share.pptx
Art of Writing Research article slide share.pptxsureshc91
14 views42 slides
IWISS Catalog 2022 by
IWISS Catalog 2022IWISS Catalog 2022
IWISS Catalog 2022Iwiss Tools Co.,Ltd
24 views66 slides
LFA-NPG-Paper.pdf by
LFA-NPG-Paper.pdfLFA-NPG-Paper.pdf
LFA-NPG-Paper.pdfharinsrikanth
40 views13 slides
Solar PV by
Solar PVSolar PV
Solar PVIwiss Tools Co.,Ltd
12 views4 slides
Update 42 models(Diode/General ) in SPICE PARK(DEC2023) by
Update 42 models(Diode/General ) in SPICE PARK(DEC2023)Update 42 models(Diode/General ) in SPICE PARK(DEC2023)
Update 42 models(Diode/General ) in SPICE PARK(DEC2023)Tsuyoshi Horigome
18 views16 slides
Investor Presentation by
Investor PresentationInvestor Presentation
Investor Presentationeser sevinç
16 views26 slides

Recently uploaded(20)

Art of Writing Research article slide share.pptx by sureshc91
Art of Writing Research article slide share.pptxArt of Writing Research article slide share.pptx
Art of Writing Research article slide share.pptx
sureshc9114 views
Update 42 models(Diode/General ) in SPICE PARK(DEC2023) by Tsuyoshi Horigome
Update 42 models(Diode/General ) in SPICE PARK(DEC2023)Update 42 models(Diode/General ) in SPICE PARK(DEC2023)
Update 42 models(Diode/General ) in SPICE PARK(DEC2023)
Dynamics of Hard-Magnetic Soft Materials by Shivendra Nandan
Dynamics of Hard-Magnetic Soft MaterialsDynamics of Hard-Magnetic Soft Materials
Dynamics of Hard-Magnetic Soft Materials
Shivendra Nandan13 views
STUDY OF SMART MATERIALS USED IN CONSTRUCTION-1.pptx by AnnieRachelJohn
STUDY OF SMART MATERIALS USED IN CONSTRUCTION-1.pptxSTUDY OF SMART MATERIALS USED IN CONSTRUCTION-1.pptx
STUDY OF SMART MATERIALS USED IN CONSTRUCTION-1.pptx
AnnieRachelJohn25 views
2_DVD_ASIC_Design_FLow.pdf by Usha Mehta
2_DVD_ASIC_Design_FLow.pdf2_DVD_ASIC_Design_FLow.pdf
2_DVD_ASIC_Design_FLow.pdf
Usha Mehta14 views
Extensions of Time - Contract Management by brainquisitive
Extensions of Time - Contract ManagementExtensions of Time - Contract Management
Extensions of Time - Contract Management
brainquisitive15 views
13_DVD_Latch-up_prevention.pdf by Usha Mehta
13_DVD_Latch-up_prevention.pdf13_DVD_Latch-up_prevention.pdf
13_DVD_Latch-up_prevention.pdf
Usha Mehta9 views
7_DVD_Combinational_MOS_Logic_Circuits.pdf by Usha Mehta
7_DVD_Combinational_MOS_Logic_Circuits.pdf7_DVD_Combinational_MOS_Logic_Circuits.pdf
7_DVD_Combinational_MOS_Logic_Circuits.pdf
Usha Mehta50 views

Bug Fix Time Classification on Open Source Repositories

  • 1. Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Τομέας Ηλεκτρονικής & Υπολογιστών Διπλωματική Εργασία Εργαστήριο Επεξεργασίας Πληροφορίας και Τεχνολογίας Λογισμικού (ISSEL) Επίβλεψη Αναπληρωτής Καθηγητής Ανδρέας Λ.Συμεωνίδης Μεταδιδακτορικός Ερευνητής Δρ. Διαμαντόπουλος Θεμιστοκλής Εκπόνηση Ζηκόπης Ευάγγελος ΑΕΜ: 8808 Ταξινόμηση Σφαλμάτων από Αποθετήρια Ανοιχτού Λογισμικού με Βάση το Χρόνο Επιδιόρθωσής τους
  • 2. Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 2 Δομή Παρουσίασης Συμπεράσματα & Μελλοντική εργασία Συμπεράσματα & Μελλοντική Εργασία Ε Εισαγωγή Αποτελέσματα & Αξιολόγηση
  • 4. Περιγραφή • Κατακόρυφη αύξηση απαιτήσεων • Νέα πρότυπα εργασίας ομάδων λογισμικού • ‘Έλλειψη αυτοματοποιημένων διαδικασιών σχετικά με την ανάπτυξη λογισμικού • Αδυναμία δημιουργίας αντιπροσωπευτικού χρονοδιαγράμματος ολοκλήρωσης έργου Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 4 Σκοπός • Συμβολή στην αυτοματοποίηση της διαχείρισης ομάδων ανάπτυξης λογισμικού • Εκμετάλλευση όλης της διαθέσιμης πληροφορίας που κρύβει ένα Issue Report • Εξαγωγή συμπερασμάτων σχετικά με τα έργα ανοιχτού κώδικα Ορισμός Προβλήματος Η σχεδίαση ενός συστήματος το οποίο ταξινομεί τα σφάλματα λογισμικού ενός συγκεκριμένου αποθετηρίου, ανάλογα με τον εκτιμώμενο χρόνο επιδιόρθωσής τους
  • 5. GitHub Issue Report Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 5 1 1 Τίτλος 2 2 Κατάσταση 3 3 Περιγραφή 4 4 Υπεύθυνος 5 5 Labels 6 6 Συνδεδεμένα Commits 7 7 Σχόλια
  • 7. Αρχιτεκτονική Συστήματος Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 7
  • 8. Συλλογή & Προεπεξεργασία Δεδομένων Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 8 Κανόνες Επιλογής Issues από τη Βάση Δεδομένων Είναι σε κατάσταση closed Έχει διαθέσιμες ημερομηνίες στις οποίες άνοιξε / έκλεισε Έχει συμπληρωμένα τα πεδία τίτλος, περιγραφή, labels, assignee Το αποθετήριο έχει από 50 έως 5000 έγκυρα issues 01 02 03 04 Προεπεξεργασία Συλλεγμένων Issues Προεπεξεργασία & Προετοιμασία κειμένου για εφαρμογή τεχνικών εξόρυξης δεδομένων Εφαρμογή μετασχηματισμού Z-Score για απομάκρυνση θορύβου Διατήρηση μόνο όσων έχουν κλείσει ή αναφερθεί σε commits ή έχουν σχόλια Διαχωρισμός των issues σε κλάσεις Διαχωρισμός σε σετ εκπαίδευσης / αξιολόγησης
  • 9. Ανάλυση Υπομοντέλων Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 9 Υπομοντέλα Τίτλου & Περιγραφής “ Υπάρχει σύνδεση μεταξύ της λεκτικής περιγραφής ενός σφάλματος και του χρόνου επιδιόρθωσής του; ” Επεξεργασία λεκτικών δεδομένων για αύξηση αποδοτικότητας Διανυσματοποίηση με τον μετασχηματισμό TF-IDF (Term Frequency – Inverse Document Frequency) 𝑡𝑓 − 𝑖𝑑𝑓 𝑤, 𝐷 = 𝑡𝑓 𝑤, 𝐷 × log 𝐶 1 + 𝐷 ∈ 𝐶: 𝑤 ∈ 𝐷 Εκπαίδευση Naïve Bayes ταξινομητή 𝑃 𝑥𝑖 𝑐 = 𝑡𝑓𝑖𝑑𝑓 𝑥𝑖, 𝑐 + 1 𝑡𝑓𝑖𝑑𝑓 𝑐 + |𝑉| Σχεδίαση ξεχωριστών μοντέλων για τίτλο και περιγραφή
  • 10. Ανάλυση Υπομοντέλων Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 10 “ Μπορούμε να προβλέψουμε τον χρόνο στον οποίο θα διορθώσει ένα σφάλμα κάποιος μηχανικός με βάση το ιστορικό του; ” Υπομοντέλο Assignee Συγκέντρωση των issues που έχει επιλύσει στο παρελθόν ο συγκεκριμένος χρήστης Μέτρηση της συχνότητας εμφάνισης αυτών των issues σε κάθε κλάση Εξαγωγή σκορ συμμετοχής του χρήστη σε κάθε κλάση (σκορ στο διάστημα [0,1])
  • 11. Ανάλυση Υπομοντέλων Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 11 “ Πόσο γρήγορα επιλύονται τα σφάλματα που χαρακτηρίζονται από συγκεκριμένο label; ” Υπομοντέλο Labels Απομόνωση των issues που έχουν κάποιο από τα labels του εξεταζόμενου issue Δημιουργία ευρετηρίου για κάθε ένα από τα labels του εξεταζόμενου issue Εξαγωγή τελικού σκορ συμμετοχής σε κάθε κλάση από τη σύνθεση των επιμέρους σκορ κάθε label
  • 12. Σύνθεση Υπομοντέλων Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 12 Άθροιση & Μέσος Όρος των επιμέρους Σκορ Class 0 – Fast Class 1– Medium Class 2 - Slow Title Score 0.22 0.35 0.43 Body Score 0.36 0.25 0.39 Labels Score 0.4 0.6 0 Assignee Score 0.4 0.5 0.1 Final Score 0.345 0.425 0.23 Εξαγωγή των σκορ συμμετοχής σε κάθε κλάση Άθροιση και Κανονικοποίηση του τελικού σκορ συμμετοχής του εξεταζόμενου issue σε κάθε κλάση
  • 13. Σύνθεση Υπομοντέλων Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 13 “ Υπάρχει πιο έξυπνος τρόπος σύνθεσης των επιμέρους σκορ σε κάθε αποθετήριο; ” Βελτιστοποιημένη Σύνθεση των επιμέρους Σκορ Χρήση του εικονιζόμενου νευρωνικού δικτύου Εύρεση του συνδυασμού βαρών που βελτιστοποιεί την ταξινόμηση των issues Είσοδος Νευρωνικού: 𝑋 = 𝑇𝑖𝑡𝑙𝑒𝑆𝑐𝑜𝑟𝑒, 𝐵𝑜𝑑𝑦𝑆𝑐𝑜𝑟𝑒, 𝐿𝑎𝑏𝑒𝑙𝑠𝑆𝑐𝑜𝑟𝑒, 𝐴𝑠𝑠𝑖𝑔𝑛𝑒𝑒𝑆𝑐𝑜𝑟𝑒 Έξοδος: Βαθμός συμμετοχής ([0,1]) του issue σε κάθε κλάση
  • 15. Διαδικασία Εκπαίδευσης & Αξιολόγησης Τελικό Σύνολο Δεδομένων 11500 issues από 26 δημοφιλή έργα στο GitHub Εκπαίδευση Συστήματος • Αναλογία συνόλων εκπαίδευσης αξιολόγησης 70/30 • Σετ αξιολόγησης από τα πιο πρόσφατα issues κάθε έργου • Αυξητική Μάθηση Συνδυασμοί που Αξιολογήθηκαν 1. Title + Body 2. Title + Body + Labels 3. Title + Body + Labels + Assignee 4. Optimized Model Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 15
  • 16. Αποτελέσματα Δυαδικής Ταξινόμησης Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 16 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Binary Classification Accuracy Plot Title + Body Title + Body + Labels Title + Body + Labels + Assignee Optimized 12% 23% 27% 38% Best Result per Submodels Combination Title + Body Title + Body + Labels Title + Body + Labels + Assignee Optimized
  • 17. Αποτελέσματα Δυαδικής Ταξινόμησης Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 17
  • 18. Αποτελέσματα Ταξινόμησης Τριών Κλάσεων Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 18 0 0.1 0.2 0.3 0.4 0.5 0.6 3 Class Classification Accuracy Title + Body Title + Body + Labels Title + Body + Labels + Assignee Optimized
  • 19. Αποτελέσματα Ταξινόμησης Τριών Κλάσεων Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 19
  • 20. Συμπεράσματα Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 20 1 Τα συγκεκριμένα χαρακτηριστικά που αναλύθηκαν μπορούν να οδηγήσουν στην πρόβλεψη του χρόνου διόρθωσης σφαλμάτων 2 Η βέλτιστη σύνθεση των υπομοντέλων μπορεί να αυξήσει την προβλεπτική ικανότητα του συστήματος 3 Το σύστημα αποδίδει πολύ καλά για δυαδική ταξινόμηση, έχοντας παρόμοια απόδοση με άλλες βιβλιογραφικές έρευνες 4 • Αναλύοντας ξεχωριστά τα υπομοντέλα, το χαρακτηριστικό των labels είχε τη μεγαλύτερη συσχέτιση με το εξεταζόμενο πρόβλημα
  • 21. Μελλοντική Εργασία Απρίλιος, 2021 Ταξινόμηση Σφαλμάτων Λογισμικού από Αποθετήρια Ανοιχτού Λογισμικού με Βάση τον Εκτιμώμενο Χρόνο Επιδιόρθωσής τους 21 1. Δοκιμή του συστήματος σε δεδομένα από διαφορετικές πλατφόρμες διαδικτυακών αποθετηρίων 2. Σχεδίαση του υπομοντέλου ανάλυσης κειμένων με πιο εξειδικευμένες τεχνικές 3. Τροποποίηση του συστήματος για προσέγγιση και υπολογισμό του χρόνου διόρθωσης σφαλμάτων 4. Ανάπτυξη διαδικτυακής εφαρμογής ή ενός GitHub plugin για ταξινόμηση σφαλμάτων σε πραγματικό χρόνο
  • 22. Σας Ευχαριστώ! Ευχαριστώ τον Αν. Καθηγητή Ανδρέα Συμεωνίδη Ευχαριστώ τον Δρ. Θεμιστοκλή Διαμαντόπουλο
  • 23. Ευχαριστώ για το χρόνο σας! Ερωτήσεις ;