Χριστίνα Μποϊδίδου

ISSEL
ISSELISSEL
Συσχέτιση χαρακτηριστικών ποιότητας
λογισμικού με αναφορές σφαλμάτων μέσα
από τη χρήση τεχνικών επεξεργασίας της
Φυσικής Γλώσσας και Εξόρυξης Δεδομένων
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ
Μποϊδίδου Χριστίνα
Επιβλέπων καθηγητής: Ανδρέας Συμεωνίδης
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης
Πολυτεχνική Σχολή
Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Η/Υ
Τομέας Ηλεκτρονικής και Υπολογιστών
Δομή παρουσίασης
Αντικείμενο
και Στόχοι
Μεθοδολογία
Υλοποίηση
Πειράματα
Συμπεράσματα
Μελλοντική
Εργασία
4/1/2017 2
Αντικείμενο και στόχοι εργασίας
4/1/2017 3
Αντικείμενο
Στόχοι
• Εξόρυξη δεδομένων σε
αναφορές σφαλμάτων
• Εξαγωγή πληροφορίας από
κείμενα αναφορών
σφαλμάτων
• Μελέτη του τρόπου
περιγραφής προβλημάτων
λογισμικού από χρήστες
• Εξαγωγή συχνών ομάδων
λέξεων
• Αντιστοίχιση των ομάδων
λέξεων με χαρακτηριστικά
ποιότητας λογισμικού
• Συμπεράσματα για το
περιεχόμενο των
αναφορών σφαλμάτων
Εφαρμογή
Ruby on Rails
Προϊόν λογισμικού
ανοιχτού κώδικα
Πλατφόρμα
ανάπτυξης
προγραμμάτων
διαδικτύου
Βασισμένο στη
γλώσσα
προγραμματισμού
Ruby
4/1/2017 4
Αριθμός αναφορών (tickets) : 4.598
Στάδια της μεθοδολογίας
4/1/2017 5
• Εξαγωγή των δεδομένων
• Προεπεξεργασία των δεδομένων
• Επεξεργασία Φυσικής Γλώσσας
• Σημασιολογική ανάλυση
• Εξαγωγή και επεξεργασία των κανόνων
• Σημασιολογική Συσχέτιση
Εξαγωγή των δεδομένων
4/1/2017 6
 Πρότυπο json : ανοιχτό πρότυπο
απεικόνισης για ανταλλαγή
πληροφοριών
 ticket μορφή json
συλλογή αντικειμένων μορφής
{name : value}
 Ανάπτυξη κλάσης Ticket
 Κάθε αρχείο json αντιστοιχίζεται
σε ένα αντικείμενο Java
τύπου Ticket
Ticket
Origina
l_body
_html
Title
Creator
_name
Project
_id
Update
d_at
Closed
User_i
d
Προεπεξεργασία των δεδομένων
 Απόρριψη άχρηστης πληροφορίας
 html tags
 ανεπιθύμητοι χαρακτήρες
4/1/2017 7
body του html
Επεξεργασία Φυσικής Γλώσσας
 Natural Language Processing με τον συντακτικό αναλυτή
Stanford Parser
 Διαδικασία
 Εξαγωγή του κειμένου του ticket (original_body_html)
 Επεξεργασία του κειμένου
 Δημιουργία Συντακτικού Δένδρου (Parse Tree)
4/1/2017 8
Αρχεία
κειμένου
Ουσιαστικά
Διανύσματα
λέξεων
Ρήματα
Διανύσματα
λέξεων
Stanford Parser
Πακέτο
λογισμικού σε
Java
Ανάλυση φυσικής γλώσσας
Συντακτικό
δέντρο
Γραμματικές
σχέσεις
Σημασιολογική Ανάλυση
 Προεπεξεργασία αρχείων κειμένου
 Stemming (εύρεση της ρίζας των λέξεων)
 Απαλοιφή λέξεων με μικρή συχνότητα εμφάνισης
 Εφαρμογή στα δεδομένα
 Στατιστική Αναγωγή για παραγωγή Θεμάτων (Topics) από
έγγραφα
 Latent Dirichlet Allocation (LDA)
 Δειγματοληψία Gibbs
4/1/2017 9
Σημασιολογική Ανάλυση(2)
 Παράδειγμα εφαρμογής LDA
4/1/2017 10
Θέμα 1ο Θέμα 2ο Θέμα 3ο
Λέξη Πιθανότητα Λέξη Πιθανότητα Λέξη Πιθανότητα
method 0.0339 patch 0.0653 test 0.0507
class 0.0264 option 0.0268 error 0.0362
name 0.0242 code 0.0215 rb 0.0353
example 0.0239 controller 0.0211 rail 0.0308
model 0.0231 action 0.0188 gem 0.0219
Παράμετρος Τιμή Μεταβλητή
Αριθμός topics Από το χρήστη nTopics
Αριθμός λέξεων ανά topic Από το χρήστη nWords
Αρχείο - file
Αριθμός επαναλήψεων 500 iterations
Alpha 50/nTopics alpha
Beta 0.1 beta
Εξαγωγή και επεξεργασία κανόνων
 Κατάλληλη μορφή για κάθε αρχείο κειμένου
 yes αν η λέξη βρίσκεται σε κάποιο από τα topics
 σύμβολο ? αν δεν υπάρχει
 δεδομένα χωρισμένα με κόμμα
 Εφαρμογή στα δεδομένα
 Apriori αλγόριθμος - υλοποίηση WEKA
 Παράμετροι
4/1/2017 11
Εξαγωγή και επεξεργασία κανόνων(2)
 Παράδειγμα εξαγωγής κανόνων
4/1/2017 12
Κανόνες Confidence Κανόνες Confidence
gem→ rb 0.6 problem→ test 0.38
test→ patch 0.6 patch→ method 0.36
option→ patch 0.53 error→ patch 0.36
rail→ rb 0.5 method→ test 0.36
method→ patch 0.49 rb→ test 0.36
patch→ test 0.49 rb→ patch 0.35
code→ patch 0.48 error→ test 0.35
class→ patch 0.46 rb→ rail 0.35
class→ method 0.46 test→ rb 0.33
problem→ patch 0.45 test→ method 0.33
name→ patch 0.44 rb→ error 0.33
error→ rb 0.4 method→ class 0.3
Εξαγωγή και επεξεργασία κανόνων(3)
 Δημιουργία ομάδων λέξεων με βάση τους κανόνες
 παρατήρηση σε ποιες λέξεις οδηγούν οι κανόνες
 ομαδοποίηση αυτών των λέξεων
 Αποτέλεσμα
4/1/2017 13
Λέξη κλειδί Ομάδες λέξεων
rb error test rail method gem
patch error test name class problem method code option rb
test error method problem patch rb
Σημασιολογική Συσχέτιση
 Ορισμός:Πόσο συσχετίζονται δύο έννοιες σε
σημασιολογικό επίπεδο
 κατανόηση του νοήματος των ομάδων λέξεων
 Συσχέτιση των ομάδων λέξεων με χαρακτηριστικά
ποιότητας λογισμικού
4/1/2017 14
performance usability
visibility compliance
compatibility accessibility
badness appearance
Σημασιολογική Συσχέτιση(2)
 Μετρική Κανονικοποιημένη Google Απόσταση
(Normalized Google Distance)
 Τύπος
 Αποτέλεσμα εφαρμογής στις ομάδες λέξεων
4/1/2017 15
Ομάδες λέξεων Χαρακτηριστικά Τιμή
error test rail method gem rb
compatibility
accessibility
0.6226
0.6237
error test name class problem method code option rb patch
visibility
compatibility
0.5837
0.5848
error method problem patch rb test
accessibility
visibility
0.4854
0.5847
Πειράματα
 Συγκεντρωτικός πίνακας πειραμάτων
4/1/2017 16
Πείραμα Μέρος του λόγου Topics Words/Topic Περιγραφή
5.1.1 Ουσιαστικά 3 5
5.1.2 Ουσιαστικά 3 5 Λέξεις με συχνότητα μεγαλύτερη του 1
5.1.3 Ουσιαστικά 3 5 Λέξεις με συχνότητα μεγαλύτερη του 3
5.1.4 Ουσιαστικά 3 5 Λέξεις με συχνότητα μεγαλύτερη του 7
5.1.5 Ουσιαστικά 3 5
Λέξεις με συχνότητα μεγαλύτερη του 3 και
μικρότερη του 600
5.1.6 Ουσιαστικά 4 5
5.1.7 Ουσιαστικά 4 5 Λέξεις με συχνότητα μεγαλύτερη του 3
5.1.8 Ουσιαστικά 4 5 Λέξεις με συχνότητα μεγαλύτερη του 7
5.1.9 Ουσιαστικά 7 5 Λέξεις με συχνότητα μεγαλύτερη του 1
5.1.10 Ουσιαστικά 7 5 Λέξεις με συχνότητα μεγαλύτερη του 3
5.2.1 Ρήματα 3 5
5.2.2 Ρήματα 3 5 Λέξεις με συχνότητα μεγαλύτερη του 1
5.2.3 Ρήματα 3 5 Λέξεις με συχνότητα μεγαλύτερη του 3
5.2.4 Ρήματα 3 5 Λέξεις με συχνότητα μεγαλύτερη του 7
5.2.5 Ρήματα 6 4
5.2.6 Ρήματα 6 4 Λέξεις με συχνότητα μεγαλύτερη του 3
5.2.7 Ρήματα 6 4 Λέξεις με συχνότητα μεγαλύτερη του 7
5.3.1 Λέξεις-κλειδιά 3 5
Πειράματα(2)
3 θέματα / 5 λέξεις 3 θέματα / 5 λέξεις (συχνότητα>1)
4/1/2017 17
 Σύγκριση πειραμάτων για Ουσιαστικά
0
0.2
0.4
0.6
0.8
1
Ομάδα 1 Ομάδα 2 Ομάδα 3
usability
accessibility
compatibility
appearance
0
0.2
0.4
0.6
0.8
1
Ομάδα 1 Ομάδα 2 Ομάδα 3
accessibility
compatibility
visibility
Λέξη κλειδί Ομάδες λέξεων
rb error test action rail method gem patch
patch error test name class method code option rb
action controller rb
Λέξη κλειδί Ομάδες λέξεων
rb error test rail method gem
patch error test name class problem method code option rb
test error method problem patch rb
Πειράματα(3)
3 θέματα / 5 λέξεις (συχνότητα>3) 3 θέματα / 5 λέξεις (συχνότητα>7)
4/1/2017 18
 Σύγκριση πειραμάτων για Ουσιαστικά
0
0.2
0.4
0.6
0.8
Ομάδα 1 Ομάδα 2 Ομάδα 3
accessibility
compatibility
usability
0
0.2
0.4
0.6
0.8
Ομάδα 1 Ομάδα 2 Ομάδα 3
accessibility
compatibility
visibility
Λέξη κλειδί Ομάδες λέξεων
rb test file rail method gem
patch test name class method code example option rb
method test name class code patch rb
Λέξη κλειδί Ομάδες λέξεων
rb test file rail method problem patch
patch test name class problem method example option
rb
test rail method problem patch rb
Πειράματα(4)
7 θέματα / 5 λέξεις (συχνότητα>1) 7 θέματα / 5 λέξεις (συχνότητα>3)
4/1/2017 19
 Σύγκριση πειραμάτων για Ουσιαστικά
0
0.2
0.4
0.6
0.8
Ομάδα
1
Ομάδα
2
Ομάδα
3
Ομάδα
4
accessibility
compatibility
usability
visibility
0
0.2
0.4
0.6
0.8
Ομάδα
1
Ομάδα
2
Ομάδα
3
Ομάδα
4
accessibility
compatibility
usability
visibility
Λέξη κλειδί Ομάδες λέξεων
rb lib error test name rail action class method problem
code controller gem end
action lib controller
patch default error fix test name class method problem
code example case end option
test error name rail problem method code case patch rb
Λέξη κλειδί Ομάδες λέξεων
rb error test class problem code lib file name rail action
method controller gem patch
action lib controller
patch error fix test name class problem method code
example case rb
test error name rail problem method code case patch rb
Πειράματα(5)
3 θέματα / 5 λέξεις 3 θέματα / 5 λέξεις (συχνότητα>1)
4/1/2017 20
 Σύγκριση πειραμάτων για Ρήματα
0
0.2
0.4
0.6
0.8
Ομάδα 1 Ομάδα 2 Ομάδα 3
compatibility
performance
appearance
0
0.2
0.4
0.6
0.8
Ομάδα 1 Ομάδα 2 Ομάδα 3 Ομάδα 4
compatibility
performanc
e
appearance
Λέξη κλειδί Ομάδες λέξεων
use call get fail set add run create make seem try find
include
create get use add try
get use add create find try
Λέξη κλειδί Ομάδες λέξεων
use call see fail set add run seem create make try find
include
create see use add
seem see use
see call use add run create make seem find try
Πειράματα(6)
3 θέματα / 5 λέξεις (συχνότητα>3) 3 θέματα / 5 λέξεις (συχνότητα>7)
4/1/2017 21
 Σύγκριση πειραμάτων για Ρήματα
0
0.2
0.4
0.6
0.8
Ομάδα 1 Ομάδα 2
compatibility
performance
appearance
visibility
0
0.2
0.4
0.6
0.8
Ομάδα 1 Ομάδα 2
compatibility
appearance
visibility
Λέξη κλειδί Ομάδες λέξεων
use
call get fail change set add run create make try find
include
get use add create try
Λέξη κλειδί Ομάδες λέξεων
use call get fail set add run create make seem try find
include
get use add create find try
Πειράματα(7)
6 θέματα / 4 λέξεις 6 θέματα / 4 λέξεις (συχνότητα>3)
4/1/2017 22
 Σύγκριση πειραμάτων για Ρήματα
0
0.2
0.4
0.6
0.8
Ομάδα 1 Ομάδα 2 Ομάδα 3
compatibility
performance
appearance
visibility
accessibility 0
0.2
0.4
0.6
0.8
Ομάδα 1 Ομάδα 2 Ομάδα 3
compatibility
appearance
visibility
accessibility
usability
Λέξη κλειδί Ομάδες λέξεων
use allow generate get change set create include expect
see load make try find want
see call get use run create make find try
add get use create make try find include
Λέξη κλειδί Ομάδες λέξεων
use work call generate get change set return add run
create pass include fail see fix load make try find
see work call get set use add run create make find try
work call see get use add create make find try
Πειράματα(8)
3 topics/5 words Ουσιαστικά
Ρήματα
4/1/2017 23
 Σύγκριση πειραμάτων για Λέξεις-κλειδιά
0
0.1
0.2
0.3
0.4
0.5
Ομάδα
1
Ομάδα
2
Ομάδα
3
Ομάδα
4
compatibility
accessibility
usability
0
0.2
0.4
0.6
0.8
Ομάδα 1 Ομάδα 2 Ομάδα 3
compatibility
performance
appearance
Λέξη
κλειδί
Ομάδες λέξεων
patch error have fix test set add option
have error fix test set file code add run patch
test have fix add run patch
add have test patch
0
0.2
0.4
0.6
0.8
Ομάδα 1 Ομάδα 2 Ομάδα 3
usability
accessibility
compatibility
appearance
Συμπεράσματα
 Ο αριθμός των topics δεν επηρεάζει σημαντικά τις
ομάδες λέξεων.
 λιγότερα topics είναι υποομάδες των περισσότερων
 παρόμοιες συσχετίσεις
 Η αύξηση του κάτω ορίου συχνότητας προκαλεί
αλλοίωση στις συσχετίσεις
 πειράματα με συχνότητα μεγαλύτερη του 1 και του 3
εξάγουν παρόμοια αποτελέσματα
 πείραμα με συχνότητα μεγαλύτερη του 7 αλλοιώνει
4/1/2017 24
Ουσιαστικά
Συμπεράσματα(2)
 Παρατηρούνται αλληλοεπικαλύψεις στις ομάδες των
ρημάτων
 υποκειμενική η χρήση των ρημάτων
 έκφραση πολλών διαφορετικών εννοιών
4/1/2017 25
Ρήματα
Λέξεις-κλειδιά
 Εμφανίζονται λέξεις από όλα τα μέρη του λόγου
 για ίδιο αριθμό topics εμφανίζονται τα αντίστοιχα
ουσιαστικά και ρήματα των μεμονωμένων πειραμάτων
 γενικότερες ομάδες λέξεων
Συμπεράσματα(3)
 Προτιμότερη η προσέγγιση των ουσιαστικών
 λογικό νόημα μιας αναφοράς σφάλματος
 ομάδες λέξεων ακριβείς και σαφώς διαχωρισμένες
 συγκεκριμένες συσχετίσεις με χαρακτηριστικά
 Χρήση ρημάτων
 δεν είναι ξεκάθαρος ο σκοπός χρήσης τους
 δεν εξάγεται πληροφορία για τα χαρακτηριστικά ποιότητας
4/1/2017 26
Μελλοντική εργασία
4/1/2017 27
• Άλλα σύνολα
δεδομένων(π.χ.
λογισμικά
κλειστού κώδικα)
Εφαρμογή
μεθοδολογίας
• Ανάπτυξη εργαλείου
αυτόματης
αναγνώρισης
χαρακτηριστικού που
ανήκει μια αναφορά
Εργαλείο
αναγνώρισης • Μελέτη συσχετίσεων
των χαρακτηριστικών
με άλλα μέρη του
λόγου (επίθετα,
επιρρήματα, κτλ.)
Περαιτέρω
μελέτη
4/1/2017 28
Ευχαριστώ
για την προσοχή σας!
Ερωτήσεις;
1 of 28

Recommended

Αλέξανδρος Αδάμος by
Αλέξανδρος ΑδάμοςΑλέξανδρος Αδάμος
Αλέξανδρος ΑδάμοςISSEL
134 views34 slides
portfolio Shaun 2016 by
portfolio Shaun 2016portfolio Shaun 2016
portfolio Shaun 2016Shaun Ghim Seong
65 views5 slides
Marcas esportivas das seleções de futebol - 2013 by
Marcas esportivas  das seleções de futebol - 2013Marcas esportivas  das seleções de futebol - 2013
Marcas esportivas das seleções de futebol - 2013Idel Halfen
3.1K views30 slides
SHAMS Power Company by
SHAMS Power CompanySHAMS Power Company
SHAMS Power CompanyJeff Letellier
182 views1 slide
نرم افزار شجره طوبی by
نرم افزار شجره طوبینرم افزار شجره طوبی
نرم افزار شجره طوبیانتشارات جهان رایانه
424 views25 slides
гжель by
гжельгжель
гжельMaria Spitsyna
793 views8 slides

More Related Content

Viewers also liked

we do certificate by
we do certificatewe do certificate
we do certificateHannah Walsh
75 views1 slide
Untitled Powtoon 1 by
Untitled Powtoon 1Untitled Powtoon 1
Untitled Powtoon 1olenaterekha
29 views4 slides
Acid and bases by
Acid and basesAcid and bases
Acid and baseslili95ana
81 views2 slides
BSc cert by
BSc certBSc cert
BSc certTulasiramanan Ramachandram
81 views1 slide
One Page Flyer Final (English-Spanish) by
One Page Flyer Final (English-Spanish)One Page Flyer Final (English-Spanish)
One Page Flyer Final (English-Spanish)Stephen Sellier
137 views2 slides
Νικόλαος Πεχλιβανίδης by
Νικόλαος ΠεχλιβανίδηςΝικόλαος Πεχλιβανίδης
Νικόλαος ΠεχλιβανίδηςISSEL
117 views24 slides

Viewers also liked(9)

Acid and bases by lili95ana
Acid and basesAcid and bases
Acid and bases
lili95ana81 views
One Page Flyer Final (English-Spanish) by Stephen Sellier
One Page Flyer Final (English-Spanish)One Page Flyer Final (English-Spanish)
One Page Flyer Final (English-Spanish)
Stephen Sellier137 views
Νικόλαος Πεχλιβανίδης by ISSEL
Νικόλαος ΠεχλιβανίδηςΝικόλαος Πεχλιβανίδης
Νικόλαος Πεχλιβανίδης
ISSEL117 views
Content Wall - Presentation Template by Prezibase
Content Wall - Presentation Template   Content Wall - Presentation Template
Content Wall - Presentation Template
Prezibase1.5K views
How to Become a Thought Leader in Your Niche by Leslie Samuel
How to Become a Thought Leader in Your NicheHow to Become a Thought Leader in Your Niche
How to Become a Thought Leader in Your Niche
Leslie Samuel1.6M views

Similar to Χριστίνα Μποϊδίδου

Ioannis Loias by
Ioannis LoiasIoannis Loias
Ioannis LoiasISSEL
239 views41 slides
Aspect-Based Sentiment Analysis for Reviews by
Aspect-Based Sentiment Analysis for ReviewsAspect-Based Sentiment Analysis for Reviews
Aspect-Based Sentiment Analysis for ReviewsISSEL
30 views25 slides
Ανίχνευση και Ανάλυση Συναισθήματος Πτυχών Κριτικών by
Ανίχνευση και Ανάλυση Συναισθήματος Πτυχών ΚριτικώνΑνίχνευση και Ανάλυση Συναισθήματος Πτυχών Κριτικών
Ανίχνευση και Ανάλυση Συναισθήματος Πτυχών ΚριτικώνISSEL
104 views25 slides
Νικόλαος Κατιρτζής 7185 by
Νικόλαος Κατιρτζής 7185Νικόλαος Κατιρτζής 7185
Νικόλαος Κατιρτζής 7185ISSEL
134 views33 slides
Ιωάννη Α. Ζαφειρίου by
Ιωάννη Α. ΖαφειρίουΙωάννη Α. Ζαφειρίου
Ιωάννη Α. ΖαφειρίουISSEL
115 views47 slides
Design and Development of Greek Open-Domain Question Answering System by
Design and Development of Greek Open-Domain Question Answering SystemDesign and Development of Greek Open-Domain Question Answering System
Design and Development of Greek Open-Domain Question Answering SystemISSEL
10 views29 slides

Similar to Χριστίνα Μποϊδίδου(20)

Ioannis Loias by ISSEL
Ioannis LoiasIoannis Loias
Ioannis Loias
ISSEL239 views
Aspect-Based Sentiment Analysis for Reviews by ISSEL
Aspect-Based Sentiment Analysis for ReviewsAspect-Based Sentiment Analysis for Reviews
Aspect-Based Sentiment Analysis for Reviews
ISSEL30 views
Ανίχνευση και Ανάλυση Συναισθήματος Πτυχών Κριτικών by ISSEL
Ανίχνευση και Ανάλυση Συναισθήματος Πτυχών ΚριτικώνΑνίχνευση και Ανάλυση Συναισθήματος Πτυχών Κριτικών
Ανίχνευση και Ανάλυση Συναισθήματος Πτυχών Κριτικών
ISSEL104 views
Νικόλαος Κατιρτζής 7185 by ISSEL
Νικόλαος Κατιρτζής 7185Νικόλαος Κατιρτζής 7185
Νικόλαος Κατιρτζής 7185
ISSEL134 views
Ιωάννη Α. Ζαφειρίου by ISSEL
Ιωάννη Α. ΖαφειρίουΙωάννη Α. Ζαφειρίου
Ιωάννη Α. Ζαφειρίου
ISSEL115 views
Design and Development of Greek Open-Domain Question Answering System by ISSEL
Design and Development of Greek Open-Domain Question Answering SystemDesign and Development of Greek Open-Domain Question Answering System
Design and Development of Greek Open-Domain Question Answering System
ISSEL10 views
Ανάπτυξη Ελληνικού Συστήματος Απάντησης Ερωτήσεων Ανοιχτού Τύπου by ISSEL
Ανάπτυξη Ελληνικού Συστήματος Απάντησης Ερωτήσεων Ανοιχτού ΤύπουΑνάπτυξη Ελληνικού Συστήματος Απάντησης Ερωτήσεων Ανοιχτού Τύπου
Ανάπτυξη Ελληνικού Συστήματος Απάντησης Ερωτήσεων Ανοιχτού Τύπου
ISSEL49 views
Exploiting structure and content of wikipedia for query by Tripsta
Exploiting structure and content of wikipedia for queryExploiting structure and content of wikipedia for query
Exploiting structure and content of wikipedia for query
Tripsta240 views
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ... by ISSEL
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...
ISSEL53 views
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V... by ISSEL
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
ISSEL93 views
Σχεδίαση και ανάπτυξη συστήματος αξιολόγησης της αισθητικής διαδικτυακών εφαρ... by ISSEL
Σχεδίαση και ανάπτυξη συστήματος αξιολόγησης της αισθητικής διαδικτυακών εφαρ...Σχεδίαση και ανάπτυξη συστήματος αξιολόγησης της αισθητικής διαδικτυακών εφαρ...
Σχεδίαση και ανάπτυξη συστήματος αξιολόγησης της αισθητικής διαδικτυακών εφαρ...
ISSEL356 views
Μαρίνα Γέραλη by ISSEL
Μαρίνα Γέραλη Μαρίνα Γέραλη
Μαρίνα Γέραλη
ISSEL143 views
Theofilos Georgiadis: Library recommendation system for the reuse of software... by Manos Tsardoulias
Theofilos Georgiadis: Library recommendation system for the reuse of software...Theofilos Georgiadis: Library recommendation system for the reuse of software...
Theofilos Georgiadis: Library recommendation system for the reuse of software...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ... by ISSEL
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
ISSEL168 views
Employing Machine Learning and Intelligent Information Management Techniques ... by ISSEL
Employing Machine Learning and Intelligent Information Management Techniques ...Employing Machine Learning and Intelligent Information Management Techniques ...
Employing Machine Learning and Intelligent Information Management Techniques ...
ISSEL534 views
Πάρης Λαγάκης 7200 by ISSEL
Πάρης Λαγάκης 7200Πάρης Λαγάκης 7200
Πάρης Λαγάκης 7200
ISSEL253 views
Applying Data Mining Techniques on Software Repositories to Extract Design an... by ISSEL
Applying Data Mining Techniques on Software Repositories to Extract Design an...Applying Data Mining Techniques on Software Repositories to Extract Design an...
Applying Data Mining Techniques on Software Repositories to Extract Design an...
ISSEL29 views
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων σε Αποθήκες Λογισμικού με σκοπό την Εξα... by ISSEL
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων σε Αποθήκες Λογισμικού με  σκοπό την Εξα...Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων σε Αποθήκες Λογισμικού με  σκοπό την Εξα...
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων σε Αποθήκες Λογισμικού με σκοπό την Εξα...
ISSEL48 views
Kagiafas Nikolaos Thesis Presentation by ISSEL
Kagiafas Nikolaos Thesis PresentationKagiafas Nikolaos Thesis Presentation
Kagiafas Nikolaos Thesis Presentation
ISSEL88 views

More from ISSEL

Camera-based localization of annotated objects in indoor environments by
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsISSEL
12 views38 slides
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ... by
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...ISSEL
6 views38 slides
Design and implementation of an automation mechanism to automatically develop... by
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...ISSEL
4 views17 slides
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ... by
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ISSEL
6 views17 slides
Static Analysis of Python code and Identification of Potential Security Vulne... by
Static Analysis of Python code and Identification of Potential Security Vulne...Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...ISSEL
7 views16 slides
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ... by
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...ISSEL
26 views27 slides

More from ISSEL(20)

Camera-based localization of annotated objects in indoor environments by ISSEL
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environments
ISSEL12 views
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ... by ISSEL
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
ISSEL6 views
Design and implementation of an automation mechanism to automatically develop... by ISSEL
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...
ISSEL4 views
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ... by ISSEL
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ISSEL6 views
Static Analysis of Python code and Identification of Potential Security Vulne... by ISSEL
Static Analysis of Python code and Identification of Potential Security Vulne...Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...
ISSEL7 views
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ... by ISSEL
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
Στατική Ανάλυση Κώδικα Python και Αναγνώριση Πιθανών Ευπαθειών Ασφαλείας για ...
ISSEL26 views
Design and Development of an Authorization and Access Control Mechanism for C... by ISSEL
Design and Development of an Authorization and Access Control Mechanism for C...Design and Development of an Authorization and Access Control Mechanism for C...
Design and Development of an Authorization and Access Control Mechanism for C...
ISSEL13 views
Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο... by ISSEL
Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο...Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο...
Σχεδίαση και Ανάπτυξη Μηχανισμού Εξουσιοδότησης και Ελέγχου Πρόσβασης σε Συνο...
ISSEL19 views
Analysis and profiling of developer profiles using data mining techniques fro... by ISSEL
Analysis and profiling of developer profiles using data mining techniques fro...Analysis and profiling of developer profiles using data mining techniques fro...
Analysis and profiling of developer profiles using data mining techniques fro...
ISSEL3 views
Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση... by ISSEL
Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση...Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση...
Ανάλυση και μοντελοποίηση προφίλ προγραμματιστών μέσω τεχνικών εξόρυξης γνώση...
ISSEL8 views
TOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEM by ISSEL
TOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEMTOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEM
TOWARDS AN AUTOMATED SOURCE CODE FORMATTING SYSTEM
ISSEL3 views
ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ... by ISSEL
ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ...ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ...
ΔΗΜΙΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΠΡΟΤΑΣΕΩΝ ΒΕΛΤΙΩΣΗΣ ΤΗΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΠΗΓ...
ISSEL11 views
System Development for Prediction of Static Analysis Metrics of Source Code by ISSEL
System Development for Prediction of Static Analysis Metrics of Source CodeSystem Development for Prediction of Static Analysis Metrics of Source Code
System Development for Prediction of Static Analysis Metrics of Source Code
ISSEL6 views
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ... by ISSEL
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
ISSEL11 views
Micro Front-ends and Microservices Architecture in Web Application Development by ISSEL
Micro Front-ends and Microservices Architecture in Web Application DevelopmentMicro Front-ends and Microservices Architecture in Web Application Development
Micro Front-ends and Microservices Architecture in Web Application Development
ISSEL8 views
Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ... by ISSEL
Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ...Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ...
Η αρχιτεκτονική των Microservices και Micro Front-ends στην Ανάπτυξη Εφαρµογώ...
ISSEL19 views
Indoor localization using wireless networks by ISSEL
Indoor localization using wireless networksIndoor localization using wireless networks
Indoor localization using wireless networks
ISSEL5 views
Εντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύων by ISSEL
Εντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύωνΕντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύων
Εντοπισμός θέσης σε εσωτερικούς χώρους με χρήση ασύρματων δικτύων
ISSEL10 views
Design and implementation of a big data architecture for storage, real-time p... by ISSEL
Design and implementation of a big data architecture for storage, real-time p...Design and implementation of a big data architecture for storage, real-time p...
Design and implementation of a big data architecture for storage, real-time p...
ISSEL9 views
Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ... by ISSEL
Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ...Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ...
Σχεδιασµός και υλοποίηση µιας αρχιτεκτονικής µεγάλων δεδοµένων για την αποθήκ...
ISSEL16 views

Χριστίνα Μποϊδίδου

  • 1. Συσχέτιση χαρακτηριστικών ποιότητας λογισμικού με αναφορές σφαλμάτων μέσα από τη χρήση τεχνικών επεξεργασίας της Φυσικής Γλώσσας και Εξόρυξης Δεδομένων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Μποϊδίδου Χριστίνα Επιβλέπων καθηγητής: Ανδρέας Συμεωνίδης Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Η/Υ Τομέας Ηλεκτρονικής και Υπολογιστών
  • 3. Αντικείμενο και στόχοι εργασίας 4/1/2017 3 Αντικείμενο Στόχοι • Εξόρυξη δεδομένων σε αναφορές σφαλμάτων • Εξαγωγή πληροφορίας από κείμενα αναφορών σφαλμάτων • Μελέτη του τρόπου περιγραφής προβλημάτων λογισμικού από χρήστες • Εξαγωγή συχνών ομάδων λέξεων • Αντιστοίχιση των ομάδων λέξεων με χαρακτηριστικά ποιότητας λογισμικού • Συμπεράσματα για το περιεχόμενο των αναφορών σφαλμάτων
  • 4. Εφαρμογή Ruby on Rails Προϊόν λογισμικού ανοιχτού κώδικα Πλατφόρμα ανάπτυξης προγραμμάτων διαδικτύου Βασισμένο στη γλώσσα προγραμματισμού Ruby 4/1/2017 4 Αριθμός αναφορών (tickets) : 4.598
  • 5. Στάδια της μεθοδολογίας 4/1/2017 5 • Εξαγωγή των δεδομένων • Προεπεξεργασία των δεδομένων • Επεξεργασία Φυσικής Γλώσσας • Σημασιολογική ανάλυση • Εξαγωγή και επεξεργασία των κανόνων • Σημασιολογική Συσχέτιση
  • 6. Εξαγωγή των δεδομένων 4/1/2017 6  Πρότυπο json : ανοιχτό πρότυπο απεικόνισης για ανταλλαγή πληροφοριών  ticket μορφή json συλλογή αντικειμένων μορφής {name : value}  Ανάπτυξη κλάσης Ticket  Κάθε αρχείο json αντιστοιχίζεται σε ένα αντικείμενο Java τύπου Ticket Ticket Origina l_body _html Title Creator _name Project _id Update d_at Closed User_i d
  • 7. Προεπεξεργασία των δεδομένων  Απόρριψη άχρηστης πληροφορίας  html tags  ανεπιθύμητοι χαρακτήρες 4/1/2017 7 body του html
  • 8. Επεξεργασία Φυσικής Γλώσσας  Natural Language Processing με τον συντακτικό αναλυτή Stanford Parser  Διαδικασία  Εξαγωγή του κειμένου του ticket (original_body_html)  Επεξεργασία του κειμένου  Δημιουργία Συντακτικού Δένδρου (Parse Tree) 4/1/2017 8 Αρχεία κειμένου Ουσιαστικά Διανύσματα λέξεων Ρήματα Διανύσματα λέξεων Stanford Parser Πακέτο λογισμικού σε Java Ανάλυση φυσικής γλώσσας Συντακτικό δέντρο Γραμματικές σχέσεις
  • 9. Σημασιολογική Ανάλυση  Προεπεξεργασία αρχείων κειμένου  Stemming (εύρεση της ρίζας των λέξεων)  Απαλοιφή λέξεων με μικρή συχνότητα εμφάνισης  Εφαρμογή στα δεδομένα  Στατιστική Αναγωγή για παραγωγή Θεμάτων (Topics) από έγγραφα  Latent Dirichlet Allocation (LDA)  Δειγματοληψία Gibbs 4/1/2017 9
  • 10. Σημασιολογική Ανάλυση(2)  Παράδειγμα εφαρμογής LDA 4/1/2017 10 Θέμα 1ο Θέμα 2ο Θέμα 3ο Λέξη Πιθανότητα Λέξη Πιθανότητα Λέξη Πιθανότητα method 0.0339 patch 0.0653 test 0.0507 class 0.0264 option 0.0268 error 0.0362 name 0.0242 code 0.0215 rb 0.0353 example 0.0239 controller 0.0211 rail 0.0308 model 0.0231 action 0.0188 gem 0.0219 Παράμετρος Τιμή Μεταβλητή Αριθμός topics Από το χρήστη nTopics Αριθμός λέξεων ανά topic Από το χρήστη nWords Αρχείο - file Αριθμός επαναλήψεων 500 iterations Alpha 50/nTopics alpha Beta 0.1 beta
  • 11. Εξαγωγή και επεξεργασία κανόνων  Κατάλληλη μορφή για κάθε αρχείο κειμένου  yes αν η λέξη βρίσκεται σε κάποιο από τα topics  σύμβολο ? αν δεν υπάρχει  δεδομένα χωρισμένα με κόμμα  Εφαρμογή στα δεδομένα  Apriori αλγόριθμος - υλοποίηση WEKA  Παράμετροι 4/1/2017 11
  • 12. Εξαγωγή και επεξεργασία κανόνων(2)  Παράδειγμα εξαγωγής κανόνων 4/1/2017 12 Κανόνες Confidence Κανόνες Confidence gem→ rb 0.6 problem→ test 0.38 test→ patch 0.6 patch→ method 0.36 option→ patch 0.53 error→ patch 0.36 rail→ rb 0.5 method→ test 0.36 method→ patch 0.49 rb→ test 0.36 patch→ test 0.49 rb→ patch 0.35 code→ patch 0.48 error→ test 0.35 class→ patch 0.46 rb→ rail 0.35 class→ method 0.46 test→ rb 0.33 problem→ patch 0.45 test→ method 0.33 name→ patch 0.44 rb→ error 0.33 error→ rb 0.4 method→ class 0.3
  • 13. Εξαγωγή και επεξεργασία κανόνων(3)  Δημιουργία ομάδων λέξεων με βάση τους κανόνες  παρατήρηση σε ποιες λέξεις οδηγούν οι κανόνες  ομαδοποίηση αυτών των λέξεων  Αποτέλεσμα 4/1/2017 13 Λέξη κλειδί Ομάδες λέξεων rb error test rail method gem patch error test name class problem method code option rb test error method problem patch rb
  • 14. Σημασιολογική Συσχέτιση  Ορισμός:Πόσο συσχετίζονται δύο έννοιες σε σημασιολογικό επίπεδο  κατανόηση του νοήματος των ομάδων λέξεων  Συσχέτιση των ομάδων λέξεων με χαρακτηριστικά ποιότητας λογισμικού 4/1/2017 14 performance usability visibility compliance compatibility accessibility badness appearance
  • 15. Σημασιολογική Συσχέτιση(2)  Μετρική Κανονικοποιημένη Google Απόσταση (Normalized Google Distance)  Τύπος  Αποτέλεσμα εφαρμογής στις ομάδες λέξεων 4/1/2017 15 Ομάδες λέξεων Χαρακτηριστικά Τιμή error test rail method gem rb compatibility accessibility 0.6226 0.6237 error test name class problem method code option rb patch visibility compatibility 0.5837 0.5848 error method problem patch rb test accessibility visibility 0.4854 0.5847
  • 16. Πειράματα  Συγκεντρωτικός πίνακας πειραμάτων 4/1/2017 16 Πείραμα Μέρος του λόγου Topics Words/Topic Περιγραφή 5.1.1 Ουσιαστικά 3 5 5.1.2 Ουσιαστικά 3 5 Λέξεις με συχνότητα μεγαλύτερη του 1 5.1.3 Ουσιαστικά 3 5 Λέξεις με συχνότητα μεγαλύτερη του 3 5.1.4 Ουσιαστικά 3 5 Λέξεις με συχνότητα μεγαλύτερη του 7 5.1.5 Ουσιαστικά 3 5 Λέξεις με συχνότητα μεγαλύτερη του 3 και μικρότερη του 600 5.1.6 Ουσιαστικά 4 5 5.1.7 Ουσιαστικά 4 5 Λέξεις με συχνότητα μεγαλύτερη του 3 5.1.8 Ουσιαστικά 4 5 Λέξεις με συχνότητα μεγαλύτερη του 7 5.1.9 Ουσιαστικά 7 5 Λέξεις με συχνότητα μεγαλύτερη του 1 5.1.10 Ουσιαστικά 7 5 Λέξεις με συχνότητα μεγαλύτερη του 3 5.2.1 Ρήματα 3 5 5.2.2 Ρήματα 3 5 Λέξεις με συχνότητα μεγαλύτερη του 1 5.2.3 Ρήματα 3 5 Λέξεις με συχνότητα μεγαλύτερη του 3 5.2.4 Ρήματα 3 5 Λέξεις με συχνότητα μεγαλύτερη του 7 5.2.5 Ρήματα 6 4 5.2.6 Ρήματα 6 4 Λέξεις με συχνότητα μεγαλύτερη του 3 5.2.7 Ρήματα 6 4 Λέξεις με συχνότητα μεγαλύτερη του 7 5.3.1 Λέξεις-κλειδιά 3 5
  • 17. Πειράματα(2) 3 θέματα / 5 λέξεις 3 θέματα / 5 λέξεις (συχνότητα>1) 4/1/2017 17  Σύγκριση πειραμάτων για Ουσιαστικά 0 0.2 0.4 0.6 0.8 1 Ομάδα 1 Ομάδα 2 Ομάδα 3 usability accessibility compatibility appearance 0 0.2 0.4 0.6 0.8 1 Ομάδα 1 Ομάδα 2 Ομάδα 3 accessibility compatibility visibility Λέξη κλειδί Ομάδες λέξεων rb error test action rail method gem patch patch error test name class method code option rb action controller rb Λέξη κλειδί Ομάδες λέξεων rb error test rail method gem patch error test name class problem method code option rb test error method problem patch rb
  • 18. Πειράματα(3) 3 θέματα / 5 λέξεις (συχνότητα>3) 3 θέματα / 5 λέξεις (συχνότητα>7) 4/1/2017 18  Σύγκριση πειραμάτων για Ουσιαστικά 0 0.2 0.4 0.6 0.8 Ομάδα 1 Ομάδα 2 Ομάδα 3 accessibility compatibility usability 0 0.2 0.4 0.6 0.8 Ομάδα 1 Ομάδα 2 Ομάδα 3 accessibility compatibility visibility Λέξη κλειδί Ομάδες λέξεων rb test file rail method gem patch test name class method code example option rb method test name class code patch rb Λέξη κλειδί Ομάδες λέξεων rb test file rail method problem patch patch test name class problem method example option rb test rail method problem patch rb
  • 19. Πειράματα(4) 7 θέματα / 5 λέξεις (συχνότητα>1) 7 θέματα / 5 λέξεις (συχνότητα>3) 4/1/2017 19  Σύγκριση πειραμάτων για Ουσιαστικά 0 0.2 0.4 0.6 0.8 Ομάδα 1 Ομάδα 2 Ομάδα 3 Ομάδα 4 accessibility compatibility usability visibility 0 0.2 0.4 0.6 0.8 Ομάδα 1 Ομάδα 2 Ομάδα 3 Ομάδα 4 accessibility compatibility usability visibility Λέξη κλειδί Ομάδες λέξεων rb lib error test name rail action class method problem code controller gem end action lib controller patch default error fix test name class method problem code example case end option test error name rail problem method code case patch rb Λέξη κλειδί Ομάδες λέξεων rb error test class problem code lib file name rail action method controller gem patch action lib controller patch error fix test name class problem method code example case rb test error name rail problem method code case patch rb
  • 20. Πειράματα(5) 3 θέματα / 5 λέξεις 3 θέματα / 5 λέξεις (συχνότητα>1) 4/1/2017 20  Σύγκριση πειραμάτων για Ρήματα 0 0.2 0.4 0.6 0.8 Ομάδα 1 Ομάδα 2 Ομάδα 3 compatibility performance appearance 0 0.2 0.4 0.6 0.8 Ομάδα 1 Ομάδα 2 Ομάδα 3 Ομάδα 4 compatibility performanc e appearance Λέξη κλειδί Ομάδες λέξεων use call get fail set add run create make seem try find include create get use add try get use add create find try Λέξη κλειδί Ομάδες λέξεων use call see fail set add run seem create make try find include create see use add seem see use see call use add run create make seem find try
  • 21. Πειράματα(6) 3 θέματα / 5 λέξεις (συχνότητα>3) 3 θέματα / 5 λέξεις (συχνότητα>7) 4/1/2017 21  Σύγκριση πειραμάτων για Ρήματα 0 0.2 0.4 0.6 0.8 Ομάδα 1 Ομάδα 2 compatibility performance appearance visibility 0 0.2 0.4 0.6 0.8 Ομάδα 1 Ομάδα 2 compatibility appearance visibility Λέξη κλειδί Ομάδες λέξεων use call get fail change set add run create make try find include get use add create try Λέξη κλειδί Ομάδες λέξεων use call get fail set add run create make seem try find include get use add create find try
  • 22. Πειράματα(7) 6 θέματα / 4 λέξεις 6 θέματα / 4 λέξεις (συχνότητα>3) 4/1/2017 22  Σύγκριση πειραμάτων για Ρήματα 0 0.2 0.4 0.6 0.8 Ομάδα 1 Ομάδα 2 Ομάδα 3 compatibility performance appearance visibility accessibility 0 0.2 0.4 0.6 0.8 Ομάδα 1 Ομάδα 2 Ομάδα 3 compatibility appearance visibility accessibility usability Λέξη κλειδί Ομάδες λέξεων use allow generate get change set create include expect see load make try find want see call get use run create make find try add get use create make try find include Λέξη κλειδί Ομάδες λέξεων use work call generate get change set return add run create pass include fail see fix load make try find see work call get set use add run create make find try work call see get use add create make find try
  • 23. Πειράματα(8) 3 topics/5 words Ουσιαστικά Ρήματα 4/1/2017 23  Σύγκριση πειραμάτων για Λέξεις-κλειδιά 0 0.1 0.2 0.3 0.4 0.5 Ομάδα 1 Ομάδα 2 Ομάδα 3 Ομάδα 4 compatibility accessibility usability 0 0.2 0.4 0.6 0.8 Ομάδα 1 Ομάδα 2 Ομάδα 3 compatibility performance appearance Λέξη κλειδί Ομάδες λέξεων patch error have fix test set add option have error fix test set file code add run patch test have fix add run patch add have test patch 0 0.2 0.4 0.6 0.8 Ομάδα 1 Ομάδα 2 Ομάδα 3 usability accessibility compatibility appearance
  • 24. Συμπεράσματα  Ο αριθμός των topics δεν επηρεάζει σημαντικά τις ομάδες λέξεων.  λιγότερα topics είναι υποομάδες των περισσότερων  παρόμοιες συσχετίσεις  Η αύξηση του κάτω ορίου συχνότητας προκαλεί αλλοίωση στις συσχετίσεις  πειράματα με συχνότητα μεγαλύτερη του 1 και του 3 εξάγουν παρόμοια αποτελέσματα  πείραμα με συχνότητα μεγαλύτερη του 7 αλλοιώνει 4/1/2017 24 Ουσιαστικά
  • 25. Συμπεράσματα(2)  Παρατηρούνται αλληλοεπικαλύψεις στις ομάδες των ρημάτων  υποκειμενική η χρήση των ρημάτων  έκφραση πολλών διαφορετικών εννοιών 4/1/2017 25 Ρήματα Λέξεις-κλειδιά  Εμφανίζονται λέξεις από όλα τα μέρη του λόγου  για ίδιο αριθμό topics εμφανίζονται τα αντίστοιχα ουσιαστικά και ρήματα των μεμονωμένων πειραμάτων  γενικότερες ομάδες λέξεων
  • 26. Συμπεράσματα(3)  Προτιμότερη η προσέγγιση των ουσιαστικών  λογικό νόημα μιας αναφοράς σφάλματος  ομάδες λέξεων ακριβείς και σαφώς διαχωρισμένες  συγκεκριμένες συσχετίσεις με χαρακτηριστικά  Χρήση ρημάτων  δεν είναι ξεκάθαρος ο σκοπός χρήσης τους  δεν εξάγεται πληροφορία για τα χαρακτηριστικά ποιότητας 4/1/2017 26
  • 27. Μελλοντική εργασία 4/1/2017 27 • Άλλα σύνολα δεδομένων(π.χ. λογισμικά κλειστού κώδικα) Εφαρμογή μεθοδολογίας • Ανάπτυξη εργαλείου αυτόματης αναγνώρισης χαρακτηριστικού που ανήκει μια αναφορά Εργαλείο αναγνώρισης • Μελέτη συσχετίσεων των χαρακτηριστικών με άλλα μέρη του λόγου (επίθετα, επιρρήματα, κτλ.) Περαιτέρω μελέτη
  • 28. 4/1/2017 28 Ευχαριστώ για την προσοχή σας! Ερωτήσεις;