Successfully reported this slideshow.
Your SlideShare is downloading. ×

Basketball data analytics via Machine Learning techniques using the REMEDES system

Basketball data analytics via Machine Learning techniques using the REMEDES system

Download to read offline

Data science although pre-existing, now days dominates and may do the same in the future. The existence of huge storage space and powerful processors capable of managing corresponding-sized databases, have enabled information to be collected in every workplace, from the medical and engineering sectors to the arts and sports. In this diploma thesis we will stand in the field of professional sport and in particular basketball. Initially basic knowledge about the sport will be presented, some of the information collection tools will be mentioned and we will analyze the importance and role of data in training, in the preparation of athletes and in the decisions of coaches. Subsequently, having collected data using the "REMEDES" system on a specific basketball set of drills, a sports performance evaluation system was developed using the "Python" programming language and various Data Preprocessing and Machine Learning techniques. The purpose of this system is to evaluate as representatively as possible non-athletes, athletes and Basketball athletes in a specific set of drills that obviously concern basketball. During the analysis and through careful monitoring of the results we have drawn some very interesting conclusions that will be presented and interpreted in this report along the way.

Data science although pre-existing, now days dominates and may do the same in the future. The existence of huge storage space and powerful processors capable of managing corresponding-sized databases, have enabled information to be collected in every workplace, from the medical and engineering sectors to the arts and sports. In this diploma thesis we will stand in the field of professional sport and in particular basketball. Initially basic knowledge about the sport will be presented, some of the information collection tools will be mentioned and we will analyze the importance and role of data in training, in the preparation of athletes and in the decisions of coaches. Subsequently, having collected data using the "REMEDES" system on a specific basketball set of drills, a sports performance evaluation system was developed using the "Python" programming language and various Data Preprocessing and Machine Learning techniques. The purpose of this system is to evaluate as representatively as possible non-athletes, athletes and Basketball athletes in a specific set of drills that obviously concern basketball. During the analysis and through careful monitoring of the results we have drawn some very interesting conclusions that will be presented and interpreted in this report along the way.

More Related Content

More from ISSEL

Related Books

Free with a 30 day trial from Scribd

See all

Basketball data analytics via Machine Learning techniques using the REMEDES system

  1. 1. ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΑΝΑΛΥΣΗ ΑΘΛΗΤΙΚΩΝ ΕΠΙΔΟΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ REMEDES ΕΚΠΟΝΗΣΗ: ΒΑΣΙΛΕΙΟΣ ΜΠΕΛΛΟΣ [8715] ΕΠΙΒΛΕΨΗ: ΑΝΤΡΕΑΣ ΣΥΜΕΩΝΙΔΗΣ ΕΜΜΑΝΟΥΗΛ ΤΣΑΡΔΟΥΛΙΑΣ ΘΩΜΑΣ ΚΑΡΑΝΙΚΙΩΤΗΣ
  2. 2. ΕΙΣΑΓΩΓΗ Αντικείμενο της παρούσας διπλωματικής είναι: Η ανάλυση αθλητικών επιδόσεων στην καλαθοσφαίριση, με τη βοήθεια του συστήματος REMEDES Σκοπός της διπλωματικής εργασίας: Η ανάπτυξη ενός μοντέλου αξιολόγησης αθλητών καλαθοσφαίρισης: • Αξιολόγηση σε συγκεκριμένα χαρακτηριστικά • Συνολική αξιολόγηση Extras: • Γίνεται χρήση της γλώσσας προγραμματισμού Python • Συλλογή δεδομένων από ένα πλήθος τριάντα χρηστών (Δέκα αθλητές, δέκα μη αθλητές και δέκα αθλητές καλαθοσφαίρισης) • Όλοι οι χρήστες εκτέλεσαν ένα σετ ασκήσεων που διαμορφώθηκε λαμβάνοντας υπόψη κινήσεις που εκτελούνται συχνά κατά τη διάρκεια ενός αγώνα. • Για τη δημιουργία του μοντέλου αξιολόγησης χρησιμοποιούνται τεχνικές Μηχανικής Μάθησης • Αλγόριθμος παλινδρόμησης: Support Vector for Regression (SVR)
  3. 3. Επιστήμη των δεδομένων: Πρόκειται για έναν συνδυασμό της στατιστικής, της ανάλυσης - εξόρυξης δεδομένων και της μηχανικής μάθησης. Αθλητισμός και επιστήμη δεδομένων: Τα πρώτα δείγματα αυτής της συνεργασίας, δεδομένων και αθλητισμού, ξεκίνησαν δειλά το 2003 στον χώρο του επαγγελματικού Baseball με τη κυκλοφορία του “Moneyball” , βιβλίο ορόσημο για την εξέλιξη του αθλητισμού και συνεχίζονται μέχρι σήμερα, με μεγαλύτερη και εντονότερη παρουσία στον χώρο της καλαθοσφαίρισης και πιο συγκεκριμένα στον μαγικό κόσμο του NBA. Καλαθοσφαίριση και επιστήμη δεδομένων: • Ανάλυση αντιπάλων • Προετοιμασία αγώνα • Προπόνηση • Επιλογή παιχτών • Αποφυγή τραυματισμών • Λήψη αποφάσεων κατά τη διάρκεια του αγώνα
  4. 4. Σύστημα REMEDES: Αποτελεί ένα σύστημα προσανατολισμένο στην μέτρηση και καταγραφή αντανακλαστικών και αντίδρασης με υψηλή ακρίβεια, κάνοντας χρήση οπτικών ή/και ακουστικών ερεθισμάτων. Το σύστημα Remedes αποτελείται από: • Remedes Pads με τα καλώδια τροφοδοσίας/φόρτισής τους. • Ένα Remedes Master Pad με το καλώδιο τροφοδοσίας/φόρτισής του. • USB Hubs για την φόρτιση των Pads. • Ένα προ-ρυθμισμένο Access Point. • Ένα power-bank 15000mAh. Τύποι ασκήσεων REMEDES: • Ασκήσεις κατά βήμα • Αυτοματοποιημένες ασκήσεις • Δημιουργία άσκησης με πρότυπο Θεωρητικό Υπόβαθρο:
  5. 5. Χαρακτηριστικά (Features) που χρησιμοποιήθηκαν: mean_response: Μέσος χρόνος αντίδρασης. successes%: Το ποσοστό επιτυχίας απενεργοποίησης των Pads. median_response: Χρόνος διάμεσης απόκρισης. max_response: Χρόνος μέγιστης απόκρισης. min_response: Χρόνος ελάχιστης απόκρισης. q10, q25, q75, q90: Τα αντίστοιχα quartiles. start_mean: Ο μέσος χρόνος αντίδρασης στην αρχή της άσκησης. start successes%: Το ποσοστό επιτυχίας απενεργοποίησης στην αρχή της άσκησης. start_std: Η τυπική απόκλιση των αποκρίσεων στην αρχή της άσκησης. middle_mean: Ο μέσος χρόνος αντίδρασης στη μέση της άσκησης. middle successes%: Το ποσοστό επιτυχίας απενεργοποίησης στη μέση της άσκησης. middle_std: Η τυπική απόκλιση των αποκρίσεων στη μέση της άσκησης. end_mean: Ο μέσος χρόνος αντίδρασης στο τέλος της άσκησης. end successes%: Το ποσοστό επιτυχίας απενεργοποίησης στο τέλος της άσκησης. end_std: Η τυπική απόκλιση των αποκρίσεων στο τέλος της άσκησης. dm_errors: Λάθη απόφασης (decision making errors). status: Περιγράφει την κατάσταση του χρήστη (pro, athlete, noob).
  6. 6. Τεχνολογικό Υπόβαθρο: Προ-επεξεργασία δεδομένων (Data Preprocessing): • Καθαρισμός Δεδομένων (Data Cleaning): Είναι η διαδικασία εντοπισμού και διόρθωσης ή διαγραφής λάθους ή μη ακριβούς πληροφορίας (Dirty Data). • Μείωση σετ δεδομένων (Dataset Reduction ή Instance Selection): Πρόκειται για τη μείωση του αρχικού σετ δεδομένων, σε ένα μικρότερο πιο ουσιώδους και πιο εύκολο στη χρήση. Ειδικά για προβλήματα μηχανικής μάθησης θα πρέπει να αφαιρεθούν και τα χαρακτηριστικά, που δεν μπορούν να χρησιμοποιηθούν σαν είσοδος στο ML μοντέλο. • Κανονικοποίηση (Normalization): Στόχος είναι ο μετασχηματισμός των αριθμητικών δεδομένων σε τιμές που θα αποφέρουν καλύτερα αποτελέσματα και θα μειώσουν την εξάρτηση μεταξύ διαφόρων χαρακτηριστικών. • Μείωση Διαστάσεων (Dimensionality Reduction): Πρόκειται για το μετασχηματισμό των δεδομένων από έναν χώρο πολλών διαστάσεων, σε μια αναπαράσταση ενός χώρου μικρότερων διαστάσεων, διατηρώντας όμως όσο το δυνατόν περισσότερη πληροφορία.
  7. 7. Μηχανική μάθηση (Machine Learning - ML) Η μηχανική μάθηση αναπτύχθηκε από τη μελέτη της αναγνώρισης προτύπων και ορίστηκε από τον Άρθουρ Σάμιουελ το 1959 ως “το πεδίο μελέτης που δίνει στους υπολογιστές την ικανότητα να μαθαίνουν χωρίς να έχουν ρητά προγραμματιστεί”.  Επιτηρούμενη Μάθηση (Supervised Learning): Αποτελεί ένα πρόβλημα για το οποίο υπάρχει γνώση των ανεξάρτητων μεταβλητών, αλλά και της εξαρτημένης μεταβλητής. Έτσι εκπαιδεύοντας κάποιο ML μοντέλο με τα ήδη γνωστά δεδομένα, υπάρχει η δυνατότητα πρόβλεψης της εξόδου για νέα δεδομένα εισόδου.  Μη επιτηρούμενη μάθηση (Unsupervised Learning): Σε αυτή την περίπτωση ενώ είναι γνωστές οι ανεξάρτητες μεταβλητές, δεν υπάρχει γνώση της εξαρτημένης μεταβλητής η αλλιώς της εξόδου. Στόχος του Unsupervised Learning είναι να ανακαλύψει τη δομή των δεδομένων εισόδου και παρόλο που δεν είναι ένα καλά ορισμένο πρόβλημα, τα αποτελέσματα του μπορεί να είναι πολύ ισχυρά Κύριοι τύποι προβλημάτων ML:  Ταξινόμηση (Classification): Η ταξινόμηση είναι ένα πρόβλημα επιτηρούμενης μάθησης και έχει ως στόχο να μπορεί να ταξινομήσει σε μια κλάση (εξαρτημένη μεταβλητή), πρότερα μη γνωστές εγγραφές (ανεξάρτητες μεταβλητές εκπαίδευσης), με όσο το δυνατόν μεγαλύτερη ακρίβεια.  Παλινδρόμηση (Regression): Η λογική της παλινδρόμησης είναι ίδια με αυτής της ταξινόμησης, με τη μόνη διαφορά πως αντί για διακριτές τιμές στην κλάση, έχουμε συνεχείς αριθμητικές τιμές.  Ομαδοποίηση (Clustering): Αποτελεί ένα πρόβλημα μη επιτηρούμενης μάθησης, με στόχο να μπορεί να διαχωρίσει τα δεδομένα σε υποομάδες με κοινά χαρακτηριστικά. Το ανορθόδοξο με το clustering είναι ότι τα κριτήρια με τα οποία θέλουμε να διαχωρίσουμε τα δεδομένα δεν είναι γνωστά, αλλά πρέπει να αναγνωριστούν στην πορεία.
  8. 8. Support Vector for Regression (SVR) Εφευρέθηκε πίσω στη δεκαετία του '90 από τον Vladimir Vapnik και τους συναδέλφους του. Linear Regression Linear SVR
  9. 9. Kernel SVR: Ένας “kernel” είναι ουσιαστικά μια μαθηματική συνάρτηση, που δέχεται ως είσοδο τα δεδομένα και τα μετατρέπει στην επιθυμητή μορφή. Οι μορφές ποικίλουν. Μπορεί να είναι γραμμική μορφή (linear), μη γραμμική (non-linear), πολυωνυμική (polynomial), σιγμοειδής (sigmoid), ακτινικής συνάρτησης βάσης (Radial Basis Function - RBF), κ.α.. Παρακάτω παρουσιάζεται ένα παράδειγμα “Non-Linear SVR” αλγορίθμου με RBF Kernel.
  10. 10. Μέτρα αξιολόγησης: F-Score: Είναι ένα μέτρο της ακρίβειας ενός μοντέλου ταξινόμησης σε ένα σύνολο δεδομένων. Όπου: *(tp = true positives, fp = false positives, fn = false negatives) Προφανώς επειδή γίνεται χρήση ενός αλγορίθμου παλινδρόμησης, θα πρέπει να στρογγυλοποιηθούν οι προβλέψεις στην πιο “κοντινή” κατηγορία πριν χρησιμοποιηθεί το μετρικό F-Score.
  11. 11. Μέτρα αξιολόγησης: R2 Squared: Όπου SS(res/tot) το άθροισμα των τετραγώνων των αποκλίσεων, όπως ακριβώς φαίνεται και στις εικόνες που ακολουθούν: Συνήθως το “R2” κυμαίνεται από μηδέν έως ένα με τη δυνατότητα φυσικά να πάρει και αρνητικές τιμές πράγμα που θα σήμαινε ένα πάρα πολύ κακό μοντέλο. Όσο μικρότερο το άθροισμα των τετραγώνων των αποκλίσεων (SSres), τόσο μεγαλύτερο το “R Squared” άρα και το μοντέλο είναι καλύτερο.
  12. 12. Μέτρα αξιολόγησης: Mean Squared Error: Το σφάλμα MSE ή αλλιώς Mean Squared είναι μία από τα προτιμώμενα μετρικά αξιολόγησης για προβλήματα παλινδρόμησης. Πρόκειται για τον μέσο όρο της τετραγωνικής διαφοράς μεταξύ της πραγματικής τιμής και της τιμής που προβλέπεται από το μοντέλο παλινδρόμησης. Καθώς τετραγωνίζει τις διαφορές, τιμωρεί ακόμη και ένα μικρό σφάλμα και οδηγεί σε υπερεκτίμηση του πόσο κακό είναι το μοντέλο.
  13. 13. Μέτρα αξιολόγησης: Root Mean Squared Error: Το RMSE είναι η πιο ευρέως χρησιμοποιούμενη αξιολόγηση για προβλήματα παλινδρόμησης, αντιπροσωπεύει την τυπική απόκλιση του δείγματος και είναι η τετραγωνική ρίζα της μέσης τετραγωνικής διαφοράς, μεταξύ της πραγματικής τιμής και της τιμής που προβλέπεται από το μοντέλο. Προτιμάται περισσότερο σε ορισμένες περιπτώσεις, επειδή τα σφάλματα τετραγωνίζονται πρώτα πριν από τον μέσο όρο, γεγονός που θέτει υψηλή ποινή σε μεγάλα σφάλματα. Αυτό σημαίνει ότι το RMSE είναι χρήσιμο όταν τα μεγάλα σφάλματα είναι ανεπιθύμητα.
  14. 14. Μέτρα αξιολόγησης: Mean Absolute Error: Το MAE είναι η απόλυτη διαφορά μεταξύ της πραγματικής τιμής και της τιμής που προβλέπεται από το μοντέλο. Η MAE είναι πιο ισχυρή στις ακραίες τιμές και δεν τιμωρεί τα σφάλματα τόσο αυστηρά όσο το MSE. Το MAE είναι ένα γραμμικό μετρικό αξιολόγησης, που σημαίνει ότι όλες οι μεμονωμένες διαφορές έχουν την ίδια αξία. Δεν είναι κατάλληλο για προβλήματα όπου χρειάζεται να δώσουμε μεγαλύτερη προσοχή στις ακραίες τιμές.
  15. 15. K-Means: Ο αλγόριθμος K-Means, βασίζεται στην τεχνική της διαίρεσης και αποτελεί έναν αλγόριθμο ομαδοποίησης, όπως αρχικά είχε προταθεί από τον J.B.MacQueen. Βήμα 1ο: Επιλέγεται το Κ, δηλαδή τον αριθμό των ομάδων όπου θέλουμε να διαχωρίσουμε τα δεδομένα. Βήμα 2ο: Επιλέγονται τυχαία K σημεία (όχι αναγκαστικά από το σετ δεδομένων) ως κέντρα (centroids) των ομάδων (clusters). Βήμα 3ο: Κάθε σημείο του σετ δεδομένων τοποθετείται σε μία ομάδα από το κέντρο της οποίας έχει την μικρότερη απόσταση. Έτσι δημιουργούνται Κ ομάδες. Βήμα 4ο: Έχοντας υπόψιν τις νέες ομάδες επανατοποθετούνται τα κέντρα. . Βήμα 5ο: Επανατοποθετείται κάθε σημείο του σετ δεδομένων σε μία ομάδα, από το κέντρο της οποίας έχει την μικρότερη απόσταση. *Τα βήματα 4 & 5 επαναλαμβάνονται μέχρι να μην υπάρξει νέα αλλαγή στις ομάδες.
  16. 16. Αξιολόγηση των ομάδων του K-Means: Η πιο συνήθης αξιολόγηση των ομάδων είναι το άθροισμα του τετραγώνου σφαλμάτων (Sum of Squared Error – SSE/WCSS) . Σφάλμα αποτελεί η απόσταση του κάθε σημείου από το κέντρο της κοντινότερης ομάδας. Elbow Method: Tο SSE/WCSS μπορεί να χρησιμοποιηθεί και για τον υπολογισμό του βέλτιστου αριθμού των ομάδων. όσο μεγαλώνει ο αριθμός των ομάδων, τόσο μικρότερες θα είναι οι ομάδες και επομένως θα ελαχιστοποιείται και το σφάλμα. Τελικά η καλύτερη επιλογή είναι το K για το οποίο το SSE μειώνεται απότομα.
  17. 17. Ασκησιολόγιο REMEDES Άσκηση 1 – Man in the Middle: Αριθμός Pads: 6 Χαρακτηριστικά: Γρήγορα Χέρια (Active Hands), Περιφερειακή Όραση Τύπος άσκησης: Αυτοματοποιημένη Τα pads βρίσκονται πάνω στην ίδια κάθετη επιφάνεια και ενεργοποιούνται τυχαία. A. Χρόνοι αντίδρασης αναγνώρισης (Recognition RT): Ανάλογα με το χρώμα, πράσινο ή κόκκινο, θα πρέπει να απενεργοποιούνται ή όχι. B. Χρόνοι αντίδρασης αναγνώρισης και επιλογής (Recognition & Choice RT): Ανάλογα με το χρώμα (πράσινο, μπλε ή κόκκινο) θα πρέπει να απενεργοποιούνται ή όχι. Το πράσινο χρώμα σημαίνει ότι το συγκεκριμένο pad θα πρέπει να απενεργοποιηθεί με το δεξί χέρι, ενώ το μπλε με το αριστερό. Στο κόκκινο χρώμα δεν πρέπει να υπάρξει καμία αντίδραση.
  18. 18. Ασκησιολόγιο REMEDES Άσκηση 2 – Crossovers in Motion: Αριθμός Pads: 6 Χαρακτηριστικά: Ballhandling, Επιτάχυνση - Πρώτο Βήμα Τύπος άσκησης: Κατά βήμα Τα Pads ενεργοποιούνται διαδοχικά, από το pad1 έως το pad6 και αντίστροφα. Ο αθλητής πριν απενεργοποιήσει το εκάστοτε pad, πρέπει να εκτελέσει σταυρωτή ντρίμπλα ενώ είναι σε κίνηση. A. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί μόνο απλή σταυρωτή ντρίμπλα. B. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί μόνο σταυρωτή ντρίμπλα κάτω από τα πόδια. C. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί μόνο σταυρωτή ντρίμπλα πίσω από την πλάτη. D. Χρόνοι αντίδρασης επιλογής (Choice RT): Ανάλογα με το χρώμα (πράσινο, μπλε ή κόκκινο) που ενεργοποιείται ένα pad, ο αθλητής εκτελεί συγκεκριμένο τύπο σταυρωτής ντρίπλας (απλή, κάτω από τα πόδια, πίσω από τη πλάτη).
  19. 19. Ασκησιολόγιο REMEDES Άσκηση 3 – Static Crossovers: Αριθμός Pads: 4 Χαρακτηριστικά: Ballhandling, Γρήγορα Χέρια (Active Hands) Τύπος άσκησης: Αυτοματοποιημένη Τα Pads ενεργοποιούνται τυχαία. Πριν απενεργοποιήσει το εκάστοτε pad, ο αθλητής πρέπει να εκτελέσει σταυρωτή ντρίμπλα στατικά. A. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί μόνο απλή σταυρωτή ντρίμπλα. B. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί μόνο σταυρωτή ντρίμπλα κάτω από τα πόδια. C. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί μόνο σταυρωτή ντρίμπλα πίσω από την πλάτη. D. Χρόνοι αντίδρασης επιλογής (Choice RT): Ανάλογα με το χρώμα (πράσινο, μπλε ή κόκκινο) που ενεργοποιείται ένα pad, ο αθλητής εκτελεί συγκεκριμένο τύπο σταυρωτής ντρίπλας (απλή, κάτω από τα πόδια, πίσω από τη πλάτη).
  20. 20. Ασκησιολόγιο REMEDES Άσκηση 4 – Quick Feet: Αριθμός Pads: 4 Χαρακτηριστικά: Footwork Τύπος άσκησης: Αυτοματοποιημένη Τα Pads ενεργοποιούνται με τυχαία σειρά. Ο αθλητής καθ’ όλη τη διάρκεια της άσκησης κρατάει τα πόδια του σε κίνηση, παρόλο που ο ίδιος είναι στατικός. A. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής απενεργοποιεί τα pads εναλλάξ, μία με το δεξί πόδι και μία με το αριστερό, εκτελώντας συγκεκριμένο footwork. B. Χρόνοι αντίδρασης επιλογής (Choice RT): Ο αθλητής ανάλογα με το χρώμα του Pad (πράσινο ή μπλε), θα το απενεργοποιεί με το αντίστοιχο πόδι (δεξί ή αριστερό).
  21. 21. Ασκησιολόγιο REMEDES Άσκηση 5 – Kick, Slide & Run Defense: Αριθμός Pads: 4 Χαρακτηριστικά: Πλάγια Βήματα, Ταχύτητα Τύπος άσκησης: Αυτοματοποιημένη Ο αθλητής βρίσκεται σε στάση άμυνας και καλείται να απενεργοποιήσει τα Pads, τα οποία ενεργοποιούνται με τυχαία σειρά. Αν ανάψουν διαδοχικά δύο διπλανά Pads, τότε ο αθλητής θα πρέπει να κινηθεί με πλάγια βήματα άμυνας, ενώ σε διαφορετική περίπτωση θα πρέπει να εκτελέσει τη τεχνική running defense. A. Απλοί χρόνοι αντίδρασης (Simple RT): Το ερέθισμα που δέχεται ο αθλητής από την ενεργοποίηση του κάθε pad είναι οπτικό- ακουστικό. B. Απλοί χρόνοι αντίδρασης (Simple RT): Το ερέθισμα που δέχεται ο αθλητής από την ενεργοποίηση του κάθε pad είναι μόνο οπτικό.
  22. 22. Ασκησιολόγιο REMEDES Άσκηση 6 – Footwork: Αριθμός Pads: 3 Χαρακτηριστικά: Footwork Τύπος άσκησης: Αυτοματοποιημένη Τα Pads ενεργοποιούνται με τυχαία σειρά. Ο αθλητής πρέπει να απενεργοποιήσει το εκάστοτε pad με συγκεκριμένο τρόπο (Footwork) χρησιμοποιώντας τα πόδια του. Ο αθλητής κινείται πάντα πάνω στην ευθεία των pads και τα απενεργοποιεί, περνώντας πάνω από αυτά. A. Απλοί χρόνοι αντίδρασης (Simple RT): Χρησιμοποιώντας αμυντικά γλιστρήματα (kick - slide footwork). Ο αθλητής ξεκινάει την κίνηση του με το πόδι που βρίσκεται προς το συγκεκριμένο pad. B. Απλοί χρόνοι αντίδρασης (Simple RT): Χρησιμοποιώντας άλματα. C. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής περνάει πάντα και τα δύο του πόδια (εναλλάξ) πάνω από το pad που θέλει να απενεργοποιήσει. Η κίνηση ξεκινάει με το πόδι που βρίσκεται προς το συγκεκριμένο pad (Two feet sideways footwork).
  23. 23. Ασκησιολόγιο REMEDES Άσκηση 7 – Rip & First Step: Ο αθλητής βρίσκεται σε στάση απειλής μπροστά από το pad3, κρατώντας τη μπάλα μπροστά από το στήθος του. Έπειτα ενεργοποιείται το pad3 και στη συνέχεια ένα από τα pad2 ή pad1. Ο κάτοχος της μπάλας πρέπει να τραβήξει με δύναμη τη μπάλα του χαμηλά (rip) πάνω από το pad3, ώστε να το απενεργοποιήσει και αμέσως χρησιμοποιώντας μία ή το πολύ δύο ντρίπλες, να φτάσει να απενεργοποιήσει το δεύτερο pad που έχει ανάψει. Η διαδικασία επαναλαμβάνεται. Η ντρίμπλα θα γίνεται πάντα με το “έξω χέρι” ενώ η απενεργοποίηση του δεύτερου pad πάντα με το “μέσα χέρι”. A. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής γνωρίζει κάθε φορά ποιο είναι το επόμενο pad που θα ενεργοποιηθεί και εκτελεί πάντα σταυρωτό πρώτο βήμα (cross step). B. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής γνωρίζει κάθε φορά ποιο είναι το επόμενο pad που θα ενεργοποιηθεί, με το πρώτο του βήμα να είναι το αντίστοιχο με το χέρι που ντριμπλάρει (same foot same hand). C. Χρόνοι αντίδρασης επιλογής (Choice RT): Ο αθλητής ανάλογα με το χρώμα του pad3 (πράσινο ή μπλε), θα εκτελέσει αντίστοιχα σταυρωτό ή όχι πρώτο βήμα.
  24. 24. Ασκησιολόγιο REMEDES Άσκηση 4 – Help & Recover: Αριθμός Pads: 2 Χαρακτηριστικά: Πλάγια Βήματα, Ταχύτητα Τύπος άσκησης: Κατά βήμα Ο αθλητής θα ξεκινάει από το pad1. Αρχικά ενεργοποιείται το pad2 και στη συνέχεια το pad1. Η διαδικασία επαναλαμβάνεται. Από το pad1 ο αθλητής θα φτάσει στο pad2 με πλάγια βήματα ενώ για την αντίθετη πορεία, με τεχνική close out. A. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί την άσκηση (και από τις δύο πλευρές του γηπέδου) γνωρίζοντας με ποιο χέρι πρέπει να απενεργοποιεί το κάθε pad. B. Χρόνοι αντίδρασης επιλογής (Choice RT): Ανάλογα με το χρώμα (πράσινο ή μπλε) που θα έχει το pad1, ο αθλητής θα πρέπει να χρησιμοποιήσει και το συγκεκριμένο χέρι (δεξί ή αριστερό αντίστοιχα) για να το απενεργοποιήσει.
  25. 25. Δημιουργία Μοντέλου Αξιολόγησης Προ-επεξεργασία δεδομένων: • Δημιουργία της κλάσης “status” (pro, noob ή athlete) • Επιλογή χαρακτηριστικών • Αντικατάσταση χαρακτηριστικών όπου μπορούσαν να εκφραστούν σε ποσοστό • Αντικατάσταση λανθασμένων τιμών • Συμπλήρωση τιμών που έλειπαν (missing values) • Ορισμός indexes Πριν Μετά
  26. 26. Δημιουργία Μοντέλου Αξιολόγησης Δημιουργία ξεχωριστών πινάκων για κάθε άσκηση : Κάθε άσκηση έχει μία ή και περισσότερες παραλλαγές και επειδή είναι προτιμότερο να παραμείνει το σύστημα όσο πιο απλό γίνεται, η τελική τιμή ενός χαρακτηριστικού μιας άσκησης, προκύπτει από τον συνδυασμό των τιμών των χαρακτηριστικών, της κάθε διαφορετικής παραλλαγής της άσκησης. Η αρχική μορφή του σετ δεδομένων της άσκησης “Ex2_BallhandlingInMotion” (με τις παραλλαγές των ασκήσεων). Η τελική μορφή του σετ δεδομένων της άσκησης “Ex2_BallhandlingInMotion” (με ομαδοποιημένες τις παραλλαγές των ασκήσεων).
  27. 27. Δημιουργία Μοντέλου Αξιολόγησης Αξιολόγηση αθλητών για κάθε άσκηση με τη χρήση του αλγορίθμου SVR: • Δημιουργία οχτώ μοντέλων SVR ένα για κάθε άσκηση. • Εκπαιδεύθηκαν με το 80% (24/30) του σετ δεδομένων (8 pro, 8 athletes, 8 noobs). • Dummy variables (pro-2, athlete-1, noob-0). • Εφαρμογή K-Fold cross validation. • Αξιολόγηση (R2 Score, F1 Score, MSE, RMSE, MAE). • Tuning σε παραμέτρους χρησιμοποιώντας GridSearchCV. Ομαδοποίηση αθλητών με τον αλγόριθμο K-Means για κάθε άσκηση: • K=3 (ανεξαρτήτως τι υποδείκνυε η μέθοδος elbow). • Ανάλογα με τα χαρακτηριστικά “Average Mean_Respone” και “Average Dm_Errors” αποδόθηκε σε κάθε ομάδα το σκορ 0, 1 ή 2. Στόχος η συνολική αξιολόγηση Μικρό Dataset
  28. 28. Δημιουργία Μοντέλου Αξιολόγησης Ex1_ActiveHands Average Mean_Response Average Dm_Erros Cluster 0 | Score = 0 0.5573 3.1000 Cluster 1 | Score = 1 0.5382 2.0000 Cluster 2 | Score = 2 0.5451 0.8000 Ex2_BallHandlingInMotion Average Mean_Response Cluster 0 | Score = 0 2.1042 Cluster 1 | Score = 1 1.7403 Cluster 2 | Score = 2 1.1500 Ex3_StaticBallHandling Average Mean_Response Average Dm_Erros Cluster 0 | Score = 0 1.5723 2.3076 Cluster 1 | Score = 1 1.5200 0.8333 Cluster 2 | Score = 2 0.8510 0.4545 Ex4_QuickFeet Average Mean_Response Average Dm_Erros Cluster 0 | Score = 0 0.9043 1.2000 Cluster 1 | Score = 1 0.7657 1.5555 Cluster 2 | Score = 2 0.6219 0.8125 Ex5_KickSlideRunDefens e Average Mean_Response Cluster 0 | Score = 0 2.2793 Cluster 1 | Score = 1 1.6791 Cluster 2 | Score = 2 1.4610 Ex6_Footwork Average Mean_Response Cluster 0 | Score = 0 1.4003 Cluster 1 | Score = 1 1.2293 Cluster 2 | Score = 2 0.9884 Ex7_RipFirstStep Average Mean_Response Average Dm_Erros Cluster 0 | Score = 0 1.4952 2.5000 Cluster 1 | Score = 1 1.1054 2.4000 Cluster 2 | Score = 2 0.8045 1.3333 Ex8_HelpAndRecover Average Mean_Response Cluster 0 | Score = 0 2.6795 Cluster 1 | Score = 1 1.8077 Cluster 2 | Score = 2 1.4609
  29. 29. Δημιουργία Μοντέλου Αξιολόγησης Εκπαίδευση και αποθήκευση ενός SVR μοντέλου ειδικό για την τελική και συνολική αξιολόγηση των αθλητών : • Διαμόρφωση ενός πίνακα με τη βαθμολογία όλων των αθλητών για κάθε άσκηση. • Εκπαίδευση και αποθήκευση ενός SVR μοντέλου χρησιμοποιώντας το παραπάνω dataset. • Παρά το γεγονός ότι το μοντέλο εκπαιδεύτηκε με τις κατηγορικές τιμές 0, 1 και 2, η πρόβλεψη αποτελεί συνεχή τιμή.
  30. 30. Δημιουργία Μοντέλου Αξιολόγησης Συνολική αξιολόγηση των αθλητών με χρήση του αλγορίθμου SVR. • Πρόβλεψη του τελικού score χρησιμοποιώντας το μοντέλο που εκπαιδεύτηκε με τα score που προέκυψαν από την ομαδοποίηση των χρηστών για κάθε άσκηση ξεχωριστά, έχοντας ως είσοδο τις προβλέψεις της απόδοσης των αθλητών για κάθε άσκηση ξεχωριστά. • Για να μπορέσει να γίνει αυτό, ο κώδικας ζητάει από τον χρήστη να του δώσει ένα συγκεκριμένο random_state Αποτελέσματα συνολικής αξιολόγησης:
  31. 31. Αξιοπιστία αποτελεσμάτων Average R2 score for 1000 different random_states 0.9348 Average F1 score for 1000 different random_states 0.9758 Average MSE score for 1000 different random_states 0.0427 Average RMSE score for 1000 different random_states 0.1980 Average MAE score for 1000 different random_states 0.1621 1998 1984
  32. 32. Correlations Ball Handling – Status: *H ικανότητα χειρισμού της μπάλας (mean_response score) συμβαδίζει σχεδόν απόλυτα με τη κλάση status. Αυτό έχει ως αποτέλεσμα οι προβλέψεις των SVR μοντέλων που δημιουργήθηκαν γι’ αυτές τις ασκήσεις, να είναι αρκετά κοντά στις πραγματικές τιμές. Προκύπτει το συμπέρασμα λοιπόν, πως ο χειρισμός της μπάλας είναι ένα από τα χαρακτηριστικά που ξεχωρίζει τον αθλητή καλαθοσφαίρισης από τους υπόλοιπους αθλητές ή μη αθλητές, πράγμα το οποίο και φυσικά περιμέναμε.
  33. 33. Correlations Footwork– Status: *Oι μέσοι χρόνοι αντίδρασης σε ασκήσεις που αφορούν το footwork, έχουν ιδιαίτερα υψηλή συσχέτιση με το status του χρήστη, παρά το γεγονός ότι τα μοτίβα κινήσεων που χρειάστηκαν να εκτελεστούν ήταν αρκετά απλά. Για άλλη μια φορά οι προβλέψεις των SVR μοντέλων ήταν αρκετά κοντά στις πραγματικές τιμές της κλάσης. Είναι οι αθλητές της καλαθοσφαίρισης όντως πιο γρήγοροι και πιο εκρηκτικοί ή απλά έχουν διαμορφώσει πιο γρήγορη αντίληψη και αντίδραση σε συγκεκριμένα μοτίβα κινήσεων των ποδιών;
  34. 34. Correlations Speed & Acceleration– Status: *Βλέπουμε πως το correlation ανάμεσα στο mean_response και το status δεν είναι ιδιαίτερα υψηλό, αλλά ούτε χαμηλό. Έτσι στις συγκεκριμένες ασκήσεις οι χρόνοι αντίδρασης “μαρτυρούν” τους αθλητές, αλλά όχι συγκεκριμένα τους αθλητές καλαθοσφαίρισης, με αποτέλεσμα τα SVR μοντέλα στις αντίστοιχες ασκήσεις να έχουν αποκλίσεις. Τα σφάλματα αυτά κάθε άλλο παρά ενοχλούν, διότι στόχος είναι να αποδοθεί score στους χρήστες ανά άσκηση και όχι να γίνει πρόβλεψη της κλάσης τους.
  35. 35. Correlations Active Hands RT – Status: *Η συσχέτιση του mean_response με το status είναι ιδιαίτερα μικρή, παρά το γεγονός πως στην καλαθοσφαίριση οι χρόνοι αντίδρασης των χεριών έχουν σημαντικό ρόλο, τόσο στη δημιουργία πάσας όσο και στην διακοπή μίας. Παρόλα αυτά φαίνεται πως υπάρχει ικανοποιητική συσχέτιση ανάμεσα στο dm_errors και στο status, πράγμα που σημαίνει ότι για ακόμα μια φορά, είναι η αντίληψη του αθλητή και όχι η ταχύτητα που κάνει τη διαφορά.
  36. 36. Επικοινωνία στην καλαθοσφαίριση *H πέμπτη κατά σειρά άσκηση με όνομα “Ex5_Kick_Slide_Run_Defense” εκτελέστηκε με δύο παραλλαγές. Την πρώτη φορά η ενεργοποίηση των Pads είχε οπτικοακουστικό ερέθισμα, ενώ τη δεύτερη μόνο οπτικό. Το αποτέλεσμα ήταν είκοσι έξι από τους τριάντα χρήστες να έχουν καλύτερη απόδοση στο οπτικοακουστικό ερέθισμα, δύο να έχουν την ίδια απόδοση και μόνο δύο να έχουν χειρότερη.
  37. 37. Σενάρια χρήσης του συστήματος 1.Αξιολόγηση της βελτίωσης • Αντίληψη βελτίωσης • Επιβράβευση της προσπάθειας • Ανάπτυξη αυτοπεποίθησης παιδιών με λιγότερο ταλέντο • Χρήσιμο για μελλοντικό προγραμματισμό της προπόνησης (π.χ. βελτίωση των λιγότερο ανεπτυγμένων χαρακτηριστικών των αθλητών της ομάδας) 2.Ένταξη νέου αθλητή στο roster • Εκπαίδευση του μοντέλου με τους 10 “pro” της εκάστοτε ομάδας • Γρήγορη πρώτη αντίληψη για τις ικανότητες του νέου αθλητή • Ενίσχυση αυτοπεποίθησης του αθλητή αν τελικά επιλεχθεί • Διαφάνεια επιλογής παιχτών • Ενίσχυση της αξιοπιστίας του συλλόγου **Το σύστημα αυτό δεν μπορεί να αξιολογήσει κάποια βασικά χαρακτηριστικά που απαιτούνται στην καλαθοσφαίριση, όπως η πάσα ή το σουτ. Για τον λόγο αυτό ο κάθε σύλλογος, θα πρέπει να αξιολογήσει τον αθλητή και στα προαναφερθέντα χαρακτηριστικά. 3.Αξιολόγηση της αποκατάστασης • Οι παίχτες της ομάδας στην αρχή της χρονιάς, μετά το τέλος της περιόδου της προετοιμασίας θα εκτελούν τις ασκήσεις του συγκεκριμένου συστήματος, ώστε να αξιολογηθεί η απόδοση τους. • Εάν κάποιος παίχτης υποστεί κάποιον τραυματισμό, θα έχει ένα σημείο αναφοράς της απόδοσής του όταν ήταν υγιής • Ο σύλλογος και ο προπονητής, θα επιτρέψουν στον αθλητή να συμμετέχει ξανά στις προπονήσεις αφού αξιολογήσουν την ετοιμότητα του, χρησιμοποιώντας το σύστημα αξιολόγησης
  38. 38. Προβλήματα που προέκυψαν Covid 19 Το ολικό lockdown απαγόρευσε την χρησιμοποίηση ενός κλειστού γηπέδου καλαθοσφαίρισης για το πειραματικό κομμάτι. Οι αθλητές αναγκάστηκαν να εκτελέσουν τις ασκήσεις σε χώρο και δάπεδο, μη κατάλληλο για αθλητικές δραστηριότητες. Εάν η συλλογή των δεδομένων γινόταν σε κανονικό κλειστό γυμναστήριο καλαθοσφαίρισης, οι χρόνοι των αθλητών ενδέχεται να ήταν λίγο έως αρκετά καλύτεροι. Εφόσον το πειραματικό κομμάτι υλοποιήθηκε σε ανοιχτό χώρο, προέκυψαν και κάποια λειτουργικά προβλήματα στο σύστημα “REMEDES”. Εξαιτίας της υγρασίας υπήρξε δυσλειτουργία στον συγχρονισμό των pads με αποτέλεσμα την πιο δύσκολη και αρκετά πιο χρονοβόρα συλλογή των δεδομένων
  39. 39. Μελλοντική εργασία 1. Δημιουργία τριών συστημάτων αξιολόγησης αθλητών. Ένα σύστημα επαγγελματικού αθλητισμού, ένα σύστημα ημιεπαγγελματικού αθλητισμού και τέλος ένα σύστημα ερασιτεχνικού αθλητισμού, καθένα από τα οποία θα είναι εκπαιδευμένο με αθλητές αντίστοιχου επιπέδου. 2. Δημιουργία εφαρμογής, ώστε οι προπονητές και οι σύλλογοι να είναι ικανοί από μόνοι τους, να εκτελέσουν ολόκληρη την διαδικασία της αξιολόγησης. Για να γίνει αυτό εκτός από τη δημιουργία της εφαρμογής, θα χρειαστεί να βελτιωθούν συγκεκριμένα κομμάτια κώδικα, ώστε κάποιες διαδικασίες να γίνονται αυτόματα. 3. Αξιολόγηση των αθλητών στην πάσα. Με τον κατάλληλο εξοπλισμό, είναι εφικτό να δημιουργηθούν ασκήσεις με το σύστημα “REMEDES”, που να αξιολογούν την ικανότητα του αθλητή στην ακρίβεια της πάσας, αλλά και τη λήψη απόφασης. 4. Δημιουργία μεγάλης βάσης δεδομένων με χρήστες που έχουν εκτελέσει τις ίδιες ακριβώς ασκήσεις ώστε το σύστημα να αξιολογήσει έναν καινούριο χρήστη με πολύ μεγαλύτερη ακρίβεια. Αν όντως υπήρχε μια τέτοια βάση δεδομένων, η διαδικασία του clustering που εκτελέστηκε στα πλαίσια αυτής της διπλωματικής εργασίας δεν θα ήταν αναγκαία, διότι θα υπήρχαν αρκετές εγγραφές ώστε να εκπαιδευτεί το τελικό SVR μοντέλο συνολικής αξιολόγησης, με τα αποτελέσματα των προηγούμενων 8 SVR μοντέλων.

×