11. Στάδια Υλοποίησης
1
• Συγκέντρωση Δεδομένων Κατανάλωσης
2
• Προ-επεξεργασία Δεδομένων
3
• Δημιουργία Διανυσμάτων
4
• Καθορισμός Παραμέτρων των Βασικών Αλγορίθμων
μέσω Πειραμάτων
5
• Εκτέλεση Συγκριτικών Πειραμάτων μεταξύ των
Αλγορίθμων
6
• Σύγκριση και Σχολιασμός Αποτελεσμάτων
12. Προ-επεξεργασία Δεδομένων
Απαραίτητη διαδικασία προκειμένου να έχουμε ένα έγκυρο σετ
δεδομένων, λόγω λανθανουσών ή ελλιπών τιμών από τους μετρητές.
Περιπτώσεις Σφαλμάτων
• Μετρήσεις με σταθερή τιμή για μεγάλο χρονικό διάστημα
• Ανάστροφη πόλωση του μετρητή
• Μεμονωμένη εμφάνιση ακραίας μεγάλης τιμής κατανάλωσης
13. Δημιουργία Διανυσμάτων
Χρησιμοποιήθηκαν δύο διαφορετικά διανύσματα εισόδου.
1. Μέσες Ημερήσιες Καμπύλες Κατανάλωσης
ανά μία ώρα, ανά μισή, ανά τέταρτο, ανά λεπτό, και ούτω καθ’
εξής
2. Διανύσματα Χαρακτηριστικών
Χαρακτηριστικό 1 έως 4: Σχετική μέση κατανάλωση σε κάθε μία
από τις 4 περιόδους της ημέρας
Χαρακτηριστικό 5: Μέση σχετική τυπική απόκλιση
Χαρακτηριστικό 6: Σκορ διαφοράς Σαββατοκύριακου έναντι
καθημερινής
14. Μετρικές Αξιολόγησης
Για την αξιολόγηση και σύγκριση των πειραμάτων που θα ακολουθήσουν
χρησιμοποιήθηκαν οι παρακάτω έξι μετρικές.
Μέσο τετραγωνικό σφάλμα
Mean Index Adequacy
Clustering Dispersion Indicator
Similarity Matrix Indicator
Davies Bouldin Index
Ration of within cluster sum of squares to between cluster variations
16. Gravitational Search Algorithm
• Αλγόριθμος
βελτιστοποίησης με χρήση
των νόμων της βαρύτητας
και κίνησης
• Όλα τα αντικείμενα
έλκονται μεταξύ τους από
βαρυτικές δυνάμεις και
συγκεντρώνονται σε
εκείνα με τις μεγαλύτερες
μάζες
17. Gravitational Search Algorithm
• Κάθε μάζα επιταχύνεται προς μία λύση, που προκύπτει από τις
δυνάμεις των άλλων μαζών
• Μεγαλύτερες μάζες - καλύτερες λύσεις- κινούνται πιο αργά από τις
μικρότερες, εξασφαλίζοντας αναζήτηση καλύτερων λύσεων
• Σταδιακή μείωση του αριθμού των σωματιδίων που ασκούν ελκτικές
δυνάμεις, αξιοποιώντας τις ήδη υπάρχουσες καλές λύσεις
• Αλγόριθμος χωρίς μνήμη, αλλά εξίσου αποτελεσματικός με εκείνους
που έχουν
18. Gravitational Search Algorithm
Καθορισμός του
χώρου αναζήτησης
Τυχαία
αρχικοποίηση
Εκτίμηση της τιμής
καταλληλόλητας
Ανανέωση των G(t),
best(t), worst(t) και
Mi(t) για i=1,2..N
Υπολογισμός
ταχύτητας και
επιτάχυνσης
Επιστροφή
βέλτιστης λύσης
Ικανοποιείται
το κριτήριο
τερματισμού?
Ανανέωση της
θέσης των
σωματιδίων
Ναι
Όχι
19. Σήμερα
Πρόβλημα: τα προφίλ φορτίων των σύγχρονων ΚΧΤ γίνονται όλο
και πιο ετερογενή με αποτέλεσμα αλγόριθμοι όπως
ο K-means, GSA, PSO να αντιμετωπίζουν αρκετά
προβλήματα κατά την ομαδοποίηση τέτοιων δεδομένων
Λύση: υλοποίηση
βελτιωμένης
έκδοσης του
αλγορίθμου GSA
GSA
GSA-PSO
IGSA
20. Particle Swarm Optimization
• Ψάχνοντας να βρούμε αλγόριθμο να επιλύσουμε το πρόβλημα
έλλειψης μνήμης χρησιμοποιούμε τον PSO που είναι μία
μέθοδος βασισμένη στη κοινωνική συμπεριφορά των σμηνών
των πουλιών
• Βασική ιδέα: Η θέση κάθε σωματιδίου αποτελεί μια υποψήφια
λύση
• Κάθε σωματίδιο χαρακτηρίζεται από: α) xi, β) ui και γ) pi
• Η θέση κάθε σωματιδίου επηρεάζεται από pbest και gbest
αντίστοιχα
21. Particle Swarm Optimization
• Δύο βασικές λειτουργίες: α) ανανέωση ταχύτητας, β) ανανέωση
θέσης κάθε σωματιδίου
• Παράμετροι: α) μέγεθος πληθυσμού, β) συντελεστής
μέγιστης/ελάχιστης ταχύτητας, γ) συντελεστές επιτάχυνσης, δ)
συντελεστής αδράνειας
• Σύγκλιση: α) όταν βρεθεί μια
λύση με ικανοποιητική τιμή
καταλληλόλητας,
β) ολοκληρωθεί ένας αριθμός
επαναλήψεων
22. Particle Swarm Optimization
Συνδυασμός GSA-PSO για ενίσχυση της έλλειψης μνήμης του
αλγορίθμου GSA
Παράμετροι:
w: συντελεστής αδρανείας
c1, c2: παράγοντες επιτάχυνσης
Ενσωμάτωση θέσεων pbest και
gbest στην εξίσωση της
ταχύτητας, σε αντίθεση με τον
GSA.
Μέθοδος με μνήμη, σε αντίθεση με τον GSA δυνατότητα
εκμετάλλευσης πιθανών τοπικών μεγίστων
23. Γενετικοί Αλγόριθμοι
• Αποτελούν μέθοδο αναζήτησης βέλτιστων λύσεων
• Πρόκειται για ένα πληθυσμό ατομικών «εξερευνητών» με θέση
κωδικοποιημένη στα γονίδια του
Τελεστές
Επιλογή Ζευγάρωμα Μετάλλαξη
24. Γενετικοί Αλγόριθμοι
Υπολογισμός Παραμέτρων
• Επίλυση προβλήματος υπολογισμού εκτιμώμενων παραμέτρων
• Μετατροπή πραγματικών μεταβλητών σε δυαδικά ψηφία
Επιλογή Υποσυνόλου
• Ικανότητα μείωσης μεγέθους ενός σετ δεδομένων
Για να βελτιώσουμε την ικανότητα αναζήτησης του GSA θεωρήσαμε
ότι μια καλή λύση είναι οι Γενετικοί Αλγόριθμοι
25. IGSA
Συνδυασμός GSA με γενετικούς αλγορίθμους χρησιμοποιώντας τις
διαδικασίες της επιλογής της διασταύρωσης και της μετάλλαξης
Μετάλλαξη: 3 στρατηγικές
μετάλλαξης με στόχο την
αποφυγή παγίδευσης σε
τοπικό βέλτιστο στον GSA
Παράμετροι: η, παράγοντας
μετάλλαξης
Διασταύρωση: αναμεσά στο
σωματίδιο xi που υπέστη
μετάλλαξη και στο σωματίδιο
με τη βέλτιστη θέση
Παράμετροι: CR, παράγοντας
διασταύρωσης
Επιλογή: σύγκριση νέου
σωματιδίου xc με το αρχικό xi
σύμφωνα με μία συνάρτηση
καταλληλόλητας
26. IGSA
ενίσχυση ικανότητας αναζήτησης ολικού βέλτιστου με την
προσθήκη της στρατηγικής 1 της μετάλλαξης και εύρεση ενός
τοπικού μεγίστου πολύ πιο γρήγορα
ενίσχυση εύρεσης τοπικού μεγίστου μέσω των στρατηγικών 2
και 3 της μετάλλαξης και επιτάχυνση μιας ακριβέστερης λύσης
το σωματίδιο xc, έχει περισσότερη πιθανότητα να αποφύγει την
παγίδευση σε κάποιο τοπικό μέγιστο
Πλεονεκτήματα IGSA
28. Πρώτο Σετ Δεδομένων
Το πρώτο σετ δεδομένων:
• Περιλαμβάνει μετρήσεις από 42 οικιακούς καταναλωτές της
Σουηδίας
• Οι μετρήσεις έγιναν ανά 1 λεπτό, ξεκίνησαν την Πέμπτη
10/01/2013 και σταμάτησαν στις 1/06/2013
• Τα πειράματα έγιναν για αριθμό ομάδων από 2 έως 7
29. Πρώτο Σετ Δεδομένων
• Δύο διανύσματα εισόδου: μέση καμπύλη κατανάλωσης ανά μισή
ώρα και το διάνυσμα των 6 χαρακτηριστικών
• Για τον υπολογισμό της απόστασης χρησιμοποιήθηκε η
Ευκλείδεια απόσταση
• Βελτιστοποίηση παραμέτρων έγινε μόνο στους νέους
αλγορίθμους GSA, GSA-PSO, IGSA
30. Δεύτερο Σετ Δεδομένων
Το δεύτερο σετ δεδομένων:
• Περιλαμβάνει δεδομένα κατανάλωσης από προσομοιωμένα
μοντέλα καταναλωτών της πλατφόρμας του διαγωνισμού
PowerTAC: 99 οικιακοί καταναλωτές και 49 εμπορικοί καταναλωτές
(γραφεία)
• Οι μετρήσεις έγιναν ανά 1 ώρα, ξεκίνησαν το Σάββατο 10/10/2009
και σταμάτησαν στις 22/12/2009
• Τα πειράματα έγιναν για αριθμό ομάδων από 5 έως 12
31. Δεύτερο Σετ Δεδομένων
• Δύο διανύσματα εισόδου: μέση καμπύλη κατανάλωσης ανά μισή
ώρα και το διάνυσμα των 6 χαρακτηριστικών
• Για τον υπολογισμό της απόστασης χρησιμοποιήθηκε η
Ευκλείδεια απόσταση
• Βελτιστοποίηση παραμέτρων έγινε μόνο στους νέους
αλγορίθμους GSA, GSA-PSO, IGSA
32. Τρίτο Σετ Δεδομένων
Το τρίτο σετ δεδομένων:
• Περιλαμβάνει μετρήσεις από 40000 οικιακούς καταναλωτές της
Ιρλανδίας
• Οι μετρήσεις έγιναν ανά μισή ώρα
• Στα πειράματα χρησιμοποιήθηκε μόνο ένα αντιπροσωπευτικό
δείγμα 988 καταναλωτών
• Τα πειράματα έγιναν για αριθμό ομάδων από 10 έως 17
33. Τρίτο Σετ Δεδομένων
• Δύο διανύσματα εισόδου: μέση καμπύλη κατανάλωσης ανά μισή
ώρα και το διάνυσμα των 6 χαρακτηριστικών
• Για τον υπολογισμό της απόστασης χρησιμοποιήθηκε η
Ευκλείδεια απόσταση
• Βελτιστοποίηση παραμέτρων έγινε μόνο στους νέους
αλγορίθμους GSA, GSA-PSO, IGSA
34. Αποτελέσματα Τρίτου Σετ Δεδομένων
Πρώτης Εισόδου
Ο αριθμός των ομάδων που επιλέχθηκε ήταν ίσος με 17
44. Συμπεράσματα
• Η μελέτη των παραμέτρων αποτελεί σημαντική διαδικασία πριν
τελικά εκτέλεση των αλγορίθμων, καθώς διαφορετικές τιμές των
παραμέτρων, και μη ιδανικές, μπορούν να οδηγήσουν σε
μεγάλες τιμές των σφαλμάτων και άλλων μετρικών
• Ο αλγόριθμος IGSA ήταν αυτός που με συνέπεια παρουσίασε τις
μικρότερες τιμές τόσο για το σφάλμα όσο και για τη μετρική ΜΙΑ
για κάθε σετ δεδομένων που δοκιμάσθηκε
45. Συμπεράσματα
• Δημιουργούνται ομάδες με διαφορετική καταναλωτική
συμπεριφορά παρά το γεγονός ότι όλες αποτελούνται από ΚΧΤ
• Χρησιμοποιώντας ως είσοδο το διάνυσμα χαρακτηριστικών
προκύπτουν μικρότερες τιμές στις μετρικές J και MIA και για τα
τρία σετ δεδομένων. Επίσης, λόγω του μικρού αριθμού των
διαστάσεων (6) βελτιώνεται πολύ η ταχύτητα
46. Μελλοντικές Επεκτάσεις
• Εκτέλεση πειραμάτων χρησιμοποιώντας ως συνάρτηση
καταλληλόλητας και τις υπόλοιπες μετρικές
• Χρησιμοποίηση εισόδων που σχετίζονται με άλλα χαρακτηριστικά
των καταναλωτών όπως δημογραφικά χαρακτηριστικά, στατιστικά
δεδομένα κατανάλωσης κ.α.
• Εφαρμογή αποτελεσμάτων για τη δημιουργία τιμολογιακών
πολιτικών, εφαρμογή προσφοράς-ζήτησης, πρόβλεψης φορτίου,
μη τεχνική ανίχνευσης απωλειών κ.α.