Presentazione Pre Laurea Finale

567 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
567
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Presentazione Pre Laurea Finale

  1. 1. Progetto e realizzazione di stimatori predittivi con tecniche di Genetic Programming Relatore: Prof. Alberto BARTOLI Correlatore: Ing. Giorgio DAVANZO Laureando: Gabriele Del Prete
  2. 2. Introduzione
  3. 3. Problema <ul><li>Mercato elettricità liberalizzato </li></ul><ul><li>Acquisto/vendita elettricità tramite aste </li></ul><ul><ul><li>aste Day-Ahead </li></ul></ul><ul><li>Importante saper predirre andamento </li></ul><ul><ul><li>dei consumi </li></ul></ul><ul><ul><li>dei prezzi </li></ul></ul><ul><ul><li>fini economici/finanziari </li></ul></ul><ul><ul><li>altri fini </li></ul></ul><ul><li>Come creo lo stimatore? </li></ul>
  4. 4. Metodi statistici <ul><li>Soluzione classica: stimatori per serie temporali con metodi statistici </li></ul><ul><ul><li>Necessarie ipotesi a priori sul sistema </li></ul></ul><ul><ul><li>Ipotesi a priori non possono essere verificate a posteriori </li></ul></ul><ul><li>Spesso necessario preprocessing </li></ul><ul><ul><li>Sostituzione valori con log(valori) </li></ul></ul><ul><ul><li>Eliminazione di valori outlier </li></ul></ul><ul><ul><li>Eliminazione giornate problematiche </li></ul></ul><ul><li>Spesso necessarie variabili esogene </li></ul><ul><li>Spesso realizzo molteplici modelli </li></ul><ul><ul><li>1 modello per ogni ora del giorno </li></ul></ul>
  5. 5. Regressione simbolica con GP <ul><li>Soluzione proposta: regressione simbolica : </li></ul><ul><ul><li>ho numerose osservazioni; </li></ul></ul><ul><ul><li>desidero una forma analitica che le riassuma </li></ul></ul><ul><li>Tipicamente </li></ul><ul><ul><li>Sequenza osservazioni variabile indipendente (o variabili indipendenti) </li></ul></ul><ul><ul><li>Sequenza osservazioni variabile dipendente </li></ul></ul><ul><ul><li>Scopro f che lega var. indipendenti e var. dipendente </li></ul></ul>
  6. 6. Metodologia
  7. 7. Metodologia <ul><li>Istanze problema: consumi California, New York City; prezzi California </li></ul><ul><li>N esecuzioni GP (su training set) </li></ul><ul><li>Scelta migliore stimatore tra gli N (prestazioni su validation set) </li></ul><ul><li>Valutazione capacità predittive (prestazioni su testing set) </li></ul><ul><li>GP -> Evolutionary Design </li></ul><ul><li>Resto -> script bash, R, gnuplot </li></ul>t Training Validation Testing
  8. 8. Genetic Programming <ul><li>Paradigma di calcolo per la generazione automatica di algoritmi ( individui ) fortemente ispirato alla selezione naturale. </li></ul><ul><li>GP per regressione simbolica: individuo == Abstract Syntax Tree (AST) </li></ul><ul><li>Nodi interni: funzioni 1 o 2 argomenti </li></ul><ul><li>Nodi foglia: costanti, var. indip. + backshift, backshift var. dip. </li></ul>
  9. 9. Genetic Programming <ul><li>Popolazione iniziale di individui casuali (  500). </li></ul><ul><li>Ripetizione: </li></ul><ul><ul><li>Determina individui migliori (prestazioni su training set) </li></ul></ul><ul><ul><li>“ Mescola” individui migliori e crea nuova popolazione </li></ul></ul><ul><li>Finché: </li></ul><ul><ul><li>Prestazioni “ottime”; </li></ul></ul><ul><ul><li>Numero massimo predefinito di iterazioni ( generazioni ); </li></ul></ul><ul><ul><li>Timeout. </li></ul></ul>
  10. 10. Genetic Programming
  11. 11. Scelta best <ul><li>Processo di evoluzione stocastico </li></ul><ul><li>Necessario fare molte prove </li></ul><ul><li>Ogni prova/evoluzione ( job ) indipendente dalle altre </li></ul><ul><li>N job -> N individui -> N soluzioni </li></ul><ul><li>Necessario scegliere criterio per scegliere best tra gli N </li></ul>
  12. 12. Scelta best <ul><li>Criterio di scelta: minima WMAE media (criterio della letteratura) </li></ul><ul><li>WMAE: Weekly-weighted Mean Absolute Error </li></ul><ul><li>Y i serie osservata, Ŷ i serie prodotta da individuo </li></ul>
  13. 13. Capacità predittiva <ul><li>Applicazione best su “serie di dati mai vista prima” (testing set) </li></ul><ul><li>Estrazione statistiche, grafici </li></ul><ul><li>Confronto con risultati in letteratura </li></ul><ul><ul><li>Scelta intervalli di training, validation, testing coincidenti con riferimenti </li></ul></ul>t Testing Validation Training
  14. 14. Risultati
  15. 15. California, consumi: configurazione <ul><li>Day-Ahead 5/7/99 – 20/10/00 </li></ul><ul><ul><li>8 settimane / 2 settimane / 31 giorni </li></ul></ul><ul><li>Configurazione per GP </li></ul><ul><ul><li>500 individui, 900 generazioni </li></ul></ul><ul><ul><li>+, -, *, / </li></ul></ul><ul><ul><li>Osservazioni passate: (-24, -25, -168) </li></ul></ul><ul><ul><li>Costanti: 0.1, 1, 10 </li></ul></ul><ul><ul><li>HOUR(0), ISHOLISATSUN(0, -24, -25, -168) </li></ul></ul>
  16. 16. California, consumi: risultati <ul><li>Target </li></ul><ul><ul><li>WMAE media su testing: 2,95% (IEEE Transactions on Power Systems, Vol. 17, No. 2, May 02) </li></ul></ul><ul><li>Risultati </li></ul><ul><ul><li>WMAE media su testing: 3,62% </li></ul></ul>
  17. 17. California, consumi: testing set
  18. 18. California, prezzi: configurazione <ul><li>Day-Ahead 5/7/00 – 11/6/00 </li></ul><ul><ul><li>29 settimane / 9 settimane / 70 giorni </li></ul></ul><ul><li>Configurazione per GP </li></ul><ul><ul><li>500 individui, 900 generazioni </li></ul></ul><ul><ul><li>+, -, *, / </li></ul></ul><ul><ul><li>Osservazioni passate: (-24, -25, -168) </li></ul></ul><ul><ul><li>Costanti: 0.1, 1, 10 </li></ul></ul><ul><ul><li>HOUR(0), ISHOLISATSUN(0, -24, -25, -168), ISNIGHT(0, -24, -25, -168) </li></ul></ul>
  19. 19. California, prezzi: premessa sul target <ul><li>Target (International Journal of Forecasting 2008) </li></ul><ul><ul><li>12 modelli diversi </li></ul></ul><ul><ul><li>Ognuno calibrato 24 volte, per ogni ora del giorno </li></ul></ul><ul><ul><li>Ognuno ri-calibrato ogni giorno </li></ul></ul><ul><ul><li>Il WMAE settimanale è il migliore fra i 12 modelli </li></ul></ul><ul><li>Nostro approccio </li></ul><ul><ul><li>1 modello </li></ul></ul><ul><ul><li>Valido su tutte le 24 ore ore </li></ul></ul><ul><ul><li>1 calibrazione </li></ul></ul>
  20. 20. California, prezzi: risultati <ul><li>Target </li></ul><ul><ul><li>WMAE media su testing: 12,65% </li></ul></ul><ul><ul><li>WMAE massima su testing: 43,43% (disponibile WMAE singole settimane) </li></ul></ul><ul><li>Risultati </li></ul><ul><ul><li>WMAE media su testing: 15,14% </li></ul></ul><ul><ul><li>WMAE massima su testing: 44,01% </li></ul></ul>
  21. 21. California, prezzi: testing set
  22. 22. New York, consumi: configurazione <ul><li>Day-Ahead 15/9/03 – 28/2/04 </li></ul><ul><ul><li>8 settimane / 2 settimane / 31 giorni </li></ul></ul><ul><ul><li>manca tutto il mese di Ottobre 2003 </li></ul></ul><ul><li>Configurazione per GP </li></ul><ul><ul><li>500 individui, 900 generazioni </li></ul></ul><ul><ul><li>+, -, *, / </li></ul></ul><ul><ul><li>Osservazioni passate: (-24, -25, -168) </li></ul></ul><ul><ul><li>Costanti: 0.1, 1, 10 </li></ul></ul><ul><ul><li>HOUR(0), ISHOLISATSUN(0, -24, -25, -168) </li></ul></ul>
  23. 23. New York, consumi: premessa sul target <ul><li>Target (IEEE Transactions on Power Systems, Vol. 21, No. 1, Feb 06) </li></ul><ul><ul><li>2 stadi (self-organizing map, support vector machine) </li></ul></ul><ul><ul><li>Ognuno calibrato 24 volte, per ogni ora del giorno </li></ul></ul><ul><ul><li>Secondo stadio duplicato, per giorni “normali”/“anormali” </li></ul></ul><ul><ul><li>Numerose variabili esogene (temperatura, umidità,…) e calibrazione molto complessa </li></ul></ul><ul><ul><li>Variabili esogene distinte per primo e secondo stadio </li></ul></ul>
  24. 24. New York, consumi: risultati <ul><li>Target </li></ul><ul><ul><li>WMAE media su testing: 1,82% </li></ul></ul><ul><li>Risultati </li></ul><ul><ul><li>WMAE media su testing: 3,14% </li></ul></ul>
  25. 25. New York, consumi: testing set
  26. 26. Conclusioni
  27. 27. Conclusioni <ul><li>Risultati non “definitivi” ma estremamente promettenti </li></ul><ul><li>Prestazioni quasi uguali – poco peggiori – dei riferimenti </li></ul><ul><li>Ma nessun uso di: </li></ul><ul><ul><li>Variabili esogene </li></ul></ul><ul><ul><li>Preprocessing </li></ul></ul><ul><ul><li>Modelli differenziati (ora, giorno, etc) </li></ul></ul><ul><li>In corso approfondimenti </li></ul><ul><ul><li>Altre variabili indipendenti ? (max sul giorno precedente; errore sul giorno precedente) </li></ul></ul>

×