Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
U.S. Natural Gas market prices: forecast analysis
1.
2. Oggetto di questo studio è l’andamento della serie storica dei prezzi al consumatore
(nominali e reali) per Kw/H del Natural Gas negli USA, nel ventennio che va dal 1990 al 2009
(Fonte: U.S. Energy Information Administration).
Le motivazioni che mi hanno spinto ad analizzare l’evoluzione nei prezzi del gas naturale, che
altro non è che una commodity, risiede nel comprovato legame esistente tra la dinamica in
questione e l’andamento economico–finanziario dei mercati globali. Più precisamente, lo
scopo è quello di verificare se – almeno indicativamente – i profondi cambiamenti che vi sono
stati negli ultimi anni nell’ambiente economico sono frutto di una mera congiuntura o
costituiscono la prova di un cambiamento strutturale in corso.
Da un punto di vista più tecnico-operativo, il seguente studio si propone di testare, dopo una
fase di preparazione dei dati, un insieme di modelli statistici (decomposizione stagionale,
ARIMA, Exponential Smoothing) utili per la stima degli andamenti a breve termine dei prezzi
nominali del Natural Gas negli Stati Uniti. Terminata questa prima fase, quindi si andrà ad
effettuare una previsione della possibile evoluzione della serie nei primi mesi del 2010.
Infine, sulla base di quanto emerso, si cercherà di dare una risposta al quesito posto in
precedenza.
3. Osservando il comportamento della serie dall’anno 2000 in poi, ci si accorge immediatamente che – rispetto
allo scorso decennio – si è registrato un cambio di rotta; infatti, da un andamento relativamente stabile, si è
passati ad una fase di intense oscillazioni nel prezzo (che raggiungono il punto massimo nel 2008). Questo
fenomeno, molto probabilmente, è figlio degli eventi economico-finanziari che hanno duramente colpito i
mercati globali negli ultimi anni (ricordiamo come la crisi di liquidità, che ancor oggi stiamo vivendo, sia
germogliata proprio negli Stati Uniti). In un contesto tale, risulta essere molto difficile poter prevedere –
anche a brevissimo termine – il comportamento dei prezzi di un bene come i Natural Gas.
24,00
23,00
22,00
21,00
20,00
19,00
18,00
17,00
16,00
15,00
14,00
13,00
12,00
11,00 Prezzo Nominale
10,00
9,00 Prezzo Reale
8,00
7,00
6,00
5,00
4,00
3,00
2,00
1,00
0,00
mar-94
lug-02
lug-07
mar-99
set-06
mag-08
gen-90
set-01
nov-90
gen-95
mag-03
nov-95
mar-04
lug-92
lug-97
gen-05
gen-00
mar-09
nov-00
nov-05
set-91
set-96
mag-98
mag-93
4. Passando ad un’analisi più tecnica della serie, risaltano all’occhio due fenomeni che la caratterizzano in particolar modo:
1. Negli ultimi dieci anni, il trend è totalmente cambiato; infatti, sin dal 2000, si è registrata una crescita alquanto
sostenuta. Anche se, già dalla fine del 2006, sembra che ci si stia avviando verso una fase di decrescita.
2. Risulta evidente la presenza di una stagionalità nella serie, che si amplifica nella decade ’99-’09. Questa raggiunge,
solitamente, il suo massimo annuale nel mese di agosto ed il minimo nel mese di ottobre.
24,00
23,00
22,00
21,00
20,00
19,00
18,00
17,00
16,00
15,00
14,00
13,00
12,00
11,00 Prezzo Nominale
10,00
9,00 Prezzo Reale
8,00
7,00
6,00
5,00
4,00
3,00
2,00
1,00
0,00
apr-98
gen-90
ago-94
lug-95
ott-92
giu-96
nov-91
mag-97
feb-00
set-93
dic-01
lug-06
ott-03
giu-07
ago-05
gen-01
apr-09
mar-99
nov-02
set-04
mag-08
dic-90
Dati questi profondi cambiamenti, si rende quasi ovvia la necessità di centrare il focus dell’analisi su un periodo più
ristretto. A fronte di quanto affermato in precedenza, si è quindi preferito tenere in considerazione solo gli ultimi
dieci anni. Tale scelta è anche volta ad evitare che vi sia una distorsione nella qualità dell’analisi imputabile a dei lag
molto lontani.
5. Come preannunciato, il focus è stato spostato sugli ultimi 10 anni (come si può notare dal grafico riportato qui di sotto).
Quanto già affermato su trend e stagionalità viene totalmente confermato da questa seconda analisi grafica.
Da notare come, restringendo il campo d’analisi, si delinei più marcatamente il fenomeno di decrescita nei prezzi che si sta
verificando negli ultimissimi anni (più precisamente, dal 2006 in poi).
24,00
23,00
22,00
21,00
20,00
19,00
18,00
17,00
16,00
15,00
14,00
13,00
12,00
11,00 Prezzo Nominale
10,00
9,00 Prezzo Reale
8,00
7,00
6,00
5,00
4,00
3,00
2,00
1,00
0,00
feb-02
dic-02
giu-00
giu-05
feb-07
dic-07
lug-02
ago-04
ago-09
gen-00
apr-06
apr-01
ott-03
gen-05
lug-07
ott-08
nov-00
set-01
nov-05
set-06
mag-03
mag-08
mar-04
mar-09
Prima di entrare però nel dettaglio, si vuole precisare che – da qui in poi – lo studio proseguirà tenendo conto solo della
variabile prezzo nominale, dato che il prezzo reale è una sua derivazione (e, quindi, poco utile ai fini dell’analisi).
6. Comparando l’andamento dei prezzi negli ultimi anni si osserva una sostanziale similitudine. Infatti, come affermato in
precedenza, vi è la presenza di una stagionalità – con un picco massimo tra luglio ed agosto, ed un livello minimo raggiunto
quasi sempre verso gli ultimi mesi dell’anno e i primi di quello successivo. Sembra essere confermata anche l’evoluzione del
trend, in crescita dal 2000 in poi ma con un leggero calo nell’ultimo triennio. Questo fenomeno potrebbe essere legato a due
ipotetiche cause:
1. Nei mesi estivi il basso livello dei consumi, e quindi dei volumi di vendita per le compagnie energetiche, viene
compensato con aumento del prezzo di vendita;
2. Le politiche statali volte a disincentivare il consumo di gas nei mesi estivi (per motivi di risparmio energetico) spingono i
player del mercato ad alzare i prezzi di vendita.
Bisogna, però, fare molta attenzione
nel valutare questa dinamica; Infatti
il dato potrebbe essere falsato dagli
avvenimenti economico-finanziari
accaduti nel biennio ‘07-’08. Proprio
per questo motivo il passo
successivo è stato quello di andare
ad analizzare la qualità del dato,
verificando la presenza di eventuali
outliers.
7. Per l’individuazione degli outliers si è proceduto nella seguente maniera:
1. Analisi grafica (Box-Plot): si è riscontrata la presenza di possibili valori anomali ed estremi negli anni 2002 e 2008;
2. Analisi descrittiva: dalla tabella si nota un elevato livello di varianza nei dati; questo viene pienamente confermato
dall’analisi dei percentili;
3. Calcolo del valore soglia per determinare gli outliers (per valori anomali si è moltiplicato il range interquartile per
1,5 volte, mentre per i valori estremi 3 volte). Risultato: solo un valore oltrepassava tali soglie;
4. Pulizia del dato: la serie pulita è stata ricavata sostituendo il dato con la media dei ritardi e degli anticipi a 12 e 24
mesi.
Statistiche
Prezzo Prezzo
Nominale Reale
N Validi 120 120
Mancanti 0 0
Media 12,029833 13,438176
Deviazione std. 3,1241714 2,6489819
Varianza 9,760 7,017
Asimmetria ,378 ,230
Errore std dell'asimmetria ,221 ,221
Curtosi ,429 -,102
Errore std della curtosi ,438 ,438
Minimo 5,1700 7,5000
Massimo 22,6800 20,7055
Percentili 1 5,422000 7,655004
2 6,374200 8,319626
5 6,919500 9,020520
25 10,047500 11,807507
50 12,005000 13,115189
75 14,315000 15,262152
95 16,702500 18,189065
98 19,840800 19,656590
99 22,239000 20,576129
8. Dato che il processo di pulizia del DB ha portato all’eliminazione, con susseguente sostituzione, di un
solo dato anomalo, la serie non ha subito grandi stravolgimenti. In sostanza, le valutazioni di carattere
qualitativo effettuate in precedenza permangono ancora.
Si procede quindi con la stima dei modelli predittivi e con la selezione di quello migliore.
Prezzo Nominale (no-missing e no-outliers)
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
mag-02
mag-06
mag-09
gen-02
gen-00
gen-01
gen-03
gen-04
gen-06
gen-08
gen-09
set-00
set-01
set-02
gen-05
gen-07
mag-07
set-03
set-04
set-06
set-08
set-09
mag-00
mag-01
mag-03
mag-04
set-05
set-07
mag-08
mag-05
9. Il processo di analisi previsionale è stato eseguito attraverso 5 fasi:
1. Preparazione degli strumenti necessari per la modellazione;
2. Identificazione delle possibile tecniche di previsione da utilizzare;
3. Elaborazione dei modelli: per ognuna delle tecniche individuate, la procedura messa
in atto è stata:
a) Stima del modello di previsione
b) Calcolo del mean average percentage error
c) Grafico degli errori
d) Simulazioni delle previsioni a 6, 12 e 24 mesi
4. Comparazione dei risultati ottenuti con le diverse tecniche, e selezione della
migliore;
5. Realizzazione di una previsione sull’andamento dei prezzi per 6 mesi successivi al
31/12/2009, con successive implicazioni di carattere qualitativo.
10. Per la stima dei modelli previsionali si è resa necessaria la stima del trend, questo è stato calcolato
attraverso due step:
PRIMO STEP
Calcolo della Moving Average: con l’aiuto del s/w è stata calcolata la media mobile della serie.
SECONDO STEP
Stima del trend mediante l’interpolazione della moving average;
Questo è stato reso possibile attraverso l’identificazione del modello di regressione più
appropriato per la serie oggetto di analisi.
11. Con riferimento al secondo step, sia l’analisi grafica che quella statistica (R2 e Test-F)
identificano nella regressione cubica il modello più adatto per l’interpolazione della media
mobile.
12. Quindi, sulla base dei risultati ottenuti, è stato infine stimato il trend della serie (identificato nel grafico con il nome Prezzo
Nominale Interpolato). La curva conferma i dubbi iniziali sulla possibile fase di decremento del trend negli ultimi anni della
serie storica, infatti dalla fine del 2007 in poi si nota un flesso nella curva.
13. Una volta calcolati tutti gli elementi necessari per effettuare le analisi, si è proceduto con
l’identificazione e l’applicazione di 3 possibili tecniche di previsione. Queste sono:
Decomposizione Stagionale (additivo e moltiplicativo)
Exponential Smoothing (stagionale semplice, Holt-Winter
additivo/moltiplicativo)
ARIMA (PASW – Expert Modeler)
14. Il primo tra i modelli di decomposizione stagionale utilizzati è stato quello di tipo additivo.
Del trend si è già parlato in precedenza; con riferimento alla stagionalità, invece, sono stati ricavati – tramite s/w – i fattori
stagionali (che nel modello additivo non sono proporzionali al trend).
Il MAPE del modello, che si attesta all’8,76%, non risulta essere particolarmente positivo (dato che la soglia ottimale è
del 6%). Comunque, non si può affermare che la capacità predittiva del modello sia limitata.
Infine, se si osserva il grafico degli errori, non sembra esservi
una struttura alla base. Si può forse ipotizzare, un lieve trend
in crescita, ma è quasi impercettibile.
15. Anche per il modello moltiplicativo è stata stimata la stagionalità (adesso proporzionale rispetto al trend).
Il MAPE in questo caso è peggiore rispetto al modello in precedenza stimato (8,82%).
Si può affermare, infine, che gli errori non mostrano una
particolare struttura.
16. Quanto osservato dalla comparazione dei MAPE sembra essere confermato dall’analisi grafica; comunque, il modello additivo
resta leggermente più preciso nello stimare i prezzi. Infatti, osservando la serie originale, è abbastanza evidente come la
stagionalità non sia proporzionale al trend.
17. La seconda delle tipologie di tecniche predittive utilizzate è l’exponential smoothing. Con riferimento a questa categoria, è stato
inizialmente analizzato il modello migliore secondo il s/w PASW (utilizzando la funzione Expert Modeler), che è risultato essere
quello stagionale semplice.
Il MAPE è molto positivo (5,13%), con un netto miglioramento rispetto ai modelli di decomposizione stagionale.
Come si intuisce dal nome, il modello in questione
prevede la presenza della sola stagionalità nella serie,
anche se il test-F avverte che il parametro in
questione non è significativo.
Da ultimo, si riporta qui di fianco il
grafico con la stima del prezzo, che
conferma quanto affermato sulla bontà
del modello.
18. A completare il quadro è stato lanciato manualmente anche il modello di Holt-Winters (sia del tipo additivo che moltiplicativo).
Il focus di questa slide viene posto su quello additivo.
Il MAPE si attesta al 5,19%, leggermente peggiore rispetto al modello precedente ma, comunque, sempre molto positivo
Il modello di H-W prevede la presenza, oltre del
parametro che stima il livello, anche dei parametri di
stima della stagionalità e del trend. Però, andando in
profondità, ci si accorge dal test-F che questi non
sono significativi.
L’analisi grafica mostra un risultato del
tutto analogo al modello stagionale
semplice.
19. Anche per il modello moltiplicativo la qualità della previsione risulta essere sempre molto positiva.
Infatti, il MAPE riesce a mantenersi sempre entro la soglia del 6% (raggiungendo il 5,34%).
Anche la variante moltiplicativa, come quella additiva,
stima tre parametri per il modello (livello, trend e
stagionalità). Qui, però, solo il parametro del trend è
non significativo; caratteristica, questa, che non
incide sulle capacità predittive del modello, dato che
il peso del trend nella serie è bassissimo (0,1%). La
stagionalità ed il livello sono invece entrambi
significativi, se si pone il livello di confidenza del test-
F al 90%.
Anche per il moltiplicativo l’analisi grafica
mostra l’ottima capacità di stima del
modello.
20. Dato che sia l’analisi numerica (i MAPE sono sostanzialmente simili) che quella grafica non
mostrano sostanziali discrepanze circa la qualità delle diverse varianti del modello, si è optato
per una interpretazione di carattere qualitativo per poter identificare quello migliore.
La scelta finale è ricaduta sul modello di Holt-Winters moltiplicativo per le seguenti ragioni:
Nonostante i modelli Semplice Stagionale e H-W additivo presentino un MAPE in
campione leggermente più performante, in quello moltiplicativo Il MAPE fuori campione
della variante in considerazione è quello migliore (i dati sulle simulazioni sono riassunti
nella slide 26); il che evidenzia ottima capacità predittiva del modello.
Dalle valutazioni grafiche inizialmente elaborate sulla serie oggetto di analisi, era parsa
subito evidente la presenza di una stagionalità. Per il trend, invece, avevamo evidenziato
sia una fase di crescita che una di decrescita, le quali si compensano a vicenda rendendo
l’elemento poco rilevante ai fini delle analisi. Proprio per queste ragioni, si è scelta la
variante di H-W moltiplicativa; infatti, è l’unica che tiene conto sia della stagionalità (con
un parametro delta che pesa il 34,5%) che del trend, il cui parametro gamma, però, non
solo è non significativo al test-F, ma mostra anche un peso irrilevante (0,1%).
21. Infine, si riporta di sotto il grafico degli errori, che non presenta struttura e quindi
può essere qualificato come una white-noise.
22. Per identificare le diverse varianti di modelli ARIMA da lanciare, sono state
realizzare in precedenza delle analisi di autocorrelazione totale e parziale. In
particolare, queste (il cui risultato è riportato nel file output modelli) sono:
1. ACF (0/0/36)
2. ACF (1/0/36)
3. ACF (1/1/36)
Quanto emerso da queste tre analisi è stato utilizzato come base indicativa per
lanciare delle possibili configurazioni di modelli ARIMA che, però, hanno prodotto
dei risultati molto poco soddisfacenti. Sulla base di ciò, attraverso l’apposita
funzione del s/w PASW, si è lanciato l’Expert Modeler, i cui risultati sono
sintetizzati nelle slide seguenti.
23. Il s/w ha identificato la combinazione ARIMA (8,1,0)(1,1,0) come output migliore.
Il MAPE del modello è stato stimato al 6,88% – leggermente sopra il limite, ma comunque buono. Questo è
confermato dal grafico con le stime dei prezzi, che approssima la serie con una discreta precisione.
25. Prima di procedere alla selezione del modello più adatto ad una stima dell’andamento futuro della serie, si vuole evidenziare
che, per motivi di spazio, nelle seguenti slide verranno riportati solo alcuni dei dati utilizzati per la scelta finale. Per chi voglia
approfondire l’analisi, vengono allegati i file EXCEL (Tabella comparazione MAPE) e PASW (Output Modelli: simulazioni) con
l’insieme e lo studio completo degli indicatori.
Detto questo, si riportano in questa slide i MAPE totali dei modelli testati (si vuole sottolineare
che, nella scelta, hanno influito anche le performance di ciascun modello sui “MAPE in campione
e fuori campione” delle stime; questi, tuttavia, vengono riportati nei file sopraindicati).
Tra tutti i modelli solo quelli di Attenuazione
Esponenziale mostrano un MAPE che riesce a
soddisfare la soglia massima ottimale del 6%.
Quindi, si è andati più in profondità
circoscrivendo il campo d’analisi a questi tre
in particolare: semplice stagionale/H-W
additivo/H-W moltiplicativo.
26. Tra i modelli selezionati con il primo screening, e sulla base di: 1) confronto dei MAPE in campione e fuori
campione (vedi file slide 26); 2) valutazioni di carattere qualitativo elencate in precedenza (vedi slide 19)
Il migliore in assoluto è la variante Holt-Winters moltiplicativa.
Si è poi testato, attraverso simulazioni di previsioni a 6/12/24 mesi, quale fosse l’arco temporale entro il
quale il modello risultasse essere più preciso. La tabella riportata di sotto mostra una maggiore attitudine
predittiva a 6 mesi.
27.
28. Anche se l’analisi grafica non può essere molto indicativa, a causa del ristretto arco temporale di previsione,
si può ipotizzare che la serie, nei prossimi 6 mesi, proseguirà nel suo andamento discendente; Questo va a
conferma di quanto avevamo affermato in precedenza per l’analisi del trend. Viene confermata la
stagionalità che, come già appurato, raggiunge il suo massimo verso il mese di luglio.
29. Purtroppo, le limitate capacità del modello selezionato, con riferimento all’estensione
temporale delle previsioni (solo 6 mesi), non permettono di poter affermare con precisione
quale sarà la dinamica che seguiranno a breve-medio termine i prezzi del Natural gas negli
USA.
Però, tenendo conto di quanto emerso lungo tutto il procedimento di analisi, si può in parte
affermare che l’evoluzione della serie si caratterizza per una dinamica più congiunturale che
strutturale. Infatti, passato il biennio2007-2008, nel corso del quale si registrano incrementi
spaventosi nei prezzi dei vendita (dai circa 6$ del gennaio 2000 ai 22$ del luglio 2008), la
situazione sta tornando pian piano verso una periodo di normalità; forse tra qualche anno la
serie riprenderà a seguire un andamento stazionario attorno ad un valore medio – replicando
quella che era la sua configurazione nel decennio 1990-2000 (vedi slide 2).
Infine, vorrei sottolineare che, nonostante lo studio che ho condotto mi ha permesso di
rispondere parzialmente ai quesiti che mi ero posto all’inizio, mi sorge ancora un dubbio:
come mai gli analisti finanziari, che impiegano degli strumenti predittivi molto più elaborati di
quelli applicati nel corso di quest’analisi, non sono riusciti negli anni passati a prevedere che il
mercato globale si stava avviando verso una fase di profondi cambiamenti? Forse lo si sapeva
ma nessuno degli operatori finanziari, che hanno guadagnato fior di quattrini prima della crisi,
era incentivato a chiedersi “perché?”.