1. Analisi delle Serie Storiche
Domanda di benzina in Ontario dal 1960 al 1975
Barbara Amendola
Marco D’Alessandro
Ida Riccio
Università degli Studi di Napoli Federico II
21 novembre 2017
3. La serie storica che abbiamo analizzato nel nostro studio è una serie storica mensile, estratta
dalla Time Series Data Library (collezione di circa 800 serie storiche creata nel 1992 da
Rob Hyndman), riguardante la domanda di benzina in Ontario dal gennaio del 1960 al
dicembre del 1975.
In microeconomia per domanda s'intende la quantità di consumo richiesta dal mercato e dai
consumatori di un certo bene o servizio.
Volendo introdurre intuitivamente il concetto di serie storica, basta riferirsi ad un qualsiasi
fenomeno che varia nel tempo e la cui registrazione costituisce la serie storica stessa.
Dal punto di vista teorico, una serie temporale è definita come una parte finita della
realizzazione di un processo stocastico, dove per processo stocastico si intende una famiglia
di variabili aleatorie indicizzate da un parametro “t”, che nell’ambito dell’analisi delle
serie storiche rappresenta, appunto, il tempo, appartenente ad un insieme parametrico “T”
continuo o discreto. Inoltre, “T” ha la proprietà di essere un insieme ordinato di numeri
reali. In tale circostanza, la serie storica è indicata come:
𝑥 𝑡, 𝑡 = 1: 𝑛
dove il pedice t indica il tempo a cui il dato ( l’osservazione ) 𝑥 𝑡 si riferisce.
*
4. *
Analisi preliminari
⇒
Identificazione del modello
ARIMA
⇒
Stima dei parametri
⇒
Controllo diagnostico
Il modello stimato è adeguato?
⇒
⇒
NO SI
⇒
Uso statistico del modello
7. *
Osservando il grafico della funzione densità della variabile “Domanda di benzina
in Ontario” osserviamo che essa è unimodale e leggermente asimmetrica, aspetto
che si riscontra anche nei valori dei seguenti indici di posizione riportati dal
summary:
Domanda di Benzina in Ontario
Min. : 86890
1st Qu.:128426
Median :157459
Mean :162064
3rd Qu.:193556
Max. :255918
Per quanto concerne lo scarto quadratico medio della serie, invece, esso vale:
41661.87
10. *
*La prima cosa importante da fare quando ci accingiamo ad analizzare
una serie storica è quello di visualizzare i dati in nostro possesso
mediante una rappresentazione grafica, ovvero attraverso il “time
plot”, in cui vengono riportati i valori del fenomeno osservato Y (in
ordinata) in corrispondenza di ciascun tempo “t” ( in ascissa ). A tal
punto, ci chiediamo se la serie temporale è:
Stazionaria in Media
presenza/assenza di un trend lineare o quadratico
presenza/assenza di stagionalità
Stazionaria in Varianza ( Omoschedasticità )
11. *
Il “trend” (o componente tendenziale) è la tendenza di fondo che caratterizza
l’evoluzione di un fenomeno nel lungo periodo ( è dovuto a fattori quali ad
esempio la crescita demografica ) ed è rappresentabile tramite una qualche
funzione del tempo, che deve essere stimata. In poche parole descrive
l’andamento medio della serie storica riferita ad un’opportuna scala
temporale.
Spesso le serie storiche mostrano un andamento periodico, ovvero un
andamento che si ripete in intervalli temporali successivi di ampiezza “s” (
s>1). Ciò significa che le osservazioni registrate ad istanti di tempo
distanziati da “s” unità temporali sono tra loro simili; “s” rappresenta quindi
la periodicità. Ebbene, una serie si definisce “stagionale” quando mostra un
andamento simile in ogni anno, quindi “s” = 12 se le osservazioni sono
registrate mensilmente, mentre “s” = 4 se la rilevazione è trimestrale.
13. *
Osservando il grafico è evidente che la serie storica presa in esame non
è stazionaria. Infatti:
1) Il “time plot” mostra un andamento crescente, evidenziando quindi
la presenza di un trend lineare. Ne segue dunque che la spezzata
del “time plot” non oscilla attorno ad un valore costante che denota
la media della serie.
2) E’ evidente una componente stagionale. Infatti, in tutti gli anni
presi in esame, si registra un picco di massimo nei mesi più caldi
ed un picco di minimo nei mesi più freddi.
3) Infine, notiamo anche la non stazionarietà in varianza a livello
poiché le oscillazioni presentano una variazione di livello lungo
l’asse temporale.
17. *Al fine di rendere la serie stazionaria, effettuiamo
dapprima la detrendizzazione mediante l’operatore
Differenza prima, con d=1, essendo il nostro trend
lineare.
*Il valore ottenuto dello scarto quadratico medio
ottenuto da tale operazione risulta essere
σ = 0.08928899
*
18. *
*Al fine di rendere stazionaria la nostra serie
effettuiamo la destagionalizzazione mediante
l’operatore Differenza stagionale (1-B12), con D=1,
poiché la cadenza è annuale.
*Il valore ottenuto dello scarto quadratico medio
ottenuto da tale operazione risulta essere
σ = 0.04150359
19. *
*Al fine di rendere stazionaria la nostra serie
applichiamo congiuntamente l’operatore Differenza
prima (1-B) e l’operatore Differenza stagionale (1-B12),
per rimuovere una non stazionarietà dovuta
simultaneamente alla presenza di una componente
trend lineare e di una componente stagionale
*Il valore ottenuto dello scarto quadratico medio
ottenuto da tale operazione risulta essere
σ = 0.06236885
24. *
* Attraverso una procedura automatica di selezione del modello,
risulta che il miglior modello identificato è il seguente:
Now re-fitting the best model(s) without approximations...
ARIMA(3,0,0)(0,0,1)[12] with non-zero mean : -693.7733
Best model: ARIMA(3,0,0)(0,0,1)[12] with non-zero mean
Il BIC del modello è pari a -693.7733.
25. *
* Il polinomio caratteristico del modello identificato è:
1 − 𝜙1 𝐵 − 𝜙2 𝐵2
− 𝜙3 𝐵3
𝑋𝑡 = 1 − 𝛩𝐵12
𝑎 𝑡
* Sviluppando i prodotti si ha:
𝑋𝑡 − 𝜙1 𝑋𝑡−1 − 𝜙2 𝑋𝑡−2 − 𝜙3 𝑋𝑡−3 = 𝑎 𝑡 − 𝛩𝑎 𝑡−12
* A sinistra c’è la componente AR.
* A destra c’è la componente MA.
26. *
Modello 1: ARMA, usando le osservazioni 1961:01-1975:12 (T = 180)
Stimato usando il filtro di Kalman (Massima Verosimiglianza esatta)
Variabile dipendente: series2
Errori standard basati sull'Hessiana
coefficiente errore std. z p-value
const 0,0494840 0,00214332 23,09 6,17e-118 ***
phi_1 -0,136651 0,0634866 -2,152 0,0314 **
phi_2 0,112373 0,0638562 1,760 0,0784 *
phi_3 0,535495 0,0635720 8,423 3,66e-017 ***
Theta_1 -0,597364 0,0702488 -8,504 1,84e-017 ***
Media variabile dipendente 0,048215 SQM variabile dipendente 0,041504
Media innovazioni -0,000475 SQM innovazioni 0,031753
Log-verosimiglianza 362,4655 Criterio di Akaike -712,9310
Criterio di Schwarz -693,7733 Hannan-Quinn -705,1634
27. *
* Le radici, in modulo, risultano maggiori di 1, come mostrato di
seguito:
Reale Immaginario Modulo Frequenza
AR
Radice 1 -0,7202 -0,9994 1,2319 -0,3494
Radice 2 -0,7202 0,9994 1,2319 0,3494
Radice 3 1,2306 0,0000 1,2306 0,0000
MA (stagionale)
Radice 1 1,6740 0,0000 1,6740 0,0000
Il processo è dunque stazionario ed invertibile.
28. *
La media dei residui è non significativamente diversa da 0,
come dimostra il seguente test t:
One Sample t-test
data: fitloginiziale$residuals
t = 0.87244, df = 179, p-value = 0.3841
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval: -0.002730914 0.007059398
sample estimates: mean of x: 0.002164242
39. *
*Domenico Piccolo, Cosimo Vitale. Metodi statistici
per l'analisi economica. Napoli, Il Mulino, 1981
*Vito Ricci. Analisi delle serie storiche con R. Bari,
Free Software Foundation, 2005
*Robert Yaffee, Monnie McGee. Introduction time
series analysis and forecasting: with applications of
SAS and SPSS. New York, Academic Press, 2000
*Paul S.P. Cowpertwait, Andrew V. Metcalfe.
Introductory time series with R. New York, Springer,
2009
*Gianluca Vasile. Processi stazionari e analisi delle
serie storiche. Tesi di laurea.
*Appunti dalle lezioni del corso.