Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Time series analysis project
1. Corso di Laurea Magistrale in Finanza e Assicurazioni
Time Series Analysis Project
RESEARCH QUESTION:
IS THE CHINA STOCK MARKET DRIVEN BY THE GPR OF
CHINA AND/OR KOREA?
Autori :
Andrea Rollo
Francesco Gerna
Pierluigi Passarelli
Anno Accademico 2019 – 2020
2. Indice
Introduzione........................................................................................................................... 1
1. Fase descrittiva-esplorativa ........................................................................................... 1
1.1 Analisi grafica dei prezzi giornalieri dello “Shanghai SE Composite Index”........... 1
1.2 Individuazioni delle componenti e trasformazioni .................................................... 2
2. Fase probabilistico-inferenziale .................................................................................... 4
2.1 Identificazione del modello ....................................................................................... 4
2.2 Diagnostica dei residui .............................................................................................. 5
3. Analisi di volatilità.......................................................................................................... 6
3.1 Fatti stilizzati dei dati finanziari ................................................................................ 6
3.2 Stima dei modelli ARCH........................................................................................... 7
3.3 Stima dei modelli GARCH e analisi comparativa..................................................... 9
4. Estensioni modellistica GARCH ................................................................................. 10
4.1 GJR-GARCH model: Definizione e Stima.............................................................. 11
4.2 GARCH-MIDAS model: Definizione..................................................................... 12
4.3 GARCH-MIDAS model: Stima............................................................................... 12
4.4 GARCH-MIDAS vs GARCH(1,1).......................................................................... 15
5. Conclusioni.................................................................................................................... 15
3. 1
Introduzione
Questo elaborato si propone di studiare se il GPR (Global Political Risk) della Cina o della Corea
influenza il principale indice finanziario Asiatico, ovvero lo Shanghai Stock Exchange Composite
Index.
Tale indice monitora il prezzo giornaliero delle azioni delle principali aziende cinesi ponderato per il
numero totale di azioni emesse. Le variazioni di prezzo delle società più grandi incidono sull'indice
più di quelle delle società più piccole. Ciò significa che è un indice ponderato per capitalizzazione,
come lo Standard & Poor 500 (S&P500). Per gli investitori internazionali, lo Shanghai Composite
Index offre informazioni riguardo la salute del mercato azionario cinese, che possono essere difficili
da ottenere altrove. Per rispondere alla domanda di ricerca compiremo un’analisi sulla serie storica
dei rendimenti dell’SSE dal 10/03/2010 al 10/03/2020.
La prima parte di questo progetto si focalizzerà sull’individuazione di un modello che catturi la
dipendenza lineare tra i rendimenti delle azioni del nostro indice.
Una volta catturata tale dipendenza si potrà passare all’individuazione di vari modelli per la stima
della volatilità e in particolare con il modello GARCH-MIDAS potremo capire se una certa macro-
variabile (in questo caso il GPR di Cina e/o Corea) influenza lo Shanghai Stock Exchange Composite
Index.
1. Fase descrittiva-esplorativa
1.1 Analisi grafica dei prezzi giornalieri dello “Shanghai SE Composite Index”
La fase descrittivo-esplorativa parte dall’analisi grafica della serie storica. In questo progetto
andremo ad osservare la serie dei prezzi di chiusura dell’SSE dal 10-03-2010 al 10-03-20201
.
Figura 1.1: Andamento dei prezzi di chiusura SSE.
Dal grafico sopra riportato appare chiaro che la serie dei prezzi di chiusura è caratterizzata da una
non stazionarietà in media e si può notare come a partire settembre 2014, i prezzi di chiusura iniziano
1
Fonte dati: Yahoo Finance
Numero dati: 2433
4. 2
a crescere molto velocemente e la condizione in cui si trova il mercato cinese sembra avere tutte le
caratteristiche di una vera e propria bolla finanziaria: i prezzi delle azioni nel 2014/15 sono cresciuti
moltissimo, senza particolari ragioni collegate ai risultati conseguiti dalle aziende.
A questa forte crescita, come accade nel caso di tutte le bolle finanziarie che prima o poi sono
destinate a scoppiare, seguì un periodo di forte decrescita e questo fenomeno prese il nome di
turbolenza del mercato azionario cinese e che si concluse all'inizio di febbraio 2016. Un ulteriore
aspetto fondamentale di questa serie storica riguarda il calo avvenuto a fine 2017 inizi 2018, dovuto
alle tensioni riguardanti la guerra commerciale tra Cina e USA; il fatto che la serie dei prezzi di
chiusura non sia stazionaria trova conferma nello studio del correlogramma della funzione di
autocorrelazione globale. Questa funzione per una serie stazionaria decade a zero al crescere dei lag
ma nel nostro caso ciò non avviene; infatti tutti i valori della funzione sono al di fuori delle bande blu
ovvero quell’intervallo entro il quale possiamo assumerli statisticamente uguali a zero (Figura 1.2).
Figura 1.2: ACF dei prezzi di chiusura SSE.
1.2 Individuazioni delle componenti e trasformazioni
Una serie storica può essere vista come un insieme di componenti che la rendono non stazionaria, in
particolare essa può essere composta da:
• Ciclo-trend: spiega l’andamento di fondo o di lungo periodo del fenomeno sia in termini di
evoluzione regolare e sia in termini di alternanza di fasi di crescita e decrescita.
• Stagionalità: spiega la componente periodica, ovvero quella componente che si ripete, uguale
o quasi, a intervalli di tempo fissi.
• Componente accidentale: rappresenta la componente erratica dovuta all’insieme di cause
imprevedibili (es. shock) e non esplicitate, che determinano nella serie delle oscillazioni
tipicamente di breve periodo.
Rendere una serie stazionaria è un punto cruciale in quanto è una condizione imprescindibile per
poter fare inferenza su un processo stocastico andando a considerare una sua sola realizzazione,
ovvero una serie storica. Nel caso della serie dei prezzi di chiusura del SSE, essendo osservazioni
giornaliere, la componente di stagionalità non è presente. La componente accidentale la possiamo
considerare totalmente casuale e non sistematica e perciò l’unica componente che resta da dover
eliminare è il ciclo-trend. Per eliminare tale componente abbiamo applicato una differenza prima e
successivamente abbiamo utilizzato la differenza logaritmica per ottenere la serie dei rendimenti,
questo perché per quanto riguarda i dati finanziari più che al livello effettivo dei prezzi si è interessati
alle variazioni tra di essi.
5. 3
Figura 1.3: Rappresentazione grafica della differenza prima logaritmica
Dall’analisi grafica della serie dei rendimenti in Figura 1.3 notiamo subito che oscilla attorno al valore
medio e questo significa che è stazionario. Inoltre, è possibile osservare il fenomeno del volatility
clustering, ovvero il fatto che periodi di forte volatilità tendono a permanere nel tempo e sono seguiti
da periodi di relativa stabilità anch’essi persistenti nel tempo.
2.3 Analisi degli indici descrittivi e dei correlogrammi
Dopo aver reso la nostra serie stazionaria calcoliamo le principali statistiche descrittive che
riguardano la posizione (media), la variabilità (deviazione standard), il minimo ed il massimo ed
infine la distribuzione dei dati (asimmetria e curtosi).
Gli indici sui quali ci focalizzeremo sono asimmetria negativa e curtosi perché rappresentano alcuni
importanti fatti stilizzati dei dati finanziari:
• l’elevata curtosi (maggiore di 3) indica che la distribuzione della nostra serie è leptocurtica
ovvero più appuntita e con code più pesanti rispetto a una distribuzione normale. Dal punto
di vista finanziario questo significa che molti rendimenti saranno intorno allo zero e
contemporaneamente ci saranno più rendimenti alti e bassi in valore assoluto rispetto al caso
di una distribuzione normale;
• l’asimmetria negativa, invece, ci dice che sarà più probabile riscontrare rendimenti negativi
rispetto a quelli positivi.
Adesso facciamo il correlogramma dei rendimenti:
Figura 1.4: ACF e PACF rendimenti SSE.
media Sd min. Max. Asimm. Curt.
-0.01 1.412 -9.249 5.85 -0.996 6.235
Tabella 1.1: Statistiche descrittive.
6. 4
Dalla Figura 1.4 possiamo osservare che, a parte il lag (0) uguale a uno per definizione, il resto dei
valori cade all’interno delle bande e questo ci dà la certezza sul fatto che la serie dei rendimenti sia
stazionaria. Oltre che per verificare la stazionarietà, l’ACF misura la dipendenza lineare tra un valore
della serie con quello precedente (al lag h) e indica l’ampiezza e la durata della memoria del processo.
Per quanto riguarda le autocorrelazioni parziali (ovvero l’autocorrelazione tra 𝑋𝑡 e 𝑋𝑡+ℎ al netto
dell’effetto esercitato dalle variabili tra di loro intermedie), esse presentano dei valori al di fuori delle
bande e ciò significa che esiste ancora una struttura di dipendenza lineare tra i rendimenti che deve
essere catturata tramite un opportuno modello.
2. Fase probabilistico-inferenziale
2.1 Identificazione del modello
Adesso procediamo con l’identificazione del modello migliore per quanto riguarda la serie dei
rendimenti tra tutti quelli possibili. Per catturare una dipendenza lineare abbiamo a disposizione tre
modelli ovvero:
• Modelli a media mobile (MA)
• Modelli auto regressivi (AR)
• Modelli auto regressivi a media mobile (ARMA)
L’identificazione del modello consiste nello scegliere il modello statisticamente significativo con i
migliori criteri d’informazione (AIC e RMSE) e che utilizzi il minor numero di parametri stimati,
cioè il più parsimonioso.
ARIMA(3,0,2) with zero mean
Per quanto riguarda la nostra serie abbiamo identificato come modello migliore l’ARMA(3,2) perché
tra tutti i modelli risulta essere quello con il minimo AIC (-13857.63) e RMSE (0.01399156); tale
modello è caratterizzato dal fatto che l’osservazione al tempo t dipenda dall’osservazione ai tempi t-
1, t-2 e t-3 e dagli shocks osservati ai tempi t, t-1 e t-2:
𝑋𝑡 = 𝜑1 𝑋𝑡−1 + 𝜑2 𝑋𝑡−2 + 𝜑3 𝑋𝑡−3 + 𝜃1 𝜀𝑡−1 + 𝜃2 𝜀𝑡−2 + 𝜀𝑡
Inoltre, andiamo a fare la statistica test e otteniamo:
Estimate Std. error Z-value Pr(>|z|)
Ar1 0.235252 0.032937 7.1425 9.164e-13
Ar2 -0.956086 0.019055 -50.1743 2.2e-16
Ar1 Ar2 Ar3 Ma1 Ma2
0.2353 -0.9561 0.0689 -0.2011 0.9250
s.e. 0.0329 0.0191 0.0212 0.0265 0.0233
Sigma^2 estimated as 0.0001962 Log likelihood = 6934.82
Aic = -13857.63 AICc = -13857.6 BIC = -13822.85
TRAINING SET ERROR MEASURES
ME RMSE MAE MPE MAPE MASE ACF1
TRAININ
G SET
-1.3415e-0.5 0.013991 0.0095638 Inf Inf 1.00300 -0.00028017
7. 5
Ar3 0.068881 0.021247 3.2419 0.001187
Ma1 -0.201088 0.026487 -7.5920 3.149e-16
Ma2 0.925047 0.023303 39.6964 2.2e-16
Dalla tabella sopra riportata, notiamo che tutti i parametri stimati sono statisticamente significativi in
quanto sono tutti associati ad un p-value inferiore al valore critico di 0.05 che ci permette di rifiutare
l’ipotesi nulla per cui i parametri sono statisticamente uguali a zero.
Figura 2.1: Confronto tra l'andamento della serie storica dei rendimenti ed il modello ARMA(3,2).
La bontà del modello scelto è confermata dal confronto con la serie dei dati osservati (Figura 2.1)
infatti la serie stimata segue abbastanza fedelmente la serie osservata e mostra anch’essa il fenomeno
del volatility clustering.
2.2 Diagnostica dei residui
Dopo aver identificato il modello, effettuiamo le operazioni di diagnostica per controllare la bontà
del modello scelto sulla base dei residui osservati. In generale, il modello scelto dovrebbe essere in
grado di cogliere e dunque spiegare tutta la dipendenza lineare esistente. A tal scopo la serie storica
dei residui ed il relativo correlogramma deve comportarsi come un White Noise.
Figura 2.2: ACF e PACF residui ARMA(3,2).
In Figura 2.2, si può notare come il comportamento dei residui sia molto simile a quello di un WN
perché rappresenta una sequenza di variabili aleatorie incorrelate. Per cui abbiamo che,
l’autocorrelazione globale (ACF) nel lag ℎ = 0 è uguale a uno per definizione, invece nei lag ℎ ≠ 0
8. 6
sono statistucamente uguali a zero e perciò i valori rientrano all’interno delle bande (non sono
statisticamente significativi). Per quanto concerne l’autocorrelazione parziale, tutti i valori ai vari lag
risultano essere pressoché all’interno delle bande e perciò sono statisticamente uguali a zero (anche
se alcuni valori sono casualmente di poco al di fuori delle bande).
Infine, per un’ulteriore conferma di tali risultati effettuiamo i test di diagnostica cioè il test di Box-
Pierce (1970) e quello di Ljung-Box (1978) nei primi 10 lag. Questi si basano sulle stesse ipotesi:
l’ipotesi nulla è che la serie dei residui sia un WN (con un p-value superiore a 0.05) e l’ipotesi
alternativa per cui la serie dei residui non è un WN (con un p-value inferiore a 0.05).
Box-Pierce test
data: res_ARMA32
X-squared = 11.743 df = 10 p-value = 0.3027
Visto che il valore del p-value è superiore a 0.05, significa che non rifiuto l’ipotesi nulla e di
conseguenza accetto che la serie sia un WN perché le prime 10 autocorrelazioni sono tutte uguali a 0
(quindi il modello si adatta bene alla serie osservata dei residui).
Un altro test che è possibile effettuare è quello di Jarque-Bera in cui si analizza se la serie dei residui
è normale.
Jarque Bera Test
data: res_ARMA32
X-squared =3298.5 df = 2 p-value = 2.2e-16
In questo caso i residui del nostro modello non seguono una normale (perché il valore del p-value è
inferiore a 0.05), ma questo è del tutto coerente con la teoria visto che si tratta di una serie storica dei
rendimenti finanziari che generalmente è caratterizzata da asimmetria negativa ed elevata curtosi
(leptocurtosi).
3. Analisi di volatilità
Adesso ci occupiamo di analizzare i principali fatti stilizzati delle serie storiche dei dati finanziari e
stimeremo i modelli ad eteroschedasticità condizionata che ci serviranno per stimare la volatilità.
3.1 Fatti stilizzati dei dati finanziari
Nel nostro progetto abbiamo osservato come la serie dei rendimenti finanziari non sia un White Noise
e per catturare la struttura di dipendenza lineare, abbiamo stimato un modello ARMA(3,2).
Successivamnete ci siamo occupati di guardare ad altre forme di dipendenza e come sappiamo la
volatilità del nostro modello ARCH e GARCH viene definita come variabile latente, cioè che non
osserviamo direttamente e dunque abbiamo bisogno di alcune proxy, cioè di stimatori. La proxy che
abbiamo utilizzato è il valore assoluto dei residui dei rendimenti finanziari; in alternativa avremmo
potuto utilizzarne anche il quadrato dei residui oppure ancora meglio la realized volatility (che viene
ritenuta come la migliore proxy).
Box-Liung test
data: res_ARMA32
X-squared = 11.789 df = 10 p-value =0.2994
9. 7
Figura 3.1: Rappresentazione grafica del valore assoluto dei residui di un ARMA(3,2).
In Figura 3.1, possiamo osservare il fenomeno del volatility clustering per il quale periodi di elevata
volatilità tendono a permanere nel tempo e sono seguiti da periodi di relativa stabilità che manifestano
ancora una volta una certa persistenza.
Figura 3.2: Rappresentazione del correlogramma (ACF) dei residui.
Guardando, invece, il grafico dell’ACF in Figura 3.2, notiamo come i residui in valore assoluto siano
fortemente autocorrelati nei vari lag perché sono al di fuori delle bande, cioè statisticamente diversi
da 0. Questo sta ad indicare che la volatilità che ho avuto oggi sarà informativa di quella che avrò
domani. Visto che la volatilità rappresenta una misura del rischio finanziario riuscire a prevederla,
dal punto di vista economico, è molto importante perché quanto maggiore sarà la volatilità e tanto
maggiore sarà il rischio di grosse perdite o di elevati profitti.
3.2 Stima dei modelli ARCH
Adesso introduciamo i primi modelli capaci di stimare la volatiltà, ovvero i modelli ARCH(p). I
modelli ARCH(p) furono introdotti da Engle (1982) e considerano che la volatilità dei rendimenti
finanziari dipenda da una combinazione lineare di rendimenti passati elevati al quadrato:
𝜎𝑡
2
= 𝜔 + ∑ 𝛼𝑖 𝑟𝑡−𝑖
2
= 𝜔 + 𝛼 𝑝(𝐵)𝑟𝑡
2
𝑝
𝑖=1
Bisognerà rispettare, inoltre, due condizioni:
• la condizione di positività di 𝜎𝑡
2
attraverso 𝜔 > 0 e 𝛼𝑖 ≥ 0;
• la condizione di stazionarietà per cui ∑ 𝛼𝑖
𝑝
𝑖=1 < 1.
10. 8
Successivamente ci siamo occupati di calcolare i principali coefficienti attraverso la stima di quasi
massima verosimiglianza per ottenere degli errori standard che siano robusti (considerando il fatto
che la condizione di normalità dei rendimenti molto spesso viene violata).
ARCH(1) Estimate Std. Error t-value Pr(>|t|)
𝝎 1.5151006 0.1359321 11.146007 0.0000000
𝜶 𝟏 0.2381855 0.0737413 3.230016 0.0012378
Nella tabella in alto abbiamo riportato rispettivamente i valori stimati dei parametri con un ARCH(1),
gli errori standard, il t-value ed il p-value. Come possiamo notare 𝜔 > 0 e 𝛼1 ≥ 0 e quindi è garantita
la positività di 𝜎𝑡
2
ed è anche rispettata la condizione di stazionarietà poiché abbiamo 𝛼1 < 1. Inoltre,
guardando il p-value ci rendiamo conto che i parametri sono statisticamente diversi da 0 perché hanno
un p-value inferiore a 0.05 e perciò sono significativi.
Nella seconda tabella ci occupiamo di vedere se gli ordini di grandezza stimati con un ARCH(1) siano
comparabili con i valori ottenuti con la proxy. Analizzando i valori di minimo e massimo di entrambi
possiamo notare che i valori ottenuti sono simili e dunque comparabili.
Facciamo la stessa cosa per un modello con un numero di ritardi molto più elevati come un ARCH(10)
e otteniamo i seguenti valori:
ARCH(10) Estimate Std. Error t-value Pr(>|t|)
𝝎 0.43461 0.09556 4.54823 0.00001
𝜶 𝟏 0.09974 0.06188 1.61196 0.10697
𝜶 𝟐 0.08999 0.03099 2.90398 0.00368
𝜶 𝟑 0.09589 0.03184 3.01117 0.00260
𝜶 𝟒 0.07796 0.04878 1.59832 0.10997
𝜶 𝟓 0.06342 0.03230 1.96358 0.04958
𝜶 𝟔 0.07681 0.03944 1.94735 0.05149
𝜶 𝟕 0.11075 0.04175 2.65248 0.00799
𝜶 𝟖 0.00598 0.02324 0.25746 0.79682
𝜶 𝟗 0.12313 0.05236 2.35177 0.01868
𝜶 𝟏𝟎 0.11733 0.03568 3.28879 0.00101
Ancora una volta vengono soddisfatte le condizioni di positività di 𝜎𝑡
2
e di stazionarietà perchè la
somma di tutti gli 𝛼 è inferiore a uno. Adesso alcuni parametri sono statisticamente significativi
perchè hanno un p-value inferiore a 0.05, ma altri non sono significativi come 𝛼1, 𝛼4, 𝛼6 e soprattutto
𝛼8. Dalla tabella in basso notiamo che anche in questo caso gli ordini di grandezza risultano essere
comparabili tra di loro.
Adesso possiamo occuparci di confrontare graficamente i modelli ARCH e capire quale modello si
adatta meglio alla proxy di volatilità.
ARCH(1) Min. 1st Qu. Median Mean 3rd Qu. Max
Cond. Vol. 1.231 1.239 1.273 1.376 1.380 4.615
Proxy Vol. 0.000 0.2814 0.6665 0.9564 1.2792 9.1138
ARCH(10) Min. 1st Qu. Median Mean 3rd Qu. Max
Cond. Vol. 0.7003 0.9837 1.1953 1.3415 1.4984 4.7733
Proxy Vol. 0.000 0.2814 0.6665 0.9564 1.2792 9.1138
11. 9
Figura 3.3: Rappresentazione grafica ARCH(1), ARCH(10) e proxy di volatilità (|Residuals|).
Nel grafico (Figura 3.3) abbiamo confrontato modelli ARCH con differenti ritardi. Come sappiamo,
dal punto di vista teorico vorremmo che l’andamento dei modelli stimati e quello della proxy di
volatiltà (in rosso) siano sovrapponibili. Nel nostro caso abbiamo rappresentato in blu l’ARCH(10)
ed in giallo l’ARCH (1), ma com’è possibile notare graficamente il modello ARCH(10) ha un
andamento migliore rispetto all’ARCH(1) perché sembra seguire meglio la proxy in tutti gli anni e
soprattutto nel periodo 2017-18 (che rappresenta un periodo di relativa stabilità dal punto di vista
della volatilità). Il fatto che segua meglio l’andamento della proxy ci viene anche confermato dal
valore del MSE che è più basso nel caso dell’ARCH(10). Infine, questo modello presenta anche un
criterio d’informazione (AIC) migliore perché più basso.
3.3 Stima dei modelli GARCH e analisi comparativa
Nel 1986 Bollerslev introdusse un modello capace di catturare il fenomeno di volatility clustering e
che generalizzasse il modello ARCH attraverso un parametro relativo alla persistenza passata:
𝜎𝑡
2
= 𝜔 + ∑ 𝛼𝑖 𝑟𝑡−𝑖
2
+ ∑ 𝛽𝑗 𝜎𝑡−𝑗
2
𝑞
𝑗=1
𝑝
𝑖=1
Bisognerà rispettare due condizioni:
• la condizione di positività di 𝜎𝑡
2
attraverso 𝜔 > 0 e 𝛼𝑖, 𝛽𝑗 ≥ 0;
• la condizione di stazionarietà per cui ∑ 𝛼𝑖 + ∑ 𝛽𝑗
𝑞
𝑗=1
𝑝
𝑖=1 < 1.
Nel nostro caso utilizziamo un modello GARCH(1,1) con soli 3 parametri da stimare:
𝜎𝑡
2
= 𝜔 + 𝛼1 𝑟𝑡−1
2
+ 𝛽1 𝜎𝑡−1
2
Stimiamo, inoltre, i parametri con la quasi massima verosimiglianza e confrontiamo gli ordini di
grandezza:
GARCH(1,1) Estimate Std. Error t-value Pr(>|t|)
𝝎 0.01003 0.00680 1.47389 0.14051
AIC MSE
ARCH(1) 8386.1964 1.199218
ARCH(10) 8034.8973 1.111177
12. 10
𝜶 𝟏 0.05779 0.01803 3.20594 0.00135
𝜷 𝟏 0.94000 0.01770 53.11431 0.00000
GARCH(1,1) Min. 1st Qu. Median Mean 3rd Qu. Max
Cond. Vol. 1.231 1.239 1.273 1.376 1.380 4.615
Proxy Vol. 0.0000 0.2814 0.6665 0.9564 1.2792 9.1138
Dalla prima tabella notiamo che viene rispettata sia la condizione di positività di 𝜎𝑡
2
che quella di
stazionarietà perché 𝛼1 + 𝛽1 < 1. Tuttavia, questa volta la costante 𝜔 è statisticamente uguale a zero
(cioè non significativa), ma non ci deve preoccupare perché ha un valore stimato pari a 0.01015 che
è talmente piccolo da non influenzare eccessivamente la volatilità del nostro modello; invece è più
importante avere (come nel nostro caso) che i valori di 𝛼1 e 𝛽1 siano statisticamente diversi da zero.
Ancora una volta le grandezze ottenute confrontando i valori di minimo e massimo della conditional
volatility del GARCH(1,1) con la proxy di volatilità risultano essere comparabili.
Infine confrontiamo graficamente i nostri modelli ARCH e GARCH:
Figura 3.4: Rappresentazione grafica ARCH(1), ARCH(10), GARCH(1,1) e proxy di volatilità (|Residuals|).
In quest’ultimo grafico (Figura 3.4) abbiamo riportato i due modelli ARCH analizzati
precedentemente ed il GARCH (1,1) in nero. Nel nostro caso, non solo il GARCH (1,1) cattura il
fenomeno del volatility clustering e utilizza un numero inferiore di parametri da stimare rispetto al
modello ARCH(10), ma riesce anche a seguire meglio l’andamento della proxy ed infatti presenta un
valore dell’MSE nettamente inferiore agli altri modelli. Infine, risulta essere il modello migliore tra
questi anche per quanto riguarda i criteri d’informazione (AIC).
4. Estensioni modellistica GARCH
I modelli GARCH sono dei modelli simmetrici, cioè considerano che rendimenti negativi e positivi
abbiano uno shock simmetrico sulla volatilità. In realtà, vi è una correlazione negativa tra rendimenti
ritardati (“laggati”) e volatilità. Ciò viene evidenziato da uno studio di Black del 1976 in cui si è
dimostrato come rendimenti negativi provocano un maggiore aumento della volatilità di domani
AIC MSE
ARCH(1) 8386.1964 1.199218
ARCH(10) 8034.8973 1.111177
GARCH(1,1) 7934.986 1.064685
13. 11
rispetto a rendimenti positivi. Questo effetto asimmetrico viene proprio definito effetto leverage. Per
poter tenere conto di questo effetto bisogna considerare ulteriori modelli che sono delle estensioni
della modellistica GARCH: GARCH Asimmetrici.
4.1 GJR-GARCH model: Definizione e Stima
Un’estensione del modello GARCH che ci permette di tenere conto di questo effetto leverage è il
GJR-GARCH, introdotto da Glosten nel 1993:
𝜎𝑡
2
= 𝜔 + ∑ 𝛼𝑖 𝑟𝑡−𝑖
2
+ ∑ 𝛽𝑗 𝜎𝑡−𝑗
2
𝑝
𝑗=1
+
𝑞
𝑖=1
∑ 𝛾𝑖 𝑟𝑡−𝑖
2
𝑞
𝑖=1
I(𝑟𝑡−𝑖 < 0)
Questo modello presenta la stessa struttura del modello GARCH includendo un parametro 𝛾𝑖
associato ai giorni in cui il rendimento è negativo e successivamente moltiplica una funzione
indicatrice 𝐼. Quest’ultima è una variabile dummy che assume valore uno quando è stato osservato, il
giorno precedente, un rendimento negativo (quindi attiva il parametro 𝛾𝑖) ed il valore zero quando, il
giorno precedente, è stato osservato un rendimento positivo.
Occorrerà rispettare, inoltre, due condizioni:
• Condizione di positività di 𝜎𝑡
2
: 𝜔 > 0, 𝛼 ≥ 0, 𝛽 ≥ 0, 𝛼 + 𝛾 ≥ 0;
• Condizione di stazionarietà di 𝜎𝑡
2
: (𝛼 + 𝛽 +
𝛾
2
) < 1.
Di seguito riportiamo il grafico ed i risultati ottenuti con la stima di un modello GJR-GARCH(1,1):
Figura 4.1: Conditional Standard Deviation vs |Residuals|.
Tabella 4.1: Risultati stima GJR-GARCH(1,1).
Dai risultati ottenuti dalla stima del modello GJR-GARCH(1,1), possiamo notare come il parametro
𝛾1 è in linea con le considerazioni di Black (1976), il segno di 𝛾1 è positivo: i rendimenti negativi
amplificano la volatilità. Inoltre, il parametro 𝛾1 risulta essere statisticamente uguale a zero, il che
implica l’assenza di effetti leverage. Possiamo osservare, successivamente, come anche le condizioni
di positività e di stazionarietà di 𝜎𝑡
2
sono rispettate.
Estimate QMLE Std. error t-value Pr(>|t|)
𝝎 0.01039 0.00762 1.36212 0.17316
𝜶 𝟏 0.05620 0.01694 3.31740 0.00091
𝜷 𝟏 0.93966 0.01909 49.23060 0.00000
𝜸 𝟏 0.00305 0.01910 0.15972 0.87310
14. 12
4.2 GARCH-MIDAS model: Definizione
L’obiettivo della ricerca è verificare se vi è una relazione tra la volatilità dello stock market
cinese ed il rischio geopolitico (GPR index) di un determinato Paese, nello specifico Corea e/o Cina.
Finora, abbiamo considerato modelli che non ci permettono di verificare se la nostra variabile di
interesse risulta essere influenzata o meno da ulteriori variabili aggiuntive, come le variabili
macroeconomiche che influenzano la volatilità attraverso annunci e/o aspettative. In letteratura, sono
stati proposti diversi modelli che si basano sul fatto che la dinamica della volatilità è guidata da due
componenti: short run (𝒈𝒊,𝒕), associata ad osservazioni ad alta frequenza e long run (𝝉𝒕), associata a
osservazioni a bassa frequenza. Alcuni dei modelli proposti, considerano queste componenti in forma
additiva ed altri in forma moltiplicativa. Il modello che ci permetterà di verificare se, effettivamente,
è presente una relazione è il GARCH-MIDAS (MIxing DAta Sampling), venne introdotto da Engle
nel 2013. Questo modello consente di mixare dati a diversa frequenza considerando le due
componenti in forma moltiplicativa e presenta la seguente struttura:
𝑟𝑖,𝑡 = √ 𝑔𝑖,𝑡 × 𝜏 𝑡 𝑧𝑖,𝑡, con 𝑖 = 1, … . , 𝑁𝑡
La componente short run, presenta la seguente struttura:
𝑔𝑖,𝑡 = (1 − 𝛼 − 𝛽) + 𝛼
(𝑟 𝑖−1,𝑡)
2
𝜏 𝑡
+ 𝛽𝑔𝑖−1,𝑡,
La componente short run, viene definita unit mean-reverting GARCH(1,1) in quanto varia intorno al
valore uno. Per quanto riguarda, mentre, la componente long run è la seguente:
𝜏 𝑡 = 𝑒𝑥𝑝 (𝑚 + 𝜃 ∑ 𝛿 𝑘(𝜔)𝑋𝑡−𝑘
𝐾
𝑘=1
),
questa componente di lungo periodo dipenderà: dalla costante 𝑚, dal parametro 𝜃 e dalla sommatoria
pesata delle K osservazioni passate della variabile macroeconomica. Focalizziamo l’attenzione sul
parametro 𝜃 , in quanto se statisticamente diverso da zero misura l’impatto che la variabile
macroeconomica ha sulla volatilità. Si può, successivamente, notare come la componente long run,
include la beta function che presenta la seguente formulazione:
𝛿 𝑘(𝜔) =
(𝑘/𝐾) 𝜔1−1(1 − 𝑘/𝐾) 𝜔2−1
∑ (𝑗/𝐾) 𝜔1−1𝐾
𝑗=1 (1 − 𝑗/𝐾) 𝜔2−1
,
con ∑ 𝛿 𝑘(𝜔2)𝐾
𝑗=1 = 1, e la condizione che 𝜔1 < 𝜔2 con cui le K osservazioni passate più recenti
della macro-variabile hanno un peso maggiore rispetto alle osservazioni passate più lontane.
Imponiamo, inoltre, che 𝜔1 = 1 in modo che le osservazioni abbiano una ponderazione decrescente.
Per quanto riguarda i parametri del modello GARCH-MIDAS, verranno stimati attraverso la
massimizzazione della funzione di log-verosimiglianza, assumendo che la variabile di errore 𝑧𝑖,𝑡 si
distribuisca normalmente condizionatamente all’insieme informativo 𝐼𝑖−1,𝑡 . Infine, occorrerà
rispettare le condizioni di stazionarietà:
• 𝛼 ≥ 0, 𝛽 ≥ 0, 𝛼 + 𝛽 < 1, 𝜔2 ≥ 1.
4.3 GARCH-MIDAS model: Stima
Procediamo, di seguito, con la stima del GARCH-MIDAS. Per poter implementare questo modello
abbiamo, innanzitutto, reso stazionaria la serie storica del GPR Corea e del GPR Cina attraverso
l’utilizzo di una differenza mese per mese, come riportato dai seguenti grafici:
15. 13
Figura 4.2: Indici GPR
Figura 4.3: ACF Indici GPR vs ACF Indici GPR differenziati
Una volta rese stazionarie le serie storiche di entrambi gli indici GPR, si è proseguito con la scelta
delle K osservazioni delle macro-variabili. Per scegliere il seguente valore, si è effettuato un confronto
tra le K osservazioni che, sia per il GPR della Cina che per quello della Corea, ci hanno permesso di
massimizzare la funzione di log-verosimiglianza, di ottenere un’elevata significatività dei parametri
stimati ed un basso valore di AIC e MSE (Tabella 4.2).
Tabella 4.2: K GPR Cina (sinistra) e K GPR Corea (destra).
Dai risultati sopra riportati, si può notare come i valori di log-likelihood, AIC e MSE sia per il GPR
Cina che per il GPR Corea, con le diverse K osservazioni considerate, risultano essere molto vicini
tra loro. Questo ci ha portato a scegliere un valore di K = 36 per il GPR Cina, in quanto otteniamo
una più alta significatività dei parametri stimati; per il GPR Corea, invece, si è scelto un valore di K
GPR
Cina
Log-
Likelihood
AIC MSE GPR
Corea
Log-
Likelihood
AIC MSE
𝑲 = 𝟔 -3948.66 7907.321 1.051063 𝑲 = 𝟔 -3942.169 7894.337 1.060284
𝑲 = 𝟑𝟔 -3948.985 7907.97 1.051661 𝑲 = 𝟏𝟖 -3942.537 7895.073 1.062095
𝑲 = 𝟒𝟖 -3948.886 7907.771 1.052617 𝑲 = 𝟐𝟒 -3942.169 7894.339 1.06313
16. 14
= 24, in quanto a parità di valori ottenuti, anche qui, abbiamo una maggiore significatività dei
parametri.
Riportiamo, di seguito, i risultati derivanti dalla stima del GARCH-MIDAS con GPR Cina (Tabella
4.3) e dalla stima del GARCH-MIDAS con GPR Corea (Tabella 4.4).
Estimate QMLE Std. error t-stat Signif.
𝜶 0.055267 0.01686177 3.2776752 ***
𝜷 0.940380 0.01881693 49.9751956 ***
𝒎 0.954500 0.52915725 1.8038113 *
𝜽 -0.004732 0.03546271 -0.1334434
𝝎 𝟐 3.023826 0.11977360 25.2461857 ***
Tabella 4.3: Risultati stima GARCH-MIDAS con GPR Cina.
Dai risultati sopra mostrati, si nota come il parametro 𝜃, risulta essere statisticamente non diverso da
zero, ciò significa che il GPR della Cina non ha alcuna influenza sulla volatilità dello stock market
cinese. Si può osservare, inoltre, come sono rispettate le condizioni di stazionarietà. Infine, 𝜔2 è in
linea con il vincolo indicato precedentemente: rispetto dello schema di ponderazione decrescente.
Estimate QMLE Std. error t-stat Signif.
𝜶 5.325e-02 0.014761740 3.607307 ***
𝜷 9.433e-01 0.016252554 58.039938 ***
𝒎 9.788e-01 0.511988507 1.911825 *
𝜽 3.020e-03 0.001330897 2.269343 **
𝝎 𝟐 9.784e+01 0.007426027 13174.955470 ***
Tabella 4.4: Risultati stima GARCH-MIDAS con GPR Corea.
Per quanto riguarda, invece, i risultati della stima del GARCH-MIDAS con il GPR Corea notiamo
come il parametro 𝜃 sia statisticamente significativo al livello del 5%; ciò indica come il GPR Corea
ha un certo impatto sulla volatilità dello stock market cinese. Si osserva, inoltre, che le condizioni di
stazionarietà sono state rispettate. Infine, anche qui, possiamo osservare il rispetto dello schema di
ponderazione decrescente di ω2.
Riportiamo, di seguito, il grafico ottenuto con la stima del GARCH-MIDAS con GPR Corea
confrontato con l’andamento della proxy di volatilità da noi scelta:
Figura 4.4: GARCH-MIDAS vs |Residuals|.
17. 15
Dal seguente grafico (Figura 4.4), si nota come la volatilità stimata con il GARCH-MIDAS riesce a
seguire abbastanza bene l’andamento della proxy di volatilità da noi scelta (|Residuals|).
4.4 GARCH-MIDAS vs GARCH(1,1)
Di seguito, riportiamo un confronto grafico tra il GARCH-MIDAS ed il GARCH(1,1) (Figura 4.5):
Figura 4.5: GARCH-MIDAS vs GARCH(1,1) vs |Residuals|.
Dal grafico sopra riportato si può osservare la volatilità stimata con il GARCH-MIDAS (AIC =
7894.339, MSE = 1.06313) confrontata con la volatilità stimata mediante il GARCH(1,1) (AIC =
7934.986, MSE = 1.064685). Si nota come il modello migliore per la modellizzazione della volatilità
risulta essere proprio il GARCH-MIDAS, perché riesce a seguire meglio la proxy e presenta più bassi
valori di criterio informativo (AIC) e misura di errore (MSE).
5. Conclusioni
Il seguente progetto è stato articolato in tre fasi fondamentali: la prima riguardante lo studio e
l’applicazione della modellistica lineare ARMA che ci ha consentito di poter catturare la struttura
lineare presente nella serie storica dei rendimenti finanziari; la seconda parte ha riguardato lo studio
e l’applicazione dei modelli per la modellizzazione della volatilità, cioè i modelli ARCH e GARCH;
infine la terza parte riguardante le estensioni della modellistica GARCH, nello specifico il GJR-
GARCH ed il GARCH-MIDAS con il quale siamo riusciti a rispondere alla domanda di ricerca. Dai
risultati ottenuti attraverso la stima del GARCH-MIDAS con l’utilizzo del GPR Cina e del GPR
Corea, possiamo affermare che l’indice GPR della Corea influenza la volatilità dello stock market
cinese come dimostrato dal parametro 𝜃 statisticamente significativo; invece l’indice GPR della Cina,
non ha alcuna influenza sulla volatilità dello stock market cinese come evidenziato dal parametro 𝜃
statisticamente non diverso da zero.