SlideShare a Scribd company logo
La disoccupazione in Irlanda
Analisi moderna di una serie storica e successiva
verifica di cointegrazione
MARCO D’ALESSANDRO
Università degli Studi di Napoli Federico II
February 15, 2018
Abstract
In the first part of this work I will analyze the quarterly time series of Ireland’s
unemployment (from 1999 to 2017) by using a modern method, which is the Box-
Jenkins’ one, in order to find out the best stochastic process that can be the generator
of the analyzed time series. In the second part, instead, I will verify if there is
cointegration among some variables, that are the total unemployment itself, the
price consumer index, the Gross Domestic Product, the real productivity and the
nominal wages. The work has been realized by using the free software Gretl.1
Keywords: Gretl, Ireland, unemployment, time series, cointegration.
1 Introduzione al fenomeno della disoccupazione in Irlanda
L’8 dicembre del 2013 l’Irlanda si è ufficialmente sganciata - per prima tra gli Stati
debitori - dall’ossigeno del Fondo salva Stati europeo (Efsf), dopo aver beneficiato, dal
febbraio 2011, di 17,7 miliardi di euro per uscire dalla crisi, innescata nel settembre
del 2008 dalla bolla immobiliare e dai crac bancari. In dirittura d’arrivo, ci sono stati
anche gli esborsi finali di 800 milioni di euro di Bruxelles e 600 milioni da parte del
Fondo monetario internazionale (Fmi) per risanare le casse statali e ricapitalizzare gli
istituti di credito. Poi Dublino è previsto righi dritto almeno fino al 2033, anno in cui il
finanziamento europeo ventennale deve essere rimborsato.
Dai freddi calcoli, il Paese oggi pare in ripresa: il Prodotto interno lordo (Pil) viaggia a
una media del +0,4% e l’economia sembra girare. Ma chi vede davanti a sè tempi floridi
si sbaglia: la Tigre celtica è fonte di business solo per le multinazionali straniere, con i
loro quartier generali a Dublino per beneficiare del regime fiscale favorevole. Per gli
irlandesi è meglio cercarsi un lavoro o un futuro fuori dall’isola, magari nella vicina
1http://gretl.sourceforge.net/
1
Inghilterra o nella ricca Germania. E a invitare ad andarsene è lo stesso Ufficio nazionale
del welfare: i disoccupati, avverte il governo, sono e saranno un peso.
Un elettricista irlandese rimasto senza clienti per il collasso dell’industria delle costruzioni,
è stato invitato a emigrare nel distretto inglese di Coventry, dove le richieste di tecnici
sono ancora alte. A un altro senza lavoro, lo Stato suggerisce di fare l’autista di pulmini
a Malta, dove lo stipendio (circa 250 euro a settimana) non è altissimo, ma si gode di
un bel clima mediterraneo. Ci sarebbe da ridere, se le famiglie non fossero da anni allo
stremo: dal 2008, i governi hanno rastrellato 28 miliardi di euro tra tasse e riduzioni alla
spesa pubblica, per far fronte ai conti prosciugati e per ripianare i buchi bancari.
Nella verde Irlanda, i senza lavoro sono il 13,2% della popolazione: più che in Italia
(12,5%), su poco più di 4,5 milioni di abitanti. Al di là delle frasi autocelebrative del
governo sul crac sventato ("L’emergenza economica è finita, siamo fuori dal bailout"), le
fondamenta dell’economia nazionale sono d’argilla. Il tasso d’indebitamento privato è
infatti ancora alto: una quantità sproporzionata di mutui resta in ritardo di pagamento.
Per Dublino, la stella polare resta dimezzare il deficit statale sul Pil che, all’8%, è il più
alto d’Europa, a fronte di un debito pubblico non indifferente, quasi raddoppiato dal
2010, di oltre 117 milioni di euro sul Pil. Certo, dal profondo rosso del 2010 con il deficit
al 32%, l’Irlanda ne ha fatta di strada. Ma i dati dell’indebitamento sono tutt’altro che
confortanti, al netto degli altissimi sacrifici pretesi dalla popolazione.
In Irlanda, un giovane over 25 su quattro è disoccupato. L’emigrazione è ai livelli record,
con oltre 75.800 cittadini che, nel 2012, hanno lasciato il Paese. Con il blocco delle
assunzioni pubbliche, in una terra d’emigranti a vocazione prevalentemente turistica e
agricola, migliaia di laureati sono dunque rimasti senza prospettive. Non solo: oltre la
metà dei medici irlandesi presta ormai servizio all’estero e, nel 2011, l’indice di bambini
e gli adolescenti sotto i 17 anni che vivono in uno stato consistente di povertà, è schizzato
dal 7,4% al 9,3%. Un dato allarmante, in un quadro ancora fragile di ’ripresa’. Non con-
sola quindi la rassicurazione ai disoccupati delle autorità del Welfare, sul mantenimento
dei sussidi, in caso di rifiuto a trasferirsi all’estero.
Le tutele per ora tengono, domani chissà: l’aria che tira è pessima. In un’isola tradizional-
mente accogliente e tollerante con gli stranieri, i governi hanno iniziato a restringere
la legge iper-liberista sulla cittadinanza agli immigrati. Nel 2012, in un Paese di per
sè poco popoloso, l’Eurostat aveva calcolato il tasso di emigrazione più alto d’Europa,
superiore per la prima volta alla Lituania e al Kosovo. Un esodo senza fine.
2 La procedura utilizzata per analizzare la serie: Box-Jenkins
L’approccio moderno alle serie storiche si fonda essenzialmente sulla procedura proposta
da George Edward Box e Gwilym Jenkins (1976). Essa consiste in un procedimento
iterativo che consente di pervenire, a partire dall’osservazione dei dati, alla costruzione
2
di un modello ARIMA che fornisce una descrizione adeguata del processo stocastico
generatore della serie storica osservata. Si tratta di uno strumento statisticamente
efficiente per risalire dalla serie storica al processo stocastico generatore. Box e Jenkins,
quindi, hanno cercato di costruire un approccio ai dati per il quale sia la serie storica ad
orientare verso il modello e non viceversa. La suddetta procedura si compone di 4 fasi:
1. analisi preliminari: consistono nelle trasformazioni iniziali da apportare alla serie
storica perchè possa essere considerata come una parte finita di una realizzazione
di un processo Gaussiano stazionario;
2. identificazione del modello ARIMA: consente di individuare il numero e la
natura dei parametri da stimare, ed è la fase più delicata e controversa;
3. stima dei parametri: avviene attraverso un pacchetto statistico di notevole comp-
lessità computazionale, attraverso il metodo della massima verosimiglianza;
4. verifica del modello stimato: si controlla la qualità statistica del risultato ottenuto
sia con test specifici sui parametri che con un controllo generale del modello e
l’analisi dei residui da esso stimati.
Accanto alle suddette fasi, nel seguente schema iterativo (Figura 1), vengono sottolineati
gli strumenti statistici che occorre utilizzare:
Figure 1: Fasi della procedura Box-Jenkins
3
Quando la verifica del modello non è soddisfacente, il modello deve essere rispecificato
per cui le fasi principali possono essere ripetute più volte in maniera iterativa. Inoltre,
si acquisiscono, nella fase di verifica, ulteriori informazioni utili ad una successiva
identificazione. Quando, invece, il modello risulta soddisfacente si passa alla fase del
suo utilizzo per scopi prevalentemente descrittivi e previsivi.
Analisi preliminari
La serie storica oggetto di analisi riguarda il tasso di disoccupazione totale irlandese,
in dati trimestrali, misurato dal secondo trimestre del 1999 al secondo trimestre del 2017,
per un totale di 73 osservazioni. I dati sono stati estratti dal sito dell’Eurostat, l’Ufficio
Statistico dell’Unione Europea.2 Il grafico della serie storica, senza ancora applicare
trasformazione sui dati, è quello proposto in Figura 2.
Figure 2: Tasso di disoccupazione totale irlandese in dati trimestrali
Una prima attenta analisi del grafico sopra riportato mostra come la serie sia non
stazionaria in media, dal momento che i valori non si attestano su un unico valore
costante. Non solo: sembra che intorno al 2008 sia successo un qualcosa che abbia
profondamente cambiato l’andamento della serie stessa, infatti a partire da questo
anno la serie prima mostra un andamento sempre crescente, poi (a partire dal 2012)
decresce e sembra tornare al livello precedente.3 Per verificare ciò, si è deciso di applicare
2http://ec.europa.eu/eurostat/
3L’effetto di questo andamento strano del tasso di disoccupazione è dovuto alla crisi economico-
finanziaria che ha attraversato il paese proprio a partire dal settembre del 2008.
4
una Intervention Analysis alla serie, volta ad identificare gli eventuali valori anomali
e correggerli. Il programma utilizzato per questo scopo è TRAMO, che è possibile
utilizzare anche dalla finestra principale di Gretl, in modo molto semplice ed intuitivo.
La procedura, effettivamente, identifica due outliers, in particolare un additive outlier,
corrispondente al quarto trimestre del 2006 (osservazione 31), ed un innovation outlier,
corrispondente al primo trimestre del 2009 (osservazione 40).4 Non è difficile capire
il motivo per il quale `siano stati identificati dei valori così strani: siamo nel periodo a
cavallo della crisi economico-finanziaria che ha colpito l’intera Europa, e l’Irlanda, come
già accennato, ne ha risentito in maniera abbastanza forte.
Inoltre, la procedura consente di salvare la serie linearizzata, nella quale sono stati
corretti gli outliers identificati. Confrontiamola con la serie originale:
Figure 3: In rosso la serie originale, in blu la serie linearizzata.
Come si evince dal grafico, le due serie seguono lo stesso percorso fino al 2006 (si
sovrappongono). Poi, proprio a partire da questo periodo la serie linearizzata segue
perlopiù un percorso totalmente diverso rispetto alla serie originale, assumendo valori
quasi sempre minori rispetto a quest’ultima (in particolare, a partire dal 2009).
Inoltre, non è comunque ancora verificata la stazionarietà in media, e ciò lo conferma
anche un primo test ADF effettuato sulla serie linearizzata, il cui responso è il seguente:
4Un additive outlier è un "disturbo" che riguarda solo un’osservazione, che può essere sia più piccola
che più grande in valore rispetto al valore atteso nei dati: dopo questo disturbo, la serie ritorna al suo
percorso naturale come se nulla fosse accaduto. Un innovation outlier, invece, è molto più difficile da
riscontrare nelle serie economiche, e si ha quando uno shock iniziale si propaga nelle successive osservazioni
con i pesi di una rappresentazione MA di un processo ARIMA: riguarda, quindi, più osservazioni.
5
Test con costante
inclusi 4 ritardi di (1-L)Ireland_linearizzata
Modello: (1-L)y = b0 + (a-1)*y(-1) + ... + e
Valore stimato di (a - 1): -0,0546531
Statistica test: tau_c(1) = -2,4509
p-value asintotico 0,1279
Coefficiente di autocorrelazione del prim’ordine per e: 0,132
differenze ritardate: F(4, 62) = 10,801 [0,0000]
Con costante e trend
inclusi 4 ritardi di (1-L)Ireland_linearizzata
Modello: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
Valore stimato di (a - 1): -0,0491193
Statistica test: tau_ct(1) = -2,16515
p-value asintotico 0,5086
Coefficiente di autocorrelazione del prim’ordine per e: 0,132
differenze ritardate: F(4, 61) = 8,971 [0,0000]
Il test è stato performato su 68 osservazioni, includendo sia la costante che la costante ed
il trend, l’ordine dei ritardi pari ad 11, ed il BIC come criterio da minimizzare scelto.
Dai risultati è abbastanza chiaro che in entrambi i casi proposti non viene rifiutata
l’ipotesi nulla di non stazionarietà della serie, dunque occorre procedere ad alcune
trasformazioni per renderla una realizzazione di un processo stazionario.
Ulteriori informazioni su eventuali componenti presenti all’interno della serie, si possono
evidenziare attraverso prima il grafico della funzione di autocorrelazione globale poi il
grafico di quella parziale, avendo impostato il numero di ritardi a 15. Il grafico dell’ACF
(Figura 4) permette di investigare alcune caratteristiche della serie oggetto di studio:
Figure 4: ACF campionaria della serie storica linearizzata
6
• i valori della funzione di autocorrelazione decrescono in modo non proprio lento
all’aumentare dei lags, segnalando una serie dove c’è molta persistenza nel breve
periodo e poca nel lungo periodo. Al decimo lag, il valore della correlazione è già
dentro le bande di confidenza, costruite al 95% e pari a ± 2√
73
= ±0, 23;
• a partire dal decimo lag, i valori della funzione di autocorrelazione rientrano tutti
all’interno delle bande di confidenza, anche se nel passaggio dai lags 12 a 13, la
correlazione cambia segno ed inizia ad aumentare (ritorno di memoria);
• la decrescita dei valori segnala, inoltre, la presenza di un trend all’interno dei dati
(la stagionalità è assente, come è assente ache la componente ciclica), e la non
stazionarietà della serie in media.
Il grafico della PACF (Figura 5), invece, mette in evidenza altre caratteristiche della serie:
Figure 5: PACF campionaria della serie storica linearizzata
• la funzione di autocorrelazione parziale si interrompe dopo il lag 1;
• oltre al primo ritardo, l’unica altra correlazione significativamente diversa da 0 è
quella al lag 5 (4 ritardi dopo). Sembra comunque assente la componente stagionale
anche in questo caso.
Per rendere la serie stazionaria in media, l’operazione più intuitiva è quella di appli-
care l’operatore differenza di ordine d d, regolare e/o stagionale, valido anche per
eliminare una componente trend il cui polinomio è di grado d e/o anche una eventuale
componente stagionale. La scelta sulla migliore combinazione di differenze da appicare
alla serie linearizzata è quella per cui è minimo lo scarto quadratico medio della serie:
Applicando la differenza prima: Scarto quadratico medio 0,40199
Applicando la differenza stagionale: Scarto quadratico medio 1,0960
Applicando entrambe: Scarto quadratico medio 0,38107
7
Nel passare dall’applicazione di una sola differenza prima all’applicazione di entrambe
le differenze, il decremento di scarto quadratico medio è bassissimo. Si potrebbe, dunque,
optare solamente per la prima soluzione. Tuttavia, effettuando nuovamente un test ADF
su entrambe le serie trasformate, risulta che è proprio la differenza stagionale a rendere
stazionaria la serie, come mostra la Tabella 1:
Nucleo deterministico Differenza prima Differenza prima e stagionale
Costante P-value asintotico P-value asintotico
0,1865 0.0000004169
Statistica-test Statistica-test
-2,25654 -5,32712
Costante + trend P-value asintotico P-value asintotico
0,2654 0,000003893
Statistica-test Statistica-test
-2,63301 -5,32915
Table 1: Test ADF condotto su entrambe le serie
La combinazione di differenze che minimizza lo scarto quadratico medio della serie è,
dunque, data dall’applicazione una differenza prima ed una differenza stagionale.
Il grafico della serie differenziata è riportato in Figura 5.
Figure 6: Serie linearizzata differenziata
Come si evince dal grafico, la serie stavolta è stazionaria in media, in quanto oscilla
8
sempre intorno ad un unico valore, che è proprio vicino allo 0. Inoltre, non c’è stato
bisogno di applicare una trasformazione logaritmica ai dati, per cui si ritiene la serie
anche stazionaria in varianza. Entrambe le differenziazioni, però, hanno portato alla
perdita delle prime e delle ultime osservazioni della serie iniziale.
Identificazione degli ordini del modello ARIMA
Una volta resa stazionaria la serie, la fase successiva consiste nell’identificazione degli
ordini p, d, q del modello ARIMA che si vuole costruire. Il punto di partenza, anche in
questo caso, è rappresentato dai grafici ACF e PACF della serie differenziata.
Il primo (Figura 7) segnala la presenza di alcune correlazioni significative ai lag 1,2 e 4
(il primo ritardo stagionale) facendo sembrare presente una componente stagionale, che
però si interrompe subito.
Figure 7: ACF della serie differenziata
Il secondo grafico (Figura 8), invece, è molto simile al primo, e segnala, comunque,
delle correlazioni significative ai lags 1 e 4 (il primo ritardo stagionale). Anche qui, la
componente stagionale si interrompe dopo il primo ritardo stagionale.
Figure 8: PACF della serie differenziata
9
Il modello ARIMA che, dunque, si proverà a stimare a partire dalla serie storica lin-
earizzata, e che potrebbe esemplificare il processo generatore della serie, è del tipo
ARIMA(1, 1, 0)(0, 1, 1)s di cui si riporta di seguito l’equazione caratteristica:
(1 − φ1B) 4Xt = µ + (1 − Θ1B4) t (1)
dove a sinistra sono presenti la componente AR regolare e le due differenze, ed a destra
è presente, invece, la componente MA stagionale.
Stima dei parametri
La stima dei parametri del modello sopra proposto è ottenuta attraverso il metodo della
massima verosimiglianza condizionale5, ed è riportata nei seguenti risultati, ognuno
dei quali evidenzia una specifica informazione ed è appositamente commentato:
Valutazioni della funzione: 26
Valutazioni del gradiente: 13
Modello 1: ARIMA, usando le osservazioni 2000:4-2017:2 (T = 67)
Stimato usando il metodo BHHH (MV condizionale)
Variabile dipendente: (1-L)(1-Ls) Ireland_linearizzata
coefficiente errore std. z p-value
----------------------------------------------------------
const -0,00204610 0,0164561 -0,1243 0,9010
phi_1 0,524079 0,106786 4,908 9,21e-07 ***
Theta_1 -0,617419 0,102776 -6,007 1,88e-09 ***
Le stime ottenute attraverso il metodo scelto6 sono tutte minori di 1 e statisticamente
significative al 5%, ad eccezione della costante: i coefficienti sono superiori di 2 volte
ai loro errori standard (il valore dell’errore standard è quasi uguale per entrambi i
coefficienti φ1 e Θ1 e sembra anche abbastanza piccolo), ed i valori della z sono superiori
a ±1, 96 (quantili di una v.c. Normale standardizzata).
Media var. dipendente 0,007986 SQM var. dipendente 0,383778
Media innovazioni 0,011591 SQM innovazioni 0,304230
Log-verosimiglianza -15,34081 Criterio di Akaike 38,68161
Criterio di Schwarz 47,50038 Hannan-Quinn 42,17122
Note: SQM = scarto quadratico medio; E.S. = errore standard
5In questo caso, la funzione di verosimiglianza che si usa considera le prime p osservazioni come fisse, e
quindi fa riferimento alla distribuzione di yp+1...yt
6L’algoritmo BHHH è un algoritmo di ottimizzazione numerica che ha il vantaggio di garantire la
convergenza della procedura iterativa, se sono verificate determinate condizioni di regolarità.
10
La media della variabile dipendente è pari a 0,007986. Lo scarto quadratico medio dei
residui è inferiore rispetto allo scarto quadratico medio della variabile dipendente.7 Il
valore della funzione di log-verosimiglianza è negativo e pari a -15,34081.
Inoltre, sostituendo le stime ottenute all’interno dell’equazione (1) è possibile ottenere la
seguente equazione in B:
(1 − 0, 524079B) 4Xt = µ + (1 + 0, 617419B4) t (2)
Ricordando che = 1 − B, e che s = 1 − Bs si può risolvere l’equazione precedente
rispetto a B, e si ottengono i seguenti valori:
Reale Immaginario Modulo Frequenza
-----------------------------------------------------------
AR
Radice 1 1,9081 0,0000 1,9081 0,0000
MA (stagionale)
Radice 1 1,6196 0,0000 1,6196 0,0000
-----------------------------------------------------------
Le radici dei polinomi caratteristici sono entrambe maggiori di 1 in modulo, quindi
è possibile affermare che il processo generatore della serie storica oggetto di studio è
stazionario (1, 9081 > 1, per la parte AR) ed invertibile (1, 6196 > 1, per la parte MA). È
completamente assente la parte immaginaria nelle radici, e ciò era già possibile notarlo
dal grafico dell’ACF della serie, in quanto manca la componente ciclica.
Una elevata correlazione delle stime, derivabile dalla normalizzazione della matrice di
varianza e covarianza dei parametri stimati (Tabella 2), può essere indice di malspeci-
ficazione del modello, perchè evidenzia un legame lineare tra i parametri e quindi la
necessità di una semplificazione, anche quando tutti i parametri risultassero significativi.
costante φ1 Θ1
costante 0,0000270802 -0,0000589026 0,000000128964
φ1 0,0114032 0,0000917312
Θ1 0,0105629
Table 2: Matrice di covarianza dei coefficienti
In questo caso, i valori della covarianza tra i parametri sono molto bassi (addirittura
prossimi allo 0), quindi non si può concludere per una relazione lineare tra i parametri
µ, φ1 e Θ1 precedentemente stimati.
7Non ha alcun senso il confronto tra la varianza dei residui (che costituisce la stima di una quantità finita
σ2 per un processo stazionario) e la varianza della serie originaria se questa non è stazionaria (poichè tale
varianza è connessa solo ai dati campionari, essendo infinita la varianza di un processo non stazionario).
11
Verifica del modello
Per concludere lo studio della serie storica in oggetto, bisogna controllare se il modello
precedentemente stimato è in grado di descrivere al meglio le caratteristiche di un
processo stocastico Gaussiano e stazionario. La procedura base è quella dell’analisi
dei residui del modello, poichè consente di verificare effettivamente la qualità delle
operazioni effettuate per giungere al modello scelto.
In primo luogo si analizza il correlogramma dei residui del modello (Figure 9 e 10).
Un modello che riesce a cogliere le dipendenze della serie storica presenterà una ACF
ed una PACF contenute nelle rispettive regioni di confidenza, ossia delle funzioni che
saranno non significativamente diverse da 0 in corrispondenza di ogni ritardo.
Dal primo grafico (Figura 9), effettivamente, risulta confermata questa teoria, essendo
tutte le correlazioni comprese all’interno delle bande di confidenza.
Figure 9: ACF dei residui del modello
Stesso risultato vale anche per il secondo grafico (Figura 10): tutte le correlazioni sono
comprese all’interno delle bande di confidenza.
Figure 10: PACF dei residui del modello
12
Ad avvalorare ancora di più la teoria di cui sopra ed i risultati dei grafici proposti è il
test di Ljung-Box per l’autocorrelazione dei residui fino all’ordine 4:
Ljung-Box Q’ = 5,1356,
con p-value = P(Chi-quadro(2) > 5,1356) = 0,07670
Il p-value è superiore al livello di significatività del 5%, quindi si può non rifiutare
l’ipotesi nulla di assenza di autocorrelazione nei residui.
Viene proposto di seguito il grafico dei residui rispetto al tempo (Figura 11), utile ad
evidenziare eventuali andamenti inerziali, ciclici, valori anomali, bruschi cambiamenti
di livello, ecc.: essi, fortunatamente, sono stazionari (è stato eseguito nuovamente un
test ADF per verificarlo, di cui però non sono stati riportati i risultati) e sembrano avere
anche varianza costante.
Figure 11: Serie storica dei residui
Infine, vengono qui proposti 2 grafici che dimostrano la Normalità dei residui stessi e
dai quali si possono trarre indicazioni su valori anomali, simmetria della distribuzione,
plurimodalità, ecc.: l’istogramma (Figura 13) ed il Q-Q plot (Figura 14).
Figure 12: Istogramma dei residui del modello
13
Dall’istogramma è possibile dedurre la Normalità dei residui, confermata anche dall’apposito
test riportato nella figura: dal momento che il p-value è largamente superiore alla soglia
del 5% non viene rifiutata l’ipotesi nulla di Normalità della distribuzione.
Figure 13: Q-Q plot dei residui
Anche il Q-Q plot conferma la stessa cosa, in quanto i residui si distribuiscono tutti sulla
retta y = x, bisettrice del piano cartesiano, e quelli nelle code non si allontanano di molto.
L’ultimo controllo da effettuare per poter accettare ed utilizzare il modello è valutare
la sua capacità previsiva, attraverso il grafico che confronta i valori effettivi ed i valori
stimati dal modello, riportato in Figura 14.
Figure 14: In rosso i valori effettivi, in blu i valori stimati.
14
Effettivamente, le stime ottenute non si discostano troppo dalle osservazioni iniziali,
infatti, si può osservare come siano in accordo con i dati osservati.
3 Analisi di cointegrazione
La seconda parte del seguente elaborato si occupa della verifica di cointegrazione8 tra
un insieme di variabili. Con questo tipo di analisi è possibile stabilire un legame lineare
stazionario tra processi stocastici non stazionari, di modo da individuare una relazione
stabile nel tempo tra variabili che prese singolarmente non sono stabili. In particolare, si
parla di serie integrate di un certo ordine p, in cui p rappresenta il numero di differenze
necessarie a rendere stazionaria una serie. Le variabili a disposizione sono:
• la serie mensile dell’indice dei prezzi al consumo armonizzato a livello europeo
(HICP) dal gennaio del 1996 al novembre del 2017;
• la serie trimestrale dei salari nominali per addetto, con valori in euro, dal primo
trimestre del 1995 al terzo trimestre del 2017;
• la serie trimestrale non destagionalizzata del Prodotto Interno Lordo (PIL), dal
primo trimestre del 1995 al terzo trimestre del 2017;
• la serie trimestrale del tasso di disoccupazione totale, dal secondo trimestre del
1999 al secondo trimestre del 2017 (già analizzata nella prima parte dell’elaborato);
• la serie trimestrale non destagionalizzata della produttività reale per ora lavorata,
dal primo trimetre del 1995 al terzo trimestre del 2017.
A partire da queste variabili, dopo averle trasformate in modo adeguato, si procederà
alla verifica di cointegrazione tra le seguenti variabili: i salari, l’inflazione come tasso di
variazione dell’indice dei prezzi, la produttività, la disoccupazione e l’output gap9 come
stima della componente ciclo-trend del PIL.
Trattamenti preliminari dei dati
Chi avrà letto bene le precedenti righe, si sarà accorto che non tutte le variabili indicate
hanno una frequenza uguale. In particolare, la variabile HICP presenta cadenza mensile
e le altre cadenza trimestrale. La prima operazione che è stata eseguita, dunque, è stata
8In pratica, si ha cointegrazione nel caso in cui due o più serie temporali con trend stocastici si muovono
congiuntamente in modo simile nel lungo periodo, tanto che sembrano possedere lo stesso trend. La
definizione è dovuta all’econometrico C.W.J. Granger che per tale ricerca è stato insignito, insieme a R.F.
Engle, del premio Nobel per l’economia nel 2003.
9In economia, l’output gap è la differenza tra il prodotto interno lordo effettivo E e quello potenziale P.
Una distanza molto piccola tra prodotto interno lordo effettivo e potenziale indica che le risorse economiche
sono utilizzate efficacemente. Al contrario, una distanza più grande indica che le risorse non sono utilizzate
correttamente, oppure che sono sfruttate oltre le loro capacità.
15
quella di calcolare (in Excel), per la variabile indicata, una media per trimestri, in modo
tale da conformare la propria frequenza a quella delle altre.
In secondo luogo, ci si sarà resi conto che i dati a disposizione non ricoprono tutti lo
stesso lasso temporale: ci sono serie più corte, come quella della disoccupazione, e
serie più lunghe, come quella della produttività e dei salari. Ecco perchè si è deciso di
prendere come punto di riferimento la serie più corta, in modo tale da avere gli stessi
dati a disposizione. Tutte le serie storiche oggetto di studio, dunque, partiranno dal
secondo trimestre del 1999 e finiranno nel secondo trimestre del 2017.
Un ulteriore problema da risolvere prima di poter iniziare con la procedura è quello
relativo all’unità di misura delle variabili a disposizione. Molte di queste, infatti, pre-
sentano un livello di misurazione nettamente diverso rispetto alle altre. Per riportare
tutte le variabili sullo stesso livello, si è deciso, allora, di utilizzare la trasformazione
logaritmica. Di questa trasformazione se ne terrà poi conto in seguito.
Si ritiene, infine, opportuno correggere gli eventuali valori anomali presenti in ciascuna
serie storica, in odo tale da non tener conto di termini di "disturbo" dovuti ad eventi ver-
ificatisi in quegli anni. L’operazione è stata svolta, ancora una volta, con il programma
TRAMO, come già visto per l’analisi della serie della disoccupazione. Va tenuto conto
del fatto che la maggior parte dei valori anomali riscontrati nelle serie osservate si è
presentata nel periodo della crisi in Irlanda (2008-2009).
Stima della componente ciclo-trend del PIL
Dal momento che alcune delle variabili utilizzate per la verifica di cointegrazione devono
essere ricavate dalle variabili di partenza, è necessario prima di tutto procedere alle
trasformazioni di queste ultime. In primis, si è deciso di stimare la componente ciclo-
trend della serie del PIL (che poi sarà utilizzata come output gap in sede di verifica). La
procedura di estrazione della componente è avvenuta attraverso il comodo programma
X12-ARIMA, anch’esso utilizzabile dalla finestra principale di Gretl in modo semplice.
Si riporta, di seguito, il grafico della componente stimata (Figura 16):
16
Figure 15: Stima della componente ciclo-trend del PIL
La stima della componente ciclo-trend presenta valori nettamente crescenti nel tempo,
ed è avvenuta correggendo la serie per la stagionalità, quindi non c’è bisogno di desta-
gionalizzare la serie del PIL.
Destagionalizzazione delle serie
Dovendo effettuare una verifica di cointegrazione, è preferibile destagionalizzare le serie
storiche, in modo da non tener conto di questa componente di "disturbo". La procedura,
anche questa volta, viene eseguita con X12-ARIMA su ciascuna delle serie di interesse.
Tale procedura esegue utili verifiche di ipotesi per l’identificazione della stagionalità, sia
evolutiva che stabile. Per una questione di brevità, per ciascuna serie, verranno riportati
solamente gli output relativi alle 3 statistiche test che più interessano nell’analisi.
La prima, M7, rappresenta la quota di stagionalità evolutiva rispetto alla quota di
stagionalità stabile. La seconda, FS, rappresenta, invece, il p-value del test di Kruskal-
Wallis per la stagionalità stabile. La terza, FM, rappresenta infine il p-value del test F
per la stagionalità stabile. Esse devono essere, rispettivamente, minore di 1 e rifiutare
entrambe le ipotesi, per confermare la presenza di una stagionalità da correggere. Le
statistiche sono riportate nella seguente tabella (Tabella 3), variabile per variabile:
17
M7 FS FM
HICP 0,327 0,00% 0,00%
Salari 3,000 60,68% 88,39%
Disoccupazione 0,343 0,00% 0.00%
Produttività 0,740 0,01% 0.03%
Table 3: Statistiche-test per la presenza di stagionalità
Dalla tabella risulta evidente che l’unica serie che non presenta stagionalità identificabile
è quella dei salari, in quanto è l’unica per la quale si verifica che l’M7 è maggiore di 1, ed
i due test sulla stagionalità abbondantemente rifiutano entrambi l’ipotesi nulla. Pertanto,
questa sarà l’unica serie a non essere destagionalizzata. Nella Figura 17, inoltre, sono
riportate le 5 serie storiche dopo tutti i trattamenti di cui si è discusso fino ad ora.
Figure 16: Le 5 serie storiche dopo le operazioni preliminari
Dal grafico, risulta evidente la presenza di una o più relazioni di cointegrazione tra le
variabili osservate. Questa, tuttavia, va verificata attraverso gli opportuni test.
Scelta dei ritardi del VAR
Un sistema VECM è, in fin dei conti, una trasformazione di un processo multivariato
(VAR): esso consente al ricercatore di includere una rappresentazione delle relazioni
economiche di equilibrio entro una specificazione di serie storica relativamente ricca.
Per questo motivo, è necessario stimare l’ordine del processo multivariato che è alla base
18
dei nostri dati. Tale informazione sarà fondamentale durante la stima del VECM.
La stima dell’ordine dei ritardi del processo VAR che meglio approssima i dati a dispo-
sizione, mette in relazione tutti i modelli dal ritardo 1 al massimo ritardo p selezionato,
eseguendo sia un test sul rapporto di verosimiglianza, sia mostrando un insieme di
criteri di informazione del modello. È con questi strumenti che sarà scelto il ritardo più
adatto. Inoltre, la procedura sottrae al campione p osservazioni, in modo da far girare
tutte le stime con lo stesso set. Si eseguirà la procedura con ritardo massimo pari a 8.10
Si riporta, di seguito, l’output finale di Gretl relativo alla scelta del ritardo.
Sistema VAR, ordine massimo ritardi 8
Gli asterischi indicano i valori migliori (ossia minimizzati)
dei rispettivi criteri di informazione, AIC = criterio di Akaike,
BIC = criterio bayesiano di Schwartz e HQC = criterio di Hannan-Quinn.
ritardi logver p(LR) AIC BIC HQC
1 1087,56125 -32,540346 -31,536783 -32,144376
2 1229,31065 0,00000 -36,132635 -34,292769 -35,406690
3 1289,30455 0,00000 -37,209371 -34,533202* -36,153451*
4 1314,80287 0,00160 -37,224704 -33,712232 -35,838808
5 1347,33416 0,00002 -37,456436 -33,107661 -35,740565
6 1375,45561 0,00034 -37,552480 -32,367403 -35,506635
7 1409,26318 0,00001 -37,823483 -31,802102 -35,447662
8 1447,71110 0,00000 -38,237265* -31,379582 -35,531469
In base a questi risultati, il BIC e l’HQC tendono a scegliere il modello più parsimonioso
ed addirittura lo stesso ordine di ritardo (3), mentre l’AIC tende a scegliere un ordine (8)
tale per cui il modello risulta meno parsimonioso rispetto agli altri due criteri: si ritiene,
dunque, che un VAR(3) sia una rappresentazione adeguata dei dati a disposizione. La
formulazione algebrica del VAR(3) scelto è la seguente:
yt = A1yt−1 + A2yt−2 + A3yt−3 + t (3)
dove yt è il processo stocastico multivariato penta-dimensionale, A1, A2 ed A3 sono
matrici di dimensioni 5x5, ed yt−1, yt−2, yt−3, t sono vettori di dimensioni 5x1.
Non si stima però il VAR completo, poichè si procederà prima alla verifica della cointe-
grazione tra le variabili. Questa scelta sarà spiegata successivamente.
10Allin Cottrell, Riccardo "Jack" Lucchetti, Cristian Rigamonti (2017) Gretl User’s Guide.
19
Test del rango di cointegrazione
L’ipotesi di cointegrazione tra le serie osservate prevede che esistano una o più combi-
nazioni lineari di processi non stazionari che risulti stazionaria. In formule, si ha:
zt = β yt (4)
dove zt rappresenta la combinazione lineare stazionaria, β è il cosiddetto vettore di coin-
tegrazione (in alcuni casi, si potrebbe chiamare anche una matrice di cointegrazione)
da stimare, ed yt è un qualsiasi processo stocastico multivariato non stazionario.
La procedura di Johansen, valida per questo tipo di studio, testerà (omonimo test di
Johansen) e stimerà il rango della matrice di cointegrazione, ed il caso più interessante,
come ci si può attendere, è quello dove il rango di cointegrazione è compreso tra 0 ed
il massimo: solo in tal caso è possibile affermare che c’è cointegrazione tra le variabili
oggetto di studio. La stessa procedura consente, inoltre, di stimare il VECM che rapp-
resenta sia la combinazione lineare stazionaria delle variabili, sia la velocità con cui le
serie ritornano all’andamento di lungo periodo dopo una divergenza di breve periodo.
La procedura funzione nel seguente modo: il test prima di tutto ordina in senso decres-
cente tutti gli autovalori di una matrice ˆM, la quale è una stima della vera matrice di
lungo periodo M, e ne contiene i medesimi autovalori. Fatto questo, vengono effettuate
due verifiche di ipotesi. La prima sui singoli autovalori (λ-max) e l’altra aggregata
(Trace test); essi hanno come ipotesi nulla che il rango di cointegrazione sia minore o al
massimo uguale rispetto al i-esimo autovalore. Per selezionare un rango adeguato, si
deve ottenere un’accettazione dell’ipotesi nulla, quindi un p-value alto.
Si preferisce ricorrere a questa procedura piuttosto che al test di Engle-Granger, poichè
la prima rappresenta una sorta di evoluzione del secondo metodo. Essa, infatti, non
presenta molti dei difetti che sono tipici dell’altro test, ed è più adatta ad una situazione
in cui c’è la presenza di più di una relazione di cointegrazione.
Si riporta, di seguito, la parte rilevante dell’output di Gretl relativo al test effettuato.
Test di Johansen:
Numero di equazioni = 5
Ordine dei ritardi = 3
Rango Autovalore Test traccia p-value Test Lmax p-value
0 0,57663 121,13 [0,0000] 60,165 [0,0000]
1 0,37535 60,967 [0,0015] 32,939 [0,0070]
2 0,24426 28,028 [0,0802] 19,604 [0,0808]
3 0,10413 8,4233 [0,4285] 7,6970 [0,4191]
4 0,010322 0,72632 [0,3941] 0,72632 [0,3941]
Corretto per ampiezza campionaria (df = 54)
Rango Test traccia p-value
20
0 121,13 [0,0000]
1 60,967 [0,0031]
2 28,028 [0,0977]
3 8,4233 [0,4460]
4 0,72632 [0,4058]
Il primo test porta al non rifiuto dell’ipotesi nulla a partire da un rango di cointegrazione
pari a 2. Stesso risultato (con annesso p-value quasi coincidente) mostra il secondo test.
Dati, dunque, i risultati di questi test, si potrebbe ipotizzare un rango 2 di cointegrazione
(la presenza cioè di 2 relazioni di cointegrazione).
Stima del modello VECM
Una volta scelto il numero delle relazioni di cointegrazione, e quindi stimato il rango
della matrice di cointegrazione, si procede con la rappresentazione VECM delle variabili,
intesa anche come la serie storica delle deviazioni dalle relazioni di cointegrazione.
Nel farlo si utilizzeranno le stime dell’ordine dei ritardi della rappresentazione VAR
insieme alle stime sul rango della matrice ˆM. La formula generale di un VECM (in forma
vettoriale) è:
∆yt = Πyt−1 +
p
∑
k=1
Γi∆yt−i + ut = αβ yt−1 +
p
∑
k=1
Γi∆yt−i + ut (5)
dove α è la matrice dei loadings, perchè il suo elemento generico ij ci dice qual è l’effetto
sulla i-esima variabile del j-esimo elemento di z, e β è la matrice dei coefficienti delle
combinazioni lineari stazionarie delle variabili, come già preannunciato. Per l’analisi
dimensionale, si tenga presente che le righe di β sono pari al rango r di cointegrazione.
Si procede ora alla stima del modello VECM, e si riporta l’output principale di Gretl.
Sistema VECM, ordine ritardi 3
Caso 3: costante non vincolata
beta (vettori di cointegrazione, errori standard tra parentesi)
Salari 1,0000 0,0000
(0,0000) (0,0000)
output_gap 0,0000 1,0000
(0,0000) (0,0000)
Disoccupazione 1,9905 0,49074
(0,31651) (0,053139)
Produzione 17,049 1,8583
(3,3480) (0,56209)
HICP -51,200 -7,8941
(7,0563) (1,1847)
21
I vettori di cointegrazione sono presentati in forma triangolare (rappresentazione di
Phillips), ossia facendo in modo che le prime r righe, corrispondenti al rango della
matrice di cointegrazione, possano formare una matrice identità.
Inoltre, moltiplicando la stimata matrice di cointegrazione β (di dimensioni 5x2) con il
vettore penta-dimensionale yt si ottiene una stima delle combinazioni lineari stazionarie:
1 0 1, 9905 17, 049 −51, 2
0 1 0, 49074 1, 8583 −7, 894







w
logp
pr
u
out







=
w + 1, 9905pr + 17, 049u − 51, 2out
logp + 0, 49074pr + 1, 8583u − 7, 89out
dove la prima combinazione ˆz1t riguarda le variabili salari, produttività, disoccupazione
e output gap, mentre la seconda combinazione ˆz2t riguarda, invece, indice dei prezzi,
produttività, disoccupazione e output gap.
Di seguito, inoltre, sono riportate le stime dei loadings, cioè degli elementi della matrice
α di cui si è discusso poco fa:
alpha (vettori di aggiustamento)
Salari -0,0048589 0,028617
output_gap 0,0071131 -0,034100
Disoccupazione 0,14949 -1,0791
Produzione -0,075892 0,55291
HICP 0,021972 -0,12257
Dai risultati, si evince come le variabili salari e produzione abbiano un effetto negativo
sulla prima combinazione lineare; mentre le variabili output gap, disoccupazione (il
valore più alto in assoluto) e HICP sulla seconda combinazione lineare.
Infine, si riportano i valori dei criteri di informazione (i soliti 3: AIC, BIC e HQC), il
valore della funzione di log-verosimiglianza ed una misura sintetica delle caratteristiche
della matrice di covarianza tra i coefficienti:
Log-verosimiglianza = 1359,9369
Determinante della matrice di covarianza = 9,1826635e-024
AIC = -36,5696
BIC = -33,9999
HQC = -35,5489
Si riporta inoltre il grafico delle radici inverse del VAR associato a questo VECM.
22
Figure 17: Grafico delle radici inverse del VAR
Come si vede, una delle radici giace proprio sulla circonferenza di raggio unitario. Ciò è
sintomo di VAR non stazionario, come ci si attendeva.
Analisi di alcune funzioni di impulso-risposta
A questo punto, si può procedere all’analisi di alcune delle 25 funzioni di impulso-
risposta ricavabili da un processo VAR con 5 variabili. Le funzioni impulso risposta
di un sistema VAR(p) stazionario sono i coefficienti della rappresentazione di WOLD
MA(∞). Un sistema VECM però non possiede rappresentazioni MA (∞) valide, dato
che la serie dei coefficienti diverge all’aumentare di t. Nonostante questo, un numero
limitato di matrici può essere computato da Gretl (e quindi la funzione è visualizzabile
fino ad un certo lag). Il significato delle IRF è quindi il medesimo: φjk,i, elemento della
matrice Φ, è la risposta della variabile j ad uno shock unitario dell’errore di previsione
(u) della variabile k, i periodi fa. Nei modelli stazionari la IRF va verso 0 all’aumentare
di i. Ne viene riportata, prima di tutto, la rappresentazione grafica in forma matriciale,
utile per formulare considerazioni immediate ed intuitive (Figura 19).
23
Figure 18: Alcune funzioni di impulso-risposta
24
Sulla sinistra sono presenti le funzioni di impulso-risposta delle variabili output gap,
salari e disoccupazione, ed in che modo queste rispondono ad uno shock sulle stesse
variabili, fino ad un massimo di 20 lags. Nel caso specifico, si ha che:
• uno shock dell’output gap produce un effetto di lungo periodo positivo sull’output
gap stesso, e la funzione assume un andamento che non è mai decrescente;
• uno shock della produttività produce un effetto di lungo periodo positivo sulla
produttività stessa, e la funzione assume prima un andamento decrescente (per
i primi 2 trimestri), poi cambia decisamente andamento, stabilizzandosi su un
valore compreso tra 0,006 e 0,007 (a partire dall’undicesimo trimestre);
• uno shock dei salari produce un effetto di lungo periodo positivo sui salari stessi,
e la funzione ha un andamento di tipo esponenziale.
Sulla destra, invece, sono presenti le funzioni di impulso-risposta delle variabili salari,
disoccupazione e produttività e come queste rispondono, rispettivamente, ad uno shock
sulla produttività e sull’output gap (le ultime due). Qui, si può dire che:
• uno shock della produzione produce un effetto di lungo periodo negativo sull’output
gap, e la funzione assume un andamento che è sempre decrescente, partendo da
un valore iniziale pari a 0;
• uno shock dell’output gap produce un effetto di lungo periodo ancora negativo
sulla disoccupazione, e la funzione assume prima un andamento decrescente
(fino al decimo trimestre, e non di tipo esponenziale), poi cambia decisamente
andamento, stabilizzandosi intorno a -0,06 (a partire dall’undicesimo trimestre);
• ancora uno shock dell’output gap produce un effetto di lungo periodo questa volta
positivo sulla produttività, e la funzione ha un andamento prima crescente (per i
primi 2 trimestri), poi sembra stabilizzarsi con il passare del tempo, anche se in
maniera non uniforme.
Si può quindi notare come in un sistema integrato la funzione non decada necessaria-
mente verso lo 0, nonostante converga ad un valore finito diverso da 0. Ciò testimonia
la non stazionarietà del sistema in esame, e i possibili effetti permanenti degli shock.
Verifica delle restrizioni
Le restrizioni sui modelli VECM sono possibili sugli elementi della matrice dei loadings
e sulla matrice delle combinazioni lineari. Su Gretl non sono supportate le cosiddette
"cross restrictions": vincoli che legano un elemento di α in modo diretto ad un elemento
di β. Le restrizioni sono date nella forma:
∆wt = b1πt−1 − b2(w − pr − p − b3u)t−1
πt = b3∆wt−1 − b4(p − b5(w − pr))t−1
25
Questa scrittura va letta come una espressione del tipo:
∆yt = αzt−1 +
p
∑
k=1
Γi∆yt−i + t (6)
Possiamo allora riscrivere i vincoli in forma "VECM":
∆
w
logp t
=
−b2 0
0 −b4
1 −1 −1 −b3 0
−b5 1 b5 0 0







w
logp
pr
u
out







t−1
+
0 b1
b3 0
∆
w
logp t−1
Per quello che concerne la notazione, si è scritto log p per sottolineare che, operando la
trasformazione logaritmica sulla variabile HICP, si può riscrivere la variabile π come
∆p. Resta pacifico che tutte le altre variabili sono pari al loro logaritmo. Come si nota,
leggendo il vincolo in questa forma è possibile ritrovare dei vincoli su alcuni coefficienti
della matrice dei loadings, e sui vettori di cointegrazione. Si procede quindi a imporre le
restrizioni tramite Gretl, e si riporta il test del rapporto di verosimiglianza risultante.
I vincoli imposti saranno gli unici che possiamo imporre, quindi su α e β.
Insieme di vincoli
1: b[1,1] = 0
2: b[1,2] = -1
3: b[1,3] = -1
4: b[1,5] = 0
5: b[2,3] + b[2,1] = 0
6: b[2,2] = 1
7: b[2,4] = 0
8: b[2,5] = 0
9: a[1,2] = 0
10: a[2,1] = 0
Rango dello Jacobiano = 10, numero di parametri liberi = 10
Il modello risulta pienamente identificato
Basato sullo Jacobiano, df = 6
Algoritmo di switching: 3738 iterazioni
-(T/2)log|Omega| = 1828,9974, lldiff = 4,99165e-005
Convergenza debole
*** warning: large number of iterations may indicate a problem
Log-verosimiglianza non vincolata (lu) = 1359,9369
Log-verosimiglianza vincolata (lr) = 1332,3689
2 * (lu - lr) = 55,1359
26
P(Chi-quadro(6) > 55,1359) = 4,35161e-010
Vettori di cointegrazione (errori standard tra parentesi)
Salari 0,0000 -0,17154
(0,0000) (0,0058418)
output_gap -1,0000 1,0000
(0,0000) (0,0000)
Disoccupazione -1,0000 0,17154
(0,0000) (0,0058418)
Produzione -789,46 0,0000
(51,097) (0,0000)
HICP 0,0000 0,0000
(0,0000) (0,0000)
Alfa (vettori di aggiustamento) (errori standard tra parentesi)
Salari 2,8290e-006 0,0000
(1,8873e-006) (0,0000)
output_gap 0,0000 0,00097169
(0,0000) (0,010780)
Disoccupazione -0,00082969 -1,1966
(0,00044848) (0,51644)
Produzione 0,00049300 0,50822
(0,00016844) (0,19389)
HICP -6,8917e-005 -0,099404
(3,2862e-005) (0,037762)
Come si evince dall’output, il test produce un netto rifiuto dei vincoli offerti, dato che
l’ipotesi nulla attesterebbe la validità dei vincoli posti. Naturalmente è stato possibile
testare queste restrizioni poichè si è scelto (in base ai test) un rango di cointegrazione
pari a 2.
I vincoli, nonostante tutto, sono interessanti, poichè nella prima equazione si ipotizza
una relazione tra salari, prezzi al consumo, produttività, e disoccupazione, il che non è
difficile da immaginare in un contesto prettamente economico. Nel secondo caso invece,
si mettono in relazione produttività, salari e prezzi, ma si pone addirittura il coefficiente
opposto per questi due.
27
References
1. Domenico Piccolo. Introduzione all’analisi delle serie storiche. Roma, La Nuova Italia
Scientifica, 1990.
2. Domenico Piccolo. Statistica. Napoli, Il Mulino, 1998.
3. Riccardo "Jack" Lucchetti. Introduzione all’Econometria. Dispensa, 2014.
4. Riccardo "Jack" Lucchetti. Appunti di analisi delle serie storiche. Dispensa, 2015.
5. Sergio Polini. Econometria for dummies. Dispensa, 2010.
6. George E.P. Box, Gwilym M. Jenkins. Time series forecasting and control: revised edition.
Oakland, Holden-Day, 1976.
7. Marno Verbeek. A guide to modern econometrics. Rotterdam, John Wiley & Sons, 2004.
8. Helmut Lütkepohl. New Introduction to Multivariate Time Series Analysis. Firenze,
Springer, 1994.
9. Allin Cottrell, Riccardo "Jack" Lucchetti, Cristian Rigamonti. Gnu Regression, Econo-
metrics and Time-series library. Gretl User’s Guide, 2017.
10. Appunti dalle lezioni del corso di Econometria, prof. Francesca Di Iorio.
28

More Related Content

Similar to Disoccupazione in irlanda

BNL Focus #31
BNL Focus #31BNL Focus #31
BNL Focus #31
BNL Mestiere Impresa
 
Qualcosa è cambiato - 2019
Qualcosa è cambiato - 2019Qualcosa è cambiato - 2019
Qualcosa è cambiato - 2019
Agenzia Italia
 
Qualcosa è cambiato - Osservatorio AgitaLab 2019
Qualcosa è cambiato - Osservatorio AgitaLab 2019Qualcosa è cambiato - Osservatorio AgitaLab 2019
Qualcosa è cambiato - Osservatorio AgitaLab 2019
Centro Studi Fleet&Mobility
 
Vito Gamberale - Considerazioni sullo scorporo della rete di accesso di Telec...
Vito Gamberale - Considerazioni sullo scorporo della rete di accesso di Telec...Vito Gamberale - Considerazioni sullo scorporo della rete di accesso di Telec...
Vito Gamberale - Considerazioni sullo scorporo della rete di accesso di Telec...
Vito Gamberale
 
MIDEST 2014: LA SUBFORNITURA INDUSTRIALE: CIFRE E ANALISI
MIDEST 2014: LA SUBFORNITURA INDUSTRIALE: CIFRE E ANALISIMIDEST 2014: LA SUBFORNITURA INDUSTRIALE: CIFRE E ANALISI
MIDEST 2014: LA SUBFORNITURA INDUSTRIALE: CIFRE E ANALISI
MIDEST, the global show for all industrial subcontracting know-how
 
Occupazione previsioni 2015 2017 abstract pptx
Occupazione previsioni 2015 2017 abstract pptxOccupazione previsioni 2015 2017 abstract pptx
Occupazione previsioni 2015 2017 abstract pptx
giovanni facco
 
SmartStatmanager 2015
SmartStatmanager 2015SmartStatmanager 2015
SmartStatmanager 2015
Statmanager
 
Statisticalbook SmartGov
Statisticalbook SmartGovStatisticalbook SmartGov
Statisticalbook SmartGovStatmanager
 
L’euro rischia di scomparire ?
L’euro rischia di scomparire ?L’euro rischia di scomparire ?
L’euro rischia di scomparire ?
Dominique Strauss-Kahn
 
Bari1dic2013a
Bari1dic2013aBari1dic2013a
Il lavoro pubblico in Europa dopo la crisi
Il lavoro pubblico in Europa dopo la crisiIl lavoro pubblico in Europa dopo la crisi
Vito Gamberale - Una riforma strutturale del sistema di gestione dei rifiuti
Vito Gamberale - Una riforma strutturale del sistema di gestione dei rifiutiVito Gamberale - Una riforma strutturale del sistema di gestione dei rifiuti
Vito Gamberale - Una riforma strutturale del sistema di gestione dei rifiuti
Vito Gamberale
 

Similar to Disoccupazione in irlanda (16)

BNL Focus #31
BNL Focus #31BNL Focus #31
BNL Focus #31
 
Qualcosa è cambiato - 2019
Qualcosa è cambiato - 2019Qualcosa è cambiato - 2019
Qualcosa è cambiato - 2019
 
BNL Focus #34
BNL Focus #34BNL Focus #34
BNL Focus #34
 
Qualcosa è cambiato - Osservatorio AgitaLab 2019
Qualcosa è cambiato - Osservatorio AgitaLab 2019Qualcosa è cambiato - Osservatorio AgitaLab 2019
Qualcosa è cambiato - Osservatorio AgitaLab 2019
 
Vito Gamberale - Considerazioni sullo scorporo della rete di accesso di Telec...
Vito Gamberale - Considerazioni sullo scorporo della rete di accesso di Telec...Vito Gamberale - Considerazioni sullo scorporo della rete di accesso di Telec...
Vito Gamberale - Considerazioni sullo scorporo della rete di accesso di Telec...
 
MIDEST 2014: LA SUBFORNITURA INDUSTRIALE: CIFRE E ANALISI
MIDEST 2014: LA SUBFORNITURA INDUSTRIALE: CIFRE E ANALISIMIDEST 2014: LA SUBFORNITURA INDUSTRIALE: CIFRE E ANALISI
MIDEST 2014: LA SUBFORNITURA INDUSTRIALE: CIFRE E ANALISI
 
Occupazione previsioni 2015 2017 abstract pptx
Occupazione previsioni 2015 2017 abstract pptxOccupazione previsioni 2015 2017 abstract pptx
Occupazione previsioni 2015 2017 abstract pptx
 
SmartStatmanager 2015
SmartStatmanager 2015SmartStatmanager 2015
SmartStatmanager 2015
 
Statisticalbook SmartGov
Statisticalbook SmartGovStatisticalbook SmartGov
Statisticalbook SmartGov
 
L’euro rischia di scomparire ?
L’euro rischia di scomparire ?L’euro rischia di scomparire ?
L’euro rischia di scomparire ?
 
BNL Focus #22
BNL Focus #22BNL Focus #22
BNL Focus #22
 
BNL Focus #38
BNL Focus #38BNL Focus #38
BNL Focus #38
 
Bari1dic2013a
Bari1dic2013aBari1dic2013a
Bari1dic2013a
 
Focus n 30_02_settembre_2013
Focus n 30_02_settembre_2013Focus n 30_02_settembre_2013
Focus n 30_02_settembre_2013
 
Il lavoro pubblico in Europa dopo la crisi
Il lavoro pubblico in Europa dopo la crisiIl lavoro pubblico in Europa dopo la crisi
Il lavoro pubblico in Europa dopo la crisi
 
Vito Gamberale - Una riforma strutturale del sistema di gestione dei rifiuti
Vito Gamberale - Una riforma strutturale del sistema di gestione dei rifiutiVito Gamberale - Una riforma strutturale del sistema di gestione dei rifiuti
Vito Gamberale - Una riforma strutturale del sistema di gestione dei rifiuti
 

More from Marco D'Alessandro

Classificazione automatica per ati ad alta dimensionalità: un approccio fuzzy...
Classificazione automatica per ati ad alta dimensionalità: un approccio fuzzy...Classificazione automatica per ati ad alta dimensionalità: un approccio fuzzy...
Classificazione automatica per ati ad alta dimensionalità: un approccio fuzzy...
Marco D'Alessandro
 
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Marco D'Alessandro
 
La differenza c'è e si vede
La differenza c'è e si vedeLa differenza c'è e si vede
La differenza c'è e si vede
Marco D'Alessandro
 
Il modello educativo-formativo di Piazza dei Mestieri di Torino
Il modello educativo-formativo di Piazza dei Mestieri di TorinoIl modello educativo-formativo di Piazza dei Mestieri di Torino
Il modello educativo-formativo di Piazza dei Mestieri di Torino
Marco D'Alessandro
 
Tesina di fine seminario sas ed sql
Tesina di fine seminario sas ed sqlTesina di fine seminario sas ed sql
Tesina di fine seminario sas ed sql
Marco D'Alessandro
 
La soddisfazione in ambito sportivo.
La soddisfazione in ambito sportivo.La soddisfazione in ambito sportivo.
La soddisfazione in ambito sportivo.
Marco D'Alessandro
 
Il basket non è solo matematica
Il basket non è solo matematicaIl basket non è solo matematica
Il basket non è solo matematica
Marco D'Alessandro
 
Domanda di benzina in Ontario dal 1960 al 1975
Domanda di benzina in Ontario dal 1960 al 1975Domanda di benzina in Ontario dal 1960 al 1975
Domanda di benzina in Ontario dal 1960 al 1975
Marco D'Alessandro
 
Modello logistico
Modello logisticoModello logistico
Modello logistico
Marco D'Alessandro
 
Pseudo-R quadro
Pseudo-R quadroPseudo-R quadro
Pseudo-R quadro
Marco D'Alessandro
 
Processi stocastici e serie storiche
Processi stocastici e serie storicheProcessi stocastici e serie storiche
Processi stocastici e serie storiche
Marco D'Alessandro
 
Analisi delle corrispondenze multiple
Analisi delle corrispondenze multipleAnalisi delle corrispondenze multiple
Analisi delle corrispondenze multiple
Marco D'Alessandro
 
Il rischio è dietro l'angolo
Il rischio è dietro l'angoloIl rischio è dietro l'angolo
Il rischio è dietro l'angolo
Marco D'Alessandro
 

More from Marco D'Alessandro (13)

Classificazione automatica per ati ad alta dimensionalità: un approccio fuzzy...
Classificazione automatica per ati ad alta dimensionalità: un approccio fuzzy...Classificazione automatica per ati ad alta dimensionalità: un approccio fuzzy...
Classificazione automatica per ati ad alta dimensionalità: un approccio fuzzy...
 
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
 
La differenza c'è e si vede
La differenza c'è e si vedeLa differenza c'è e si vede
La differenza c'è e si vede
 
Il modello educativo-formativo di Piazza dei Mestieri di Torino
Il modello educativo-formativo di Piazza dei Mestieri di TorinoIl modello educativo-formativo di Piazza dei Mestieri di Torino
Il modello educativo-formativo di Piazza dei Mestieri di Torino
 
Tesina di fine seminario sas ed sql
Tesina di fine seminario sas ed sqlTesina di fine seminario sas ed sql
Tesina di fine seminario sas ed sql
 
La soddisfazione in ambito sportivo.
La soddisfazione in ambito sportivo.La soddisfazione in ambito sportivo.
La soddisfazione in ambito sportivo.
 
Il basket non è solo matematica
Il basket non è solo matematicaIl basket non è solo matematica
Il basket non è solo matematica
 
Domanda di benzina in Ontario dal 1960 al 1975
Domanda di benzina in Ontario dal 1960 al 1975Domanda di benzina in Ontario dal 1960 al 1975
Domanda di benzina in Ontario dal 1960 al 1975
 
Modello logistico
Modello logisticoModello logistico
Modello logistico
 
Pseudo-R quadro
Pseudo-R quadroPseudo-R quadro
Pseudo-R quadro
 
Processi stocastici e serie storiche
Processi stocastici e serie storicheProcessi stocastici e serie storiche
Processi stocastici e serie storiche
 
Analisi delle corrispondenze multiple
Analisi delle corrispondenze multipleAnalisi delle corrispondenze multiple
Analisi delle corrispondenze multiple
 
Il rischio è dietro l'angolo
Il rischio è dietro l'angoloIl rischio è dietro l'angolo
Il rischio è dietro l'angolo
 

Disoccupazione in irlanda

  • 1. La disoccupazione in Irlanda Analisi moderna di una serie storica e successiva verifica di cointegrazione MARCO D’ALESSANDRO Università degli Studi di Napoli Federico II February 15, 2018 Abstract In the first part of this work I will analyze the quarterly time series of Ireland’s unemployment (from 1999 to 2017) by using a modern method, which is the Box- Jenkins’ one, in order to find out the best stochastic process that can be the generator of the analyzed time series. In the second part, instead, I will verify if there is cointegration among some variables, that are the total unemployment itself, the price consumer index, the Gross Domestic Product, the real productivity and the nominal wages. The work has been realized by using the free software Gretl.1 Keywords: Gretl, Ireland, unemployment, time series, cointegration. 1 Introduzione al fenomeno della disoccupazione in Irlanda L’8 dicembre del 2013 l’Irlanda si è ufficialmente sganciata - per prima tra gli Stati debitori - dall’ossigeno del Fondo salva Stati europeo (Efsf), dopo aver beneficiato, dal febbraio 2011, di 17,7 miliardi di euro per uscire dalla crisi, innescata nel settembre del 2008 dalla bolla immobiliare e dai crac bancari. In dirittura d’arrivo, ci sono stati anche gli esborsi finali di 800 milioni di euro di Bruxelles e 600 milioni da parte del Fondo monetario internazionale (Fmi) per risanare le casse statali e ricapitalizzare gli istituti di credito. Poi Dublino è previsto righi dritto almeno fino al 2033, anno in cui il finanziamento europeo ventennale deve essere rimborsato. Dai freddi calcoli, il Paese oggi pare in ripresa: il Prodotto interno lordo (Pil) viaggia a una media del +0,4% e l’economia sembra girare. Ma chi vede davanti a sè tempi floridi si sbaglia: la Tigre celtica è fonte di business solo per le multinazionali straniere, con i loro quartier generali a Dublino per beneficiare del regime fiscale favorevole. Per gli irlandesi è meglio cercarsi un lavoro o un futuro fuori dall’isola, magari nella vicina 1http://gretl.sourceforge.net/ 1
  • 2. Inghilterra o nella ricca Germania. E a invitare ad andarsene è lo stesso Ufficio nazionale del welfare: i disoccupati, avverte il governo, sono e saranno un peso. Un elettricista irlandese rimasto senza clienti per il collasso dell’industria delle costruzioni, è stato invitato a emigrare nel distretto inglese di Coventry, dove le richieste di tecnici sono ancora alte. A un altro senza lavoro, lo Stato suggerisce di fare l’autista di pulmini a Malta, dove lo stipendio (circa 250 euro a settimana) non è altissimo, ma si gode di un bel clima mediterraneo. Ci sarebbe da ridere, se le famiglie non fossero da anni allo stremo: dal 2008, i governi hanno rastrellato 28 miliardi di euro tra tasse e riduzioni alla spesa pubblica, per far fronte ai conti prosciugati e per ripianare i buchi bancari. Nella verde Irlanda, i senza lavoro sono il 13,2% della popolazione: più che in Italia (12,5%), su poco più di 4,5 milioni di abitanti. Al di là delle frasi autocelebrative del governo sul crac sventato ("L’emergenza economica è finita, siamo fuori dal bailout"), le fondamenta dell’economia nazionale sono d’argilla. Il tasso d’indebitamento privato è infatti ancora alto: una quantità sproporzionata di mutui resta in ritardo di pagamento. Per Dublino, la stella polare resta dimezzare il deficit statale sul Pil che, all’8%, è il più alto d’Europa, a fronte di un debito pubblico non indifferente, quasi raddoppiato dal 2010, di oltre 117 milioni di euro sul Pil. Certo, dal profondo rosso del 2010 con il deficit al 32%, l’Irlanda ne ha fatta di strada. Ma i dati dell’indebitamento sono tutt’altro che confortanti, al netto degli altissimi sacrifici pretesi dalla popolazione. In Irlanda, un giovane over 25 su quattro è disoccupato. L’emigrazione è ai livelli record, con oltre 75.800 cittadini che, nel 2012, hanno lasciato il Paese. Con il blocco delle assunzioni pubbliche, in una terra d’emigranti a vocazione prevalentemente turistica e agricola, migliaia di laureati sono dunque rimasti senza prospettive. Non solo: oltre la metà dei medici irlandesi presta ormai servizio all’estero e, nel 2011, l’indice di bambini e gli adolescenti sotto i 17 anni che vivono in uno stato consistente di povertà, è schizzato dal 7,4% al 9,3%. Un dato allarmante, in un quadro ancora fragile di ’ripresa’. Non con- sola quindi la rassicurazione ai disoccupati delle autorità del Welfare, sul mantenimento dei sussidi, in caso di rifiuto a trasferirsi all’estero. Le tutele per ora tengono, domani chissà: l’aria che tira è pessima. In un’isola tradizional- mente accogliente e tollerante con gli stranieri, i governi hanno iniziato a restringere la legge iper-liberista sulla cittadinanza agli immigrati. Nel 2012, in un Paese di per sè poco popoloso, l’Eurostat aveva calcolato il tasso di emigrazione più alto d’Europa, superiore per la prima volta alla Lituania e al Kosovo. Un esodo senza fine. 2 La procedura utilizzata per analizzare la serie: Box-Jenkins L’approccio moderno alle serie storiche si fonda essenzialmente sulla procedura proposta da George Edward Box e Gwilym Jenkins (1976). Essa consiste in un procedimento iterativo che consente di pervenire, a partire dall’osservazione dei dati, alla costruzione 2
  • 3. di un modello ARIMA che fornisce una descrizione adeguata del processo stocastico generatore della serie storica osservata. Si tratta di uno strumento statisticamente efficiente per risalire dalla serie storica al processo stocastico generatore. Box e Jenkins, quindi, hanno cercato di costruire un approccio ai dati per il quale sia la serie storica ad orientare verso il modello e non viceversa. La suddetta procedura si compone di 4 fasi: 1. analisi preliminari: consistono nelle trasformazioni iniziali da apportare alla serie storica perchè possa essere considerata come una parte finita di una realizzazione di un processo Gaussiano stazionario; 2. identificazione del modello ARIMA: consente di individuare il numero e la natura dei parametri da stimare, ed è la fase più delicata e controversa; 3. stima dei parametri: avviene attraverso un pacchetto statistico di notevole comp- lessità computazionale, attraverso il metodo della massima verosimiglianza; 4. verifica del modello stimato: si controlla la qualità statistica del risultato ottenuto sia con test specifici sui parametri che con un controllo generale del modello e l’analisi dei residui da esso stimati. Accanto alle suddette fasi, nel seguente schema iterativo (Figura 1), vengono sottolineati gli strumenti statistici che occorre utilizzare: Figure 1: Fasi della procedura Box-Jenkins 3
  • 4. Quando la verifica del modello non è soddisfacente, il modello deve essere rispecificato per cui le fasi principali possono essere ripetute più volte in maniera iterativa. Inoltre, si acquisiscono, nella fase di verifica, ulteriori informazioni utili ad una successiva identificazione. Quando, invece, il modello risulta soddisfacente si passa alla fase del suo utilizzo per scopi prevalentemente descrittivi e previsivi. Analisi preliminari La serie storica oggetto di analisi riguarda il tasso di disoccupazione totale irlandese, in dati trimestrali, misurato dal secondo trimestre del 1999 al secondo trimestre del 2017, per un totale di 73 osservazioni. I dati sono stati estratti dal sito dell’Eurostat, l’Ufficio Statistico dell’Unione Europea.2 Il grafico della serie storica, senza ancora applicare trasformazione sui dati, è quello proposto in Figura 2. Figure 2: Tasso di disoccupazione totale irlandese in dati trimestrali Una prima attenta analisi del grafico sopra riportato mostra come la serie sia non stazionaria in media, dal momento che i valori non si attestano su un unico valore costante. Non solo: sembra che intorno al 2008 sia successo un qualcosa che abbia profondamente cambiato l’andamento della serie stessa, infatti a partire da questo anno la serie prima mostra un andamento sempre crescente, poi (a partire dal 2012) decresce e sembra tornare al livello precedente.3 Per verificare ciò, si è deciso di applicare 2http://ec.europa.eu/eurostat/ 3L’effetto di questo andamento strano del tasso di disoccupazione è dovuto alla crisi economico- finanziaria che ha attraversato il paese proprio a partire dal settembre del 2008. 4
  • 5. una Intervention Analysis alla serie, volta ad identificare gli eventuali valori anomali e correggerli. Il programma utilizzato per questo scopo è TRAMO, che è possibile utilizzare anche dalla finestra principale di Gretl, in modo molto semplice ed intuitivo. La procedura, effettivamente, identifica due outliers, in particolare un additive outlier, corrispondente al quarto trimestre del 2006 (osservazione 31), ed un innovation outlier, corrispondente al primo trimestre del 2009 (osservazione 40).4 Non è difficile capire il motivo per il quale `siano stati identificati dei valori così strani: siamo nel periodo a cavallo della crisi economico-finanziaria che ha colpito l’intera Europa, e l’Irlanda, come già accennato, ne ha risentito in maniera abbastanza forte. Inoltre, la procedura consente di salvare la serie linearizzata, nella quale sono stati corretti gli outliers identificati. Confrontiamola con la serie originale: Figure 3: In rosso la serie originale, in blu la serie linearizzata. Come si evince dal grafico, le due serie seguono lo stesso percorso fino al 2006 (si sovrappongono). Poi, proprio a partire da questo periodo la serie linearizzata segue perlopiù un percorso totalmente diverso rispetto alla serie originale, assumendo valori quasi sempre minori rispetto a quest’ultima (in particolare, a partire dal 2009). Inoltre, non è comunque ancora verificata la stazionarietà in media, e ciò lo conferma anche un primo test ADF effettuato sulla serie linearizzata, il cui responso è il seguente: 4Un additive outlier è un "disturbo" che riguarda solo un’osservazione, che può essere sia più piccola che più grande in valore rispetto al valore atteso nei dati: dopo questo disturbo, la serie ritorna al suo percorso naturale come se nulla fosse accaduto. Un innovation outlier, invece, è molto più difficile da riscontrare nelle serie economiche, e si ha quando uno shock iniziale si propaga nelle successive osservazioni con i pesi di una rappresentazione MA di un processo ARIMA: riguarda, quindi, più osservazioni. 5
  • 6. Test con costante inclusi 4 ritardi di (1-L)Ireland_linearizzata Modello: (1-L)y = b0 + (a-1)*y(-1) + ... + e Valore stimato di (a - 1): -0,0546531 Statistica test: tau_c(1) = -2,4509 p-value asintotico 0,1279 Coefficiente di autocorrelazione del prim’ordine per e: 0,132 differenze ritardate: F(4, 62) = 10,801 [0,0000] Con costante e trend inclusi 4 ritardi di (1-L)Ireland_linearizzata Modello: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e Valore stimato di (a - 1): -0,0491193 Statistica test: tau_ct(1) = -2,16515 p-value asintotico 0,5086 Coefficiente di autocorrelazione del prim’ordine per e: 0,132 differenze ritardate: F(4, 61) = 8,971 [0,0000] Il test è stato performato su 68 osservazioni, includendo sia la costante che la costante ed il trend, l’ordine dei ritardi pari ad 11, ed il BIC come criterio da minimizzare scelto. Dai risultati è abbastanza chiaro che in entrambi i casi proposti non viene rifiutata l’ipotesi nulla di non stazionarietà della serie, dunque occorre procedere ad alcune trasformazioni per renderla una realizzazione di un processo stazionario. Ulteriori informazioni su eventuali componenti presenti all’interno della serie, si possono evidenziare attraverso prima il grafico della funzione di autocorrelazione globale poi il grafico di quella parziale, avendo impostato il numero di ritardi a 15. Il grafico dell’ACF (Figura 4) permette di investigare alcune caratteristiche della serie oggetto di studio: Figure 4: ACF campionaria della serie storica linearizzata 6
  • 7. • i valori della funzione di autocorrelazione decrescono in modo non proprio lento all’aumentare dei lags, segnalando una serie dove c’è molta persistenza nel breve periodo e poca nel lungo periodo. Al decimo lag, il valore della correlazione è già dentro le bande di confidenza, costruite al 95% e pari a ± 2√ 73 = ±0, 23; • a partire dal decimo lag, i valori della funzione di autocorrelazione rientrano tutti all’interno delle bande di confidenza, anche se nel passaggio dai lags 12 a 13, la correlazione cambia segno ed inizia ad aumentare (ritorno di memoria); • la decrescita dei valori segnala, inoltre, la presenza di un trend all’interno dei dati (la stagionalità è assente, come è assente ache la componente ciclica), e la non stazionarietà della serie in media. Il grafico della PACF (Figura 5), invece, mette in evidenza altre caratteristiche della serie: Figure 5: PACF campionaria della serie storica linearizzata • la funzione di autocorrelazione parziale si interrompe dopo il lag 1; • oltre al primo ritardo, l’unica altra correlazione significativamente diversa da 0 è quella al lag 5 (4 ritardi dopo). Sembra comunque assente la componente stagionale anche in questo caso. Per rendere la serie stazionaria in media, l’operazione più intuitiva è quella di appli- care l’operatore differenza di ordine d d, regolare e/o stagionale, valido anche per eliminare una componente trend il cui polinomio è di grado d e/o anche una eventuale componente stagionale. La scelta sulla migliore combinazione di differenze da appicare alla serie linearizzata è quella per cui è minimo lo scarto quadratico medio della serie: Applicando la differenza prima: Scarto quadratico medio 0,40199 Applicando la differenza stagionale: Scarto quadratico medio 1,0960 Applicando entrambe: Scarto quadratico medio 0,38107 7
  • 8. Nel passare dall’applicazione di una sola differenza prima all’applicazione di entrambe le differenze, il decremento di scarto quadratico medio è bassissimo. Si potrebbe, dunque, optare solamente per la prima soluzione. Tuttavia, effettuando nuovamente un test ADF su entrambe le serie trasformate, risulta che è proprio la differenza stagionale a rendere stazionaria la serie, come mostra la Tabella 1: Nucleo deterministico Differenza prima Differenza prima e stagionale Costante P-value asintotico P-value asintotico 0,1865 0.0000004169 Statistica-test Statistica-test -2,25654 -5,32712 Costante + trend P-value asintotico P-value asintotico 0,2654 0,000003893 Statistica-test Statistica-test -2,63301 -5,32915 Table 1: Test ADF condotto su entrambe le serie La combinazione di differenze che minimizza lo scarto quadratico medio della serie è, dunque, data dall’applicazione una differenza prima ed una differenza stagionale. Il grafico della serie differenziata è riportato in Figura 5. Figure 6: Serie linearizzata differenziata Come si evince dal grafico, la serie stavolta è stazionaria in media, in quanto oscilla 8
  • 9. sempre intorno ad un unico valore, che è proprio vicino allo 0. Inoltre, non c’è stato bisogno di applicare una trasformazione logaritmica ai dati, per cui si ritiene la serie anche stazionaria in varianza. Entrambe le differenziazioni, però, hanno portato alla perdita delle prime e delle ultime osservazioni della serie iniziale. Identificazione degli ordini del modello ARIMA Una volta resa stazionaria la serie, la fase successiva consiste nell’identificazione degli ordini p, d, q del modello ARIMA che si vuole costruire. Il punto di partenza, anche in questo caso, è rappresentato dai grafici ACF e PACF della serie differenziata. Il primo (Figura 7) segnala la presenza di alcune correlazioni significative ai lag 1,2 e 4 (il primo ritardo stagionale) facendo sembrare presente una componente stagionale, che però si interrompe subito. Figure 7: ACF della serie differenziata Il secondo grafico (Figura 8), invece, è molto simile al primo, e segnala, comunque, delle correlazioni significative ai lags 1 e 4 (il primo ritardo stagionale). Anche qui, la componente stagionale si interrompe dopo il primo ritardo stagionale. Figure 8: PACF della serie differenziata 9
  • 10. Il modello ARIMA che, dunque, si proverà a stimare a partire dalla serie storica lin- earizzata, e che potrebbe esemplificare il processo generatore della serie, è del tipo ARIMA(1, 1, 0)(0, 1, 1)s di cui si riporta di seguito l’equazione caratteristica: (1 − φ1B) 4Xt = µ + (1 − Θ1B4) t (1) dove a sinistra sono presenti la componente AR regolare e le due differenze, ed a destra è presente, invece, la componente MA stagionale. Stima dei parametri La stima dei parametri del modello sopra proposto è ottenuta attraverso il metodo della massima verosimiglianza condizionale5, ed è riportata nei seguenti risultati, ognuno dei quali evidenzia una specifica informazione ed è appositamente commentato: Valutazioni della funzione: 26 Valutazioni del gradiente: 13 Modello 1: ARIMA, usando le osservazioni 2000:4-2017:2 (T = 67) Stimato usando il metodo BHHH (MV condizionale) Variabile dipendente: (1-L)(1-Ls) Ireland_linearizzata coefficiente errore std. z p-value ---------------------------------------------------------- const -0,00204610 0,0164561 -0,1243 0,9010 phi_1 0,524079 0,106786 4,908 9,21e-07 *** Theta_1 -0,617419 0,102776 -6,007 1,88e-09 *** Le stime ottenute attraverso il metodo scelto6 sono tutte minori di 1 e statisticamente significative al 5%, ad eccezione della costante: i coefficienti sono superiori di 2 volte ai loro errori standard (il valore dell’errore standard è quasi uguale per entrambi i coefficienti φ1 e Θ1 e sembra anche abbastanza piccolo), ed i valori della z sono superiori a ±1, 96 (quantili di una v.c. Normale standardizzata). Media var. dipendente 0,007986 SQM var. dipendente 0,383778 Media innovazioni 0,011591 SQM innovazioni 0,304230 Log-verosimiglianza -15,34081 Criterio di Akaike 38,68161 Criterio di Schwarz 47,50038 Hannan-Quinn 42,17122 Note: SQM = scarto quadratico medio; E.S. = errore standard 5In questo caso, la funzione di verosimiglianza che si usa considera le prime p osservazioni come fisse, e quindi fa riferimento alla distribuzione di yp+1...yt 6L’algoritmo BHHH è un algoritmo di ottimizzazione numerica che ha il vantaggio di garantire la convergenza della procedura iterativa, se sono verificate determinate condizioni di regolarità. 10
  • 11. La media della variabile dipendente è pari a 0,007986. Lo scarto quadratico medio dei residui è inferiore rispetto allo scarto quadratico medio della variabile dipendente.7 Il valore della funzione di log-verosimiglianza è negativo e pari a -15,34081. Inoltre, sostituendo le stime ottenute all’interno dell’equazione (1) è possibile ottenere la seguente equazione in B: (1 − 0, 524079B) 4Xt = µ + (1 + 0, 617419B4) t (2) Ricordando che = 1 − B, e che s = 1 − Bs si può risolvere l’equazione precedente rispetto a B, e si ottengono i seguenti valori: Reale Immaginario Modulo Frequenza ----------------------------------------------------------- AR Radice 1 1,9081 0,0000 1,9081 0,0000 MA (stagionale) Radice 1 1,6196 0,0000 1,6196 0,0000 ----------------------------------------------------------- Le radici dei polinomi caratteristici sono entrambe maggiori di 1 in modulo, quindi è possibile affermare che il processo generatore della serie storica oggetto di studio è stazionario (1, 9081 > 1, per la parte AR) ed invertibile (1, 6196 > 1, per la parte MA). È completamente assente la parte immaginaria nelle radici, e ciò era già possibile notarlo dal grafico dell’ACF della serie, in quanto manca la componente ciclica. Una elevata correlazione delle stime, derivabile dalla normalizzazione della matrice di varianza e covarianza dei parametri stimati (Tabella 2), può essere indice di malspeci- ficazione del modello, perchè evidenzia un legame lineare tra i parametri e quindi la necessità di una semplificazione, anche quando tutti i parametri risultassero significativi. costante φ1 Θ1 costante 0,0000270802 -0,0000589026 0,000000128964 φ1 0,0114032 0,0000917312 Θ1 0,0105629 Table 2: Matrice di covarianza dei coefficienti In questo caso, i valori della covarianza tra i parametri sono molto bassi (addirittura prossimi allo 0), quindi non si può concludere per una relazione lineare tra i parametri µ, φ1 e Θ1 precedentemente stimati. 7Non ha alcun senso il confronto tra la varianza dei residui (che costituisce la stima di una quantità finita σ2 per un processo stazionario) e la varianza della serie originaria se questa non è stazionaria (poichè tale varianza è connessa solo ai dati campionari, essendo infinita la varianza di un processo non stazionario). 11
  • 12. Verifica del modello Per concludere lo studio della serie storica in oggetto, bisogna controllare se il modello precedentemente stimato è in grado di descrivere al meglio le caratteristiche di un processo stocastico Gaussiano e stazionario. La procedura base è quella dell’analisi dei residui del modello, poichè consente di verificare effettivamente la qualità delle operazioni effettuate per giungere al modello scelto. In primo luogo si analizza il correlogramma dei residui del modello (Figure 9 e 10). Un modello che riesce a cogliere le dipendenze della serie storica presenterà una ACF ed una PACF contenute nelle rispettive regioni di confidenza, ossia delle funzioni che saranno non significativamente diverse da 0 in corrispondenza di ogni ritardo. Dal primo grafico (Figura 9), effettivamente, risulta confermata questa teoria, essendo tutte le correlazioni comprese all’interno delle bande di confidenza. Figure 9: ACF dei residui del modello Stesso risultato vale anche per il secondo grafico (Figura 10): tutte le correlazioni sono comprese all’interno delle bande di confidenza. Figure 10: PACF dei residui del modello 12
  • 13. Ad avvalorare ancora di più la teoria di cui sopra ed i risultati dei grafici proposti è il test di Ljung-Box per l’autocorrelazione dei residui fino all’ordine 4: Ljung-Box Q’ = 5,1356, con p-value = P(Chi-quadro(2) > 5,1356) = 0,07670 Il p-value è superiore al livello di significatività del 5%, quindi si può non rifiutare l’ipotesi nulla di assenza di autocorrelazione nei residui. Viene proposto di seguito il grafico dei residui rispetto al tempo (Figura 11), utile ad evidenziare eventuali andamenti inerziali, ciclici, valori anomali, bruschi cambiamenti di livello, ecc.: essi, fortunatamente, sono stazionari (è stato eseguito nuovamente un test ADF per verificarlo, di cui però non sono stati riportati i risultati) e sembrano avere anche varianza costante. Figure 11: Serie storica dei residui Infine, vengono qui proposti 2 grafici che dimostrano la Normalità dei residui stessi e dai quali si possono trarre indicazioni su valori anomali, simmetria della distribuzione, plurimodalità, ecc.: l’istogramma (Figura 13) ed il Q-Q plot (Figura 14). Figure 12: Istogramma dei residui del modello 13
  • 14. Dall’istogramma è possibile dedurre la Normalità dei residui, confermata anche dall’apposito test riportato nella figura: dal momento che il p-value è largamente superiore alla soglia del 5% non viene rifiutata l’ipotesi nulla di Normalità della distribuzione. Figure 13: Q-Q plot dei residui Anche il Q-Q plot conferma la stessa cosa, in quanto i residui si distribuiscono tutti sulla retta y = x, bisettrice del piano cartesiano, e quelli nelle code non si allontanano di molto. L’ultimo controllo da effettuare per poter accettare ed utilizzare il modello è valutare la sua capacità previsiva, attraverso il grafico che confronta i valori effettivi ed i valori stimati dal modello, riportato in Figura 14. Figure 14: In rosso i valori effettivi, in blu i valori stimati. 14
  • 15. Effettivamente, le stime ottenute non si discostano troppo dalle osservazioni iniziali, infatti, si può osservare come siano in accordo con i dati osservati. 3 Analisi di cointegrazione La seconda parte del seguente elaborato si occupa della verifica di cointegrazione8 tra un insieme di variabili. Con questo tipo di analisi è possibile stabilire un legame lineare stazionario tra processi stocastici non stazionari, di modo da individuare una relazione stabile nel tempo tra variabili che prese singolarmente non sono stabili. In particolare, si parla di serie integrate di un certo ordine p, in cui p rappresenta il numero di differenze necessarie a rendere stazionaria una serie. Le variabili a disposizione sono: • la serie mensile dell’indice dei prezzi al consumo armonizzato a livello europeo (HICP) dal gennaio del 1996 al novembre del 2017; • la serie trimestrale dei salari nominali per addetto, con valori in euro, dal primo trimestre del 1995 al terzo trimestre del 2017; • la serie trimestrale non destagionalizzata del Prodotto Interno Lordo (PIL), dal primo trimestre del 1995 al terzo trimestre del 2017; • la serie trimestrale del tasso di disoccupazione totale, dal secondo trimestre del 1999 al secondo trimestre del 2017 (già analizzata nella prima parte dell’elaborato); • la serie trimestrale non destagionalizzata della produttività reale per ora lavorata, dal primo trimetre del 1995 al terzo trimestre del 2017. A partire da queste variabili, dopo averle trasformate in modo adeguato, si procederà alla verifica di cointegrazione tra le seguenti variabili: i salari, l’inflazione come tasso di variazione dell’indice dei prezzi, la produttività, la disoccupazione e l’output gap9 come stima della componente ciclo-trend del PIL. Trattamenti preliminari dei dati Chi avrà letto bene le precedenti righe, si sarà accorto che non tutte le variabili indicate hanno una frequenza uguale. In particolare, la variabile HICP presenta cadenza mensile e le altre cadenza trimestrale. La prima operazione che è stata eseguita, dunque, è stata 8In pratica, si ha cointegrazione nel caso in cui due o più serie temporali con trend stocastici si muovono congiuntamente in modo simile nel lungo periodo, tanto che sembrano possedere lo stesso trend. La definizione è dovuta all’econometrico C.W.J. Granger che per tale ricerca è stato insignito, insieme a R.F. Engle, del premio Nobel per l’economia nel 2003. 9In economia, l’output gap è la differenza tra il prodotto interno lordo effettivo E e quello potenziale P. Una distanza molto piccola tra prodotto interno lordo effettivo e potenziale indica che le risorse economiche sono utilizzate efficacemente. Al contrario, una distanza più grande indica che le risorse non sono utilizzate correttamente, oppure che sono sfruttate oltre le loro capacità. 15
  • 16. quella di calcolare (in Excel), per la variabile indicata, una media per trimestri, in modo tale da conformare la propria frequenza a quella delle altre. In secondo luogo, ci si sarà resi conto che i dati a disposizione non ricoprono tutti lo stesso lasso temporale: ci sono serie più corte, come quella della disoccupazione, e serie più lunghe, come quella della produttività e dei salari. Ecco perchè si è deciso di prendere come punto di riferimento la serie più corta, in modo tale da avere gli stessi dati a disposizione. Tutte le serie storiche oggetto di studio, dunque, partiranno dal secondo trimestre del 1999 e finiranno nel secondo trimestre del 2017. Un ulteriore problema da risolvere prima di poter iniziare con la procedura è quello relativo all’unità di misura delle variabili a disposizione. Molte di queste, infatti, pre- sentano un livello di misurazione nettamente diverso rispetto alle altre. Per riportare tutte le variabili sullo stesso livello, si è deciso, allora, di utilizzare la trasformazione logaritmica. Di questa trasformazione se ne terrà poi conto in seguito. Si ritiene, infine, opportuno correggere gli eventuali valori anomali presenti in ciascuna serie storica, in odo tale da non tener conto di termini di "disturbo" dovuti ad eventi ver- ificatisi in quegli anni. L’operazione è stata svolta, ancora una volta, con il programma TRAMO, come già visto per l’analisi della serie della disoccupazione. Va tenuto conto del fatto che la maggior parte dei valori anomali riscontrati nelle serie osservate si è presentata nel periodo della crisi in Irlanda (2008-2009). Stima della componente ciclo-trend del PIL Dal momento che alcune delle variabili utilizzate per la verifica di cointegrazione devono essere ricavate dalle variabili di partenza, è necessario prima di tutto procedere alle trasformazioni di queste ultime. In primis, si è deciso di stimare la componente ciclo- trend della serie del PIL (che poi sarà utilizzata come output gap in sede di verifica). La procedura di estrazione della componente è avvenuta attraverso il comodo programma X12-ARIMA, anch’esso utilizzabile dalla finestra principale di Gretl in modo semplice. Si riporta, di seguito, il grafico della componente stimata (Figura 16): 16
  • 17. Figure 15: Stima della componente ciclo-trend del PIL La stima della componente ciclo-trend presenta valori nettamente crescenti nel tempo, ed è avvenuta correggendo la serie per la stagionalità, quindi non c’è bisogno di desta- gionalizzare la serie del PIL. Destagionalizzazione delle serie Dovendo effettuare una verifica di cointegrazione, è preferibile destagionalizzare le serie storiche, in modo da non tener conto di questa componente di "disturbo". La procedura, anche questa volta, viene eseguita con X12-ARIMA su ciascuna delle serie di interesse. Tale procedura esegue utili verifiche di ipotesi per l’identificazione della stagionalità, sia evolutiva che stabile. Per una questione di brevità, per ciascuna serie, verranno riportati solamente gli output relativi alle 3 statistiche test che più interessano nell’analisi. La prima, M7, rappresenta la quota di stagionalità evolutiva rispetto alla quota di stagionalità stabile. La seconda, FS, rappresenta, invece, il p-value del test di Kruskal- Wallis per la stagionalità stabile. La terza, FM, rappresenta infine il p-value del test F per la stagionalità stabile. Esse devono essere, rispettivamente, minore di 1 e rifiutare entrambe le ipotesi, per confermare la presenza di una stagionalità da correggere. Le statistiche sono riportate nella seguente tabella (Tabella 3), variabile per variabile: 17
  • 18. M7 FS FM HICP 0,327 0,00% 0,00% Salari 3,000 60,68% 88,39% Disoccupazione 0,343 0,00% 0.00% Produttività 0,740 0,01% 0.03% Table 3: Statistiche-test per la presenza di stagionalità Dalla tabella risulta evidente che l’unica serie che non presenta stagionalità identificabile è quella dei salari, in quanto è l’unica per la quale si verifica che l’M7 è maggiore di 1, ed i due test sulla stagionalità abbondantemente rifiutano entrambi l’ipotesi nulla. Pertanto, questa sarà l’unica serie a non essere destagionalizzata. Nella Figura 17, inoltre, sono riportate le 5 serie storiche dopo tutti i trattamenti di cui si è discusso fino ad ora. Figure 16: Le 5 serie storiche dopo le operazioni preliminari Dal grafico, risulta evidente la presenza di una o più relazioni di cointegrazione tra le variabili osservate. Questa, tuttavia, va verificata attraverso gli opportuni test. Scelta dei ritardi del VAR Un sistema VECM è, in fin dei conti, una trasformazione di un processo multivariato (VAR): esso consente al ricercatore di includere una rappresentazione delle relazioni economiche di equilibrio entro una specificazione di serie storica relativamente ricca. Per questo motivo, è necessario stimare l’ordine del processo multivariato che è alla base 18
  • 19. dei nostri dati. Tale informazione sarà fondamentale durante la stima del VECM. La stima dell’ordine dei ritardi del processo VAR che meglio approssima i dati a dispo- sizione, mette in relazione tutti i modelli dal ritardo 1 al massimo ritardo p selezionato, eseguendo sia un test sul rapporto di verosimiglianza, sia mostrando un insieme di criteri di informazione del modello. È con questi strumenti che sarà scelto il ritardo più adatto. Inoltre, la procedura sottrae al campione p osservazioni, in modo da far girare tutte le stime con lo stesso set. Si eseguirà la procedura con ritardo massimo pari a 8.10 Si riporta, di seguito, l’output finale di Gretl relativo alla scelta del ritardo. Sistema VAR, ordine massimo ritardi 8 Gli asterischi indicano i valori migliori (ossia minimizzati) dei rispettivi criteri di informazione, AIC = criterio di Akaike, BIC = criterio bayesiano di Schwartz e HQC = criterio di Hannan-Quinn. ritardi logver p(LR) AIC BIC HQC 1 1087,56125 -32,540346 -31,536783 -32,144376 2 1229,31065 0,00000 -36,132635 -34,292769 -35,406690 3 1289,30455 0,00000 -37,209371 -34,533202* -36,153451* 4 1314,80287 0,00160 -37,224704 -33,712232 -35,838808 5 1347,33416 0,00002 -37,456436 -33,107661 -35,740565 6 1375,45561 0,00034 -37,552480 -32,367403 -35,506635 7 1409,26318 0,00001 -37,823483 -31,802102 -35,447662 8 1447,71110 0,00000 -38,237265* -31,379582 -35,531469 In base a questi risultati, il BIC e l’HQC tendono a scegliere il modello più parsimonioso ed addirittura lo stesso ordine di ritardo (3), mentre l’AIC tende a scegliere un ordine (8) tale per cui il modello risulta meno parsimonioso rispetto agli altri due criteri: si ritiene, dunque, che un VAR(3) sia una rappresentazione adeguata dei dati a disposizione. La formulazione algebrica del VAR(3) scelto è la seguente: yt = A1yt−1 + A2yt−2 + A3yt−3 + t (3) dove yt è il processo stocastico multivariato penta-dimensionale, A1, A2 ed A3 sono matrici di dimensioni 5x5, ed yt−1, yt−2, yt−3, t sono vettori di dimensioni 5x1. Non si stima però il VAR completo, poichè si procederà prima alla verifica della cointe- grazione tra le variabili. Questa scelta sarà spiegata successivamente. 10Allin Cottrell, Riccardo "Jack" Lucchetti, Cristian Rigamonti (2017) Gretl User’s Guide. 19
  • 20. Test del rango di cointegrazione L’ipotesi di cointegrazione tra le serie osservate prevede che esistano una o più combi- nazioni lineari di processi non stazionari che risulti stazionaria. In formule, si ha: zt = β yt (4) dove zt rappresenta la combinazione lineare stazionaria, β è il cosiddetto vettore di coin- tegrazione (in alcuni casi, si potrebbe chiamare anche una matrice di cointegrazione) da stimare, ed yt è un qualsiasi processo stocastico multivariato non stazionario. La procedura di Johansen, valida per questo tipo di studio, testerà (omonimo test di Johansen) e stimerà il rango della matrice di cointegrazione, ed il caso più interessante, come ci si può attendere, è quello dove il rango di cointegrazione è compreso tra 0 ed il massimo: solo in tal caso è possibile affermare che c’è cointegrazione tra le variabili oggetto di studio. La stessa procedura consente, inoltre, di stimare il VECM che rapp- resenta sia la combinazione lineare stazionaria delle variabili, sia la velocità con cui le serie ritornano all’andamento di lungo periodo dopo una divergenza di breve periodo. La procedura funzione nel seguente modo: il test prima di tutto ordina in senso decres- cente tutti gli autovalori di una matrice ˆM, la quale è una stima della vera matrice di lungo periodo M, e ne contiene i medesimi autovalori. Fatto questo, vengono effettuate due verifiche di ipotesi. La prima sui singoli autovalori (λ-max) e l’altra aggregata (Trace test); essi hanno come ipotesi nulla che il rango di cointegrazione sia minore o al massimo uguale rispetto al i-esimo autovalore. Per selezionare un rango adeguato, si deve ottenere un’accettazione dell’ipotesi nulla, quindi un p-value alto. Si preferisce ricorrere a questa procedura piuttosto che al test di Engle-Granger, poichè la prima rappresenta una sorta di evoluzione del secondo metodo. Essa, infatti, non presenta molti dei difetti che sono tipici dell’altro test, ed è più adatta ad una situazione in cui c’è la presenza di più di una relazione di cointegrazione. Si riporta, di seguito, la parte rilevante dell’output di Gretl relativo al test effettuato. Test di Johansen: Numero di equazioni = 5 Ordine dei ritardi = 3 Rango Autovalore Test traccia p-value Test Lmax p-value 0 0,57663 121,13 [0,0000] 60,165 [0,0000] 1 0,37535 60,967 [0,0015] 32,939 [0,0070] 2 0,24426 28,028 [0,0802] 19,604 [0,0808] 3 0,10413 8,4233 [0,4285] 7,6970 [0,4191] 4 0,010322 0,72632 [0,3941] 0,72632 [0,3941] Corretto per ampiezza campionaria (df = 54) Rango Test traccia p-value 20
  • 21. 0 121,13 [0,0000] 1 60,967 [0,0031] 2 28,028 [0,0977] 3 8,4233 [0,4460] 4 0,72632 [0,4058] Il primo test porta al non rifiuto dell’ipotesi nulla a partire da un rango di cointegrazione pari a 2. Stesso risultato (con annesso p-value quasi coincidente) mostra il secondo test. Dati, dunque, i risultati di questi test, si potrebbe ipotizzare un rango 2 di cointegrazione (la presenza cioè di 2 relazioni di cointegrazione). Stima del modello VECM Una volta scelto il numero delle relazioni di cointegrazione, e quindi stimato il rango della matrice di cointegrazione, si procede con la rappresentazione VECM delle variabili, intesa anche come la serie storica delle deviazioni dalle relazioni di cointegrazione. Nel farlo si utilizzeranno le stime dell’ordine dei ritardi della rappresentazione VAR insieme alle stime sul rango della matrice ˆM. La formula generale di un VECM (in forma vettoriale) è: ∆yt = Πyt−1 + p ∑ k=1 Γi∆yt−i + ut = αβ yt−1 + p ∑ k=1 Γi∆yt−i + ut (5) dove α è la matrice dei loadings, perchè il suo elemento generico ij ci dice qual è l’effetto sulla i-esima variabile del j-esimo elemento di z, e β è la matrice dei coefficienti delle combinazioni lineari stazionarie delle variabili, come già preannunciato. Per l’analisi dimensionale, si tenga presente che le righe di β sono pari al rango r di cointegrazione. Si procede ora alla stima del modello VECM, e si riporta l’output principale di Gretl. Sistema VECM, ordine ritardi 3 Caso 3: costante non vincolata beta (vettori di cointegrazione, errori standard tra parentesi) Salari 1,0000 0,0000 (0,0000) (0,0000) output_gap 0,0000 1,0000 (0,0000) (0,0000) Disoccupazione 1,9905 0,49074 (0,31651) (0,053139) Produzione 17,049 1,8583 (3,3480) (0,56209) HICP -51,200 -7,8941 (7,0563) (1,1847) 21
  • 22. I vettori di cointegrazione sono presentati in forma triangolare (rappresentazione di Phillips), ossia facendo in modo che le prime r righe, corrispondenti al rango della matrice di cointegrazione, possano formare una matrice identità. Inoltre, moltiplicando la stimata matrice di cointegrazione β (di dimensioni 5x2) con il vettore penta-dimensionale yt si ottiene una stima delle combinazioni lineari stazionarie: 1 0 1, 9905 17, 049 −51, 2 0 1 0, 49074 1, 8583 −7, 894        w logp pr u out        = w + 1, 9905pr + 17, 049u − 51, 2out logp + 0, 49074pr + 1, 8583u − 7, 89out dove la prima combinazione ˆz1t riguarda le variabili salari, produttività, disoccupazione e output gap, mentre la seconda combinazione ˆz2t riguarda, invece, indice dei prezzi, produttività, disoccupazione e output gap. Di seguito, inoltre, sono riportate le stime dei loadings, cioè degli elementi della matrice α di cui si è discusso poco fa: alpha (vettori di aggiustamento) Salari -0,0048589 0,028617 output_gap 0,0071131 -0,034100 Disoccupazione 0,14949 -1,0791 Produzione -0,075892 0,55291 HICP 0,021972 -0,12257 Dai risultati, si evince come le variabili salari e produzione abbiano un effetto negativo sulla prima combinazione lineare; mentre le variabili output gap, disoccupazione (il valore più alto in assoluto) e HICP sulla seconda combinazione lineare. Infine, si riportano i valori dei criteri di informazione (i soliti 3: AIC, BIC e HQC), il valore della funzione di log-verosimiglianza ed una misura sintetica delle caratteristiche della matrice di covarianza tra i coefficienti: Log-verosimiglianza = 1359,9369 Determinante della matrice di covarianza = 9,1826635e-024 AIC = -36,5696 BIC = -33,9999 HQC = -35,5489 Si riporta inoltre il grafico delle radici inverse del VAR associato a questo VECM. 22
  • 23. Figure 17: Grafico delle radici inverse del VAR Come si vede, una delle radici giace proprio sulla circonferenza di raggio unitario. Ciò è sintomo di VAR non stazionario, come ci si attendeva. Analisi di alcune funzioni di impulso-risposta A questo punto, si può procedere all’analisi di alcune delle 25 funzioni di impulso- risposta ricavabili da un processo VAR con 5 variabili. Le funzioni impulso risposta di un sistema VAR(p) stazionario sono i coefficienti della rappresentazione di WOLD MA(∞). Un sistema VECM però non possiede rappresentazioni MA (∞) valide, dato che la serie dei coefficienti diverge all’aumentare di t. Nonostante questo, un numero limitato di matrici può essere computato da Gretl (e quindi la funzione è visualizzabile fino ad un certo lag). Il significato delle IRF è quindi il medesimo: φjk,i, elemento della matrice Φ, è la risposta della variabile j ad uno shock unitario dell’errore di previsione (u) della variabile k, i periodi fa. Nei modelli stazionari la IRF va verso 0 all’aumentare di i. Ne viene riportata, prima di tutto, la rappresentazione grafica in forma matriciale, utile per formulare considerazioni immediate ed intuitive (Figura 19). 23
  • 24. Figure 18: Alcune funzioni di impulso-risposta 24
  • 25. Sulla sinistra sono presenti le funzioni di impulso-risposta delle variabili output gap, salari e disoccupazione, ed in che modo queste rispondono ad uno shock sulle stesse variabili, fino ad un massimo di 20 lags. Nel caso specifico, si ha che: • uno shock dell’output gap produce un effetto di lungo periodo positivo sull’output gap stesso, e la funzione assume un andamento che non è mai decrescente; • uno shock della produttività produce un effetto di lungo periodo positivo sulla produttività stessa, e la funzione assume prima un andamento decrescente (per i primi 2 trimestri), poi cambia decisamente andamento, stabilizzandosi su un valore compreso tra 0,006 e 0,007 (a partire dall’undicesimo trimestre); • uno shock dei salari produce un effetto di lungo periodo positivo sui salari stessi, e la funzione ha un andamento di tipo esponenziale. Sulla destra, invece, sono presenti le funzioni di impulso-risposta delle variabili salari, disoccupazione e produttività e come queste rispondono, rispettivamente, ad uno shock sulla produttività e sull’output gap (le ultime due). Qui, si può dire che: • uno shock della produzione produce un effetto di lungo periodo negativo sull’output gap, e la funzione assume un andamento che è sempre decrescente, partendo da un valore iniziale pari a 0; • uno shock dell’output gap produce un effetto di lungo periodo ancora negativo sulla disoccupazione, e la funzione assume prima un andamento decrescente (fino al decimo trimestre, e non di tipo esponenziale), poi cambia decisamente andamento, stabilizzandosi intorno a -0,06 (a partire dall’undicesimo trimestre); • ancora uno shock dell’output gap produce un effetto di lungo periodo questa volta positivo sulla produttività, e la funzione ha un andamento prima crescente (per i primi 2 trimestri), poi sembra stabilizzarsi con il passare del tempo, anche se in maniera non uniforme. Si può quindi notare come in un sistema integrato la funzione non decada necessaria- mente verso lo 0, nonostante converga ad un valore finito diverso da 0. Ciò testimonia la non stazionarietà del sistema in esame, e i possibili effetti permanenti degli shock. Verifica delle restrizioni Le restrizioni sui modelli VECM sono possibili sugli elementi della matrice dei loadings e sulla matrice delle combinazioni lineari. Su Gretl non sono supportate le cosiddette "cross restrictions": vincoli che legano un elemento di α in modo diretto ad un elemento di β. Le restrizioni sono date nella forma: ∆wt = b1πt−1 − b2(w − pr − p − b3u)t−1 πt = b3∆wt−1 − b4(p − b5(w − pr))t−1 25
  • 26. Questa scrittura va letta come una espressione del tipo: ∆yt = αzt−1 + p ∑ k=1 Γi∆yt−i + t (6) Possiamo allora riscrivere i vincoli in forma "VECM": ∆ w logp t = −b2 0 0 −b4 1 −1 −1 −b3 0 −b5 1 b5 0 0        w logp pr u out        t−1 + 0 b1 b3 0 ∆ w logp t−1 Per quello che concerne la notazione, si è scritto log p per sottolineare che, operando la trasformazione logaritmica sulla variabile HICP, si può riscrivere la variabile π come ∆p. Resta pacifico che tutte le altre variabili sono pari al loro logaritmo. Come si nota, leggendo il vincolo in questa forma è possibile ritrovare dei vincoli su alcuni coefficienti della matrice dei loadings, e sui vettori di cointegrazione. Si procede quindi a imporre le restrizioni tramite Gretl, e si riporta il test del rapporto di verosimiglianza risultante. I vincoli imposti saranno gli unici che possiamo imporre, quindi su α e β. Insieme di vincoli 1: b[1,1] = 0 2: b[1,2] = -1 3: b[1,3] = -1 4: b[1,5] = 0 5: b[2,3] + b[2,1] = 0 6: b[2,2] = 1 7: b[2,4] = 0 8: b[2,5] = 0 9: a[1,2] = 0 10: a[2,1] = 0 Rango dello Jacobiano = 10, numero di parametri liberi = 10 Il modello risulta pienamente identificato Basato sullo Jacobiano, df = 6 Algoritmo di switching: 3738 iterazioni -(T/2)log|Omega| = 1828,9974, lldiff = 4,99165e-005 Convergenza debole *** warning: large number of iterations may indicate a problem Log-verosimiglianza non vincolata (lu) = 1359,9369 Log-verosimiglianza vincolata (lr) = 1332,3689 2 * (lu - lr) = 55,1359 26
  • 27. P(Chi-quadro(6) > 55,1359) = 4,35161e-010 Vettori di cointegrazione (errori standard tra parentesi) Salari 0,0000 -0,17154 (0,0000) (0,0058418) output_gap -1,0000 1,0000 (0,0000) (0,0000) Disoccupazione -1,0000 0,17154 (0,0000) (0,0058418) Produzione -789,46 0,0000 (51,097) (0,0000) HICP 0,0000 0,0000 (0,0000) (0,0000) Alfa (vettori di aggiustamento) (errori standard tra parentesi) Salari 2,8290e-006 0,0000 (1,8873e-006) (0,0000) output_gap 0,0000 0,00097169 (0,0000) (0,010780) Disoccupazione -0,00082969 -1,1966 (0,00044848) (0,51644) Produzione 0,00049300 0,50822 (0,00016844) (0,19389) HICP -6,8917e-005 -0,099404 (3,2862e-005) (0,037762) Come si evince dall’output, il test produce un netto rifiuto dei vincoli offerti, dato che l’ipotesi nulla attesterebbe la validità dei vincoli posti. Naturalmente è stato possibile testare queste restrizioni poichè si è scelto (in base ai test) un rango di cointegrazione pari a 2. I vincoli, nonostante tutto, sono interessanti, poichè nella prima equazione si ipotizza una relazione tra salari, prezzi al consumo, produttività, e disoccupazione, il che non è difficile da immaginare in un contesto prettamente economico. Nel secondo caso invece, si mettono in relazione produttività, salari e prezzi, ma si pone addirittura il coefficiente opposto per questi due. 27
  • 28. References 1. Domenico Piccolo. Introduzione all’analisi delle serie storiche. Roma, La Nuova Italia Scientifica, 1990. 2. Domenico Piccolo. Statistica. Napoli, Il Mulino, 1998. 3. Riccardo "Jack" Lucchetti. Introduzione all’Econometria. Dispensa, 2014. 4. Riccardo "Jack" Lucchetti. Appunti di analisi delle serie storiche. Dispensa, 2015. 5. Sergio Polini. Econometria for dummies. Dispensa, 2010. 6. George E.P. Box, Gwilym M. Jenkins. Time series forecasting and control: revised edition. Oakland, Holden-Day, 1976. 7. Marno Verbeek. A guide to modern econometrics. Rotterdam, John Wiley & Sons, 2004. 8. Helmut Lütkepohl. New Introduction to Multivariate Time Series Analysis. Firenze, Springer, 1994. 9. Allin Cottrell, Riccardo "Jack" Lucchetti, Cristian Rigamonti. Gnu Regression, Econo- metrics and Time-series library. Gretl User’s Guide, 2017. 10. Appunti dalle lezioni del corso di Econometria, prof. Francesca Di Iorio. 28