SlideShare a Scribd company logo
1 of 27
Download to read offline
PAIRS TRADING
Selezione delle coppie, analisi di cointegrazione ed
elaborazione di una strategia di trading
Autore: Thomas Dossi
Professore: Rocco Roberto Mosconi
27/07/2015
Abstract
Il lavoro si concentra sullo sviluppo di una strategia di statistical arbitrage pairs trading attraverso
il metodo di cointegrazione, illustrando i criteri di selezione delle coppie, la procedura di
cointegrazione di Engle-Granger e l’implementazione della strategia di trading. La teoria
presentata viene applicata a 5 coppie di serie storiche di prezzi di titoli quotati. Infine viene
condotta un’analisi di back-testing per verificare le performance della strategia sviluppata.
2
SOMMARIO
ABSTRACT 1
CAPITOLO 1. PAIRS TRADING 3
1.1 STRATEGIE MARKET-NEUTRAL 3
1.2 PAIRS TRADING 3
1.3 IMPLEMENTAZIONE DELLA STRATEGIA 5
CAPITOLO 2. SCELTA DELLE COPPIE E ANALISI DEI DATI 6
2.1 SCELTA DELLE COPPIE 6
2.2 ANALISI DEI DATI 7
2.3 NOTA SULLA SPECIFICAZIONE LOGARITMICA DEL MODELLO 8
CAPITOLO 3. ANALISI DI COINTEGRAZIONE, APPROCCIO ENGLE-GRANGER 8
3.1 ANALISI DI RADICE UNITARIA SULLE SERIE STORICHE 9
3.1.1 TEST AUGMENTED DICKEY FULLER: CENNI TEORICI 9
3.1.2 APPLICAZIONE DEL TEST ADF 11
3.1.3 TEST KPSS 13
3.2 REGRESSIONE DI COINTEGRAZIONE 13
3.3 ANALISI DI RADICE UNITARIA SUI RESIDUI 15
3.4 MODELLAZIONE DINAMICA DELLE COPPIE COINTEGRATE 15
3.5 IMPLICAZIONI DELLA COINTEGRAZIONE A SECONDA DELLA SPECIFICAZIONE DEL MODELLO 15
CAPITOLO 4. STRATEGIA DI TRADING 16
4.1 COSTRUZIONE DEL PORTAFOGLIO 16
4.2 I COSTI DI TRANSAZIONE 18
4.3 CONDIZIONI DI APERTURA E CHIUSURA DELLA POSIZIONE 19
CAPITOLO 5. BACK-TESTING 21
CAPITOLO 6. BIBLIOGRAFIA 24
APPENDICI 25
3
Capitolo 1. PAIRS TRADING
1.1 Strategie Market-Neutral
Il termine market-neutral caratterizza una serie di strategie di investimento il cui ritorno sia incorrelato con
il ritorno del mercato. Facendo riferimento alla teoria del Capital Asset Pricing Model, portafogli market-
neutral possono essere definiti come portafogli caratterizzati da un β pari a 0. Il rendimento è dunque
legato alla componente residuale del CAPM. Tipicamente portafogli costruiti secondo questa logica
presentano una minore volatilità, ma questo non implica che tali strategie siano prive di rischio.
Queste strategie vengono concretamente implementate attraverso l’utilizzo combinato di acquisto e
vendita allo scoperto di titoli, e derivano i propri ritorni dalla relazione fra le performance dei titoli detenuti
in posizione long e di quelli in posizione short: l’idea centrale di queste strategie è dunque che il
rendimento sia definito dalle performance relative fra i titoli piuttosto che dalle loro performance assolute,
come invece accade nei portafogli tradizionali. L’investitore che sviluppa una strategia di questo genere si
attende che il portafoglio in posizione lunga sovraperformi quello in posizione corta, generando così un
ritorno positivo a prescindere dalla performance assoluta dei due portafogli.
Si noti che la possibilità di includere titoli in posizione corta all’interno di un portafoglio consente di
utilizzare in maniera più efficiente l’informazione disponibile: infatti in un portafoglio tradizionale,
caratterizzato da sole posizioni lunghe, la capacità di ordinare i titoli in base alle performance attese (come
tipicamente si fa nel processo di allocazione dei capitali) genererà ritorni positivi solo quando tali
performance siano positive: se i titoli selezionati performano meglio di quelli scartati, ma comunque con
performance negative, il portafoglio complessivo vedrà ridotto il proprio valore. Quindi, l’abilità di trasferire
al portafoglio le informazioni sulle performance relative attese, attraverso l’assunzione di posizioni long-
short può incrementare i ritorni a parità del livello di rischio assunto.
Una particolare strategia market-neutral è rappresentata dal Pairs Trading.
1.2 Pairs Trading
Definizione: con il termine Pairs Trading si indica una strategia di investimento volta a identificare due
società (o commodities) con caratteristiche similari, i cui titoli equity siano scambiati a un prezzo lontano
dalla loro relazione storica. La strategia di investimento consiste nell’acquistare la security relativamente
sottovalutata e contemporaneamente vendere allo scoperto quella relativamente sopravvalutata,
mantenendo così la neutralità rispetto al mercato (Ehrman, 2006). Un profitto è realizzato attraverso la
chiusura delle posizioni a seguito del ritorno “all’equilibrio” dei due prezzi (Do, 2006).
Il pairs trading è dunque una strategia market-neutral per la quale il portafoglio neutrale è costruito
utilizzando solo due asset, uno in posizione lunga e l’altro in posizione corta, secondo un rapporto
predeterminato. Tale portafoglio è costruito in modo da essere proporzionale in ogni istante a una
grandezza chiamata spread, misura del mispricing rispetto alla relazione statistica di equilibrio, determinata
attraverso l’analisi delle serie storiche dei prezzi.
4
Lo spread, opportunamente costruito e testato, è ritenuto essere un processo mean-reverting, e dunque il
pairs trading consiste nell’apertura delle posizioni quando lo spread è lontano dal suo valore atteso
marginale, nell’aspettativa che vi ritorni: le posizioni vengono così chiuse dopo la convergenza dello spread
al suo valore atteso marginale.
Esistono due versioni differenti di pairs trading su titoli di equity (Vidyamurthy, 2004): statistical arbitrage
pairs trading e risk arbitrage pairs trading.
Lo statistical arbitrage pairs trading fa riferimento al pricing relativo fra due titoli: la ratio alla base è che
titoli con caratteristiche similari debbano essere prezzati in maniera simile, e che dunque sussistano
relazioni statistiche fra titoli simili: in quest’ottica, lo spread è visto come mispricing di uno o entrambi i
titoli. La strategia si fonda dunque sull’assunzione di una posizione long-short quando lo spread sia lontano
dalla media, nell’ipotesi che il mispricing venga corretto dal mercato e ritorni a zero, generando una
performance positiva nel portafoglio.
Diversamente, il risk arbitrage pairs trading viene sviluppato in ambito di fusioni e acquisizioni fra imprese:
qualora l’operazione sia realizzata tramite scambio di azioni, i termini dell’M&A, in particolare il rapporto di
concambio, stabiliscono una relazione di parità fra i titoli delle due imprese coinvolte. Tuttavia, sul mercato
possono generarsi delle inefficienze che portano i titoli lontano dalla relazione di parità definita, spesso a
causa di incertezze sul’effettiva realizzazione dell’operazione: questo apre la possibilità di assumere una
posizione long-short sui titoli delle due aziende quando essi siano lontani dal rapporto di concambio
definito dal contratto dell’operazione. Lo spread è dunque misurato dalla distanza da questo rapporto, il
rischio del portafoglio è dato dall’incertezza sull’effettiva realizzazione dell’operazione, e il rendimento
deriva dal ritorno a zero dello spread. A differenza dello statistical arbitrage pairs trading, dunque, questa
forma di pairs trading non si basa su un rapporto statistico fra i due titoli, bensi sulla relazione di concambio
deterministica definita dalle condizioni contrattuali della fusione o acquisizione.
Si noti che il termine statistical arbitrage, detto anche relative value arbitrage, non indica un arbitraggio
“tradizionale”, risultante da inefficienze di mercato, informazione lenta o errata, bensì da un
allontanamento statisticamente significativo del prezzo dalla relazione percepita come corretta
dall’investitore. Pertanto, questa forma di arbitraggio non è affatto priva di rischio come l’arbitraggio
tradizionalmente inteso. Allo stesso modo, come detto, anche il risk arbitrage presenta una componente di
rischio, legata all’effettiva realizzazione dell’operazione.
Esistono tre metodi principali secondo cui viene implementata una strategia di Pairs Trading (Do, 2006):
 Distance method: lo spread fra i due titoli viene misurato come la distanza verticale al quadrato fra
le due serie dei prezzi normalizzate. Le coppie sono selezionate scegliendo per ciascun titolo il titolo
che minimizza la distanza da esso, vale a dire la somma delle differenze al quadrato fra le due serie
dei prezzi. Questo approccio manca di capacità previsiva riguardo al tempo di convergenza e,
soprattutto, assume implicitamente che la distanza fra i livelli dei prezzi sia stazionaria nel tempo.
 Cointegration method: l’approccio basato sulla cointegrazione esplora la possibilità di combinare
linearmente due serie storiche entrambe integrate di ordine d per produrre una singola serie
storica integrata di ordine d-b; il caso più semplice, che analizzeremo in dettaglio in seguito è il caso
d=b=1. In questo caso, la serie storica derivante dalla combinazione lineare è stazionaria, e questo
5
permette di fare forecasting sulla base di informazioni passate. Per testare la cointegrazione
seguiremo l’approccio di Engle-Granger. Se il test di cointegrazione fallisce, è bene evitare di
elaborare una strategia di pairs trading sulla coppia analizzata.
 Stochastic spread method (Elliot et al, 2005): definisce lo spread come la differenza fra i prezzi dei
due asset, e modella il comportamento mean-reverting dello spread nel tempo continuo,
attraverso il seguente modello:
𝑦𝑡 = 𝑥𝑡 + 𝐻𝜔 𝑡
𝑑𝑥𝑡 = 𝑘(𝜃 − 𝑥𝑡)𝑑𝑡 + 𝜎𝑑𝐵𝑡
Lo spread 𝑦𝑡 è rappresentato dalla somma della variabile di stato latente 𝑥𝑡 e un errore Gaussiano:
𝜔 𝑡~𝑁𝑜𝑟(0,1). Il modello assume che 𝑥𝑡 segua un processo di Vasicek; tale processo è mean-
reverting con media 𝜃, a cui tende con velocità 𝑘. 𝑑𝐵𝑡è un moto Browniano standard. In questo
modo si assume che lo spread osservato si comporti come un processo mean-reverting disturbato
da un errore gaussiano.
In questo genere di analisi, è opportuno definire lo spread come la differenza fra i logaritmi dei
prezzi dei due asset:
𝑦(𝑡) = 𝑙𝑜𝑔(𝑝𝑡
𝐴
) − 𝑙𝑜𝑔(𝑝𝑡
𝐵
)
Infatti, spesso la differenza di lungo termine fra due titoli non è costante, ma si allarga quando essi
crescono, mentre si stringe quando il loro prezzo cala: questo fa si che la specificazione logaritmica
risulti in questi casi più appropriata.
In questo lavoro ci occuperemo di statistical arbitrage pairs trading, sviluppato attraverso il metodo di
cointegrazione.
Il pairs trading può essere realizzato su titoli di equity o su ETF trattanti commodity, o su altre tipologie di
strumenti finanziari. Diverse tipologie di strumenti hanno comportamenti differenti, e questo può portare
ad aggiustamenti nella strategia (ad esempio si veda Donninger, 2013). In questo lavoro si analizzeranno 4
coppie equity e una coppia di ETF aventi come sottostante petrolio.
1.3 Implementazione della strategia
In questa sezione riassumiamo brevemente il processo di implementazione di una strategia di pairs trading,
che riflette peraltro la struttura del prosieguo del lavoro.
Innanzitutto, il trader deve individuare le coppie di titoli candidate ad essere utilizzate, sulla base di
considerazioni illustrate nel capitolo 2. Le coppie saranno poi sottoposte a un test di cointegrazione, per
valutare se gli elementi teorichi sui titoli considerati sono rispecchiati dall’effettivo andamento dei loro
prezzi. Una considerazione importante riguarda la necessità di non selezionare troppe coppie senza validi
motivi che ne spieghino la cointegrazione e poi sottoporle al test, in quanto come tutti i test, il test di
cointegrazione è soggetto a errore di prima specie; quindi, fissata una significatività α, il test porta a
accettare erroneamente la cointegrazione in una percentuale α dei casi. La scelta di testare numerose
coppie per identificare quelle cointegrate, può portare a accettare coppie solo per effetto dell’errore di
prima specie.
6
L’analisi di cointegrazione, che sarà trattata in dettaglio nel capitolo 3, identifica anche la relazione di
“equilibrio” fra i due asset, e dunque permette di calcolare lo spread e di identificare il vettore di
cointegrazione, fondamentali per l’implementazione concreta della strategia.
Per le coppie di titoli che risultino cointegrati si procede alla formalizzatione delle regole di trading,
esaminata nel capitolo 4: innanzitutto si individuano le condizioni di apertura e chiusura delle posizioni,
incluse delle condizioni stop-loss per limitare le perdite in caso di andamento inaspettato dello spread;
inoltre si identificano le caratteristiche che deve avere il portafoglio in modo che il suo valore rispecchi
l’andamento dello spread in posizione lunga o corta a seconda che esso si trovi rispettivamente sotto o
sopra il suo valore atteso marginale. Per fare ciò si acquista in posizione lunga il titolo che si trova sopra la
relazione di equilibrio identificata, mentre si vende allo scoperto quello che si trova al di sotto, secondo un
rapporto ben preciso legato al vettore di cointegrazione, come sarà discusso al paragrafo 4.1.
Ultimo passo è l’effettiva implementazione della strategia: trattata nel capitolo 5 attraverso il back testing
del modello: la strategia di trading sarà elaborata sulla base dei dati fino a luglio 2014, e poi sarà applicata
per un anno, utilizzando gli effettivi dati registrati sul mercato negli ultimi 12 mesi. si terrà conto dei reali
costi di transazione, in modo da testare la reale efficacia del modello e i ritorni che esso garantisce.
Capitolo 2. SCELTA DELLE COPPIE E ANALISI DEI DATI
2.1 Scelta delle coppie
Passo fondamentale in un processo di Pairs Trading è l’identificazione delle coppie di titoli potenzialmente
cointegrate. Questa scelta può essere fatta sulla base dei fondamentali reali delle aziende (o dei titoli) in
questione, oppure su considerazioni puramente statistiche derivanti dall’analisi delle serie storiche de
prezzi.
L’approccio scelto è il primo, in quanto la presenza di un solido razionale economico che leghi l’andamento
dei prezzi dei due titoli permette una giustificazione teorica alla ricerca di un legame di cointegrazione, e dà
più garanzie sul fatto che questo legame perdurerà nel tempo, fintanto che perdureranno le condizioni
tecnologiche o di mercato che uniscono i due titoli.
Al contrario, la semplice individuazione di titoli statisticamente correlati o con andamenti simili, non dà
alcuna garanzia che la relazione individuata perdurerà anche nel futuro, e se anche esistessero cause reali
che legano i due titoli, questo approccio statistico non permette di accorgersi del loro venir meno, in
quanto tali cause non sono state propriamente individuate.
Il processo di selezione può essere sviluppato in maniera più sofisticata, affiancando a un’analisi del grado
di co-movimento dei due titoli, l’individuazione di un nesso fra cointegrazione e l’Arbitrage Pricing Theory,
in modo da legare il rendimento di un titolo a una serie di variabili macroeconomiche: questo permette di
individuare i titoli con maggiore probabilità di essere cointegrati, giustificando la selezione con variabili
reali. Tale processo esula dai fini di questo lavoro, mentre è trattato nel dettaglio in Vidyamurthy, 2007,
capitolo 6.
7
2.2 Analisi dei dati
Selezioniamo 5 coppie di titoli con buone potenzialità di risultare cointegrati, sulla base di similitudini di
business, prodotti, immagine, mercato di vendita e mercato di quotazione.
4 di queste coppie riguardano titoli equity quotati sul mercato americano, riferite a aziende simili: esse
sono:
 Ford – General Motors
 Exxon – Chevron
 Coca Cola – Pepsi
 Apple – Google
La quinta coppia, invece, riguarda due ETF quotati entrambi al London Stock Exchange, entrambi aventi
petrolio come sottostante: il primo, OSW1.L, fa riferimento al petrolio WTI, mentre il secondo, OSB1.L, ha
come sottostante il petrolio BRENT. Le due tipologie di petrolio hanno caratteristiche diverse, e per
motivazioni tecnologiche i loro prezzi sono differenti; tuttavia, esiste una relazione chiara e abbastanza
stabile fra i due titoli, quindi si è ritenuto opportuno testarne la cointegrazione.
I dati raccolti per ciascuna coppia fanno riferimento ai prezzi di chiusura giornalieri (aggiustati per i
dividendi e altre forme di distribuzione, in modo che rappresentino fedelmente l’andamento del valore
della società) per il periodo gennaio 2010 – luglio 2015. Tutti i prezzi indicati sono in dollari USA. Le fonti dei
dati sono Quandl e Yahoo Finance.
8
Già da una prima ispezione grafica, quasi tutte le serie presentate paiono presentare un comportamento
compatibile con un processo random-walk: Coca Cola, Pepsi ed Apple danno l’idea di poter essere trend-
reverting, con un trend crescente, ipotesi che indagheremo al paragrafo 3.1.2.
Se vi sono stagionalità, esse non sono immediatamente identificabili, neppure nei titoli connessi al petrolio
(Brent, WTI innanzitutto, ma anche Exxon e Chevron), a dispetto di quanto ci potremmo aspettare.
Ciononostante, è possibile la presenza di stagionalità con periodo di stagionalità annuale, legata alla
stagionalità dei consumi energetici. Nella modellazione di questi titoli dovremmo tenere conto della
possibile presenza di stagionalità, valutando la possibilità di includere dummy stagionali.
2.3 Nota sulla specificazione logaritmica del modello
In questo lavoro, l’analisi sarà condotta sia sulle serie storiche dei prezzi, sia sulle serie storiche dei loro
logaritmi. Infatti, non siamo alla ricerca di un particolare tipo di relazione fra i titoli, purché essa risulti
stazionaria: l’identificazione di stazionarietà del residuo può portare a elaborare una strategia di Pairs
Trading per entrambi i modelli, seppur con alcune differenze importanti di cui è fondamentale tenere
conto. Le due differenti specificazioni del modello determinano implicazioni della cointegrazione differenti,
e conseguentemente determinano differenze nella strategia di trading: le differenze che sorgono
applicando il modello logaritmico sono trattate nei paragrafi 3.5 e 4.1.
Capitolo 3. ANALISI DI COINTEGRAZIONE, APPROCCIO ENGLE-GRANGER
Passo fondamentale della nostra analisi è individuare e stimare le eventuali relazioni di cointegrazione fra le
coppie di titoli selezionate. Esistono diversi approcci per raggiungere tale risultato; in particolare seguiremo
l’approccio di Engle-Granger, basato sulla regressione di cointegrazione, che illustreremo passo passo.
Innanzitutto definiamo (Engle, Granger, 1987):
SERIE INTEGRATA: una serie senza componenti deterministiche avente una
rappresentazione ARMA stazionaria e invertibile dopo aver differenziato d volte si dice
essere integrate di ordine d, indicato come 𝒙 𝑡~𝐼(𝑑).
COINTEGRAZIONE: le componenti di un vettore 𝒙 𝑡 si dicono co-integrate di ordine d, b,
indicato come 𝒙 𝑡~𝐶𝐼(𝑑, 𝑏), se tutte le componenti di 𝒙 𝑡 sono 𝐼(𝑑) e se esiste un vettore
𝛼 ≠ 0 tale che 𝑧𝑡 = 𝛼′
𝒙 𝑡~𝐼(𝑑 − 𝑏) con 𝑏 > 0.
9
Per la nostra analisi, il vettore 𝒙 𝑡 è composto di sole 2 componenti; noi analizzeremo il caso frequente per
cui 𝑑 = 1, 𝑏 = 1, e dunque diremo cointegrate due serie per le quali esista una combinazione lineare
stazionaria, ossia 𝐼(0).
La procedura si compone di 3 passi:
1. Il passo preliminare è verificare che le serie storiche dei prezzi siano integrate di ordine maggiore di
0, dunque che siano non stazionarie
2. Si procede poi a individuare la relazione di cointegrazione, che si ritiene possa risultare stazionaria:
per fare questo, l’approccio di Engle-Granger prevede di regredire una serie contro l’altra, sulla
base dell’idea che, essendo la relazione di regressione quella che minimizza il residuo, essa debba
darmi la relazione più stabile fra le due serie
3. Il passo finale consiste nel verificare che il residuo della regressione di cointegrazione sia in effetti
stazionario
Proprietà fondamentale della regressione di cointegrazione è che, se il residuo risulta stazionario, allora le
stime ottenute dalla regressione di cointegrazione sono super-consistenti, vale a dire che al crescere della
dimensione campionaria T, esse convergono al valore vero con un tasso di convergenza pari a T, maggiore
delle normali stime di regressione, che presentano un tasso di convergenza pari a √𝑇.
Se al contrario, il residuo risultasse non stazionario, le stime della regressione di cointegrazione sarebbero
soggette al problema della regressione spuria e dunque non convergerebbero neanche asintoticamente al
valore vero.
Analizziamo ora uno ad uno i passi del processo.
3.1 Analisi di radice unitaria sulle serie storiche
Primo passo dell’analisi di cointegrazione è la verifica della non stazionarietà delle serie storiche dei prezzi.
L’assunzione che il prezzo di un asset in borsa (o il suo logaritmo) segua un processo random-walk è
un’assunzione standard, è stata usata estensivamente nei modelli di pricing di opzioni con buoni risultati:
dunque ci aspettiamo di individuare la presenza di almeno una radice unitaria in ciascun polinomio
autoregressivo caratterizzante le serie storiche dei prezzi.
Il random-walk è una martingala, e dunque il miglior predittore del prezzo è l’ultimo prezzo registrato sul
mercato: questo è concorde con l’ipotesi di efficienza del mercato; se, come ci aspettiamo, l’analisi di
radice unitaria confermasse la possibilità che i prezzi seguano un processo random walk, non è possibile
costruire un portafoglio di statistical arbitrage (come definito al paragrafo 1.2) su una sola posizione lunga o
corta. Al contrario, se il test rifiutasse la presenza di radice unitaria, sarebbe possibile modellare il prezzo
con un processo stazionario trend-reverting, e dunque costruire un portafoglio di statistical arbitrage senza
necessità di ricorrere alla regressione di cointegrazione.
Come già indicato nel capitolo 2, la semplice analisi grafica pare indicare la possibilità di presenza di radici
unitarie; andiamo dunque a testare la convinzione che le serie storiche presentino almeno una radice
unitaria, facendo ricorso ai test di radice unitaria.
3.1.1 Test Augmented Dickey Fuller: cenni teorici
Dickey e Fuller (1979) elaborano una procedura per testare la stazionarietà di un processo, indagando la
presenza di radici di modulo unitario nel polinomio autoregressivo. Inizialmente il test era pensato per un
10
processo AR(1), in seguito Said e Dickey (1984) estesero la procedura a modelli autoregressivi di ordine
superiore, il cosiddetto test Augmented Dickey-Fuller.
Data una serie storica nella forma1
:
𝑦𝑡 = 𝜇0 + 𝜇1 𝑡 + ∑ 𝜌𝑗 𝑦𝑡−𝑗
𝑝
𝑗=1 + 𝑢 𝑡 con 𝑢 𝑡~𝑊𝑁
Il suo polinomio auto regressivo è:
1 − ∑ 𝜌𝑗 𝐿𝑗
𝑝
𝑗=1
= 0
Si dimostra che, sotto l’ipotesi ∑ 𝜌𝑗
𝑝
𝑗=1 ≥ 1, le radici del polinomio autoregressivo cadono all’esterno della
circonferenza di raggio unitario nel piano complesso (tale risultato non vale in generale; tuttavia, esso vale
sempre purché |𝜌𝑗| < 1 ∀𝑗; vale anche sotto altre ipotesi particolari).
Dunque, sotto le ipotesi indicate, ∑ 𝜌𝑗
𝑝
𝑗=1 ≥ 1 implica la stazionarietà del processoAR(p). L’idea alla base
del test Augmented Dickey-Fuller è stimare i parametri autoregressivi 𝜌𝑗 e poi verificare l’ipotesi
𝐻0 ∶ ∑ 𝜌𝑗
𝑝
𝑗=1
≥ 1 𝐻𝐴 ∶ ∑ 𝜌𝑗
𝑝
𝑗=1
< 1
Nel concreto, il test ADF viene svolto in un’altra forma, ricorrendo a una riparametrizzazione del modello
(ottenuta sottraendo 𝑦𝑡−1 da entrambi i lati):
∆𝑦𝑡 = 𝜇0 + 𝜇1 𝑡 + 𝜋𝑦𝑡−𝑗 + ∑ 𝛾𝑗∆𝑦𝑡−𝑗
𝑝−1
𝑗=1
+ 𝑢 𝑡
E’ facile dimostrare che questo modello sia una semplice riparametrizzazione di quello presentato in
precedenza, e le relazioni invertibili che legano il secondo modello al primo sono:
{
𝜋 = −(1 − ∑ 𝜌𝑗
𝑝
𝑗=1
)
𝛾𝑗 = − ∑ 𝜌 𝑘
𝑝
𝑘=𝑗+1
𝑗 = 1, … , 𝑝 − 1
Le ipotesi del test possono dunque essere riscritte come:
𝐻0 ∶ 𝜋 ≥ 0 𝐻𝐴 ∶ 𝜋 < 0
1 L’ordine massimo p del modello AR(p) utilizzato per descrivere la serie storica per il test ADF è normalmente fissato attraverso la
raccomandazione di Schwert (1989):
𝑝 𝑚𝑎𝑥 = ⌊12 (
𝑇
100
)
0,25
⌋
Spesso, questo valore è preso come ordine massimo per una strategia “a tappeto”, come descritta al paragrafo 3.1.2
11
La statistica test è data da
𝜋̂
𝜎̂ 𝜋
, tuttavia essa non si distribuisce per campioni finiti come una t di Student
come nei normali t test di azzeramento di un parametro, né è asintoticamente Normale, in quanto sotto 𝐻0
la variabile è non stazionaria, e dunque le stime di π non sono Normali; si ricorre allora alla distribuzione
asintotica Dickey-Fuller:
𝜋̂
𝜎̂ 𝜋
~𝐷𝐹
La distribuzione DF non ha un’espressione analitica né per la densità né per la FDR, in quanto viene ricavata
tramite simulazioni.
La distribuzione DF varia a seconda dell’introduzione o meno delle componenti deterministiche nel
modello, in particolare costante e trend; è invece invariante all’introduzione delle componenti stagionali.
Non è dunque indifferente la scelta di inserire tali componenti ai fini del test.
Come già accennato, il test Dickey-Fuller è un caso particolare del test Augmented Dickey-Fuller, per il
quale l’ordine p del modello autoregressivo è pari a 1.
3.1.2 Applicazione del test ADF
Tenendo presente quanto detto riguardo al test ADF, andiamo a verificare la stazionarietà delle serie
storiche dei prezzi.
Un passo preliminare che può essere utile per l’analisi successiva consiste nell’individuare gli ordini massimi
del modello ARMA con cui modellizzare ciascuna serie: facciamo un’analisi preventiva dei correlogrammi
delle varie serie
Tutti i correlogrammi delle serie storiche dei prezzi, così come delle serie logaritmiche, presentano una
Funzione di Autocorrelazione che parte vicina ad 1 e decresce molto lentamente; la Funzione di
Autocorrelazione Parziale, invece, presenta sempre il primo elemento vicino ad 1, mentre gli altri cadono
quasi sempre all’interno della banda di confidenza; il fatto che pochi ne cadano all’esterno è molto
probabilmente legato alla probabilità di errore di prima specie del 5% implicita nei test disgiunti
rappresentati dalla banda di confidenza.
A titolo di esempio, riportiamo ACF e PACF per la serie dei prezzi del titolo FORD:
Da questa analisi qualitativa, ci aspettiamo dunque di poter modellare le serie con dei processi AR (1).
12
Per accertarcene, tuttavia, procediamo con una strategia “a tappeto”: stabiliamo gli ordini massimi 𝑝 𝑚𝑎𝑥 e
𝑞 𝑚𝑎𝑥 e sviluppiamo tutte le combinazioni di ARMA (p, q) con 𝑝 < 𝑝 𝑚𝑎𝑥 e 𝑞 < 𝑞 𝑚𝑎𝑥.
Gli ordini massimi sono fissati arbitrariamente a 5 e vengono calcolati i criteri di informazioni di Akaike,
Schwarz, e Hannan-Quinn per ciascuna combinazione di p e q minori o uguali ai massimi scelti.
In questa operazione, è importante aggiustare il campione in modo che tutti i modelli si basino sugli stessi
dati: infatti la stima è stata realizzata con la massima verosimiglianza condizionale, e dunque il numero
delle prime osservazioni che non vengono utilizzate dipende dal numero di ritardi dello specifico modello:
bisogna dunque limitare il campione per tutti i modelli a escludere le prime 5 osservazione, in modo che
tutti si basino sulle medesime osservazioni, e l’applicazione dei criteri di informazione sia corretta2
. La
scelta non risulta mai univoca, in particolare il criterio AIC tende ad essere permissivo in quanto a numero
totale di parametri, mentre BIC e HQC sono più parsimoniosi; tuttavia, BIC e HQC concordano quasi sempre
nell’indicare entrambi come ottimale il modello ARMA(1,0), cioè il modello AR(1), come ci aspettavamo.
Possiamo dunque ritenere che le serie storiche dei prezzi siano effettivamente ben rappresentate da
processi AR(1).
A titolo di esempio, riportiamo in appendice i risultati dei criteri di informazione per il titolo Ford (tabella 1).
Sui prezzi logaritmici l’analisi porta ai medesimi risultati.
Una volta individuato il processo che meglio approssima le serie storiche dei prezzi, procediamo
all’applicazione vera e propria del test Dickey-Fuller: l’algoritmo di applicazione del test ADF va
automaticamente a eseguire la procedura appena descritta, in modo da determinare il numero di ritardi
ottimale da inserire nell’equazione il cui parametro 𝜋̂ determina la statistica test. Il test ADF, tuttavia,
specifica la serie storica solo come modello AR, senza componenti MA. Per verificare ulteriormente la
correttezza dell’analisi appena svolta, lasciamo che l’algoritmo scelga liberamente l’ordine AR ottimale,
partendo dall’ordine massimo di Schwert, di cui abbiamo già accennato in nota al paragrafo 3.1.1. Il criterio
di informazione da ottimizzare selezionato è stato il criterio di Schwarz, che identifica per tutte le serie
come ottimale un processo AR(1)
I test sono condotti tutti con costante e trend, in quanto non inserirli erroneamente potrebbe portare a
distorsioni significative a favore della non stazionarietà dei processi, mentre inserirli erroneamente porta a
una meno grave perdita di efficienza3
.
Come ci aspettavamo, tutti i test, sia sulle serie storiche dei prezzi sia sulle serie logaritmiche dei prezzi, non
rifiutano l’ipotesi 𝐻0 di presenza di radici unitarie; non possiamo dunque rifiutare la non stazionarietà dei
processi.
I risultati dei test sono riportati in appendice, alla tabella 2.
Volendo testare se le variabili siano I(1) sarebbe possibile eseguire un test ADF sulla differenza prima e
valutare se essa risulti stazionaria.
2
Contrariamente a quanto si potrebbe pensare, anche 5 osservazioni su un campione di più di mille elementi possono
portare a scelte dell’ordine ottimale differenti per i criteri di informazione.
3
In alternativa, sarebbe possibile valutare la significatività dei parametri 𝜇̂0 e 𝜇̂1 ottenuti attraverso la stima di max
verosimiglianza esatta o condizionale del modello, tramite i t-test restituiti in output. Resta però vero che, a meno di
forte evidenza statistica contraria, sia opportuno inserire costante e trend nel test ADF.
13
3.1.3 Test KPSS
Esistono altri test oltre al test ADF, per testare la stazionarietà di una serie storica; in particolare, il test
KPSS (Kwiatkowski, Phillips, Schmidt e Shin, 1991) testa l’ipotesi nulla di stazionarietà, al contrario di quanto
faceva il test ADF.
Una descrizione dettagliata del test esula dai fini di questo lavoro; l’idea alla base è che una generica serie
storica 𝑦𝑡può essere scomposta nella somma di trend, random walk e un errore stazionario:
𝑦𝑡 = 𝜉0 + 𝜉1 𝑡 + 𝑟𝑡 + 𝑒𝑡 dove 𝑟𝑡 = 𝑟𝑡−1 + 𝑢 𝑡 è un random walk con 𝑢 𝑡~𝑖𝑖𝑑(0, 𝜎 𝑢
2
),
𝜉0 e 𝜉1 rappresentano costante e trend, mentre 𝑒𝑡 è un processo stazionario a media nulla
Il caso in cui la serie non presenti trend è un caso particolare di quello presentato, in cui basta imporre 𝜉 =
0.
Per il modello scritto in questa forma, l’ipotesi di stazionarietà si traduce semplicemente nell’ipotesi 𝜎 𝑢
2
=
0.
La statistica utilizzata è la statistica dei Moltiplicatori di Lagrange (o Score) per testare 𝜎 𝑢
2
= 0 contro
l’alternativa 𝜎 𝑢
2
> 0, ed è data da:
∑ 𝑆̂𝑡
2𝑇
𝑡=1
𝑇2 𝜎̂2
Dove 𝑆̂𝑡 = ∑ 𝑒̂ 𝑠
𝑡
𝑠=1 è la cumulata parziale dei residui stimati dalla regressione di 𝑦𝑡contro il blocco
deterministico, mentre 𝜎̂2
è la stima della varianza di 𝑒𝑡.
Applichiamo il test KPSS a tutte le serie storiche dei prezzi. I test KPSS rifiutano la stazionarietà di tutte le
serie storiche dei prezzi, concordando così con i test ADF visti al paragrafo precedente.
3.2 Regressione di Cointegrazione
Una volta verificata la non stazionarietà delle serie storiche dei prezzi, procediamo a stimarne la
regressione di cointegrazione. Per fare questo ricorriamo agli OLS, anche se esistono studi che indicano
l’opportunità di ricorrere ad altri stimatori come lo stimatore di Theil-Sen; ricordiamo infatti che, qualora i
residui della regressione di cointegrazione risultino stazionari, le stime OLS della regressione di
cointegrazione godranno della proprietà di super-consistenza.
La regressione di cointegrazione è: 𝑃𝑡
𝐴
= 𝛽0 + 𝛽1 𝑃𝑡
𝐵
+ 𝑧𝑡
oppure, per il modello logaritmico: 𝑙𝑛𝑃𝑡
𝐴
= 𝑏0 + 𝑏1 𝑙𝑛𝑃𝑡
𝐵
+ 𝑣𝑡
Di queste regressioni salviamo i residui 𝑧𝑡, 𝑣𝑡, dei quali al passo successivo testeremo la stazionarietà.
𝜷 è detto vettore di cointegrazione; 𝛽1è detto coefficiente di cointegrazione
A titolo di esempio, riportiamo i grafici delle stime di cointegrazione e i residui della coppia FORD-GM e
APPLE-GOOGLE:
14
Vediamo che gli attraversamenti dell’asse delle ascisse sono molto più numerosi per il residuo di Ford-GM
rispetto al residuo Apple-Google; esiste una relazione fra il numero di zero-crossing del residuo e le sue
caratteristiche, in particolare la sua stazionarietà (Rice, 1945): a noi basti notare che già da un’analisi grafica
il residuo della coppia Ford-GM appare più mean-reverting rispetto al residuo di Apple-Google. Vedremo
nel prossimo paragrafo, che la prima coppia risulta cointegrata, mentre la seconda no.
15
3.3 Analisi di Radice Unitaria sui residui
Il terzo passo dell’analisi di cointegrazione consiste nel testare la stazionarietà dei residui. La procedura è
identica a quella esaminata al paragrafo 3.1.
C’è tuttavia da notare che la variabile di cui stiamo testando la stazionarietà nasce come residuo di una
regressione lineare, e quindi ha per costruzione media e trend nulli: per questo motivo, nei test ADF e KPSS
ora non ha senso subire la perdita di efficienza legata all’inserimento non necessario di costante e trend. I
test sono dunque condotti sempre senza costante né trend4
.
Essendo al momento lo scopo della nostra analisi testare la stazionarietà dei residui, il test ADF ci risulta più
affidabile rispetto al test KPSS, in quanto il test ADF ci permette di rifiutare con una confidenza nota
l’ipotesi di non stazionarietà. Per questo motivo, quando i test risultano discordanti, in questa sezione ci
affidiamo al test ADF.
I risultati dei test sono riportati in appendice alla tabella 3. Tutte le coppie selezionate risultano cointegrate,
ad eccezione della coppia Apple-Google.
3.4 Modellazione dinamica delle coppie cointegrate
E’ possibile modellare i residui che sono risultati cointegrati, applicando la strategia “a tappeto” vista nella
sezione 3.1.2: come per le serie storiche, i criteri di informazione propendono quasi sempre per una
modellazione AR(1).
Una conseguenza fondamentale della cointegrazione è che, nota la caratteristica del residuo di essere
mean-reverting, è possibile dare una rappresentazione dinamica delle serie dei prezzi, attraverso un Error-
Correction-Model: l’idea dietro questa rappresentazione è che sistemi cointegrati hanno un equilibrio di
lungo termine; dunque, se vi è un allontanamento dalla media, allora una o entrambe le serie si aggiustano
per ripristinare l’equilibrio; il teorema che afferma l’equivalenza fra cointegrazione e rappresentazione
error-correction prende il nome di Granger Representation Theorem. La modellazione dinamica delle serie
dei prezzi risulta dunque:
{
∆𝑃𝑡
𝐴
= 𝛾 𝐴[𝑃𝑡−1
𝐴
− (𝛽̂0 + 𝛽̂1 𝑃𝑡−1
𝐵
)] + 𝑢 𝑡
𝐴
∆𝑃𝑡
𝐵
= 𝛾 𝐵[𝑃𝑡−1
𝐴
− (𝛽̂0 + 𝛽̂1 𝑃𝑡−1
𝐵
)] + 𝑢 𝑡
𝐵
Si noti che il fattore in parentesi quadra rappresenta lo spread al periodo precedente, 𝑧𝑡−1.
E’ proprio la capacità predittiva derivante dall’aver determinato la caratteristica del residuo di essere mean
reverting a permetterci di elaborare la strategia di Pairs Trading, e ottenere ritorni maggiori a parità di
rischio.
3.5 Implicazioni della cointegrazione a seconda della specificazione del modello
E’ interessante notare che, a seconda che l’analisi sia condotta sulla serie storica dei prezzi o su quella
trasformata in logaritmi, le implicazioni concrete sono differenti.
4
Il comando coint sul software Gretl permette di inserire o meno costante e trend nella regressione di cointegrazione,
ma non permette di specificare se inserirli nel test di radice unitaria, per questo non è stato applicato e si è preferito
svolgere il procedimento separatamente
16
L’individuazione di cointegrazione per le serie storiche dei prezzi non trasformati suppone una relazione
lineare stazionaria fra i due titoli, e dunque che la differenza fra il prezzo del titolo A e β volte il prezzo del
titolo B (dove β è il coefficiente di cointegrazione) sia mean-reverting. Tuttavia, come visto, si può indagare
se esista una relazione stazionaria fra i logaritmi dei prezzi, e dunque applicare un modello ad elasticità
costante. In questo modello, la cointegrazione implica che la differenza fra il ritorno del titolo A e β volte il
ritorno del titolo B sia mean-reverting.
Euristicamente si nota che, se le serie dei prezzi sono cointegrate, normalmente anche le serie dei logaritmi
risultano cointegrate, e questo è confermato dalle nostre analisi.
Capitolo 4. STRATEGIA DI TRADING
Le coppie sono state selezionate in quanto legate dal settore di appartenenza, o dalla commodity che ne
determina il valore, o da motivi tecnici, e infatti molte di esse sono risultate cointegrate.
E’ tuttavia importante notare che la cointegrazione da sola non garantisce il buon esito della strategia di
Pairs Trading: ad esempio, se il residuo ha oscillazioni troppo contenute intorno allo zero, il guadagno
ottenuto dal ritorno a zero dello spread può risultare insufficiente a coprire i costi di apertura della
posizione, e dunque esiste una soglia di volatilità minima necessaria affinché la coppia sia utilizzabile in una
strategia di pairs trading. Esistono dunque una serie di considerazioni ulteriori alla semplice cointegrazione,
che devono essere analizzate affinché la strategia di Pairs Trading abbia successo: esse costituiscono
l’argomento di questo capitolo.
4.1 Costruzione del Portafoglio
Per prima cosa andiamo ad esaminare come utilizzare le informazioni individuate nell’analisi di
cointegrazione per costruire il portafoglio.
Abbiamo concluso che il residuo della regressione di cointegrazione, che prende il nome di spread nella
strategia di trading, ha un comportamento stazionario mean-reverting: la logica alla base di tutta la
strategia è acquistare lo spread quando esso è sotto media e venderlo allo scoperto quando è sopra media,
aspettandoci che il suo comportamento mean-reverting ci porti un capital gain. Ovviamente a tal fine va
bene acquistare o vendere allo scoperto una qualsiasi grandezza proporzionale allo spread.
Nel caso in cui si sia scelta la specificazione lineare, realizzare un portafoglio con queste caratteristiche è
molto semplice; infatti il modello nel caso lineare è 𝑃𝑡
𝐴
= 𝛽0 + 𝛽1 𝑃𝑡
𝐵
+ 𝑧𝑡, che può essere
riscritto come 𝑥𝑡 = 𝑧𝑡 + 𝛽0 = 𝑃𝑡
𝐴
− 𝛽1 𝑃𝑡
𝐵
Viste le caratteristiche di 𝑧𝑡, 𝑥𝑡 è un processo stazionario e mean reverting, con l’unica differenza che la
media a cui ritorna è 𝛽0 invece che zero; è quindi evidente che un portafoglio costruito acquistando 𝑛 𝐴
titoli A e 𝑛 𝐵 = −𝛽1 𝑛 𝐴 titoli B soddisfa le condizioni richieste: equivale a comprare o vendere lo spread
17
più una costante, che però verrà annullata al momento della chiusura della posizione, e quindi sono le
variazioni dello spread a determinare la variazione di valore del portafoglio, come volevamo.
Nel caso in cui il modello sia scritto in forma logaritmica, invece, bisogna fare attenzione a costruire
diversamente il portafoglio di trading: in questo caso, infatti, bisogna mantenere una proporzione 1: 𝑏1 non
sul numero di azioni, bensì sulla quantità di denaro investita nei due asset.
Il risultato finale è molto semplice, mostriamo come vi si giunge:
il modello in forma logaritmica si scrive: 𝑙𝑛𝑃𝑡
𝐴
= 𝑏0 + 𝑏1 𝑙𝑛𝑃𝑡
𝐵
+ 𝑣𝑡
Come nel caso lineare, riscriviamo il modello come: 𝑥𝑡 = 𝑣𝑡 + 𝑏0 = 𝑙𝑛𝑃𝑡
𝐴
− 𝑏1 𝑙𝑛𝑃𝑡
𝐵
Di nuovo, 𝑥𝑡 è un processo stazionario e mean reverting come 𝑣𝑡, solo con media pari a 𝑏0 invece che 0.
Immaginiamo di investire 𝑚 𝐴 euro nel titolo A, e 𝑚 𝐵 = −𝑏1 𝑚 𝐴 euro nel titolo B.
Indichiamo con ∆ la variazione fra il periodo t e il periodo t+i e con ∆% la variazione percentuale nel
medesimo intervallo di tempo.
Vale:
∆𝑃𝐹𝑡 = 𝑚 𝐴 ∗ ∆% 𝑃𝑡
𝐴
+ 𝑚 𝐵 ∗ ∆% 𝑃𝑡
𝐵
=̃ 𝑚 𝐴 ∗ [ 𝑙𝑛𝑃𝑡+𝑖
𝐴
− 𝑙𝑛𝑃𝑡
𝐴
] − 𝛽1 𝑚 𝐴[ 𝑙𝑛𝑃𝑡+𝑖
𝐵
− 𝑙𝑛𝑃𝑡
𝐵
] =
= 𝑚 𝐴 [( 𝑙𝑛𝑃𝑡+𝑖
𝐴
− 𝛽1 𝑙𝑛𝑃𝑡+𝑖
𝐵
) − ( 𝑙𝑛𝑃𝑡
𝐴
− 𝛽1 𝑙𝑛𝑃𝑡
𝐵
)] = 𝑚 𝐴 ∗ ∆𝑥𝑡
Il caso 𝑚 𝐴 = 1 , 𝑚 𝐵 = −𝑏1 è ovviamente un caso particolare di quello presentato.
Abbiamo dimostrato che la variazione del valore del portafoglio così costruito è pari a 𝑚 𝐴 volte 𝑥𝑡, che è un
processo stazionario e mean reverting come lo spread, a meno di una costante.
Quindi anche questo portafoglio rispetta le condizioni necessarie per poter generare una strategia di Pairs
Trading basata sul comportamento mean-reverting dello spread.
Spesso la regressione di cointegrazione sui logaritmi porta a individuare un coefficiente di cointegrazione 𝑏1
vicino ad 1; infatti, un beta uguale ad 1 implica che il rapporto fra i due prezzi sia stazionario, e questo è
ragionevole e si trova frequentemente nella realtà, ed è stato rilevato anche per alcune serie storiche
analizzate.
Il modello logaritmico infatti può essere riscritto come:
𝑃 𝐴,𝑡
𝑃 𝐵,𝑡
𝑏1
= 𝐴𝑒 𝑣 𝑡, che diventa, in caso di coefficiente di cointegrazione unitario:
𝑃 𝐴,𝑡
𝑃 𝐵,𝑡
= 𝐴𝑒 𝑣 𝑡
Dove A è una costante, data da 𝐴 = 𝑒 𝑏0
18
Se si dimostra che i logaritmi dei prezzi sono cointegrati, questo indica che 𝑣𝑡 è stazionario e mean
reverting: il modello riscritto nella forma 2 rende evidente il fatto che questo implica che il rapporto fra le
due variabili sia mean-reverting a sua volta.
4.2 I costi di transazione
Mentre in altre strategie di trading i costi di transazione possono essere trascurati, nel pairs trading essi
giocano un ruolo fondamentale: infatti, il pairs trading sfrutta deviazioni relativamente piccole e fa un
numero non trascurabile di transazioni in un breve tempo. Per questo i costi di transazione possono
incidere significativamente sulla marginalità della strategia, e inoltre la struttura dei costi deve essere
tenuta in considerazione per fissare adeguatamente i parametri che indicano quando aprire o chiudere le
posizioni.
I costi di transazione variano considerevolmente da caso a caso, dipendono dal mercato di quotazione, del
tipo di titolo e dalla sua liquidità, dalle condizioni del provider o della piattaforma sulla quale vengono
effettuate le transazioni, dalla tipologia di investitore o addirittura dalla frequenza con cui fa operazioni sul
mercato e così via. Cerchiamo di dare un quadro generale dei costi di transazione più rilevanti.
Il primo tipo di costi che consideriamo sono le commissioni sull’operazione: esse rappresentano dei costi
fissi che vengono pagati ogni volta che viene effettuata un’operazione. Solitamente sono una quota del
capitale mosso dalla transazione, e hanno un valore minimo oltre il quale non scendono, anche se il capitale
mosso è molto basso.
Questi costi spingono verso una strategia conservativa nel numero di posizioni da aprire: infatti, di fronte a
uno spread con varianza molto bassa intorno alla media, sarebbe possibile pensare di aprire e chiudere le
posizioni con frequenza molto alta, ogni qualvolta lo spread si allontani anche di poco dalla media. Questo
tipo di strategia risulta non adeguata se i costi fissi sono elevati, mentre è preferibile aprire le posizioni solo
quando lo spread si sia allontanato considerevolmente dal valore di equilibrio, in modo da poter
beneficiare di un ritorno consistente dalla chiusura delle posizioni, che compensi i costi sostenuti per
aprirle.
Nelle successive analisi, descritte nel capitolo 5, applicheremo un tasso di commissione di 19 punti base
rispetto al totale del capitale impegnato, calcolato per ogni transazione (il dato è tratto da FINECO), in
media con i tassi applicati dagli operatori del settore per transazioni simili. Le commissioni generalmente
dipendono dall’operatore considerato e dalla fascia in cui si colloca l’investitore (la quale dipende dalla
frequenza con cui egli effettua transazioni); i valori scelti sono dunque dei valori ragionevoli, puramente
indicativi per un investitore medio.
Un altro costo rilevante, tipico di operazioni di Pairs Trading sono gli interessi sullo short selling: la
piattaforma sulla quale si effettua il trading richiede degli interessi sulle posizioni corte assunte. Infatti, essa
presta all’investitore il denaro necessario per assumere tale posizione. Vi è inoltre un altro costo implicito
dello short selling, costituito dal costo opportunità del margine di garanzia.
19
Più sono alti questi costi, e più rapida dovrebbe essere la chiusura delle posizioni; infatti gli interessi sono
legati al tempo in cui resta aperta la posizione. Per questo motivo è necessario prestare attenzione agli
effetti dei parametri di apertura e chiusura delle posizioni sul cosiddetto holding period.
Nelle simulazioni condotte al capitolo 5, il tasso per queste operazioni è calcolato considerando un tasso di
attualizzazione composto giornalmente, secondo la formula:
𝑡𝑔 = √(1 + 𝑡𝑎)
365
− 1
Utilizzando un tasso ragionevole per queste operazioni (6% annuo, di nuovo applicato da FINECO per
operazioni di short-selling) si ottiene un tasso giornaliero di 0,016%.
Un altro costo che è importante considerare per questa tipologia di trading è il bid-ask spread: esso
rappresenta il denaro che si è costretti a perdere nell’operazione di acquisto o vendita, per via della
distanza fra curve di domanda e offerta.
Lo spread bid-ask cresce al diminuire della liquidità del titolo, e può ridurre i margini della strategia in
maniera rilevante se essa comprende titoli illiquidi.
Quando il titolo ha un intermediario che svolge il compito di Market-Maker, lo spread bid ask è fissato da
quest’ultimo e rappresenta il suo guadagno; questo ha il pregio di mantenere il bid ask spread a livelli
contenuti favorendo la liquidità dei titoli, tuttavia i margini del market maker erodono quelli degli
investitori. Quando invece non c’è market maker, lo spread è direttamente la distanza fra la curva di
domanda e la curva di offerta nel book del mercato.
Ne deriva che questo costo non è fisso, bensì dipende dall’incontrarsi di curva di domanda e offerta al
momento in cui si intende effettuare la transazione, ed è dunque difficile stimarlo; un’ipotesi ragionevole
per titoli non illiquidi può essere di 2 punti base sul valore scambiato.
Meno rilevanti sono i costi di slippage e brokerage.
4.3 Condizioni di apertura e chiusura della posizione
Come accennato all’inizio del capitolo, la cointegrazione è condizione necessaria ma non sufficiente
all’apertura di una posizione: esistono una serie di altre condizioni che indicano l’opportunità e il momento
in cui aprire una posizione.
Nel paragrafo precedente abbiamo detto che le condizioni di apertura e chiusura delle posizioni devono
essere ottimizzate sulla base della struttura dei costi di transazione, che tuttavia variano a seconda del caso
specifico; ne segue che non si possono stabilire regole valide in generale, quindi ci limiteremo a indicare i
principali criteri e le logiche con cui si fissano tali condizioni, ricordando che esse vanno modificate caso per
caso.
Innanzitutto, vi è un’altra condizione preliminare, necessaria per fare trading su una coppia di titoli: essa
consiste in una soglia minima di volatilità del residuo di cointegrazione: esso deve presentare delle
oscillazioni intorno alla media di ampiezza sufficiente a generare un capital gain nel portafoglio che
giustifichi i costi di transazione sopportati per aprire la posizione.
20
Questa condizione è alla base dei risultati di alcuni studi recenti che indicano come i margini garantiti dal
pairs trading siano in calo: la presenza di grossi operatori che effettuano questo genere di trading tende a
far chiudere molto rapidamente le oscillazioni dello spread, per l’effetto che il loro investimento ha sul
valore dei titoli. Di conseguenza, i piccoli investitori che hanno costi di apertura delle posizioni molto
maggiori, vedono i loro profitti diminuire.
La condizione principale per determinare il momento di apertura di una coppia, invece, richiede che lo
spread sia sufficientemente lontano dalla media; a ciò è opportuno aggiungere la condizione che lo spread
sia in fase di convergenza verso la media, e non vi si stia allontanando. La lontananza dello spread dalla sua
media è espressa in termini di deviazioni standard della serie dei residui di cointegrazione.
Un esempio di condizione di apertura, che è quello che sarà poi applicato nell’analisi di back-testing del
modello nel capitolo 5 è la seguente: 𝑧𝑡−2 > 1,5 𝜎̂𝑧 ; 𝑧𝑡−1 > 1,5 𝜎̂𝑧 ; 𝑧𝑡 < 1,5 𝜎̂𝑧
Come detto al capitolo 2.1, se la relazione di cointegrazione non è supportata da considerazioni legate ai
fondamentali dei titoli o delle aziende, essa può rompersi senza preavviso: per le coppie in cui si ritiene che
la relazione di cointegrazione possa modificarsi o cessare di esistere, è importante mettere una condizione
di stop-loss, vale a dire un valore soglia di allontanamento del residuo dalla sua media, oltre il quale si
ritiene che la relazione di cointegrazione si possa essere rotta, e dunque che sia opportuno chiudere la
posizione per limitare le perdite. Come sempre, il valore soglia deve essere valutato caso per caso, a
seconda della robustezza della relazione di cointegrazione e della propensione al rischio dell’investitore. Un
esempio di valore soglia potrebbe essere rappresentato da 3 deviazioni standard di distanza dalla media.
Alla condizione di stop-loss spesso si affianca una durata massima accettabile per una posizione senza che
essa superi incontri una condizione di chiusura.
Esistono poi differenti criteri per chiudere la posizione: si può usare un criterio di prudenza e chiudere già
quando lo spread scende al di sotto di un certo numero di deviazioni standard, ad esempio al di sotto di
0,25 deviazioni standard, oppure aspettare il completo ritorno in media dello spread. Un’alternativa più
rischiosa è attendere che lo spread oscilli dall’altra parte della media prima di chiudere la posizione.
Un altro parametro da considerare nell’elaborazione di una strategia di pairs trading è il livello di leverage
da utilizzare. Una trattazione dei costi e dei benefici dell’indebitamento nelle operazioni di trading esula dai
nostri scopi; si tenga solo presente che è possibile indebitarsi (normalmente fino a una certa soglia massima
fissata dalla piattaforma di trading utilizzata) e questo può portare a incrementare notevolmente i
guadagni, al prezzo di una maggior esposizione al rischio.
Allo stesso modo, la quantità di denaro da allocare su una posizione dipende da un’analisi comparata di
diverse opportunità di investimento, che non tratteremo.
21
Capitolo 5. BACK-TESTING
Per concludere, è stata svolta un’analisi di back testing sulla strategia fin qui descritta.
Con il termine back-testing si indica il processo per cui l’investitore si mette idealmente in un istante di
tempo nel passato, ed elabora la strategia basandosi solo sui dati in suo possesso fino a quel momento: poi
utilizza i dati che si sono effettivamente registrati sui mercati dal momento scelto fino ad oggi, per valutare
come avrebbe performato la strategia elaborata.
Per fare back testing su una strategia di pairs trading è necessario stabilire un parametro per tutte le
condizioni indicati nel capitolo precedente. Una volta che tutte le condizioni sono stabilite, la strategia
viene applicata in automatico ai dati, e se ne registrano i risultati, determinando quali trade il modello
avrebbe selezionato.
Nota che noi guardiamo alle operazioni sul singolo titolo; normalmente, si fa una serie di coppie e criteri di
apertura e chiusura, e si mette un portafogli e si vede come performa: ad esempio si veda (The Duck
Strategy Chrilly Donninger)... noi però testiamo la validità del modello solamente su due o tre titoli, non
siamo interessati a misurare la performance del portafoglio..
Normalmente, per i gestori di portafogli, il back testing viene fatto considerando un universo molto nutrito
di coppie possibili, e allocando mano a mano il capitale disponibile fra tali coppie: la crescita del capitale
investito a seguito della strategia viene misurata e confrontata con un benchmark. Si veda ad esempio The
Duck Strategy, Donninger, 2013.
Nel nostro caso, invece, ci limiteremo ad applicare la strategia a due coppie, per verificarne la
ragionevolezza e il funzionamento; non siamo invece interessati a confrontare i rendimenti percentuali di
una certa somma rispetto a un’alternativa di investimento.
Il back testing è stato applicato sia al modello lineare che al modello logaritmico, per vedere se i due
modelli portano a scelte di investimento differenti.
Si sono utilizzati i dati dal 2010 al luglio 2014 per costruire il modello, mentre i dati degli ultimi 12 mesi
sono stati utilizzati per testare il funzionamento della strategia.
I risultati dei test di cointegrazione non sono cambiati limitando il campione, mentre le stime dei residui
della regressione di cointegrazione sono risultate leggermente differenti, ma non in maniera molto
evidente, come si può vedere dal seguente grafico:
22
Sulla base dei residui stimati, applicando le condizioni di apertura e chiusura delle posizioni si sono
individuati i momenti in cui la strategia avrebbe portato ad effettuare gli investimenti: in figura è
rappresentata l’implementazione della strategia per le varie coppie testate:
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
10/06/2014 18/09/2014 27/12/2014 06/04/2015 15/07/2015 23/10/2015
Confronto stime residui Ford - GM
RES BACK TESTING
RES CAMPIONE COMPLETO
-1
-0,5
0
0,5
1
1,5
2
2,5
10/06/2014 18/09/2014 27/12/2014 06/04/2015 15/07/2015 23/10/2015
Back testing Ford - GM lineare
RES BACK TESTING
POSIZIONE
23
I flussi netti totali generati dalla strategia costruita sul modello lineare e su quello logaritmico sono stati
rispettivamente € 1.148,16 e € 1.180,47.
Le strategie sono pressoché identiche, e le posizioni si aprono e chiudono negli stessi giorni.
La differenza nel ritorno complessivo è legata più alla diversa composizione del portafoglio (come trattato
al paragrafo 4.1) che a effettive differenze nei risultati.
Riguardo al back testing della coppia Exxon – Chevron, riportiamo il grafico complessivo:
Poiché l’anno è terminato con la posizione ancora aperta, per verificare i flussi fino a quel momento la
posizione è stata chiusa forzatamente, seppure questo abbia penalizzato la strategia; inoltre, la lunga
durata della prima apertura ha ridotto i margini. I flussi annuali complessivi di questa coppia sono di €
252,05.
La strategia pare funzionare bene in entrambi i casi: le posizioni si sono aperte in momenti ragionevoli, e
hanno portato a buoni ritorni, soprattutto per la coppia Ford – GM, il cui spread ha avuto più zero-crossing
nel corso degli ultimi 12 mesi. La strategia non pare influenzata dai momenti negativi di mercato, a
conferma della sua market-neutrality.
-0,1
-0,05
0
0,05
0,1
0,15
0,2
10/06/2014 18/09/2014 27/12/2014 06/04/2015 15/07/2015 23/10/2015
Back testing Ford - GM logaritmico
RESIDUO BT
posizione
-4
-2
0
2
4
6
8
10
10/06/2014 18/09/2014 27/12/2014 06/04/2015 15/07/2015 23/10/2015
Back testing EXXON - Chevron
res_lin
posizione
res_lin_BT
24
Capitolo 6. BIBLIOGRAFIA
Robert F. Engle; C. W. J. Granger (1987). Co-Integration and Error Correction: Representation, Estimation,
and Testing. Econometrica, Vol. 55, No. 2. (Mar., 1987), pp. 251-276.
Ganapathy Vidyamurthy (2004) Pairs trading : quantitative methods and analysis. New Jersey: John Wiley.
Douglas S. Ehrman (2006) The handbook of Pairs Trading. John Wiley.
Binh Do, Robert Faff, Kais Hamza (2006), A new approach to modeling and estimation for pairs trading
Dickey, D. and W. Fuller (1979). “Distribution of the Estimators for Autoregressive Time Series with a Unit
Root,” Journal of the American Statistical Association, 74, 427-431.
Kwiatkowski, Phillips, Schmidt, Shin (1991) Testing the null hypothesis of stationarity against the alternative
of a unit root
Mengyun Zhang (2012) Research on Modern Implications of Pairs Trading
Chrilly Donninger (2013) Pairs Trading with CoIntegration: The Duck Strategy
Supakorn Mudchanatongsuk, James A. Primbs and Wilfred Wong (2008) Optimal Pairs Trading: A Stochastic
Control Approach
Greene W.H (2012), Econometric Analysis, 7th edition
Riccardo Lucchetti (2013): Appunti di analisi delle serie storiche
25
Appendici
TAVOLA 1: SELEZIONE DEGLI ORDINI MASSIMI
Campione completo dei dati: 2010-11-18 - 2015-07-17 (n = 1157)
Campione attuale: 2010-11-26 - 2015-07-17 (n = 1152)
AR = 0 MA = 0 AIC = 5453,538 BIC = 5458,587 HQ = 5455,444
AR = 0 MA = 1 AIC = 3997,252 BIC = 4012,399 HQ = 4002,969
AR = 0 MA = 2 AIC = 2878,273 BIC = 2898,47 HQ = 2885,897
AR = 0 MA = 3 AIC = 2148,43 BIC = 2173,676 HQ = 2157,959
AR = 0 MA = 4 AIC = 1661,176 BIC = 1691,472 HQ = 1672,611
AR = 0 MA = 5 AIC = 1285,111 BIC = 1320,456 HQ = 1298,452
AR = 1 MA = 0 AIC = -215,27 BIC = -205,172 HQ = -211,459
AR = 1 MA = 1 AIC = -214,925 BIC = -194,728 HQ = -207,302
AR = 1 MA = 2 AIC = -212,925 BIC = -187,678 HQ = -203,395
AR = 1 MA = 3 AIC = -211,297 BIC = -181,001 HQ = -199,862
AR = 1 MA = 4 AIC = -210,766 BIC = -175,422 HQ = -197,425
AR = 1 MA = 5 AIC = -213,072 BIC = -172,678 HQ = -197,826
AR = 2 MA = 0 AIC = -216,976 BIC = -201,828 HQ = -211,258
AR = 2 MA = 1 AIC = -212,984 BIC = -187,737 HQ = -203,454
AR = 2 MA = 2 AIC = -212,108 BIC = -181,812 HQ = -200,673
AR = 2 MA = 3 AIC = -210,649 BIC = -175,304 HQ = -197,308
AR = 2 MA = 4 AIC = -209,76 BIC = -169,366 HQ = -194,514
AR = 2 MA = 5 AIC = -211,394 BIC = -165,95 HQ = -194,241
AR = 3 MA = 0 AIC = -215,028 BIC = -194,831 HQ = -207,404
AR = 3 MA = 1 AIC = -211,911 BIC = -181,615 HQ = -200,476
AR = 3 MA = 2 AIC = -212,53 BIC = -177,185 HQ = -199,189
AR = 3 MA = 3 AIC = -216,571 BIC = -176,177 HQ = -201,324
AR = 3 MA = 4 AIC = -212,82 BIC = -167,377 HQ = -195,667
AR = 3 MA = 5 AIC = -221,204 BIC = -170,712 HQ = -202,146
AR = 4 MA = 0 AIC = -213,225 BIC = -187,978 HQ = -203,695
AR = 4 MA = 1 AIC = -209,912 BIC = -174,567 HQ = -196,571
AR = 4 MA = 2 AIC = -215,886 BIC = -175,492 HQ = -200,639
AR = 4 MA = 3 AIC = -214,834 BIC = -169,391 HQ = -197,681
AR = 4 MA = 4 AIC = -220,907 BIC = -170,415 HQ = -201,849
AR = 4 MA = 5 AIC = -222,061 BIC = -166,519 HQ = -201,097
AR = 5 MA = 0 AIC = -212,531 BIC = -182,235 HQ = -201,096
AR = 5 MA = 1 AIC = -210,079 BIC = -169,685 HQ = -194,832
AR = 5 MA = 2 AIC = -212,127 BIC = -166,684 HQ = -194,975
AR = 5 MA = 3 AIC = -219,205 BIC = -168,712 HQ = -200,147
AR = 5 MA = 4 AIC = -220,386 BIC = -164,844 HQ = -199,422
AR = 5 MA = 5 AIC = -220,098 BIC = -159,507 HQ = -197,228
26
TAVOLA 2: REGRESSIONI DI COINTEGRAZIONE
REGRESSIONE DI COINTEGRAZIONE FORD-GM
OLS, usando le osservazioni 2010-11-18:2015-07-17 (T = 1157)
Variabile dipendente: F
Coefficiente Errore Std. rapporto t p-value
const 0,442924 0,11669 3,7957 0,0002 ***
GM 0,426245 0,00380555 112,0061 <0,0001 ***
REGRESSIONE DI COINTEGRAZIONE EXXON-CHEVRON
OLS, usando le osservazioni 2010-01-04:2015-07-16 (T = 1383)
Variabile dipendente: XOM
Coefficiente Errore Std. rapporto t p-value
const 11,6372 0,485799 23,9548 <0,0001 ***
CVX 0,686422 0,00482624 142,2271 <0,0001 ***
REGRESSIONE DI COINTEGRAZIONE COCA COLA-PEPSI
OLS, usando le osservazioni 2010-01-04:2015-07-17 (T = 1384)
Variabile dipendente: CCE
Coefficiente Errore Std. rapporto t p-value
const −15,4779 0,485569 −31,8757 <0,0001 ***
PEP 0,660519 0,00669472 98,6626 <0,0001 ***
REGRESSIONE DI COINTEGRAZIONE APPLE-GOOGLE
OLS, usando le osservazioni 2010-01-04:2015-07-16 (T = 1387)
Variabile dipendente: AAPL
Coefficiente Errore Std. rapporto t p-value
const 1,98619 1,56659 1,2678 0,2051
GOOGL 0,172015 0,00380718 45,1817 <0,0001 ***
REGRESSIONE DI COINTEGRAZIONE BRENT-WTI
OLS, usando le osservazioni 2010-02-11:2015-07-17 (T = 1360)
Variabile dipendente: BRENT
Coefficiente Errore Std. rapporto t p-value
const −2,65999 1,22651 −2,1688 0,0303 **
WTI 1,13225 0,0149739 75,6149 <0,0001 ***
27
TAVOLA 3: RISULTATI DEI TEST DI STAZIONARIETA’
TEST ADF NON
STAZIONARIETA' PREZZI
TEST ADF NON
STAZIONARIETA' RESIDUI
P-VALUE IPOTESI NULLA P-VALUE IPOTESI NULLA
FORD 0,4856 accetto
0,005946 rifiuto
GENERAL MOTORS 0,509 accetto
EXXON 0,8207 accetto
0,008916 rifiuto
CHEVRON 0,9842 accetto
COCA COLA 0,1172 accetto
0,01355 rifiuto
PEPSI 0,265 accetto
APPLE 0,8038 accetto
0,1302 accetto
GOOGLE 0,1291 accetto
BRENT 0,9656 accetto
0,04174 rifiuto
WTI 0,8671 accetto

More Related Content

Similar to 2015.07.27_Applied Econometrics Paper - Pairs Trading_Thomas Dossi

Presentazione seminario roma 4 marzo 2016 enrico malverti
Presentazione seminario roma 4 marzo 2016   enrico malvertiPresentazione seminario roma 4 marzo 2016   enrico malverti
Presentazione seminario roma 4 marzo 2016 enrico malvertiStefano Gianti
 
Cybertrade con Swissquote @Modena - venerdì 5 febbraio 2016
Cybertrade con Swissquote @Modena - venerdì 5 febbraio 2016Cybertrade con Swissquote @Modena - venerdì 5 febbraio 2016
Cybertrade con Swissquote @Modena - venerdì 5 febbraio 2016Stefano Gianti
 
PRICE MANAGEMENT E POSIZIONAMENTO COMPETITIVO (by Fabio Bullita)
PRICE MANAGEMENT E POSIZIONAMENTO COMPETITIVO (by Fabio Bullita)PRICE MANAGEMENT E POSIZIONAMENTO COMPETITIVO (by Fabio Bullita)
PRICE MANAGEMENT E POSIZIONAMENTO COMPETITIVO (by Fabio Bullita)Fabio Bullita
 
Valutazione d'impresa 2012 (4 lezioni)
Valutazione d'impresa 2012 (4 lezioni)Valutazione d'impresa 2012 (4 lezioni)
Valutazione d'impresa 2012 (4 lezioni)EAAUNIPA
 
Simare la volatilità dalle serie storiche
Simare la volatilità dalle serie storicheSimare la volatilità dalle serie storiche
Simare la volatilità dalle serie storicheLuigi Piva CQF
 
Ot medie mobili e bande di bollinger
Ot   medie mobili e bande di bollingerOt   medie mobili e bande di bollinger
Ot medie mobili e bande di bollingerbuylink
 
[IT] Mindscope Inst / L’allocazione delle obbligazioni convertibili in un co...
[IT] Mindscope Inst /  L’allocazione delle obbligazioni convertibili in un co...[IT] Mindscope Inst /  L’allocazione delle obbligazioni convertibili in un co...
[IT] Mindscope Inst / L’allocazione delle obbligazioni convertibili in un co...NN Investment Partners
 

Similar to 2015.07.27_Applied Econometrics Paper - Pairs Trading_Thomas Dossi (12)

Multiple Spread Trading
Multiple Spread TradingMultiple Spread Trading
Multiple Spread Trading
 
Financial Physics
Financial PhysicsFinancial Physics
Financial Physics
 
Presentazione seminario roma 4 marzo 2016 enrico malverti
Presentazione seminario roma 4 marzo 2016   enrico malvertiPresentazione seminario roma 4 marzo 2016   enrico malverti
Presentazione seminario roma 4 marzo 2016 enrico malverti
 
Cybertrade con Swissquote @Modena - venerdì 5 febbraio 2016
Cybertrade con Swissquote @Modena - venerdì 5 febbraio 2016Cybertrade con Swissquote @Modena - venerdì 5 febbraio 2016
Cybertrade con Swissquote @Modena - venerdì 5 febbraio 2016
 
07.shares valuation
07.shares valuation07.shares valuation
07.shares valuation
 
PRICE MANAGEMENT E POSIZIONAMENTO COMPETITIVO (by Fabio Bullita)
PRICE MANAGEMENT E POSIZIONAMENTO COMPETITIVO (by Fabio Bullita)PRICE MANAGEMENT E POSIZIONAMENTO COMPETITIVO (by Fabio Bullita)
PRICE MANAGEMENT E POSIZIONAMENTO COMPETITIVO (by Fabio Bullita)
 
Valutazione d'impresa 2012 (4 lezioni)
Valutazione d'impresa 2012 (4 lezioni)Valutazione d'impresa 2012 (4 lezioni)
Valutazione d'impresa 2012 (4 lezioni)
 
Simare la volatilità dalle serie storiche
Simare la volatilità dalle serie storicheSimare la volatilità dalle serie storiche
Simare la volatilità dalle serie storiche
 
Ot medie mobili e bande di bollinger
Ot   medie mobili e bande di bollingerOt   medie mobili e bande di bollinger
Ot medie mobili e bande di bollinger
 
[IT] Mindscope Inst / L’allocazione delle obbligazioni convertibili in un co...
[IT] Mindscope Inst /  L’allocazione delle obbligazioni convertibili in un co...[IT] Mindscope Inst /  L’allocazione delle obbligazioni convertibili in un co...
[IT] Mindscope Inst / L’allocazione delle obbligazioni convertibili in un co...
 
Teoria asset allocation
Teoria asset allocationTeoria asset allocation
Teoria asset allocation
 
Low Entropy Pattern
Low Entropy PatternLow Entropy Pattern
Low Entropy Pattern
 

2015.07.27_Applied Econometrics Paper - Pairs Trading_Thomas Dossi

  • 1. PAIRS TRADING Selezione delle coppie, analisi di cointegrazione ed elaborazione di una strategia di trading Autore: Thomas Dossi Professore: Rocco Roberto Mosconi 27/07/2015 Abstract Il lavoro si concentra sullo sviluppo di una strategia di statistical arbitrage pairs trading attraverso il metodo di cointegrazione, illustrando i criteri di selezione delle coppie, la procedura di cointegrazione di Engle-Granger e l’implementazione della strategia di trading. La teoria presentata viene applicata a 5 coppie di serie storiche di prezzi di titoli quotati. Infine viene condotta un’analisi di back-testing per verificare le performance della strategia sviluppata.
  • 2. 2 SOMMARIO ABSTRACT 1 CAPITOLO 1. PAIRS TRADING 3 1.1 STRATEGIE MARKET-NEUTRAL 3 1.2 PAIRS TRADING 3 1.3 IMPLEMENTAZIONE DELLA STRATEGIA 5 CAPITOLO 2. SCELTA DELLE COPPIE E ANALISI DEI DATI 6 2.1 SCELTA DELLE COPPIE 6 2.2 ANALISI DEI DATI 7 2.3 NOTA SULLA SPECIFICAZIONE LOGARITMICA DEL MODELLO 8 CAPITOLO 3. ANALISI DI COINTEGRAZIONE, APPROCCIO ENGLE-GRANGER 8 3.1 ANALISI DI RADICE UNITARIA SULLE SERIE STORICHE 9 3.1.1 TEST AUGMENTED DICKEY FULLER: CENNI TEORICI 9 3.1.2 APPLICAZIONE DEL TEST ADF 11 3.1.3 TEST KPSS 13 3.2 REGRESSIONE DI COINTEGRAZIONE 13 3.3 ANALISI DI RADICE UNITARIA SUI RESIDUI 15 3.4 MODELLAZIONE DINAMICA DELLE COPPIE COINTEGRATE 15 3.5 IMPLICAZIONI DELLA COINTEGRAZIONE A SECONDA DELLA SPECIFICAZIONE DEL MODELLO 15 CAPITOLO 4. STRATEGIA DI TRADING 16 4.1 COSTRUZIONE DEL PORTAFOGLIO 16 4.2 I COSTI DI TRANSAZIONE 18 4.3 CONDIZIONI DI APERTURA E CHIUSURA DELLA POSIZIONE 19 CAPITOLO 5. BACK-TESTING 21 CAPITOLO 6. BIBLIOGRAFIA 24 APPENDICI 25
  • 3. 3 Capitolo 1. PAIRS TRADING 1.1 Strategie Market-Neutral Il termine market-neutral caratterizza una serie di strategie di investimento il cui ritorno sia incorrelato con il ritorno del mercato. Facendo riferimento alla teoria del Capital Asset Pricing Model, portafogli market- neutral possono essere definiti come portafogli caratterizzati da un β pari a 0. Il rendimento è dunque legato alla componente residuale del CAPM. Tipicamente portafogli costruiti secondo questa logica presentano una minore volatilità, ma questo non implica che tali strategie siano prive di rischio. Queste strategie vengono concretamente implementate attraverso l’utilizzo combinato di acquisto e vendita allo scoperto di titoli, e derivano i propri ritorni dalla relazione fra le performance dei titoli detenuti in posizione long e di quelli in posizione short: l’idea centrale di queste strategie è dunque che il rendimento sia definito dalle performance relative fra i titoli piuttosto che dalle loro performance assolute, come invece accade nei portafogli tradizionali. L’investitore che sviluppa una strategia di questo genere si attende che il portafoglio in posizione lunga sovraperformi quello in posizione corta, generando così un ritorno positivo a prescindere dalla performance assoluta dei due portafogli. Si noti che la possibilità di includere titoli in posizione corta all’interno di un portafoglio consente di utilizzare in maniera più efficiente l’informazione disponibile: infatti in un portafoglio tradizionale, caratterizzato da sole posizioni lunghe, la capacità di ordinare i titoli in base alle performance attese (come tipicamente si fa nel processo di allocazione dei capitali) genererà ritorni positivi solo quando tali performance siano positive: se i titoli selezionati performano meglio di quelli scartati, ma comunque con performance negative, il portafoglio complessivo vedrà ridotto il proprio valore. Quindi, l’abilità di trasferire al portafoglio le informazioni sulle performance relative attese, attraverso l’assunzione di posizioni long- short può incrementare i ritorni a parità del livello di rischio assunto. Una particolare strategia market-neutral è rappresentata dal Pairs Trading. 1.2 Pairs Trading Definizione: con il termine Pairs Trading si indica una strategia di investimento volta a identificare due società (o commodities) con caratteristiche similari, i cui titoli equity siano scambiati a un prezzo lontano dalla loro relazione storica. La strategia di investimento consiste nell’acquistare la security relativamente sottovalutata e contemporaneamente vendere allo scoperto quella relativamente sopravvalutata, mantenendo così la neutralità rispetto al mercato (Ehrman, 2006). Un profitto è realizzato attraverso la chiusura delle posizioni a seguito del ritorno “all’equilibrio” dei due prezzi (Do, 2006). Il pairs trading è dunque una strategia market-neutral per la quale il portafoglio neutrale è costruito utilizzando solo due asset, uno in posizione lunga e l’altro in posizione corta, secondo un rapporto predeterminato. Tale portafoglio è costruito in modo da essere proporzionale in ogni istante a una grandezza chiamata spread, misura del mispricing rispetto alla relazione statistica di equilibrio, determinata attraverso l’analisi delle serie storiche dei prezzi.
  • 4. 4 Lo spread, opportunamente costruito e testato, è ritenuto essere un processo mean-reverting, e dunque il pairs trading consiste nell’apertura delle posizioni quando lo spread è lontano dal suo valore atteso marginale, nell’aspettativa che vi ritorni: le posizioni vengono così chiuse dopo la convergenza dello spread al suo valore atteso marginale. Esistono due versioni differenti di pairs trading su titoli di equity (Vidyamurthy, 2004): statistical arbitrage pairs trading e risk arbitrage pairs trading. Lo statistical arbitrage pairs trading fa riferimento al pricing relativo fra due titoli: la ratio alla base è che titoli con caratteristiche similari debbano essere prezzati in maniera simile, e che dunque sussistano relazioni statistiche fra titoli simili: in quest’ottica, lo spread è visto come mispricing di uno o entrambi i titoli. La strategia si fonda dunque sull’assunzione di una posizione long-short quando lo spread sia lontano dalla media, nell’ipotesi che il mispricing venga corretto dal mercato e ritorni a zero, generando una performance positiva nel portafoglio. Diversamente, il risk arbitrage pairs trading viene sviluppato in ambito di fusioni e acquisizioni fra imprese: qualora l’operazione sia realizzata tramite scambio di azioni, i termini dell’M&A, in particolare il rapporto di concambio, stabiliscono una relazione di parità fra i titoli delle due imprese coinvolte. Tuttavia, sul mercato possono generarsi delle inefficienze che portano i titoli lontano dalla relazione di parità definita, spesso a causa di incertezze sul’effettiva realizzazione dell’operazione: questo apre la possibilità di assumere una posizione long-short sui titoli delle due aziende quando essi siano lontani dal rapporto di concambio definito dal contratto dell’operazione. Lo spread è dunque misurato dalla distanza da questo rapporto, il rischio del portafoglio è dato dall’incertezza sull’effettiva realizzazione dell’operazione, e il rendimento deriva dal ritorno a zero dello spread. A differenza dello statistical arbitrage pairs trading, dunque, questa forma di pairs trading non si basa su un rapporto statistico fra i due titoli, bensi sulla relazione di concambio deterministica definita dalle condizioni contrattuali della fusione o acquisizione. Si noti che il termine statistical arbitrage, detto anche relative value arbitrage, non indica un arbitraggio “tradizionale”, risultante da inefficienze di mercato, informazione lenta o errata, bensì da un allontanamento statisticamente significativo del prezzo dalla relazione percepita come corretta dall’investitore. Pertanto, questa forma di arbitraggio non è affatto priva di rischio come l’arbitraggio tradizionalmente inteso. Allo stesso modo, come detto, anche il risk arbitrage presenta una componente di rischio, legata all’effettiva realizzazione dell’operazione. Esistono tre metodi principali secondo cui viene implementata una strategia di Pairs Trading (Do, 2006):  Distance method: lo spread fra i due titoli viene misurato come la distanza verticale al quadrato fra le due serie dei prezzi normalizzate. Le coppie sono selezionate scegliendo per ciascun titolo il titolo che minimizza la distanza da esso, vale a dire la somma delle differenze al quadrato fra le due serie dei prezzi. Questo approccio manca di capacità previsiva riguardo al tempo di convergenza e, soprattutto, assume implicitamente che la distanza fra i livelli dei prezzi sia stazionaria nel tempo.  Cointegration method: l’approccio basato sulla cointegrazione esplora la possibilità di combinare linearmente due serie storiche entrambe integrate di ordine d per produrre una singola serie storica integrata di ordine d-b; il caso più semplice, che analizzeremo in dettaglio in seguito è il caso d=b=1. In questo caso, la serie storica derivante dalla combinazione lineare è stazionaria, e questo
  • 5. 5 permette di fare forecasting sulla base di informazioni passate. Per testare la cointegrazione seguiremo l’approccio di Engle-Granger. Se il test di cointegrazione fallisce, è bene evitare di elaborare una strategia di pairs trading sulla coppia analizzata.  Stochastic spread method (Elliot et al, 2005): definisce lo spread come la differenza fra i prezzi dei due asset, e modella il comportamento mean-reverting dello spread nel tempo continuo, attraverso il seguente modello: 𝑦𝑡 = 𝑥𝑡 + 𝐻𝜔 𝑡 𝑑𝑥𝑡 = 𝑘(𝜃 − 𝑥𝑡)𝑑𝑡 + 𝜎𝑑𝐵𝑡 Lo spread 𝑦𝑡 è rappresentato dalla somma della variabile di stato latente 𝑥𝑡 e un errore Gaussiano: 𝜔 𝑡~𝑁𝑜𝑟(0,1). Il modello assume che 𝑥𝑡 segua un processo di Vasicek; tale processo è mean- reverting con media 𝜃, a cui tende con velocità 𝑘. 𝑑𝐵𝑡è un moto Browniano standard. In questo modo si assume che lo spread osservato si comporti come un processo mean-reverting disturbato da un errore gaussiano. In questo genere di analisi, è opportuno definire lo spread come la differenza fra i logaritmi dei prezzi dei due asset: 𝑦(𝑡) = 𝑙𝑜𝑔(𝑝𝑡 𝐴 ) − 𝑙𝑜𝑔(𝑝𝑡 𝐵 ) Infatti, spesso la differenza di lungo termine fra due titoli non è costante, ma si allarga quando essi crescono, mentre si stringe quando il loro prezzo cala: questo fa si che la specificazione logaritmica risulti in questi casi più appropriata. In questo lavoro ci occuperemo di statistical arbitrage pairs trading, sviluppato attraverso il metodo di cointegrazione. Il pairs trading può essere realizzato su titoli di equity o su ETF trattanti commodity, o su altre tipologie di strumenti finanziari. Diverse tipologie di strumenti hanno comportamenti differenti, e questo può portare ad aggiustamenti nella strategia (ad esempio si veda Donninger, 2013). In questo lavoro si analizzeranno 4 coppie equity e una coppia di ETF aventi come sottostante petrolio. 1.3 Implementazione della strategia In questa sezione riassumiamo brevemente il processo di implementazione di una strategia di pairs trading, che riflette peraltro la struttura del prosieguo del lavoro. Innanzitutto, il trader deve individuare le coppie di titoli candidate ad essere utilizzate, sulla base di considerazioni illustrate nel capitolo 2. Le coppie saranno poi sottoposte a un test di cointegrazione, per valutare se gli elementi teorichi sui titoli considerati sono rispecchiati dall’effettivo andamento dei loro prezzi. Una considerazione importante riguarda la necessità di non selezionare troppe coppie senza validi motivi che ne spieghino la cointegrazione e poi sottoporle al test, in quanto come tutti i test, il test di cointegrazione è soggetto a errore di prima specie; quindi, fissata una significatività α, il test porta a accettare erroneamente la cointegrazione in una percentuale α dei casi. La scelta di testare numerose coppie per identificare quelle cointegrate, può portare a accettare coppie solo per effetto dell’errore di prima specie.
  • 6. 6 L’analisi di cointegrazione, che sarà trattata in dettaglio nel capitolo 3, identifica anche la relazione di “equilibrio” fra i due asset, e dunque permette di calcolare lo spread e di identificare il vettore di cointegrazione, fondamentali per l’implementazione concreta della strategia. Per le coppie di titoli che risultino cointegrati si procede alla formalizzatione delle regole di trading, esaminata nel capitolo 4: innanzitutto si individuano le condizioni di apertura e chiusura delle posizioni, incluse delle condizioni stop-loss per limitare le perdite in caso di andamento inaspettato dello spread; inoltre si identificano le caratteristiche che deve avere il portafoglio in modo che il suo valore rispecchi l’andamento dello spread in posizione lunga o corta a seconda che esso si trovi rispettivamente sotto o sopra il suo valore atteso marginale. Per fare ciò si acquista in posizione lunga il titolo che si trova sopra la relazione di equilibrio identificata, mentre si vende allo scoperto quello che si trova al di sotto, secondo un rapporto ben preciso legato al vettore di cointegrazione, come sarà discusso al paragrafo 4.1. Ultimo passo è l’effettiva implementazione della strategia: trattata nel capitolo 5 attraverso il back testing del modello: la strategia di trading sarà elaborata sulla base dei dati fino a luglio 2014, e poi sarà applicata per un anno, utilizzando gli effettivi dati registrati sul mercato negli ultimi 12 mesi. si terrà conto dei reali costi di transazione, in modo da testare la reale efficacia del modello e i ritorni che esso garantisce. Capitolo 2. SCELTA DELLE COPPIE E ANALISI DEI DATI 2.1 Scelta delle coppie Passo fondamentale in un processo di Pairs Trading è l’identificazione delle coppie di titoli potenzialmente cointegrate. Questa scelta può essere fatta sulla base dei fondamentali reali delle aziende (o dei titoli) in questione, oppure su considerazioni puramente statistiche derivanti dall’analisi delle serie storiche de prezzi. L’approccio scelto è il primo, in quanto la presenza di un solido razionale economico che leghi l’andamento dei prezzi dei due titoli permette una giustificazione teorica alla ricerca di un legame di cointegrazione, e dà più garanzie sul fatto che questo legame perdurerà nel tempo, fintanto che perdureranno le condizioni tecnologiche o di mercato che uniscono i due titoli. Al contrario, la semplice individuazione di titoli statisticamente correlati o con andamenti simili, non dà alcuna garanzia che la relazione individuata perdurerà anche nel futuro, e se anche esistessero cause reali che legano i due titoli, questo approccio statistico non permette di accorgersi del loro venir meno, in quanto tali cause non sono state propriamente individuate. Il processo di selezione può essere sviluppato in maniera più sofisticata, affiancando a un’analisi del grado di co-movimento dei due titoli, l’individuazione di un nesso fra cointegrazione e l’Arbitrage Pricing Theory, in modo da legare il rendimento di un titolo a una serie di variabili macroeconomiche: questo permette di individuare i titoli con maggiore probabilità di essere cointegrati, giustificando la selezione con variabili reali. Tale processo esula dai fini di questo lavoro, mentre è trattato nel dettaglio in Vidyamurthy, 2007, capitolo 6.
  • 7. 7 2.2 Analisi dei dati Selezioniamo 5 coppie di titoli con buone potenzialità di risultare cointegrati, sulla base di similitudini di business, prodotti, immagine, mercato di vendita e mercato di quotazione. 4 di queste coppie riguardano titoli equity quotati sul mercato americano, riferite a aziende simili: esse sono:  Ford – General Motors  Exxon – Chevron  Coca Cola – Pepsi  Apple – Google La quinta coppia, invece, riguarda due ETF quotati entrambi al London Stock Exchange, entrambi aventi petrolio come sottostante: il primo, OSW1.L, fa riferimento al petrolio WTI, mentre il secondo, OSB1.L, ha come sottostante il petrolio BRENT. Le due tipologie di petrolio hanno caratteristiche diverse, e per motivazioni tecnologiche i loro prezzi sono differenti; tuttavia, esiste una relazione chiara e abbastanza stabile fra i due titoli, quindi si è ritenuto opportuno testarne la cointegrazione. I dati raccolti per ciascuna coppia fanno riferimento ai prezzi di chiusura giornalieri (aggiustati per i dividendi e altre forme di distribuzione, in modo che rappresentino fedelmente l’andamento del valore della società) per il periodo gennaio 2010 – luglio 2015. Tutti i prezzi indicati sono in dollari USA. Le fonti dei dati sono Quandl e Yahoo Finance.
  • 8. 8 Già da una prima ispezione grafica, quasi tutte le serie presentate paiono presentare un comportamento compatibile con un processo random-walk: Coca Cola, Pepsi ed Apple danno l’idea di poter essere trend- reverting, con un trend crescente, ipotesi che indagheremo al paragrafo 3.1.2. Se vi sono stagionalità, esse non sono immediatamente identificabili, neppure nei titoli connessi al petrolio (Brent, WTI innanzitutto, ma anche Exxon e Chevron), a dispetto di quanto ci potremmo aspettare. Ciononostante, è possibile la presenza di stagionalità con periodo di stagionalità annuale, legata alla stagionalità dei consumi energetici. Nella modellazione di questi titoli dovremmo tenere conto della possibile presenza di stagionalità, valutando la possibilità di includere dummy stagionali. 2.3 Nota sulla specificazione logaritmica del modello In questo lavoro, l’analisi sarà condotta sia sulle serie storiche dei prezzi, sia sulle serie storiche dei loro logaritmi. Infatti, non siamo alla ricerca di un particolare tipo di relazione fra i titoli, purché essa risulti stazionaria: l’identificazione di stazionarietà del residuo può portare a elaborare una strategia di Pairs Trading per entrambi i modelli, seppur con alcune differenze importanti di cui è fondamentale tenere conto. Le due differenti specificazioni del modello determinano implicazioni della cointegrazione differenti, e conseguentemente determinano differenze nella strategia di trading: le differenze che sorgono applicando il modello logaritmico sono trattate nei paragrafi 3.5 e 4.1. Capitolo 3. ANALISI DI COINTEGRAZIONE, APPROCCIO ENGLE-GRANGER Passo fondamentale della nostra analisi è individuare e stimare le eventuali relazioni di cointegrazione fra le coppie di titoli selezionate. Esistono diversi approcci per raggiungere tale risultato; in particolare seguiremo l’approccio di Engle-Granger, basato sulla regressione di cointegrazione, che illustreremo passo passo. Innanzitutto definiamo (Engle, Granger, 1987): SERIE INTEGRATA: una serie senza componenti deterministiche avente una rappresentazione ARMA stazionaria e invertibile dopo aver differenziato d volte si dice essere integrate di ordine d, indicato come 𝒙 𝑡~𝐼(𝑑). COINTEGRAZIONE: le componenti di un vettore 𝒙 𝑡 si dicono co-integrate di ordine d, b, indicato come 𝒙 𝑡~𝐶𝐼(𝑑, 𝑏), se tutte le componenti di 𝒙 𝑡 sono 𝐼(𝑑) e se esiste un vettore 𝛼 ≠ 0 tale che 𝑧𝑡 = 𝛼′ 𝒙 𝑡~𝐼(𝑑 − 𝑏) con 𝑏 > 0.
  • 9. 9 Per la nostra analisi, il vettore 𝒙 𝑡 è composto di sole 2 componenti; noi analizzeremo il caso frequente per cui 𝑑 = 1, 𝑏 = 1, e dunque diremo cointegrate due serie per le quali esista una combinazione lineare stazionaria, ossia 𝐼(0). La procedura si compone di 3 passi: 1. Il passo preliminare è verificare che le serie storiche dei prezzi siano integrate di ordine maggiore di 0, dunque che siano non stazionarie 2. Si procede poi a individuare la relazione di cointegrazione, che si ritiene possa risultare stazionaria: per fare questo, l’approccio di Engle-Granger prevede di regredire una serie contro l’altra, sulla base dell’idea che, essendo la relazione di regressione quella che minimizza il residuo, essa debba darmi la relazione più stabile fra le due serie 3. Il passo finale consiste nel verificare che il residuo della regressione di cointegrazione sia in effetti stazionario Proprietà fondamentale della regressione di cointegrazione è che, se il residuo risulta stazionario, allora le stime ottenute dalla regressione di cointegrazione sono super-consistenti, vale a dire che al crescere della dimensione campionaria T, esse convergono al valore vero con un tasso di convergenza pari a T, maggiore delle normali stime di regressione, che presentano un tasso di convergenza pari a √𝑇. Se al contrario, il residuo risultasse non stazionario, le stime della regressione di cointegrazione sarebbero soggette al problema della regressione spuria e dunque non convergerebbero neanche asintoticamente al valore vero. Analizziamo ora uno ad uno i passi del processo. 3.1 Analisi di radice unitaria sulle serie storiche Primo passo dell’analisi di cointegrazione è la verifica della non stazionarietà delle serie storiche dei prezzi. L’assunzione che il prezzo di un asset in borsa (o il suo logaritmo) segua un processo random-walk è un’assunzione standard, è stata usata estensivamente nei modelli di pricing di opzioni con buoni risultati: dunque ci aspettiamo di individuare la presenza di almeno una radice unitaria in ciascun polinomio autoregressivo caratterizzante le serie storiche dei prezzi. Il random-walk è una martingala, e dunque il miglior predittore del prezzo è l’ultimo prezzo registrato sul mercato: questo è concorde con l’ipotesi di efficienza del mercato; se, come ci aspettiamo, l’analisi di radice unitaria confermasse la possibilità che i prezzi seguano un processo random walk, non è possibile costruire un portafoglio di statistical arbitrage (come definito al paragrafo 1.2) su una sola posizione lunga o corta. Al contrario, se il test rifiutasse la presenza di radice unitaria, sarebbe possibile modellare il prezzo con un processo stazionario trend-reverting, e dunque costruire un portafoglio di statistical arbitrage senza necessità di ricorrere alla regressione di cointegrazione. Come già indicato nel capitolo 2, la semplice analisi grafica pare indicare la possibilità di presenza di radici unitarie; andiamo dunque a testare la convinzione che le serie storiche presentino almeno una radice unitaria, facendo ricorso ai test di radice unitaria. 3.1.1 Test Augmented Dickey Fuller: cenni teorici Dickey e Fuller (1979) elaborano una procedura per testare la stazionarietà di un processo, indagando la presenza di radici di modulo unitario nel polinomio autoregressivo. Inizialmente il test era pensato per un
  • 10. 10 processo AR(1), in seguito Said e Dickey (1984) estesero la procedura a modelli autoregressivi di ordine superiore, il cosiddetto test Augmented Dickey-Fuller. Data una serie storica nella forma1 : 𝑦𝑡 = 𝜇0 + 𝜇1 𝑡 + ∑ 𝜌𝑗 𝑦𝑡−𝑗 𝑝 𝑗=1 + 𝑢 𝑡 con 𝑢 𝑡~𝑊𝑁 Il suo polinomio auto regressivo è: 1 − ∑ 𝜌𝑗 𝐿𝑗 𝑝 𝑗=1 = 0 Si dimostra che, sotto l’ipotesi ∑ 𝜌𝑗 𝑝 𝑗=1 ≥ 1, le radici del polinomio autoregressivo cadono all’esterno della circonferenza di raggio unitario nel piano complesso (tale risultato non vale in generale; tuttavia, esso vale sempre purché |𝜌𝑗| < 1 ∀𝑗; vale anche sotto altre ipotesi particolari). Dunque, sotto le ipotesi indicate, ∑ 𝜌𝑗 𝑝 𝑗=1 ≥ 1 implica la stazionarietà del processoAR(p). L’idea alla base del test Augmented Dickey-Fuller è stimare i parametri autoregressivi 𝜌𝑗 e poi verificare l’ipotesi 𝐻0 ∶ ∑ 𝜌𝑗 𝑝 𝑗=1 ≥ 1 𝐻𝐴 ∶ ∑ 𝜌𝑗 𝑝 𝑗=1 < 1 Nel concreto, il test ADF viene svolto in un’altra forma, ricorrendo a una riparametrizzazione del modello (ottenuta sottraendo 𝑦𝑡−1 da entrambi i lati): ∆𝑦𝑡 = 𝜇0 + 𝜇1 𝑡 + 𝜋𝑦𝑡−𝑗 + ∑ 𝛾𝑗∆𝑦𝑡−𝑗 𝑝−1 𝑗=1 + 𝑢 𝑡 E’ facile dimostrare che questo modello sia una semplice riparametrizzazione di quello presentato in precedenza, e le relazioni invertibili che legano il secondo modello al primo sono: { 𝜋 = −(1 − ∑ 𝜌𝑗 𝑝 𝑗=1 ) 𝛾𝑗 = − ∑ 𝜌 𝑘 𝑝 𝑘=𝑗+1 𝑗 = 1, … , 𝑝 − 1 Le ipotesi del test possono dunque essere riscritte come: 𝐻0 ∶ 𝜋 ≥ 0 𝐻𝐴 ∶ 𝜋 < 0 1 L’ordine massimo p del modello AR(p) utilizzato per descrivere la serie storica per il test ADF è normalmente fissato attraverso la raccomandazione di Schwert (1989): 𝑝 𝑚𝑎𝑥 = ⌊12 ( 𝑇 100 ) 0,25 ⌋ Spesso, questo valore è preso come ordine massimo per una strategia “a tappeto”, come descritta al paragrafo 3.1.2
  • 11. 11 La statistica test è data da 𝜋̂ 𝜎̂ 𝜋 , tuttavia essa non si distribuisce per campioni finiti come una t di Student come nei normali t test di azzeramento di un parametro, né è asintoticamente Normale, in quanto sotto 𝐻0 la variabile è non stazionaria, e dunque le stime di π non sono Normali; si ricorre allora alla distribuzione asintotica Dickey-Fuller: 𝜋̂ 𝜎̂ 𝜋 ~𝐷𝐹 La distribuzione DF non ha un’espressione analitica né per la densità né per la FDR, in quanto viene ricavata tramite simulazioni. La distribuzione DF varia a seconda dell’introduzione o meno delle componenti deterministiche nel modello, in particolare costante e trend; è invece invariante all’introduzione delle componenti stagionali. Non è dunque indifferente la scelta di inserire tali componenti ai fini del test. Come già accennato, il test Dickey-Fuller è un caso particolare del test Augmented Dickey-Fuller, per il quale l’ordine p del modello autoregressivo è pari a 1. 3.1.2 Applicazione del test ADF Tenendo presente quanto detto riguardo al test ADF, andiamo a verificare la stazionarietà delle serie storiche dei prezzi. Un passo preliminare che può essere utile per l’analisi successiva consiste nell’individuare gli ordini massimi del modello ARMA con cui modellizzare ciascuna serie: facciamo un’analisi preventiva dei correlogrammi delle varie serie Tutti i correlogrammi delle serie storiche dei prezzi, così come delle serie logaritmiche, presentano una Funzione di Autocorrelazione che parte vicina ad 1 e decresce molto lentamente; la Funzione di Autocorrelazione Parziale, invece, presenta sempre il primo elemento vicino ad 1, mentre gli altri cadono quasi sempre all’interno della banda di confidenza; il fatto che pochi ne cadano all’esterno è molto probabilmente legato alla probabilità di errore di prima specie del 5% implicita nei test disgiunti rappresentati dalla banda di confidenza. A titolo di esempio, riportiamo ACF e PACF per la serie dei prezzi del titolo FORD: Da questa analisi qualitativa, ci aspettiamo dunque di poter modellare le serie con dei processi AR (1).
  • 12. 12 Per accertarcene, tuttavia, procediamo con una strategia “a tappeto”: stabiliamo gli ordini massimi 𝑝 𝑚𝑎𝑥 e 𝑞 𝑚𝑎𝑥 e sviluppiamo tutte le combinazioni di ARMA (p, q) con 𝑝 < 𝑝 𝑚𝑎𝑥 e 𝑞 < 𝑞 𝑚𝑎𝑥. Gli ordini massimi sono fissati arbitrariamente a 5 e vengono calcolati i criteri di informazioni di Akaike, Schwarz, e Hannan-Quinn per ciascuna combinazione di p e q minori o uguali ai massimi scelti. In questa operazione, è importante aggiustare il campione in modo che tutti i modelli si basino sugli stessi dati: infatti la stima è stata realizzata con la massima verosimiglianza condizionale, e dunque il numero delle prime osservazioni che non vengono utilizzate dipende dal numero di ritardi dello specifico modello: bisogna dunque limitare il campione per tutti i modelli a escludere le prime 5 osservazione, in modo che tutti si basino sulle medesime osservazioni, e l’applicazione dei criteri di informazione sia corretta2 . La scelta non risulta mai univoca, in particolare il criterio AIC tende ad essere permissivo in quanto a numero totale di parametri, mentre BIC e HQC sono più parsimoniosi; tuttavia, BIC e HQC concordano quasi sempre nell’indicare entrambi come ottimale il modello ARMA(1,0), cioè il modello AR(1), come ci aspettavamo. Possiamo dunque ritenere che le serie storiche dei prezzi siano effettivamente ben rappresentate da processi AR(1). A titolo di esempio, riportiamo in appendice i risultati dei criteri di informazione per il titolo Ford (tabella 1). Sui prezzi logaritmici l’analisi porta ai medesimi risultati. Una volta individuato il processo che meglio approssima le serie storiche dei prezzi, procediamo all’applicazione vera e propria del test Dickey-Fuller: l’algoritmo di applicazione del test ADF va automaticamente a eseguire la procedura appena descritta, in modo da determinare il numero di ritardi ottimale da inserire nell’equazione il cui parametro 𝜋̂ determina la statistica test. Il test ADF, tuttavia, specifica la serie storica solo come modello AR, senza componenti MA. Per verificare ulteriormente la correttezza dell’analisi appena svolta, lasciamo che l’algoritmo scelga liberamente l’ordine AR ottimale, partendo dall’ordine massimo di Schwert, di cui abbiamo già accennato in nota al paragrafo 3.1.1. Il criterio di informazione da ottimizzare selezionato è stato il criterio di Schwarz, che identifica per tutte le serie come ottimale un processo AR(1) I test sono condotti tutti con costante e trend, in quanto non inserirli erroneamente potrebbe portare a distorsioni significative a favore della non stazionarietà dei processi, mentre inserirli erroneamente porta a una meno grave perdita di efficienza3 . Come ci aspettavamo, tutti i test, sia sulle serie storiche dei prezzi sia sulle serie logaritmiche dei prezzi, non rifiutano l’ipotesi 𝐻0 di presenza di radici unitarie; non possiamo dunque rifiutare la non stazionarietà dei processi. I risultati dei test sono riportati in appendice, alla tabella 2. Volendo testare se le variabili siano I(1) sarebbe possibile eseguire un test ADF sulla differenza prima e valutare se essa risulti stazionaria. 2 Contrariamente a quanto si potrebbe pensare, anche 5 osservazioni su un campione di più di mille elementi possono portare a scelte dell’ordine ottimale differenti per i criteri di informazione. 3 In alternativa, sarebbe possibile valutare la significatività dei parametri 𝜇̂0 e 𝜇̂1 ottenuti attraverso la stima di max verosimiglianza esatta o condizionale del modello, tramite i t-test restituiti in output. Resta però vero che, a meno di forte evidenza statistica contraria, sia opportuno inserire costante e trend nel test ADF.
  • 13. 13 3.1.3 Test KPSS Esistono altri test oltre al test ADF, per testare la stazionarietà di una serie storica; in particolare, il test KPSS (Kwiatkowski, Phillips, Schmidt e Shin, 1991) testa l’ipotesi nulla di stazionarietà, al contrario di quanto faceva il test ADF. Una descrizione dettagliata del test esula dai fini di questo lavoro; l’idea alla base è che una generica serie storica 𝑦𝑡può essere scomposta nella somma di trend, random walk e un errore stazionario: 𝑦𝑡 = 𝜉0 + 𝜉1 𝑡 + 𝑟𝑡 + 𝑒𝑡 dove 𝑟𝑡 = 𝑟𝑡−1 + 𝑢 𝑡 è un random walk con 𝑢 𝑡~𝑖𝑖𝑑(0, 𝜎 𝑢 2 ), 𝜉0 e 𝜉1 rappresentano costante e trend, mentre 𝑒𝑡 è un processo stazionario a media nulla Il caso in cui la serie non presenti trend è un caso particolare di quello presentato, in cui basta imporre 𝜉 = 0. Per il modello scritto in questa forma, l’ipotesi di stazionarietà si traduce semplicemente nell’ipotesi 𝜎 𝑢 2 = 0. La statistica utilizzata è la statistica dei Moltiplicatori di Lagrange (o Score) per testare 𝜎 𝑢 2 = 0 contro l’alternativa 𝜎 𝑢 2 > 0, ed è data da: ∑ 𝑆̂𝑡 2𝑇 𝑡=1 𝑇2 𝜎̂2 Dove 𝑆̂𝑡 = ∑ 𝑒̂ 𝑠 𝑡 𝑠=1 è la cumulata parziale dei residui stimati dalla regressione di 𝑦𝑡contro il blocco deterministico, mentre 𝜎̂2 è la stima della varianza di 𝑒𝑡. Applichiamo il test KPSS a tutte le serie storiche dei prezzi. I test KPSS rifiutano la stazionarietà di tutte le serie storiche dei prezzi, concordando così con i test ADF visti al paragrafo precedente. 3.2 Regressione di Cointegrazione Una volta verificata la non stazionarietà delle serie storiche dei prezzi, procediamo a stimarne la regressione di cointegrazione. Per fare questo ricorriamo agli OLS, anche se esistono studi che indicano l’opportunità di ricorrere ad altri stimatori come lo stimatore di Theil-Sen; ricordiamo infatti che, qualora i residui della regressione di cointegrazione risultino stazionari, le stime OLS della regressione di cointegrazione godranno della proprietà di super-consistenza. La regressione di cointegrazione è: 𝑃𝑡 𝐴 = 𝛽0 + 𝛽1 𝑃𝑡 𝐵 + 𝑧𝑡 oppure, per il modello logaritmico: 𝑙𝑛𝑃𝑡 𝐴 = 𝑏0 + 𝑏1 𝑙𝑛𝑃𝑡 𝐵 + 𝑣𝑡 Di queste regressioni salviamo i residui 𝑧𝑡, 𝑣𝑡, dei quali al passo successivo testeremo la stazionarietà. 𝜷 è detto vettore di cointegrazione; 𝛽1è detto coefficiente di cointegrazione A titolo di esempio, riportiamo i grafici delle stime di cointegrazione e i residui della coppia FORD-GM e APPLE-GOOGLE:
  • 14. 14 Vediamo che gli attraversamenti dell’asse delle ascisse sono molto più numerosi per il residuo di Ford-GM rispetto al residuo Apple-Google; esiste una relazione fra il numero di zero-crossing del residuo e le sue caratteristiche, in particolare la sua stazionarietà (Rice, 1945): a noi basti notare che già da un’analisi grafica il residuo della coppia Ford-GM appare più mean-reverting rispetto al residuo di Apple-Google. Vedremo nel prossimo paragrafo, che la prima coppia risulta cointegrata, mentre la seconda no.
  • 15. 15 3.3 Analisi di Radice Unitaria sui residui Il terzo passo dell’analisi di cointegrazione consiste nel testare la stazionarietà dei residui. La procedura è identica a quella esaminata al paragrafo 3.1. C’è tuttavia da notare che la variabile di cui stiamo testando la stazionarietà nasce come residuo di una regressione lineare, e quindi ha per costruzione media e trend nulli: per questo motivo, nei test ADF e KPSS ora non ha senso subire la perdita di efficienza legata all’inserimento non necessario di costante e trend. I test sono dunque condotti sempre senza costante né trend4 . Essendo al momento lo scopo della nostra analisi testare la stazionarietà dei residui, il test ADF ci risulta più affidabile rispetto al test KPSS, in quanto il test ADF ci permette di rifiutare con una confidenza nota l’ipotesi di non stazionarietà. Per questo motivo, quando i test risultano discordanti, in questa sezione ci affidiamo al test ADF. I risultati dei test sono riportati in appendice alla tabella 3. Tutte le coppie selezionate risultano cointegrate, ad eccezione della coppia Apple-Google. 3.4 Modellazione dinamica delle coppie cointegrate E’ possibile modellare i residui che sono risultati cointegrati, applicando la strategia “a tappeto” vista nella sezione 3.1.2: come per le serie storiche, i criteri di informazione propendono quasi sempre per una modellazione AR(1). Una conseguenza fondamentale della cointegrazione è che, nota la caratteristica del residuo di essere mean-reverting, è possibile dare una rappresentazione dinamica delle serie dei prezzi, attraverso un Error- Correction-Model: l’idea dietro questa rappresentazione è che sistemi cointegrati hanno un equilibrio di lungo termine; dunque, se vi è un allontanamento dalla media, allora una o entrambe le serie si aggiustano per ripristinare l’equilibrio; il teorema che afferma l’equivalenza fra cointegrazione e rappresentazione error-correction prende il nome di Granger Representation Theorem. La modellazione dinamica delle serie dei prezzi risulta dunque: { ∆𝑃𝑡 𝐴 = 𝛾 𝐴[𝑃𝑡−1 𝐴 − (𝛽̂0 + 𝛽̂1 𝑃𝑡−1 𝐵 )] + 𝑢 𝑡 𝐴 ∆𝑃𝑡 𝐵 = 𝛾 𝐵[𝑃𝑡−1 𝐴 − (𝛽̂0 + 𝛽̂1 𝑃𝑡−1 𝐵 )] + 𝑢 𝑡 𝐵 Si noti che il fattore in parentesi quadra rappresenta lo spread al periodo precedente, 𝑧𝑡−1. E’ proprio la capacità predittiva derivante dall’aver determinato la caratteristica del residuo di essere mean reverting a permetterci di elaborare la strategia di Pairs Trading, e ottenere ritorni maggiori a parità di rischio. 3.5 Implicazioni della cointegrazione a seconda della specificazione del modello E’ interessante notare che, a seconda che l’analisi sia condotta sulla serie storica dei prezzi o su quella trasformata in logaritmi, le implicazioni concrete sono differenti. 4 Il comando coint sul software Gretl permette di inserire o meno costante e trend nella regressione di cointegrazione, ma non permette di specificare se inserirli nel test di radice unitaria, per questo non è stato applicato e si è preferito svolgere il procedimento separatamente
  • 16. 16 L’individuazione di cointegrazione per le serie storiche dei prezzi non trasformati suppone una relazione lineare stazionaria fra i due titoli, e dunque che la differenza fra il prezzo del titolo A e β volte il prezzo del titolo B (dove β è il coefficiente di cointegrazione) sia mean-reverting. Tuttavia, come visto, si può indagare se esista una relazione stazionaria fra i logaritmi dei prezzi, e dunque applicare un modello ad elasticità costante. In questo modello, la cointegrazione implica che la differenza fra il ritorno del titolo A e β volte il ritorno del titolo B sia mean-reverting. Euristicamente si nota che, se le serie dei prezzi sono cointegrate, normalmente anche le serie dei logaritmi risultano cointegrate, e questo è confermato dalle nostre analisi. Capitolo 4. STRATEGIA DI TRADING Le coppie sono state selezionate in quanto legate dal settore di appartenenza, o dalla commodity che ne determina il valore, o da motivi tecnici, e infatti molte di esse sono risultate cointegrate. E’ tuttavia importante notare che la cointegrazione da sola non garantisce il buon esito della strategia di Pairs Trading: ad esempio, se il residuo ha oscillazioni troppo contenute intorno allo zero, il guadagno ottenuto dal ritorno a zero dello spread può risultare insufficiente a coprire i costi di apertura della posizione, e dunque esiste una soglia di volatilità minima necessaria affinché la coppia sia utilizzabile in una strategia di pairs trading. Esistono dunque una serie di considerazioni ulteriori alla semplice cointegrazione, che devono essere analizzate affinché la strategia di Pairs Trading abbia successo: esse costituiscono l’argomento di questo capitolo. 4.1 Costruzione del Portafoglio Per prima cosa andiamo ad esaminare come utilizzare le informazioni individuate nell’analisi di cointegrazione per costruire il portafoglio. Abbiamo concluso che il residuo della regressione di cointegrazione, che prende il nome di spread nella strategia di trading, ha un comportamento stazionario mean-reverting: la logica alla base di tutta la strategia è acquistare lo spread quando esso è sotto media e venderlo allo scoperto quando è sopra media, aspettandoci che il suo comportamento mean-reverting ci porti un capital gain. Ovviamente a tal fine va bene acquistare o vendere allo scoperto una qualsiasi grandezza proporzionale allo spread. Nel caso in cui si sia scelta la specificazione lineare, realizzare un portafoglio con queste caratteristiche è molto semplice; infatti il modello nel caso lineare è 𝑃𝑡 𝐴 = 𝛽0 + 𝛽1 𝑃𝑡 𝐵 + 𝑧𝑡, che può essere riscritto come 𝑥𝑡 = 𝑧𝑡 + 𝛽0 = 𝑃𝑡 𝐴 − 𝛽1 𝑃𝑡 𝐵 Viste le caratteristiche di 𝑧𝑡, 𝑥𝑡 è un processo stazionario e mean reverting, con l’unica differenza che la media a cui ritorna è 𝛽0 invece che zero; è quindi evidente che un portafoglio costruito acquistando 𝑛 𝐴 titoli A e 𝑛 𝐵 = −𝛽1 𝑛 𝐴 titoli B soddisfa le condizioni richieste: equivale a comprare o vendere lo spread
  • 17. 17 più una costante, che però verrà annullata al momento della chiusura della posizione, e quindi sono le variazioni dello spread a determinare la variazione di valore del portafoglio, come volevamo. Nel caso in cui il modello sia scritto in forma logaritmica, invece, bisogna fare attenzione a costruire diversamente il portafoglio di trading: in questo caso, infatti, bisogna mantenere una proporzione 1: 𝑏1 non sul numero di azioni, bensì sulla quantità di denaro investita nei due asset. Il risultato finale è molto semplice, mostriamo come vi si giunge: il modello in forma logaritmica si scrive: 𝑙𝑛𝑃𝑡 𝐴 = 𝑏0 + 𝑏1 𝑙𝑛𝑃𝑡 𝐵 + 𝑣𝑡 Come nel caso lineare, riscriviamo il modello come: 𝑥𝑡 = 𝑣𝑡 + 𝑏0 = 𝑙𝑛𝑃𝑡 𝐴 − 𝑏1 𝑙𝑛𝑃𝑡 𝐵 Di nuovo, 𝑥𝑡 è un processo stazionario e mean reverting come 𝑣𝑡, solo con media pari a 𝑏0 invece che 0. Immaginiamo di investire 𝑚 𝐴 euro nel titolo A, e 𝑚 𝐵 = −𝑏1 𝑚 𝐴 euro nel titolo B. Indichiamo con ∆ la variazione fra il periodo t e il periodo t+i e con ∆% la variazione percentuale nel medesimo intervallo di tempo. Vale: ∆𝑃𝐹𝑡 = 𝑚 𝐴 ∗ ∆% 𝑃𝑡 𝐴 + 𝑚 𝐵 ∗ ∆% 𝑃𝑡 𝐵 =̃ 𝑚 𝐴 ∗ [ 𝑙𝑛𝑃𝑡+𝑖 𝐴 − 𝑙𝑛𝑃𝑡 𝐴 ] − 𝛽1 𝑚 𝐴[ 𝑙𝑛𝑃𝑡+𝑖 𝐵 − 𝑙𝑛𝑃𝑡 𝐵 ] = = 𝑚 𝐴 [( 𝑙𝑛𝑃𝑡+𝑖 𝐴 − 𝛽1 𝑙𝑛𝑃𝑡+𝑖 𝐵 ) − ( 𝑙𝑛𝑃𝑡 𝐴 − 𝛽1 𝑙𝑛𝑃𝑡 𝐵 )] = 𝑚 𝐴 ∗ ∆𝑥𝑡 Il caso 𝑚 𝐴 = 1 , 𝑚 𝐵 = −𝑏1 è ovviamente un caso particolare di quello presentato. Abbiamo dimostrato che la variazione del valore del portafoglio così costruito è pari a 𝑚 𝐴 volte 𝑥𝑡, che è un processo stazionario e mean reverting come lo spread, a meno di una costante. Quindi anche questo portafoglio rispetta le condizioni necessarie per poter generare una strategia di Pairs Trading basata sul comportamento mean-reverting dello spread. Spesso la regressione di cointegrazione sui logaritmi porta a individuare un coefficiente di cointegrazione 𝑏1 vicino ad 1; infatti, un beta uguale ad 1 implica che il rapporto fra i due prezzi sia stazionario, e questo è ragionevole e si trova frequentemente nella realtà, ed è stato rilevato anche per alcune serie storiche analizzate. Il modello logaritmico infatti può essere riscritto come: 𝑃 𝐴,𝑡 𝑃 𝐵,𝑡 𝑏1 = 𝐴𝑒 𝑣 𝑡, che diventa, in caso di coefficiente di cointegrazione unitario: 𝑃 𝐴,𝑡 𝑃 𝐵,𝑡 = 𝐴𝑒 𝑣 𝑡 Dove A è una costante, data da 𝐴 = 𝑒 𝑏0
  • 18. 18 Se si dimostra che i logaritmi dei prezzi sono cointegrati, questo indica che 𝑣𝑡 è stazionario e mean reverting: il modello riscritto nella forma 2 rende evidente il fatto che questo implica che il rapporto fra le due variabili sia mean-reverting a sua volta. 4.2 I costi di transazione Mentre in altre strategie di trading i costi di transazione possono essere trascurati, nel pairs trading essi giocano un ruolo fondamentale: infatti, il pairs trading sfrutta deviazioni relativamente piccole e fa un numero non trascurabile di transazioni in un breve tempo. Per questo i costi di transazione possono incidere significativamente sulla marginalità della strategia, e inoltre la struttura dei costi deve essere tenuta in considerazione per fissare adeguatamente i parametri che indicano quando aprire o chiudere le posizioni. I costi di transazione variano considerevolmente da caso a caso, dipendono dal mercato di quotazione, del tipo di titolo e dalla sua liquidità, dalle condizioni del provider o della piattaforma sulla quale vengono effettuate le transazioni, dalla tipologia di investitore o addirittura dalla frequenza con cui fa operazioni sul mercato e così via. Cerchiamo di dare un quadro generale dei costi di transazione più rilevanti. Il primo tipo di costi che consideriamo sono le commissioni sull’operazione: esse rappresentano dei costi fissi che vengono pagati ogni volta che viene effettuata un’operazione. Solitamente sono una quota del capitale mosso dalla transazione, e hanno un valore minimo oltre il quale non scendono, anche se il capitale mosso è molto basso. Questi costi spingono verso una strategia conservativa nel numero di posizioni da aprire: infatti, di fronte a uno spread con varianza molto bassa intorno alla media, sarebbe possibile pensare di aprire e chiudere le posizioni con frequenza molto alta, ogni qualvolta lo spread si allontani anche di poco dalla media. Questo tipo di strategia risulta non adeguata se i costi fissi sono elevati, mentre è preferibile aprire le posizioni solo quando lo spread si sia allontanato considerevolmente dal valore di equilibrio, in modo da poter beneficiare di un ritorno consistente dalla chiusura delle posizioni, che compensi i costi sostenuti per aprirle. Nelle successive analisi, descritte nel capitolo 5, applicheremo un tasso di commissione di 19 punti base rispetto al totale del capitale impegnato, calcolato per ogni transazione (il dato è tratto da FINECO), in media con i tassi applicati dagli operatori del settore per transazioni simili. Le commissioni generalmente dipendono dall’operatore considerato e dalla fascia in cui si colloca l’investitore (la quale dipende dalla frequenza con cui egli effettua transazioni); i valori scelti sono dunque dei valori ragionevoli, puramente indicativi per un investitore medio. Un altro costo rilevante, tipico di operazioni di Pairs Trading sono gli interessi sullo short selling: la piattaforma sulla quale si effettua il trading richiede degli interessi sulle posizioni corte assunte. Infatti, essa presta all’investitore il denaro necessario per assumere tale posizione. Vi è inoltre un altro costo implicito dello short selling, costituito dal costo opportunità del margine di garanzia.
  • 19. 19 Più sono alti questi costi, e più rapida dovrebbe essere la chiusura delle posizioni; infatti gli interessi sono legati al tempo in cui resta aperta la posizione. Per questo motivo è necessario prestare attenzione agli effetti dei parametri di apertura e chiusura delle posizioni sul cosiddetto holding period. Nelle simulazioni condotte al capitolo 5, il tasso per queste operazioni è calcolato considerando un tasso di attualizzazione composto giornalmente, secondo la formula: 𝑡𝑔 = √(1 + 𝑡𝑎) 365 − 1 Utilizzando un tasso ragionevole per queste operazioni (6% annuo, di nuovo applicato da FINECO per operazioni di short-selling) si ottiene un tasso giornaliero di 0,016%. Un altro costo che è importante considerare per questa tipologia di trading è il bid-ask spread: esso rappresenta il denaro che si è costretti a perdere nell’operazione di acquisto o vendita, per via della distanza fra curve di domanda e offerta. Lo spread bid-ask cresce al diminuire della liquidità del titolo, e può ridurre i margini della strategia in maniera rilevante se essa comprende titoli illiquidi. Quando il titolo ha un intermediario che svolge il compito di Market-Maker, lo spread bid ask è fissato da quest’ultimo e rappresenta il suo guadagno; questo ha il pregio di mantenere il bid ask spread a livelli contenuti favorendo la liquidità dei titoli, tuttavia i margini del market maker erodono quelli degli investitori. Quando invece non c’è market maker, lo spread è direttamente la distanza fra la curva di domanda e la curva di offerta nel book del mercato. Ne deriva che questo costo non è fisso, bensì dipende dall’incontrarsi di curva di domanda e offerta al momento in cui si intende effettuare la transazione, ed è dunque difficile stimarlo; un’ipotesi ragionevole per titoli non illiquidi può essere di 2 punti base sul valore scambiato. Meno rilevanti sono i costi di slippage e brokerage. 4.3 Condizioni di apertura e chiusura della posizione Come accennato all’inizio del capitolo, la cointegrazione è condizione necessaria ma non sufficiente all’apertura di una posizione: esistono una serie di altre condizioni che indicano l’opportunità e il momento in cui aprire una posizione. Nel paragrafo precedente abbiamo detto che le condizioni di apertura e chiusura delle posizioni devono essere ottimizzate sulla base della struttura dei costi di transazione, che tuttavia variano a seconda del caso specifico; ne segue che non si possono stabilire regole valide in generale, quindi ci limiteremo a indicare i principali criteri e le logiche con cui si fissano tali condizioni, ricordando che esse vanno modificate caso per caso. Innanzitutto, vi è un’altra condizione preliminare, necessaria per fare trading su una coppia di titoli: essa consiste in una soglia minima di volatilità del residuo di cointegrazione: esso deve presentare delle oscillazioni intorno alla media di ampiezza sufficiente a generare un capital gain nel portafoglio che giustifichi i costi di transazione sopportati per aprire la posizione.
  • 20. 20 Questa condizione è alla base dei risultati di alcuni studi recenti che indicano come i margini garantiti dal pairs trading siano in calo: la presenza di grossi operatori che effettuano questo genere di trading tende a far chiudere molto rapidamente le oscillazioni dello spread, per l’effetto che il loro investimento ha sul valore dei titoli. Di conseguenza, i piccoli investitori che hanno costi di apertura delle posizioni molto maggiori, vedono i loro profitti diminuire. La condizione principale per determinare il momento di apertura di una coppia, invece, richiede che lo spread sia sufficientemente lontano dalla media; a ciò è opportuno aggiungere la condizione che lo spread sia in fase di convergenza verso la media, e non vi si stia allontanando. La lontananza dello spread dalla sua media è espressa in termini di deviazioni standard della serie dei residui di cointegrazione. Un esempio di condizione di apertura, che è quello che sarà poi applicato nell’analisi di back-testing del modello nel capitolo 5 è la seguente: 𝑧𝑡−2 > 1,5 𝜎̂𝑧 ; 𝑧𝑡−1 > 1,5 𝜎̂𝑧 ; 𝑧𝑡 < 1,5 𝜎̂𝑧 Come detto al capitolo 2.1, se la relazione di cointegrazione non è supportata da considerazioni legate ai fondamentali dei titoli o delle aziende, essa può rompersi senza preavviso: per le coppie in cui si ritiene che la relazione di cointegrazione possa modificarsi o cessare di esistere, è importante mettere una condizione di stop-loss, vale a dire un valore soglia di allontanamento del residuo dalla sua media, oltre il quale si ritiene che la relazione di cointegrazione si possa essere rotta, e dunque che sia opportuno chiudere la posizione per limitare le perdite. Come sempre, il valore soglia deve essere valutato caso per caso, a seconda della robustezza della relazione di cointegrazione e della propensione al rischio dell’investitore. Un esempio di valore soglia potrebbe essere rappresentato da 3 deviazioni standard di distanza dalla media. Alla condizione di stop-loss spesso si affianca una durata massima accettabile per una posizione senza che essa superi incontri una condizione di chiusura. Esistono poi differenti criteri per chiudere la posizione: si può usare un criterio di prudenza e chiudere già quando lo spread scende al di sotto di un certo numero di deviazioni standard, ad esempio al di sotto di 0,25 deviazioni standard, oppure aspettare il completo ritorno in media dello spread. Un’alternativa più rischiosa è attendere che lo spread oscilli dall’altra parte della media prima di chiudere la posizione. Un altro parametro da considerare nell’elaborazione di una strategia di pairs trading è il livello di leverage da utilizzare. Una trattazione dei costi e dei benefici dell’indebitamento nelle operazioni di trading esula dai nostri scopi; si tenga solo presente che è possibile indebitarsi (normalmente fino a una certa soglia massima fissata dalla piattaforma di trading utilizzata) e questo può portare a incrementare notevolmente i guadagni, al prezzo di una maggior esposizione al rischio. Allo stesso modo, la quantità di denaro da allocare su una posizione dipende da un’analisi comparata di diverse opportunità di investimento, che non tratteremo.
  • 21. 21 Capitolo 5. BACK-TESTING Per concludere, è stata svolta un’analisi di back testing sulla strategia fin qui descritta. Con il termine back-testing si indica il processo per cui l’investitore si mette idealmente in un istante di tempo nel passato, ed elabora la strategia basandosi solo sui dati in suo possesso fino a quel momento: poi utilizza i dati che si sono effettivamente registrati sui mercati dal momento scelto fino ad oggi, per valutare come avrebbe performato la strategia elaborata. Per fare back testing su una strategia di pairs trading è necessario stabilire un parametro per tutte le condizioni indicati nel capitolo precedente. Una volta che tutte le condizioni sono stabilite, la strategia viene applicata in automatico ai dati, e se ne registrano i risultati, determinando quali trade il modello avrebbe selezionato. Nota che noi guardiamo alle operazioni sul singolo titolo; normalmente, si fa una serie di coppie e criteri di apertura e chiusura, e si mette un portafogli e si vede come performa: ad esempio si veda (The Duck Strategy Chrilly Donninger)... noi però testiamo la validità del modello solamente su due o tre titoli, non siamo interessati a misurare la performance del portafoglio.. Normalmente, per i gestori di portafogli, il back testing viene fatto considerando un universo molto nutrito di coppie possibili, e allocando mano a mano il capitale disponibile fra tali coppie: la crescita del capitale investito a seguito della strategia viene misurata e confrontata con un benchmark. Si veda ad esempio The Duck Strategy, Donninger, 2013. Nel nostro caso, invece, ci limiteremo ad applicare la strategia a due coppie, per verificarne la ragionevolezza e il funzionamento; non siamo invece interessati a confrontare i rendimenti percentuali di una certa somma rispetto a un’alternativa di investimento. Il back testing è stato applicato sia al modello lineare che al modello logaritmico, per vedere se i due modelli portano a scelte di investimento differenti. Si sono utilizzati i dati dal 2010 al luglio 2014 per costruire il modello, mentre i dati degli ultimi 12 mesi sono stati utilizzati per testare il funzionamento della strategia. I risultati dei test di cointegrazione non sono cambiati limitando il campione, mentre le stime dei residui della regressione di cointegrazione sono risultate leggermente differenti, ma non in maniera molto evidente, come si può vedere dal seguente grafico:
  • 22. 22 Sulla base dei residui stimati, applicando le condizioni di apertura e chiusura delle posizioni si sono individuati i momenti in cui la strategia avrebbe portato ad effettuare gli investimenti: in figura è rappresentata l’implementazione della strategia per le varie coppie testate: -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 10/06/2014 18/09/2014 27/12/2014 06/04/2015 15/07/2015 23/10/2015 Confronto stime residui Ford - GM RES BACK TESTING RES CAMPIONE COMPLETO -1 -0,5 0 0,5 1 1,5 2 2,5 10/06/2014 18/09/2014 27/12/2014 06/04/2015 15/07/2015 23/10/2015 Back testing Ford - GM lineare RES BACK TESTING POSIZIONE
  • 23. 23 I flussi netti totali generati dalla strategia costruita sul modello lineare e su quello logaritmico sono stati rispettivamente € 1.148,16 e € 1.180,47. Le strategie sono pressoché identiche, e le posizioni si aprono e chiudono negli stessi giorni. La differenza nel ritorno complessivo è legata più alla diversa composizione del portafoglio (come trattato al paragrafo 4.1) che a effettive differenze nei risultati. Riguardo al back testing della coppia Exxon – Chevron, riportiamo il grafico complessivo: Poiché l’anno è terminato con la posizione ancora aperta, per verificare i flussi fino a quel momento la posizione è stata chiusa forzatamente, seppure questo abbia penalizzato la strategia; inoltre, la lunga durata della prima apertura ha ridotto i margini. I flussi annuali complessivi di questa coppia sono di € 252,05. La strategia pare funzionare bene in entrambi i casi: le posizioni si sono aperte in momenti ragionevoli, e hanno portato a buoni ritorni, soprattutto per la coppia Ford – GM, il cui spread ha avuto più zero-crossing nel corso degli ultimi 12 mesi. La strategia non pare influenzata dai momenti negativi di mercato, a conferma della sua market-neutrality. -0,1 -0,05 0 0,05 0,1 0,15 0,2 10/06/2014 18/09/2014 27/12/2014 06/04/2015 15/07/2015 23/10/2015 Back testing Ford - GM logaritmico RESIDUO BT posizione -4 -2 0 2 4 6 8 10 10/06/2014 18/09/2014 27/12/2014 06/04/2015 15/07/2015 23/10/2015 Back testing EXXON - Chevron res_lin posizione res_lin_BT
  • 24. 24 Capitolo 6. BIBLIOGRAFIA Robert F. Engle; C. W. J. Granger (1987). Co-Integration and Error Correction: Representation, Estimation, and Testing. Econometrica, Vol. 55, No. 2. (Mar., 1987), pp. 251-276. Ganapathy Vidyamurthy (2004) Pairs trading : quantitative methods and analysis. New Jersey: John Wiley. Douglas S. Ehrman (2006) The handbook of Pairs Trading. John Wiley. Binh Do, Robert Faff, Kais Hamza (2006), A new approach to modeling and estimation for pairs trading Dickey, D. and W. Fuller (1979). “Distribution of the Estimators for Autoregressive Time Series with a Unit Root,” Journal of the American Statistical Association, 74, 427-431. Kwiatkowski, Phillips, Schmidt, Shin (1991) Testing the null hypothesis of stationarity against the alternative of a unit root Mengyun Zhang (2012) Research on Modern Implications of Pairs Trading Chrilly Donninger (2013) Pairs Trading with CoIntegration: The Duck Strategy Supakorn Mudchanatongsuk, James A. Primbs and Wilfred Wong (2008) Optimal Pairs Trading: A Stochastic Control Approach Greene W.H (2012), Econometric Analysis, 7th edition Riccardo Lucchetti (2013): Appunti di analisi delle serie storiche
  • 25. 25 Appendici TAVOLA 1: SELEZIONE DEGLI ORDINI MASSIMI Campione completo dei dati: 2010-11-18 - 2015-07-17 (n = 1157) Campione attuale: 2010-11-26 - 2015-07-17 (n = 1152) AR = 0 MA = 0 AIC = 5453,538 BIC = 5458,587 HQ = 5455,444 AR = 0 MA = 1 AIC = 3997,252 BIC = 4012,399 HQ = 4002,969 AR = 0 MA = 2 AIC = 2878,273 BIC = 2898,47 HQ = 2885,897 AR = 0 MA = 3 AIC = 2148,43 BIC = 2173,676 HQ = 2157,959 AR = 0 MA = 4 AIC = 1661,176 BIC = 1691,472 HQ = 1672,611 AR = 0 MA = 5 AIC = 1285,111 BIC = 1320,456 HQ = 1298,452 AR = 1 MA = 0 AIC = -215,27 BIC = -205,172 HQ = -211,459 AR = 1 MA = 1 AIC = -214,925 BIC = -194,728 HQ = -207,302 AR = 1 MA = 2 AIC = -212,925 BIC = -187,678 HQ = -203,395 AR = 1 MA = 3 AIC = -211,297 BIC = -181,001 HQ = -199,862 AR = 1 MA = 4 AIC = -210,766 BIC = -175,422 HQ = -197,425 AR = 1 MA = 5 AIC = -213,072 BIC = -172,678 HQ = -197,826 AR = 2 MA = 0 AIC = -216,976 BIC = -201,828 HQ = -211,258 AR = 2 MA = 1 AIC = -212,984 BIC = -187,737 HQ = -203,454 AR = 2 MA = 2 AIC = -212,108 BIC = -181,812 HQ = -200,673 AR = 2 MA = 3 AIC = -210,649 BIC = -175,304 HQ = -197,308 AR = 2 MA = 4 AIC = -209,76 BIC = -169,366 HQ = -194,514 AR = 2 MA = 5 AIC = -211,394 BIC = -165,95 HQ = -194,241 AR = 3 MA = 0 AIC = -215,028 BIC = -194,831 HQ = -207,404 AR = 3 MA = 1 AIC = -211,911 BIC = -181,615 HQ = -200,476 AR = 3 MA = 2 AIC = -212,53 BIC = -177,185 HQ = -199,189 AR = 3 MA = 3 AIC = -216,571 BIC = -176,177 HQ = -201,324 AR = 3 MA = 4 AIC = -212,82 BIC = -167,377 HQ = -195,667 AR = 3 MA = 5 AIC = -221,204 BIC = -170,712 HQ = -202,146 AR = 4 MA = 0 AIC = -213,225 BIC = -187,978 HQ = -203,695 AR = 4 MA = 1 AIC = -209,912 BIC = -174,567 HQ = -196,571 AR = 4 MA = 2 AIC = -215,886 BIC = -175,492 HQ = -200,639 AR = 4 MA = 3 AIC = -214,834 BIC = -169,391 HQ = -197,681 AR = 4 MA = 4 AIC = -220,907 BIC = -170,415 HQ = -201,849 AR = 4 MA = 5 AIC = -222,061 BIC = -166,519 HQ = -201,097 AR = 5 MA = 0 AIC = -212,531 BIC = -182,235 HQ = -201,096 AR = 5 MA = 1 AIC = -210,079 BIC = -169,685 HQ = -194,832 AR = 5 MA = 2 AIC = -212,127 BIC = -166,684 HQ = -194,975 AR = 5 MA = 3 AIC = -219,205 BIC = -168,712 HQ = -200,147 AR = 5 MA = 4 AIC = -220,386 BIC = -164,844 HQ = -199,422 AR = 5 MA = 5 AIC = -220,098 BIC = -159,507 HQ = -197,228
  • 26. 26 TAVOLA 2: REGRESSIONI DI COINTEGRAZIONE REGRESSIONE DI COINTEGRAZIONE FORD-GM OLS, usando le osservazioni 2010-11-18:2015-07-17 (T = 1157) Variabile dipendente: F Coefficiente Errore Std. rapporto t p-value const 0,442924 0,11669 3,7957 0,0002 *** GM 0,426245 0,00380555 112,0061 <0,0001 *** REGRESSIONE DI COINTEGRAZIONE EXXON-CHEVRON OLS, usando le osservazioni 2010-01-04:2015-07-16 (T = 1383) Variabile dipendente: XOM Coefficiente Errore Std. rapporto t p-value const 11,6372 0,485799 23,9548 <0,0001 *** CVX 0,686422 0,00482624 142,2271 <0,0001 *** REGRESSIONE DI COINTEGRAZIONE COCA COLA-PEPSI OLS, usando le osservazioni 2010-01-04:2015-07-17 (T = 1384) Variabile dipendente: CCE Coefficiente Errore Std. rapporto t p-value const −15,4779 0,485569 −31,8757 <0,0001 *** PEP 0,660519 0,00669472 98,6626 <0,0001 *** REGRESSIONE DI COINTEGRAZIONE APPLE-GOOGLE OLS, usando le osservazioni 2010-01-04:2015-07-16 (T = 1387) Variabile dipendente: AAPL Coefficiente Errore Std. rapporto t p-value const 1,98619 1,56659 1,2678 0,2051 GOOGL 0,172015 0,00380718 45,1817 <0,0001 *** REGRESSIONE DI COINTEGRAZIONE BRENT-WTI OLS, usando le osservazioni 2010-02-11:2015-07-17 (T = 1360) Variabile dipendente: BRENT Coefficiente Errore Std. rapporto t p-value const −2,65999 1,22651 −2,1688 0,0303 ** WTI 1,13225 0,0149739 75,6149 <0,0001 ***
  • 27. 27 TAVOLA 3: RISULTATI DEI TEST DI STAZIONARIETA’ TEST ADF NON STAZIONARIETA' PREZZI TEST ADF NON STAZIONARIETA' RESIDUI P-VALUE IPOTESI NULLA P-VALUE IPOTESI NULLA FORD 0,4856 accetto 0,005946 rifiuto GENERAL MOTORS 0,509 accetto EXXON 0,8207 accetto 0,008916 rifiuto CHEVRON 0,9842 accetto COCA COLA 0,1172 accetto 0,01355 rifiuto PEPSI 0,265 accetto APPLE 0,8038 accetto 0,1302 accetto GOOGLE 0,1291 accetto BRENT 0,9656 accetto 0,04174 rifiuto WTI 0,8671 accetto