2015.07.27_Applied Econometrics Paper - Pairs Trading_Thomas Dossi

PAIRS TRADING
Selezione delle coppie, analisi di cointegrazione ed
elaborazione di una strategia di trading
Autore: Thomas Dossi
Professore: Rocco Roberto Mosconi
27/07/2015
Abstract
Il lavoro si concentra sullo sviluppo di una strategia di statistical arbitrage pairs trading attraverso
il metodo di cointegrazione, illustrando i criteri di selezione delle coppie, la procedura di
cointegrazione di Engle-Granger e l’implementazione della strategia di trading. La teoria
presentata viene applicata a 5 coppie di serie storiche di prezzi di titoli quotati. Infine viene
condotta un’analisi di back-testing per verificare le performance della strategia sviluppata.

2
SOMMARIO
ABSTRACT 1
CAPITOLO 1. PAIRS TRADING 3
1.1 STRATEGIE MARKET-NEUTRAL 3
1.2 PAIRS TRADING 3
1.3 IMPLEMENTAZIONE DELLA STRATEGIA 5
CAPITOLO 2. SCELTA DELLE COPPIE E ANALISI DEI DATI 6
2.1 SCELTA DELLE COPPIE 6
2.2 ANALISI DEI DATI 7
2.3 NOTA SULLA SPECIFICAZIONE LOGARITMICA DEL MODELLO 8
CAPITOLO 3. ANALISI DI COINTEGRAZIONE, APPROCCIO ENGLE-GRANGER 8
3.1 ANALISI DI RADICE UNITARIA SULLE SERIE STORICHE 9
3.1.1 TEST AUGMENTED DICKEY FULLER: CENNI TEORICI 9
3.1.2 APPLICAZIONE DEL TEST ADF 11
3.1.3 TEST KPSS 13
3.2 REGRESSIONE DI COINTEGRAZIONE 13
3.3 ANALISI DI RADICE UNITARIA SUI RESIDUI 15
3.4 MODELLAZIONE DINAMICA DELLE COPPIE COINTEGRATE 15
3.5 IMPLICAZIONI DELLA COINTEGRAZIONE A SECONDA DELLA SPECIFICAZIONE DEL MODELLO 15
CAPITOLO 4. STRATEGIA DI TRADING 16
4.1 COSTRUZIONE DEL PORTAFOGLIO 16
4.2 I COSTI DI TRANSAZIONE 18
4.3 CONDIZIONI DI APERTURA E CHIUSURA DELLA POSIZIONE 19
CAPITOLO 5. BACK-TESTING 21
CAPITOLO 6. BIBLIOGRAFIA 24
APPENDICI 25

3
Capitolo 1. PAIRS TRADING
1.1 Strategie Market-Neutral
Il termine market-neutral caratterizza una serie di strategie di investimento il cui ritorno sia incorrelato con
il ritorno del mercato. Facendo riferimento alla teoria del Capital Asset Pricing Model, portafogli market-
neutral possono essere definiti come portafogli caratterizzati da un β pari a 0. Il rendimento è dunque
legato alla componente residuale del CAPM. Tipicamente portafogli costruiti secondo questa logica
presentano una minore volatilità, ma questo non implica che tali strategie siano prive di rischio.
Queste strategie vengono concretamente implementate attraverso l’utilizzo combinato di acquisto e
vendita allo scoperto di titoli, e derivano i propri ritorni dalla relazione fra le performance dei titoli detenuti
in posizione long e di quelli in posizione short: l’idea centrale di queste strategie è dunque che il
rendimento sia definito dalle performance relative fra i titoli piuttosto che dalle loro performance assolute,
come invece accade nei portafogli tradizionali. L’investitore che sviluppa una strategia di questo genere si
attende che il portafoglio in posizione lunga sovraperformi quello in posizione corta, generando così un
ritorno positivo a prescindere dalla performance assoluta dei due portafogli.
Si noti che la possibilità di includere titoli in posizione corta all’interno di un portafoglio consente di
utilizzare in maniera più efficiente l’informazione disponibile: infatti in un portafoglio tradizionale,
caratterizzato da sole posizioni lunghe, la capacità di ordinare i titoli in base alle performance attese (come
tipicamente si fa nel processo di allocazione dei capitali) genererà ritorni positivi solo quando tali
performance siano positive: se i titoli selezionati performano meglio di quelli scartati, ma comunque con
performance negative, il portafoglio complessivo vedrà ridotto il proprio valore. Quindi, l’abilità di trasferire
al portafoglio le informazioni sulle performance relative attese, attraverso l’assunzione di posizioni long-
short può incrementare i ritorni a parità del livello di rischio assunto.
Una particolare strategia market-neutral è rappresentata dal Pairs Trading.
1.2 Pairs Trading
Definizione: con il termine Pairs Trading si indica una strategia di investimento volta a identificare due
società (o commodities) con caratteristiche similari, i cui titoli equity siano scambiati a un prezzo lontano
dalla loro relazione storica. La strategia di investimento consiste nell’acquistare la security relativamente
sottovalutata e contemporaneamente vendere allo scoperto quella relativamente sopravvalutata,
mantenendo così la neutralità rispetto al mercato (Ehrman, 2006). Un profitto è realizzato attraverso la
chiusura delle posizioni a seguito del ritorno “all’equilibrio” dei due prezzi (Do, 2006).
Il pairs trading è dunque una strategia market-neutral per la quale il portafoglio neutrale è costruito
utilizzando solo due asset, uno in posizione lunga e l’altro in posizione corta, secondo un rapporto
predeterminato. Tale portafoglio è costruito in modo da essere proporzionale in ogni istante a una
grandezza chiamata spread, misura del mispricing rispetto alla relazione statistica di equilibrio, determinata
attraverso l’analisi delle serie storiche dei prezzi.

4
Lo spread, opportunamente costruito e testato, è ritenuto essere un processo mean-reverting, e dunque il
pairs trading consiste nell’apertura delle posizioni quando lo spread è lontano dal suo valore atteso
marginale, nell’aspettativa che vi ritorni: le posizioni vengono così chiuse dopo la convergenza dello spread
al suo valore atteso marginale.
Esistono due versioni differenti di pairs trading su titoli di equity (Vidyamurthy, 2004): statistical arbitrage
pairs trading e risk arbitrage pairs trading.
Lo statistical arbitrage pairs trading fa riferimento al pricing relativo fra due titoli: la ratio alla base è che
titoli con caratteristiche similari debbano essere prezzati in maniera simile, e che dunque sussistano
relazioni statistiche fra titoli simili: in quest’ottica, lo spread è visto come mispricing di uno o entrambi i
titoli. La strategia si fonda dunque sull’assunzione di una posizione long-short quando lo spread sia lontano
dalla media, nell’ipotesi che il mispricing venga corretto dal mercato e ritorni a zero, generando una
performance positiva nel portafoglio.
Diversamente, il risk arbitrage pairs trading viene sviluppato in ambito di fusioni e acquisizioni fra imprese:
qualora l’operazione sia realizzata tramite scambio di azioni, i termini dell’M&A, in particolare il rapporto di
concambio, stabiliscono una relazione di parità fra i titoli delle due imprese coinvolte. Tuttavia, sul mercato
possono generarsi delle inefficienze che portano i titoli lontano dalla relazione di parità definita, spesso a
causa di incertezze sul’effettiva realizzazione dell’operazione: questo apre la possibilità di assumere una
posizione long-short sui titoli delle due aziende quando essi siano lontani dal rapporto di concambio
definito dal contratto dell’operazione. Lo spread è dunque misurato dalla distanza da questo rapporto, il
rischio del portafoglio è dato dall’incertezza sull’effettiva realizzazione dell’operazione, e il rendimento
deriva dal ritorno a zero dello spread. A differenza dello statistical arbitrage pairs trading, dunque, questa
forma di pairs trading non si basa su un rapporto statistico fra i due titoli, bensi sulla relazione di concambio
deterministica definita dalle condizioni contrattuali della fusione o acquisizione.
Si noti che il termine statistical arbitrage, detto anche relative value arbitrage, non indica un arbitraggio
“tradizionale”, risultante da inefficienze di mercato, informazione lenta o errata, bensì da un
allontanamento statisticamente significativo del prezzo dalla relazione percepita come corretta
dall’investitore. Pertanto, questa forma di arbitraggio non è affatto priva di rischio come l’arbitraggio
tradizionalmente inteso. Allo stesso modo, come detto, anche il risk arbitrage presenta una componente di
rischio, legata all’effettiva realizzazione dell’operazione.
Esistono tre metodi principali secondo cui viene implementata una strategia di Pairs Trading (Do, 2006):
 Distance method: lo spread fra i due titoli viene misurato come la distanza verticale al quadrato fra
le due serie dei prezzi normalizzate. Le coppie sono selezionate scegliendo per ciascun titolo il titolo
che minimizza la distanza da esso, vale a dire la somma delle differenze al quadrato fra le due serie
dei prezzi. Questo approccio manca di capacità previsiva riguardo al tempo di convergenza e,
soprattutto, assume implicitamente che la distanza fra i livelli dei prezzi sia stazionaria nel tempo.
 Cointegration method: l’approccio basato sulla cointegrazione esplora la possibilità di combinare
linearmente due serie storiche entrambe integrate di ordine d per produrre una singola serie
storica integrata di ordine d-b; il caso più semplice, che analizzeremo in dettaglio in seguito è il caso
d=b=1. In questo caso, la serie storica derivante dalla combinazione lineare è stazionaria, e questo

5
permette di fare forecasting sulla base di informazioni passate. Per testare la cointegrazione
seguiremo l’approccio di Engle-Granger. Se il test di cointegrazione fallisce, è bene evitare di
elaborare una strategia di pairs trading sulla coppia analizzata.
 Stochastic spread method (Elliot et al, 2005): definisce lo spread come la differenza fra i prezzi dei
due asset, e modella il comportamento mean-reverting dello spread nel tempo continuo,
attraverso il seguente modello:
𝑦𝑡 = 𝑥𝑡 + 𝐻𝜔 𝑡
𝑑𝑥𝑡 = 𝑘(𝜃 − 𝑥𝑡)𝑑𝑡 + 𝜎𝑑𝐵𝑡
Lo spread 𝑦𝑡 è rappresentato dalla somma della variabile di stato latente 𝑥𝑡 e un errore Gaussiano:
𝜔 𝑡~𝑁𝑜𝑟(0,1). Il modello assume che 𝑥𝑡 segua un processo di Vasicek; tale processo è mean-
reverting con media 𝜃, a cui tende con velocità 𝑘. 𝑑𝐵𝑡è un moto Browniano standard. In questo
modo si assume che lo spread osservato si comporti come un processo mean-reverting disturbato
da un errore gaussiano.
In questo genere di analisi, è opportuno definire lo spread come la differenza fra i logaritmi dei
prezzi dei due asset:
𝑦(𝑡) = 𝑙𝑜𝑔(𝑝𝑡
𝐴
) − 𝑙𝑜𝑔(𝑝𝑡
𝐵
)
Infatti, spesso la differenza di lungo termine fra due titoli non è costante, ma si allarga quando essi
crescono, mentre si stringe quando il loro prezzo cala: questo fa si che la specificazione logaritmica
risulti in questi casi più appropriata.
In questo lavoro ci occuperemo di statistical arbitrage pairs trading, sviluppato attraverso il metodo di
cointegrazione.
Il pairs trading può essere realizzato su titoli di equity o su ETF trattanti commodity, o su altre tipologie di
strumenti finanziari. Diverse tipologie di strumenti hanno comportamenti differenti, e questo può portare
ad aggiustamenti nella strategia (ad esempio si veda Donninger, 2013). In questo lavoro si analizzeranno 4
coppie equity e una coppia di ETF aventi come sottostante petrolio.
1.3 Implementazione della strategia
In questa sezione riassumiamo brevemente il processo di implementazione di una strategia di pairs trading,
che riflette peraltro la struttura del prosieguo del lavoro.
Innanzitutto, il trader deve individuare le coppie di titoli candidate ad essere utilizzate, sulla base di
considerazioni illustrate nel capitolo 2. Le coppie saranno poi sottoposte a un test di cointegrazione, per
valutare se gli elementi teorichi sui titoli considerati sono rispecchiati dall’effettivo andamento dei loro
prezzi. Una considerazione importante riguarda la necessità di non selezionare troppe coppie senza validi
motivi che ne spieghino la cointegrazione e poi sottoporle al test, in quanto come tutti i test, il test di
cointegrazione è soggetto a errore di prima specie; quindi, fissata una significatività α, il test porta a
accettare erroneamente la cointegrazione in una percentuale α dei casi. La scelta di testare numerose
coppie per identificare quelle cointegrate, può portare a accettare coppie solo per effetto dell’errore di
prima specie.

6
L’analisi di cointegrazione, che sarà trattata in dettaglio nel capitolo 3, identifica anche la relazione di
“equilibrio” fra i due asset, e dunque permette di calcolare lo spread e di identificare il vettore di
cointegrazione, fondamentali per l’implementazione concreta della strategia.
Per le coppie di titoli che risultino cointegrati si procede alla formalizzatione delle regole di trading,
esaminata nel capitolo 4: innanzitutto si individuano le condizioni di apertura e chiusura delle posizioni,
incluse delle condizioni stop-loss per limitare le perdite in caso di andamento inaspettato dello spread;
inoltre si identificano le caratteristiche che deve avere il portafoglio in modo che il suo valore rispecchi
l’andamento dello spread in posizione lunga o corta a seconda che esso si trovi rispettivamente sotto o
sopra il suo valore atteso marginale. Per fare ciò si acquista in posizione lunga il titolo che si trova sopra la
relazione di equilibrio identificata, mentre si vende allo scoperto quello che si trova al di sotto, secondo un
rapporto ben preciso legato al vettore di cointegrazione, come sarà discusso al paragrafo 4.1.
Ultimo passo è l’effettiva implementazione della strategia: trattata nel capitolo 5 attraverso il back testing
del modello: la strategia di trading sarà elaborata sulla base dei dati fino a luglio 2014, e poi sarà applicata
per un anno, utilizzando gli effettivi dati registrati sul mercato negli ultimi 12 mesi. si terrà conto dei reali
costi di transazione, in modo da testare la reale efficacia del modello e i ritorni che esso garantisce.
Capitolo 2. SCELTA DELLE COPPIE E ANALISI DEI DATI
2.1 Scelta delle coppie
Passo fondamentale in un processo di Pairs Trading è l’identificazione delle coppie di titoli potenzialmente
cointegrate. Questa scelta può essere fatta sulla base dei fondamentali reali delle aziende (o dei titoli) in
questione, oppure su considerazioni puramente statistiche derivanti dall’analisi delle serie storiche de
prezzi.
L’approccio scelto è il primo, in quanto la presenza di un solido razionale economico che leghi l’andamento
dei prezzi dei due titoli permette una giustificazione teorica alla ricerca di un legame di cointegrazione, e dà
più garanzie sul fatto che questo legame perdurerà nel tempo, fintanto che perdureranno le condizioni
tecnologiche o di mercato che uniscono i due titoli.
Al contrario, la semplice individuazione di titoli statisticamente correlati o con andamenti simili, non dà
alcuna garanzia che la relazione individuata perdurerà anche nel futuro, e se anche esistessero cause reali
che legano i due titoli, questo approccio statistico non permette di accorgersi del loro venir meno, in
quanto tali cause non sono state propriamente individuate.
Il processo di selezione può essere sviluppato in maniera più sofisticata, affiancando a un’analisi del grado
di co-movimento dei due titoli, l’individuazione di un nesso fra cointegrazione e l’Arbitrage Pricing Theory,
in modo da legare il rendimento di un titolo a una serie di variabili macroeconomiche: questo permette di
individuare i titoli con maggiore probabilità di essere cointegrati, giustificando la selezione con variabili
reali. Tale processo esula dai fini di questo lavoro, mentre è trattato nel dettaglio in Vidyamurthy, 2007,
capitolo 6.

7
2.2 Analisi dei dati
Selezioniamo 5 coppie di titoli con buone potenzialità di risultare cointegrati, sulla base di similitudini di
business, prodotti, immagine, mercato di vendita e mercato di quotazione.
4 di queste coppie riguardano titoli equity quotati sul mercato americano, riferite a aziende simili: esse
sono:
 Ford – General Motors
 Exxon – Chevron
 Coca Cola – Pepsi
 Apple – Google
La quinta coppia, invece, riguarda due ETF quotati entrambi al London Stock Exchange, entrambi aventi
petrolio come sottostante: il primo, OSW1.L, fa riferimento al petrolio WTI, mentre il secondo, OSB1.L, ha
come sottostante il petrolio BRENT. Le due tipologie di petrolio hanno caratteristiche diverse, e per
motivazioni tecnologiche i loro prezzi sono differenti; tuttavia, esiste una relazione chiara e abbastanza
stabile fra i due titoli, quindi si è ritenuto opportuno testarne la cointegrazione.
I dati raccolti per ciascuna coppia fanno riferimento ai prezzi di chiusura giornalieri (aggiustati per i
dividendi e altre forme di distribuzione, in modo che rappresentino fedelmente l’andamento del valore
della società) per il periodo gennaio 2010 – luglio 2015. Tutti i prezzi indicati sono in dollari USA. Le fonti dei
dati sono Quandl e Yahoo Finance.

8
Già da una prima ispezione grafica, quasi tutte le serie presentate paiono presentare un comportamento
compatibile con un processo random-walk: Coca Cola, Pepsi ed Apple danno l’idea di poter essere trend-
reverting, con un trend crescente, ipotesi che indagheremo al paragrafo 3.1.2.
Se vi sono stagionalità, esse non sono immediatamente identificabili, neppure nei titoli connessi al petrolio
(Brent, WTI innanzitutto, ma anche Exxon e Chevron), a dispetto di quanto ci potremmo aspettare.
Ciononostante, è possibile la presenza di stagionalità con periodo di stagionalità annuale, legata alla
stagionalità dei consumi energetici. Nella modellazione di questi titoli dovremmo tenere conto della
possibile presenza di stagionalità, valutando la possibilità di includere dummy stagionali.
2.3 Nota sulla specificazione logaritmica del modello
In questo lavoro, l’analisi sarà condotta sia sulle serie storiche dei prezzi, sia sulle serie storiche dei loro
logaritmi. Infatti, non siamo alla ricerca di un particolare tipo di relazione fra i titoli, purché essa risulti
stazionaria: l’identificazione di stazionarietà del residuo può portare a elaborare una strategia di Pairs
Trading per entrambi i modelli, seppur con alcune differenze importanti di cui è fondamentale tenere
conto. Le due differenti specificazioni del modello determinano implicazioni della cointegrazione differenti,
e conseguentemente determinano differenze nella strategia di trading: le differenze che sorgono
applicando il modello logaritmico sono trattate nei paragrafi 3.5 e 4.1.
Capitolo 3. ANALISI DI COINTEGRAZIONE, APPROCCIO ENGLE-GRANGER
Passo fondamentale della nostra analisi è individuare e stimare le eventuali relazioni di cointegrazione fra le
coppie di titoli selezionate. Esistono diversi approcci per raggiungere tale risultato; in particolare seguiremo
l’approccio di Engle-Granger, basato sulla regressione di cointegrazione, che illustreremo passo passo.
Innanzitutto definiamo (Engle, Granger, 1987):
SERIE INTEGRATA: una serie senza componenti deterministiche avente una
rappresentazione ARMA stazionaria e invertibile dopo aver differenziato d volte si dice
essere integrate di ordine d, indicato come 𝒙 𝑡~𝐼(𝑑).
COINTEGRAZIONE: le componenti di un vettore 𝒙 𝑡 si dicono co-integrate di ordine d, b,
indicato come 𝒙 𝑡~𝐶𝐼(𝑑, 𝑏), se tutte le componenti di 𝒙 𝑡 sono 𝐼(𝑑) e se esiste un vettore
𝛼 ≠ 0 tale che 𝑧𝑡 = 𝛼′
𝒙 𝑡~𝐼(𝑑 − 𝑏) con 𝑏 > 0.

9
Per la nostra analisi, il vettore 𝒙 𝑡 è composto di sole 2 componenti; noi analizzeremo il caso frequente per
cui 𝑑 = 1, 𝑏 = 1, e dunque diremo cointegrate due serie per le quali esista una combinazione lineare
stazionaria, ossia 𝐼(0).
La procedura si compone di 3 passi:
1. Il passo preliminare è verificare che le serie storiche dei prezzi siano integrate di ordine maggiore di
0, dunque che siano non stazionarie
2. Si procede poi a individuare la relazione di cointegrazione, che si ritiene possa risultare stazionaria:
per fare questo, l’approccio di Engle-Granger prevede di regredire una serie contro l’altra, sulla
base dell’idea che, essendo la relazione di regressione quella che minimizza il residuo, essa debba
darmi la relazione più stabile fra le due serie
3. Il passo finale consiste nel verificare che il residuo della regressione di cointegrazione sia in effetti
stazionario
Proprietà fondamentale della regressione di cointegrazione è che, se il residuo risulta stazionario, allora le
stime ottenute dalla regressione di cointegrazione sono super-consistenti, vale a dire che al crescere della
dimensione campionaria T, esse convergono al valore vero con un tasso di convergenza pari a T, maggiore
delle normali stime di regressione, che presentano un tasso di convergenza pari a √𝑇.
Se al contrario, il residuo risultasse non stazionario, le stime della regressione di cointegrazione sarebbero
soggette al problema della regressione spuria e dunque non convergerebbero neanche asintoticamente al
valore vero.
Analizziamo ora uno ad uno i passi del processo.
3.1 Analisi di radice unitaria sulle serie storiche
Primo passo dell’analisi di cointegrazione è la verifica della non stazionarietà delle serie storiche dei prezzi.
L’assunzione che il prezzo di un asset in borsa (o il suo logaritmo) segua un processo random-walk è
un’assunzione standard, è stata usata estensivamente nei modelli di pricing di opzioni con buoni risultati:
dunque ci aspettiamo di individuare la presenza di almeno una radice unitaria in ciascun polinomio
autoregressivo caratterizzante le serie storiche dei prezzi.
Il random-walk è una martingala, e dunque il miglior predittore del prezzo è l’ultimo prezzo registrato sul
mercato: questo è concorde con l’ipotesi di efficienza del mercato; se, come ci aspettiamo, l’analisi di
radice unitaria confermasse la possibilità che i prezzi seguano un processo random walk, non è possibile
costruire un portafoglio di statistical arbitrage (come definito al paragrafo 1.2) su una sola posizione lunga o
corta. Al contrario, se il test rifiutasse la presenza di radice unitaria, sarebbe possibile modellare il prezzo
con un processo stazionario trend-reverting, e dunque costruire un portafoglio di statistical arbitrage senza
necessità di ricorrere alla regressione di cointegrazione.
Come già indicato nel capitolo 2, la semplice analisi grafica pare indicare la possibilità di presenza di radici
unitarie; andiamo dunque a testare la convinzione che le serie storiche presentino almeno una radice
unitaria, facendo ricorso ai test di radice unitaria.
3.1.1 Test Augmented Dickey Fuller: cenni teorici
Dickey e Fuller (1979) elaborano una procedura per testare la stazionarietà di un processo, indagando la
presenza di radici di modulo unitario nel polinomio autoregressivo. Inizialmente il test era pensato per un

10
processo AR(1), in seguito Said e Dickey (1984) estesero la procedura a modelli autoregressivi di ordine
superiore, il cosiddetto test Augmented Dickey-Fuller.
Data una serie storica nella forma1
:
𝑦𝑡 = 𝜇0 + 𝜇1 𝑡 + ∑ 𝜌𝑗 𝑦𝑡−𝑗
𝑝
𝑗=1 + 𝑢 𝑡 con 𝑢 𝑡~𝑊𝑁
Il suo polinomio auto regressivo è:
1 − ∑ 𝜌𝑗 𝐿𝑗
𝑝
𝑗=1
= 0
Si dimostra che, sotto l’ipotesi ∑ 𝜌𝑗
𝑝
𝑗=1 ≥ 1, le radici del polinomio autoregressivo cadono all’esterno della
circonferenza di raggio unitario nel piano complesso (tale risultato non vale in generale; tuttavia, esso vale
sempre purché |𝜌𝑗| < 1 ∀𝑗; vale anche sotto altre ipotesi particolari).
Dunque, sotto le ipotesi indicate, ∑ 𝜌𝑗
𝑝
𝑗=1 ≥ 1 implica la stazionarietà del processoAR(p). L’idea alla base
del test Augmented Dickey-Fuller è stimare i parametri autoregressivi 𝜌𝑗 e poi verificare l’ipotesi
𝐻0 ∶ ∑ 𝜌𝑗
𝑝
𝑗=1
≥ 1 𝐻𝐴 ∶ ∑ 𝜌𝑗
𝑝
𝑗=1
< 1
Nel concreto, il test ADF viene svolto in un’altra forma, ricorrendo a una riparametrizzazione del modello
(ottenuta sottraendo 𝑦𝑡−1 da entrambi i lati):
∆𝑦𝑡 = 𝜇0 + 𝜇1 𝑡 + 𝜋𝑦𝑡−𝑗 + ∑ 𝛾𝑗∆𝑦𝑡−𝑗
𝑝−1
𝑗=1
+ 𝑢 𝑡
E’ facile dimostrare che questo modello sia una semplice riparametrizzazione di quello presentato in
precedenza, e le relazioni invertibili che legano il secondo modello al primo sono:
{
𝜋 = −(1 − ∑ 𝜌𝑗
𝑝
𝑗=1
)
𝛾𝑗 = − ∑ 𝜌 𝑘
𝑝
𝑘=𝑗+1
𝑗 = 1, … , 𝑝 − 1
Le ipotesi del test possono dunque essere riscritte come:
𝐻0 ∶ 𝜋 ≥ 0 𝐻𝐴 ∶ 𝜋 < 0
1 L’ordine massimo p del modello AR(p) utilizzato per descrivere la serie storica per il test ADF è normalmente fissato attraverso la
raccomandazione di Schwert (1989):
𝑝 𝑚𝑎𝑥 = ⌊12 (
𝑇
100
)
0,25
⌋
Spesso, questo valore è preso come ordine massimo per una strategia “a tappeto”, come descritta al paragrafo 3.1.2

11
La statistica test è data da
𝜋̂
𝜎̂ 𝜋
, tuttavia essa non si distribuisce per campioni finiti come una t di Student
come nei normali t test di azzeramento di un parametro, né è asintoticamente Normale, in quanto sotto 𝐻0
la variabile è non stazionaria, e dunque le stime di π non sono Normali; si ricorre allora alla distribuzione
asintotica Dickey-Fuller:
𝜋̂
𝜎̂ 𝜋
~𝐷𝐹
La distribuzione DF non ha un’espressione analitica né per la densità né per la FDR, in quanto viene ricavata
tramite simulazioni.
La distribuzione DF varia a seconda dell’introduzione o meno delle componenti deterministiche nel
modello, in particolare costante e trend; è invece invariante all’introduzione delle componenti stagionali.
Non è dunque indifferente la scelta di inserire tali componenti ai fini del test.
Come già accennato, il test Dickey-Fuller è un caso particolare del test Augmented Dickey-Fuller, per il
quale l’ordine p del modello autoregressivo è pari a 1.
3.1.2 Applicazione del test ADF
Tenendo presente quanto detto riguardo al test ADF, andiamo a verificare la stazionarietà delle serie
storiche dei prezzi.
Un passo preliminare che può essere utile per l’analisi successiva consiste nell’individuare gli ordini massimi
del modello ARMA con cui modellizzare ciascuna serie: facciamo un’analisi preventiva dei correlogrammi
delle varie serie
Tutti i correlogrammi delle serie storiche dei prezzi, così come delle serie logaritmiche, presentano una
Funzione di Autocorrelazione che parte vicina ad 1 e decresce molto lentamente; la Funzione di
Autocorrelazione Parziale, invece, presenta sempre il primo elemento vicino ad 1, mentre gli altri cadono
quasi sempre all’interno della banda di confidenza; il fatto che pochi ne cadano all’esterno è molto
probabilmente legato alla probabilità di errore di prima specie del 5% implicita nei test disgiunti
rappresentati dalla banda di confidenza.
A titolo di esempio, riportiamo ACF e PACF per la serie dei prezzi del titolo FORD:
Da questa analisi qualitativa, ci aspettiamo dunque di poter modellare le serie con dei processi AR (1).

12
Per accertarcene, tuttavia, procediamo con una strategia “a tappeto”: stabiliamo gli ordini massimi 𝑝 𝑚𝑎𝑥 e
𝑞 𝑚𝑎𝑥 e sviluppiamo tutte le combinazioni di ARMA (p, q) con 𝑝 < 𝑝 𝑚𝑎𝑥 e 𝑞 < 𝑞 𝑚𝑎𝑥.
Gli ordini massimi sono fissati arbitrariamente a 5 e vengono calcolati i criteri di informazioni di Akaike,
Schwarz, e Hannan-Quinn per ciascuna combinazione di p e q minori o uguali ai massimi scelti.
In questa operazione, è importante aggiustare il campione in modo che tutti i modelli si basino sugli stessi
dati: infatti la stima è stata realizzata con la massima verosimiglianza condizionale, e dunque il numero
delle prime osservazioni che non vengono utilizzate dipende dal numero di ritardi dello specifico modello:
bisogna dunque limitare il campione per tutti i modelli a escludere le prime 5 osservazione, in modo che
tutti si basino sulle medesime osservazioni, e l’applicazione dei criteri di informazione sia corretta2
. La
scelta non risulta mai univoca, in particolare il criterio AIC tende ad essere permissivo in quanto a numero
totale di parametri, mentre BIC e HQC sono più parsimoniosi; tuttavia, BIC e HQC concordano quasi sempre
nell’indicare entrambi come ottimale il modello ARMA(1,0), cioè il modello AR(1), come ci aspettavamo.
Possiamo dunque ritenere che le serie storiche dei prezzi siano effettivamente ben rappresentate da
processi AR(1).
A titolo di esempio, riportiamo in appendice i risultati dei criteri di informazione per il titolo Ford (tabella 1).
Sui prezzi logaritmici l’analisi porta ai medesimi risultati.
Una volta individuato il processo che meglio approssima le serie storiche dei prezzi, procediamo
all’applicazione vera e propria del test Dickey-Fuller: l’algoritmo di applicazione del test ADF va
automaticamente a eseguire la procedura appena descritta, in modo da determinare il numero di ritardi
ottimale da inserire nell’equazione il cui parametro 𝜋̂ determina la statistica test. Il test ADF, tuttavia,
specifica la serie storica solo come modello AR, senza componenti MA. Per verificare ulteriormente la
correttezza dell’analisi appena svolta, lasciamo che l’algoritmo scelga liberamente l’ordine AR ottimale,
partendo dall’ordine massimo di Schwert, di cui abbiamo già accennato in nota al paragrafo 3.1.1. Il criterio
di informazione da ottimizzare selezionato è stato il criterio di Schwarz, che identifica per tutte le serie
come ottimale un processo AR(1)
I test sono condotti tutti con costante e trend, in quanto non inserirli erroneamente potrebbe portare a
distorsioni significative a favore della non stazionarietà dei processi, mentre inserirli erroneamente porta a
una meno grave perdita di efficienza3
.
Come ci aspettavamo, tutti i test, sia sulle serie storiche dei prezzi sia sulle serie logaritmiche dei prezzi, non
rifiutano l’ipotesi 𝐻0 di presenza di radici unitarie; non possiamo dunque rifiutare la non stazionarietà dei
processi.
I risultati dei test sono riportati in appendice, alla tabella 2.
Volendo testare se le variabili siano I(1) sarebbe possibile eseguire un test ADF sulla differenza prima e
valutare se essa risulti stazionaria.
2
Contrariamente a quanto si potrebbe pensare, anche 5 osservazioni su un campione di più di mille elementi possono
portare a scelte dell’ordine ottimale differenti per i criteri di informazione.
3
In alternativa, sarebbe possibile valutare la significatività dei parametri 𝜇̂0 e 𝜇̂1 ottenuti attraverso la stima di max
verosimiglianza esatta o condizionale del modello, tramite i t-test restituiti in output. Resta però vero che, a meno di
forte evidenza statistica contraria, sia opportuno inserire costante e trend nel test ADF.

13
3.1.3 Test KPSS
Esistono altri test oltre al test ADF, per testare la stazionarietà di una serie storica; in particolare, il test
KPSS (Kwiatkowski, Phillips, Schmidt e Shin, 1991) testa l’ipotesi nulla di stazionarietà, al contrario di quanto
faceva il test ADF.
Una descrizione dettagliata del test esula dai fini di questo lavoro; l’idea alla base è che una generica serie
storica 𝑦𝑡può essere scomposta nella somma di trend, random walk e un errore stazionario:
𝑦𝑡 = 𝜉0 + 𝜉1 𝑡 + 𝑟𝑡 + 𝑒𝑡 dove 𝑟𝑡 = 𝑟𝑡−1 + 𝑢 𝑡 è un random walk con 𝑢 𝑡~𝑖𝑖𝑑(0, 𝜎 𝑢
2
),
𝜉0 e 𝜉1 rappresentano costante e trend, mentre 𝑒𝑡 è un processo stazionario a media nulla
Il caso in cui la serie non presenti trend è un caso particolare di quello presentato, in cui basta imporre 𝜉 =
0.
Per il modello scritto in questa forma, l’ipotesi di stazionarietà si traduce semplicemente nell’ipotesi 𝜎 𝑢
2
=
0.
La statistica utilizzata è la statistica dei Moltiplicatori di Lagrange (o Score) per testare 𝜎 𝑢
2
= 0 contro
l’alternativa 𝜎 𝑢
2
> 0, ed è data da:
∑ 𝑆̂𝑡
2𝑇
𝑡=1
𝑇2 𝜎̂2
Dove 𝑆̂𝑡 = ∑ 𝑒̂ 𝑠
𝑡
𝑠=1 è la cumulata parziale dei residui stimati dalla regressione di 𝑦𝑡contro il blocco
deterministico, mentre 𝜎̂2
è la stima della varianza di 𝑒𝑡.
Applichiamo il test KPSS a tutte le serie storiche dei prezzi. I test KPSS rifiutano la stazionarietà di tutte le
serie storiche dei prezzi, concordando così con i test ADF visti al paragrafo precedente.
3.2 Regressione di Cointegrazione
Una volta verificata la non stazionarietà delle serie storiche dei prezzi, procediamo a stimarne la
regressione di cointegrazione. Per fare questo ricorriamo agli OLS, anche se esistono studi che indicano
l’opportunità di ricorrere ad altri stimatori come lo stimatore di Theil-Sen; ricordiamo infatti che, qualora i
residui della regressione di cointegrazione risultino stazionari, le stime OLS della regressione di
cointegrazione godranno della proprietà di super-consistenza.
La regressione di cointegrazione è: 𝑃𝑡
𝐴
= 𝛽0 + 𝛽1 𝑃𝑡
𝐵
+ 𝑧𝑡
oppure, per il modello logaritmico: 𝑙𝑛𝑃𝑡
𝐴
= 𝑏0 + 𝑏1 𝑙𝑛𝑃𝑡
𝐵
+ 𝑣𝑡
Di queste regressioni salviamo i residui 𝑧𝑡, 𝑣𝑡, dei quali al passo successivo testeremo la stazionarietà.
𝜷 è detto vettore di cointegrazione; 𝛽1è detto coefficiente di cointegrazione
A titolo di esempio, riportiamo i grafici delle stime di cointegrazione e i residui della coppia FORD-GM e
APPLE-GOOGLE:

14
Vediamo che gli attraversamenti dell’asse delle ascisse sono molto più numerosi per il residuo di Ford-GM
rispetto al residuo Apple-Google; esiste una relazione fra il numero di zero-crossing del residuo e le sue
caratteristiche, in particolare la sua stazionarietà (Rice, 1945): a noi basti notare che già da un’analisi grafica
il residuo della coppia Ford-GM appare più mean-reverting rispetto al residuo di Apple-Google. Vedremo
nel prossimo paragrafo, che la prima coppia risulta cointegrata, mentre la seconda no.

15
3.3 Analisi di Radice Unitaria sui residui
Il terzo passo dell’analisi di cointegrazione consiste nel testare la stazionarietà dei residui. La procedura è
identica a quella esaminata al paragrafo 3.1.
C’è tuttavia da notare che la variabile di cui stiamo testando la stazionarietà nasce come residuo di una
regressione lineare, e quindi ha per costruzione media e trend nulli: per questo motivo, nei test ADF e KPSS
ora non ha senso subire la perdita di efficienza legata all’inserimento non necessario di costante e trend. I
test sono dunque condotti sempre senza costante né trend4
.
Essendo al momento lo scopo della nostra analisi testare la stazionarietà dei residui, il test ADF ci risulta più
affidabile rispetto al test KPSS, in quanto il test ADF ci permette di rifiutare con una confidenza nota
l’ipotesi di non stazionarietà. Per questo motivo, quando i test risultano discordanti, in questa sezione ci
affidiamo al test ADF.
I risultati dei test sono riportati in appendice alla tabella 3. Tutte le coppie selezionate risultano cointegrate,
ad eccezione della coppia Apple-Google.
3.4 Modellazione dinamica delle coppie cointegrate
E’ possibile modellare i residui che sono risultati cointegrati, applicando la strategia “a tappeto” vista nella
sezione 3.1.2: come per le serie storiche, i criteri di informazione propendono quasi sempre per una
modellazione AR(1).
Una conseguenza fondamentale della cointegrazione è che, nota la caratteristica del residuo di essere
mean-reverting, è possibile dare una rappresentazione dinamica delle serie dei prezzi, attraverso un Error-
Correction-Model: l’idea dietro questa rappresentazione è che sistemi cointegrati hanno un equilibrio di
lungo termine; dunque, se vi è un allontanamento dalla media, allora una o entrambe le serie si aggiustano
per ripristinare l’equilibrio; il teorema che afferma l’equivalenza fra cointegrazione e rappresentazione
error-correction prende il nome di Granger Representation Theorem. La modellazione dinamica delle serie
dei prezzi risulta dunque:
{
∆𝑃𝑡
𝐴
= 𝛾 𝐴[𝑃𝑡−1
𝐴
− (𝛽̂0 + 𝛽̂1 𝑃𝑡−1
𝐵
)] + 𝑢 𝑡
𝐴
∆𝑃𝑡
𝐵
= 𝛾 𝐵[𝑃𝑡−1
𝐴
− (𝛽̂0 + 𝛽̂1 𝑃𝑡−1
𝐵
)] + 𝑢 𝑡
𝐵
Si noti che il fattore in parentesi quadra rappresenta lo spread al periodo precedente, 𝑧𝑡−1.
E’ proprio la capacità predittiva derivante dall’aver determinato la caratteristica del residuo di essere mean
reverting a permetterci di elaborare la strategia di Pairs Trading, e ottenere ritorni maggiori a parità di
rischio.
3.5 Implicazioni della cointegrazione a seconda della specificazione del modello
E’ interessante notare che, a seconda che l’analisi sia condotta sulla serie storica dei prezzi o su quella
trasformata in logaritmi, le implicazioni concrete sono differenti.
4
Il comando coint sul software Gretl permette di inserire o meno costante e trend nella regressione di cointegrazione,
ma non permette di specificare se inserirli nel test di radice unitaria, per questo non è stato applicato e si è preferito
svolgere il procedimento separatamente

16
L’individuazione di cointegrazione per le serie storiche dei prezzi non trasformati suppone una relazione
lineare stazionaria fra i due titoli, e dunque che la differenza fra il prezzo del titolo A e β volte il prezzo del
titolo B (dove β è il coefficiente di cointegrazione) sia mean-reverting. Tuttavia, come visto, si può indagare
se esista una relazione stazionaria fra i logaritmi dei prezzi, e dunque applicare un modello ad elasticità
costante. In questo modello, la cointegrazione implica che la differenza fra il ritorno del titolo A e β volte il
ritorno del titolo B sia mean-reverting.
Euristicamente si nota che, se le serie dei prezzi sono cointegrate, normalmente anche le serie dei logaritmi
risultano cointegrate, e questo è confermato dalle nostre analisi.
Capitolo 4. STRATEGIA DI TRADING
Le coppie sono state selezionate in quanto legate dal settore di appartenenza, o dalla commodity che ne
determina il valore, o da motivi tecnici, e infatti molte di esse sono risultate cointegrate.
E’ tuttavia importante notare che la cointegrazione da sola non garantisce il buon esito della strategia di
Pairs Trading: ad esempio, se il residuo ha oscillazioni troppo contenute intorno allo zero, il guadagno
ottenuto dal ritorno a zero dello spread può risultare insufficiente a coprire i costi di apertura della
posizione, e dunque esiste una soglia di volatilità minima necessaria affinché la coppia sia utilizzabile in una
strategia di pairs trading. Esistono dunque una serie di considerazioni ulteriori alla semplice cointegrazione,
che devono essere analizzate affinché la strategia di Pairs Trading abbia successo: esse costituiscono
l’argomento di questo capitolo.
4.1 Costruzione del Portafoglio
Per prima cosa andiamo ad esaminare come utilizzare le informazioni individuate nell’analisi di
cointegrazione per costruire il portafoglio.
Abbiamo concluso che il residuo della regressione di cointegrazione, che prende il nome di spread nella
strategia di trading, ha un comportamento stazionario mean-reverting: la logica alla base di tutta la
strategia è acquistare lo spread quando esso è sotto media e venderlo allo scoperto quando è sopra media,
aspettandoci che il suo comportamento mean-reverting ci porti un capital gain. Ovviamente a tal fine va
bene acquistare o vendere allo scoperto una qualsiasi grandezza proporzionale allo spread.
Nel caso in cui si sia scelta la specificazione lineare, realizzare un portafoglio con queste caratteristiche è
molto semplice; infatti il modello nel caso lineare è 𝑃𝑡
𝐴
= 𝛽0 + 𝛽1 𝑃𝑡
𝐵
+ 𝑧𝑡, che può essere
riscritto come 𝑥𝑡 = 𝑧𝑡 + 𝛽0 = 𝑃𝑡
𝐴
− 𝛽1 𝑃𝑡
𝐵
Viste le caratteristiche di 𝑧𝑡, 𝑥𝑡 è un processo stazionario e mean reverting, con l’unica differenza che la
media a cui ritorna è 𝛽0 invece che zero; è quindi evidente che un portafoglio costruito acquistando 𝑛 𝐴
titoli A e 𝑛 𝐵 = −𝛽1 𝑛 𝐴 titoli B soddisfa le condizioni richieste: equivale a comprare o vendere lo spread

17
più una costante, che però verrà annullata al momento della chiusura della posizione, e quindi sono le
variazioni dello spread a determinare la variazione di valore del portafoglio, come volevamo.
Nel caso in cui il modello sia scritto in forma logaritmica, invece, bisogna fare attenzione a costruire
diversamente il portafoglio di trading: in questo caso, infatti, bisogna mantenere una proporzione 1: 𝑏1 non
sul numero di azioni, bensì sulla quantità di denaro investita nei due asset.
Il risultato finale è molto semplice, mostriamo come vi si giunge:
il modello in forma logaritmica si scrive: 𝑙𝑛𝑃𝑡
𝐴
= 𝑏0 + 𝑏1 𝑙𝑛𝑃𝑡
𝐵
+ 𝑣𝑡
Come nel caso lineare, riscriviamo il modello come: 𝑥𝑡 = 𝑣𝑡 + 𝑏0 = 𝑙𝑛𝑃𝑡
𝐴
− 𝑏1 𝑙𝑛𝑃𝑡
𝐵
Di nuovo, 𝑥𝑡 è un processo stazionario e mean reverting come 𝑣𝑡, solo con media pari a 𝑏0 invece che 0.
Immaginiamo di investire 𝑚 𝐴 euro nel titolo A, e 𝑚 𝐵 = −𝑏1 𝑚 𝐴 euro nel titolo B.
Indichiamo con ∆ la variazione fra il periodo t e il periodo t+i e con ∆% la variazione percentuale nel
medesimo intervallo di tempo.
Vale:
∆𝑃𝐹𝑡 = 𝑚 𝐴 ∗ ∆% 𝑃𝑡
𝐴
+ 𝑚 𝐵 ∗ ∆% 𝑃𝑡
𝐵
=̃ 𝑚 𝐴 ∗ [ 𝑙𝑛𝑃𝑡+𝑖
𝐴
− 𝑙𝑛𝑃𝑡
𝐴
] − 𝛽1 𝑚 𝐴[ 𝑙𝑛𝑃𝑡+𝑖
𝐵
− 𝑙𝑛𝑃𝑡
𝐵
] =
= 𝑚 𝐴 [( 𝑙𝑛𝑃𝑡+𝑖
𝐴
− 𝛽1 𝑙𝑛𝑃𝑡+𝑖
𝐵
) − ( 𝑙𝑛𝑃𝑡
𝐴
− 𝛽1 𝑙𝑛𝑃𝑡
𝐵
)] = 𝑚 𝐴 ∗ ∆𝑥𝑡
Il caso 𝑚 𝐴 = 1 , 𝑚 𝐵 = −𝑏1 è ovviamente un caso particolare di quello presentato.
Abbiamo dimostrato che la variazione del valore del portafoglio così costruito è pari a 𝑚 𝐴 volte 𝑥𝑡, che è un
processo stazionario e mean reverting come lo spread, a meno di una costante.
Quindi anche questo portafoglio rispetta le condizioni necessarie per poter generare una strategia di Pairs
Trading basata sul comportamento mean-reverting dello spread.
Spesso la regressione di cointegrazione sui logaritmi porta a individuare un coefficiente di cointegrazione 𝑏1
vicino ad 1; infatti, un beta uguale ad 1 implica che il rapporto fra i due prezzi sia stazionario, e questo è
ragionevole e si trova frequentemente nella realtà, ed è stato rilevato anche per alcune serie storiche
analizzate.
Il modello logaritmico infatti può essere riscritto come:
𝑃 𝐴,𝑡
𝑃 𝐵,𝑡
𝑏1
= 𝐴𝑒 𝑣 𝑡, che diventa, in caso di coefficiente di cointegrazione unitario:
𝑃 𝐴,𝑡
𝑃 𝐵,𝑡
= 𝐴𝑒 𝑣 𝑡
Dove A è una costante, data da 𝐴 = 𝑒 𝑏0

18
Se si dimostra che i logaritmi dei prezzi sono cointegrati, questo indica che 𝑣𝑡 è stazionario e mean
reverting: il modello riscritto nella forma 2 rende evidente il fatto che questo implica che il rapporto fra le
due variabili sia mean-reverting a sua volta.
4.2 I costi di transazione
Mentre in altre strategie di trading i costi di transazione possono essere trascurati, nel pairs trading essi
giocano un ruolo fondamentale: infatti, il pairs trading sfrutta deviazioni relativamente piccole e fa un
numero non trascurabile di transazioni in un breve tempo. Per questo i costi di transazione possono
incidere significativamente sulla marginalità della strategia, e inoltre la struttura dei costi deve essere
tenuta in considerazione per fissare adeguatamente i parametri che indicano quando aprire o chiudere le
posizioni.
I costi di transazione variano considerevolmente da caso a caso, dipendono dal mercato di quotazione, del
tipo di titolo e dalla sua liquidità, dalle condizioni del provider o della piattaforma sulla quale vengono
effettuate le transazioni, dalla tipologia di investitore o addirittura dalla frequenza con cui fa operazioni sul
mercato e così via. Cerchiamo di dare un quadro generale dei costi di transazione più rilevanti.
Il primo tipo di costi che consideriamo sono le commissioni sull’operazione: esse rappresentano dei costi
fissi che vengono pagati ogni volta che viene effettuata un’operazione. Solitamente sono una quota del
capitale mosso dalla transazione, e hanno un valore minimo oltre il quale non scendono, anche se il capitale
mosso è molto basso.
Questi costi spingono verso una strategia conservativa nel numero di posizioni da aprire: infatti, di fronte a
uno spread con varianza molto bassa intorno alla media, sarebbe possibile pensare di aprire e chiudere le
posizioni con frequenza molto alta, ogni qualvolta lo spread si allontani anche di poco dalla media. Questo
tipo di strategia risulta non adeguata se i costi fissi sono elevati, mentre è preferibile aprire le posizioni solo
quando lo spread si sia allontanato considerevolmente dal valore di equilibrio, in modo da poter
beneficiare di un ritorno consistente dalla chiusura delle posizioni, che compensi i costi sostenuti per
aprirle.
Nelle successive analisi, descritte nel capitolo 5, applicheremo un tasso di commissione di 19 punti base
rispetto al totale del capitale impegnato, calcolato per ogni transazione (il dato è tratto da FINECO), in
media con i tassi applicati dagli operatori del settore per transazioni simili. Le commissioni generalmente
dipendono dall’operatore considerato e dalla fascia in cui si colloca l’investitore (la quale dipende dalla
frequenza con cui egli effettua transazioni); i valori scelti sono dunque dei valori ragionevoli, puramente
indicativi per un investitore medio.
Un altro costo rilevante, tipico di operazioni di Pairs Trading sono gli interessi sullo short selling: la
piattaforma sulla quale si effettua il trading richiede degli interessi sulle posizioni corte assunte. Infatti, essa
presta all’investitore il denaro necessario per assumere tale posizione. Vi è inoltre un altro costo implicito
dello short selling, costituito dal costo opportunità del margine di garanzia.

19
Più sono alti questi costi, e più rapida dovrebbe essere la chiusura delle posizioni; infatti gli interessi sono
legati al tempo in cui resta aperta la posizione. Per questo motivo è necessario prestare attenzione agli
effetti dei parametri di apertura e chiusura delle posizioni sul cosiddetto holding period.
Nelle simulazioni condotte al capitolo 5, il tasso per queste operazioni è calcolato considerando un tasso di
attualizzazione composto giornalmente, secondo la formula:
𝑡𝑔 = √(1 + 𝑡𝑎)
365
− 1
Utilizzando un tasso ragionevole per queste operazioni (6% annuo, di nuovo applicato da FINECO per
operazioni di short-selling) si ottiene un tasso giornaliero di 0,016%.
Un altro costo che è importante considerare per questa tipologia di trading è il bid-ask spread: esso
rappresenta il denaro che si è costretti a perdere nell’operazione di acquisto o vendita, per via della
distanza fra curve di domanda e offerta.
Lo spread bid-ask cresce al diminuire della liquidità del titolo, e può ridurre i margini della strategia in
maniera rilevante se essa comprende titoli illiquidi.
Quando il titolo ha un intermediario che svolge il compito di Market-Maker, lo spread bid ask è fissato da
quest’ultimo e rappresenta il suo guadagno; questo ha il pregio di mantenere il bid ask spread a livelli
contenuti favorendo la liquidità dei titoli, tuttavia i margini del market maker erodono quelli degli
investitori. Quando invece non c’è market maker, lo spread è direttamente la distanza fra la curva di
domanda e la curva di offerta nel book del mercato.
Ne deriva che questo costo non è fisso, bensì dipende dall’incontrarsi di curva di domanda e offerta al
momento in cui si intende effettuare la transazione, ed è dunque difficile stimarlo; un’ipotesi ragionevole
per titoli non illiquidi può essere di 2 punti base sul valore scambiato.
Meno rilevanti sono i costi di slippage e brokerage.
4.3 Condizioni di apertura e chiusura della posizione
Come accennato all’inizio del capitolo, la cointegrazione è condizione necessaria ma non sufficiente
all’apertura di una posizione: esistono una serie di altre condizioni che indicano l’opportunità e il momento
in cui aprire una posizione.
Nel paragrafo precedente abbiamo detto che le condizioni di apertura e chiusura delle posizioni devono
essere ottimizzate sulla base della struttura dei costi di transazione, che tuttavia variano a seconda del caso
specifico; ne segue che non si possono stabilire regole valide in generale, quindi ci limiteremo a indicare i
principali criteri e le logiche con cui si fissano tali condizioni, ricordando che esse vanno modificate caso per
caso.
Innanzitutto, vi è un’altra condizione preliminare, necessaria per fare trading su una coppia di titoli: essa
consiste in una soglia minima di volatilità del residuo di cointegrazione: esso deve presentare delle
oscillazioni intorno alla media di ampiezza sufficiente a generare un capital gain nel portafoglio che
giustifichi i costi di transazione sopportati per aprire la posizione.

20
Questa condizione è alla base dei risultati di alcuni studi recenti che indicano come i margini garantiti dal
pairs trading siano in calo: la presenza di grossi operatori che effettuano questo genere di trading tende a
far chiudere molto rapidamente le oscillazioni dello spread, per l’effetto che il loro investimento ha sul
valore dei titoli. Di conseguenza, i piccoli investitori che hanno costi di apertura delle posizioni molto
maggiori, vedono i loro profitti diminuire.
La condizione principale per determinare il momento di apertura di una coppia, invece, richiede che lo
spread sia sufficientemente lontano dalla media; a ciò è opportuno aggiungere la condizione che lo spread
sia in fase di convergenza verso la media, e non vi si stia allontanando. La lontananza dello spread dalla sua
media è espressa in termini di deviazioni standard della serie dei residui di cointegrazione.
Un esempio di condizione di apertura, che è quello che sarà poi applicato nell’analisi di back-testing del
modello nel capitolo 5 è la seguente: 𝑧𝑡−2 > 1,5 𝜎̂𝑧 ; 𝑧𝑡−1 > 1,5 𝜎̂𝑧 ; 𝑧𝑡 < 1,5 𝜎̂𝑧
Come detto al capitolo 2.1, se la relazione di cointegrazione non è supportata da considerazioni legate ai
fondamentali dei titoli o delle aziende, essa può rompersi senza preavviso: per le coppie in cui si ritiene che
la relazione di cointegrazione possa modificarsi o cessare di esistere, è importante mettere una condizione
di stop-loss, vale a dire un valore soglia di allontanamento del residuo dalla sua media, oltre il quale si
ritiene che la relazione di cointegrazione si possa essere rotta, e dunque che sia opportuno chiudere la
posizione per limitare le perdite. Come sempre, il valore soglia deve essere valutato caso per caso, a
seconda della robustezza della relazione di cointegrazione e della propensione al rischio dell’investitore. Un
esempio di valore soglia potrebbe essere rappresentato da 3 deviazioni standard di distanza dalla media.
Alla condizione di stop-loss spesso si affianca una durata massima accettabile per una posizione senza che
essa superi incontri una condizione di chiusura.
Esistono poi differenti criteri per chiudere la posizione: si può usare un criterio di prudenza e chiudere già
quando lo spread scende al di sotto di un certo numero di deviazioni standard, ad esempio al di sotto di
0,25 deviazioni standard, oppure aspettare il completo ritorno in media dello spread. Un’alternativa più
rischiosa è attendere che lo spread oscilli dall’altra parte della media prima di chiudere la posizione.
Un altro parametro da considerare nell’elaborazione di una strategia di pairs trading è il livello di leverage
da utilizzare. Una trattazione dei costi e dei benefici dell’indebitamento nelle operazioni di trading esula dai
nostri scopi; si tenga solo presente che è possibile indebitarsi (normalmente fino a una certa soglia massima
fissata dalla piattaforma di trading utilizzata) e questo può portare a incrementare notevolmente i
guadagni, al prezzo di una maggior esposizione al rischio.
Allo stesso modo, la quantità di denaro da allocare su una posizione dipende da un’analisi comparata di
diverse opportunità di investimento, che non tratteremo.

21
Capitolo 5. BACK-TESTING
Per concludere, è stata svolta un’analisi di back testing sulla strategia fin qui descritta.
Con il termine back-testing si indica il processo per cui l’investitore si mette idealmente in un istante di
tempo nel passato, ed elabora la strategia basandosi solo sui dati in suo possesso fino a quel momento: poi
utilizza i dati che si sono effettivamente registrati sui mercati dal momento scelto fino ad oggi, per valutare
come avrebbe performato la strategia elaborata.
Per fare back testing su una strategia di pairs trading è necessario stabilire un parametro per tutte le
condizioni indicati nel capitolo precedente. Una volta che tutte le condizioni sono stabilite, la strategia
viene applicata in automatico ai dati, e se ne registrano i risultati, determinando quali trade il modello
avrebbe selezionato.
Nota che noi guardiamo alle operazioni sul singolo titolo; normalmente, si fa una serie di coppie e criteri di
apertura e chiusura, e si mette un portafogli e si vede come performa: ad esempio si veda (The Duck
Strategy Chrilly Donninger)... noi però testiamo la validità del modello solamente su due o tre titoli, non
siamo interessati a misurare la performance del portafoglio..
Normalmente, per i gestori di portafogli, il back testing viene fatto considerando un universo molto nutrito
di coppie possibili, e allocando mano a mano il capitale disponibile fra tali coppie: la crescita del capitale
investito a seguito della strategia viene misurata e confrontata con un benchmark. Si veda ad esempio The
Duck Strategy, Donninger, 2013.
Nel nostro caso, invece, ci limiteremo ad applicare la strategia a due coppie, per verificarne la
ragionevolezza e il funzionamento; non siamo invece interessati a confrontare i rendimenti percentuali di
una certa somma rispetto a un’alternativa di investimento.
Il back testing è stato applicato sia al modello lineare che al modello logaritmico, per vedere se i due
modelli portano a scelte di investimento differenti.
Si sono utilizzati i dati dal 2010 al luglio 2014 per costruire il modello, mentre i dati degli ultimi 12 mesi
sono stati utilizzati per testare il funzionamento della strategia.
I risultati dei test di cointegrazione non sono cambiati limitando il campione, mentre le stime dei residui
della regressione di cointegrazione sono risultate leggermente differenti, ma non in maniera molto
evidente, come si può vedere dal seguente grafico:

22
Sulla base dei residui stimati, applicando le condizioni di apertura e chiusura delle posizioni si sono
individuati i momenti in cui la strategia avrebbe portato ad effettuare gli investimenti: in figura è
rappresentata l’implementazione della strategia per le varie coppie testate:
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
10/06/2014 18/09/2014 27/12/2014 06/04/2015 15/07/2015 23/10/2015
Confronto stime residui Ford - GM
RES BACK TESTING
RES CAMPIONE COMPLETO
-1
-0,5
0
0,5
1
1,5
2
2,5
10/06/2014 18/09/2014 27/12/2014 06/04/2015 15/07/2015 23/10/2015
Back testing Ford - GM lineare
RES BACK TESTING
POSIZIONE

23
I flussi netti totali generati dalla strategia costruita sul modello lineare e su quello logaritmico sono stati
rispettivamente € 1.148,16 e € 1.180,47.
Le strategie sono pressoché identiche, e le posizioni si aprono e chiudono negli stessi giorni.
La differenza nel ritorno complessivo è legata più alla diversa composizione del portafoglio (come trattato
al paragrafo 4.1) che a effettive differenze nei risultati.
Riguardo al back testing della coppia Exxon – Chevron, riportiamo il grafico complessivo:
Poiché l’anno è terminato con la posizione ancora aperta, per verificare i flussi fino a quel momento la
posizione è stata chiusa forzatamente, seppure questo abbia penalizzato la strategia; inoltre, la lunga
durata della prima apertura ha ridotto i margini. I flussi annuali complessivi di questa coppia sono di €
252,05.
La strategia pare funzionare bene in entrambi i casi: le posizioni si sono aperte in momenti ragionevoli, e
hanno portato a buoni ritorni, soprattutto per la coppia Ford – GM, il cui spread ha avuto più zero-crossing
nel corso degli ultimi 12 mesi. La strategia non pare influenzata dai momenti negativi di mercato, a
conferma della sua market-neutrality.
-0,1
-0,05
0
0,05
0,1
0,15
0,2
10/06/2014 18/09/2014 27/12/2014 06/04/2015 15/07/2015 23/10/2015
Back testing Ford - GM logaritmico
RESIDUO BT
posizione
-4
-2
0
2
4
6
8
10
10/06/2014 18/09/2014 27/12/2014 06/04/2015 15/07/2015 23/10/2015
Back testing EXXON - Chevron
res_lin
posizione
res_lin_BT

24
Capitolo 6. BIBLIOGRAFIA
Robert F. Engle; C. W. J. Granger (1987). Co-Integration and Error Correction: Representation, Estimation,
and Testing. Econometrica, Vol. 55, No. 2. (Mar., 1987), pp. 251-276.
Ganapathy Vidyamurthy (2004) Pairs trading : quantitative methods and analysis. New Jersey: John Wiley.
Douglas S. Ehrman (2006) The handbook of Pairs Trading. John Wiley.
Binh Do, Robert Faff, Kais Hamza (2006), A new approach to modeling and estimation for pairs trading
Dickey, D. and W. Fuller (1979). “Distribution of the Estimators for Autoregressive Time Series with a Unit
Root,” Journal of the American Statistical Association, 74, 427-431.
Kwiatkowski, Phillips, Schmidt, Shin (1991) Testing the null hypothesis of stationarity against the alternative
of a unit root
Mengyun Zhang (2012) Research on Modern Implications of Pairs Trading
Chrilly Donninger (2013) Pairs Trading with CoIntegration: The Duck Strategy
Supakorn Mudchanatongsuk, James A. Primbs and Wilfred Wong (2008) Optimal Pairs Trading: A Stochastic
Control Approach
Greene W.H (2012), Econometric Analysis, 7th edition
Riccardo Lucchetti (2013): Appunti di analisi delle serie storiche

25
Appendici
TAVOLA 1: SELEZIONE DEGLI ORDINI MASSIMI
Campione completo dei dati: 2010-11-18 - 2015-07-17 (n = 1157)
Campione attuale: 2010-11-26 - 2015-07-17 (n = 1152)
AR = 0 MA = 0 AIC = 5453,538 BIC = 5458,587 HQ = 5455,444
AR = 0 MA = 1 AIC = 3997,252 BIC = 4012,399 HQ = 4002,969
AR = 0 MA = 2 AIC = 2878,273 BIC = 2898,47 HQ = 2885,897
AR = 0 MA = 3 AIC = 2148,43 BIC = 2173,676 HQ = 2157,959
AR = 0 MA = 4 AIC = 1661,176 BIC = 1691,472 HQ = 1672,611
AR = 0 MA = 5 AIC = 1285,111 BIC = 1320,456 HQ = 1298,452
AR = 1 MA = 0 AIC = -215,27 BIC = -205,172 HQ = -211,459
AR = 1 MA = 1 AIC = -214,925 BIC = -194,728 HQ = -207,302
AR = 1 MA = 2 AIC = -212,925 BIC = -187,678 HQ = -203,395
AR = 1 MA = 3 AIC = -211,297 BIC = -181,001 HQ = -199,862
AR = 1 MA = 4 AIC = -210,766 BIC = -175,422 HQ = -197,425
AR = 1 MA = 5 AIC = -213,072 BIC = -172,678 HQ = -197,826
AR = 2 MA = 0 AIC = -216,976 BIC = -201,828 HQ = -211,258
AR = 2 MA = 1 AIC = -212,984 BIC = -187,737 HQ = -203,454
AR = 2 MA = 2 AIC = -212,108 BIC = -181,812 HQ = -200,673
AR = 2 MA = 3 AIC = -210,649 BIC = -175,304 HQ = -197,308
AR = 2 MA = 4 AIC = -209,76 BIC = -169,366 HQ = -194,514
AR = 2 MA = 5 AIC = -211,394 BIC = -165,95 HQ = -194,241
AR = 3 MA = 0 AIC = -215,028 BIC = -194,831 HQ = -207,404
AR = 3 MA = 1 AIC = -211,911 BIC = -181,615 HQ = -200,476
AR = 3 MA = 2 AIC = -212,53 BIC = -177,185 HQ = -199,189
AR = 3 MA = 3 AIC = -216,571 BIC = -176,177 HQ = -201,324
AR = 3 MA = 4 AIC = -212,82 BIC = -167,377 HQ = -195,667
AR = 3 MA = 5 AIC = -221,204 BIC = -170,712 HQ = -202,146
AR = 4 MA = 0 AIC = -213,225 BIC = -187,978 HQ = -203,695
AR = 4 MA = 1 AIC = -209,912 BIC = -174,567 HQ = -196,571
AR = 4 MA = 2 AIC = -215,886 BIC = -175,492 HQ = -200,639
AR = 4 MA = 3 AIC = -214,834 BIC = -169,391 HQ = -197,681
AR = 4 MA = 4 AIC = -220,907 BIC = -170,415 HQ = -201,849
AR = 4 MA = 5 AIC = -222,061 BIC = -166,519 HQ = -201,097
AR = 5 MA = 0 AIC = -212,531 BIC = -182,235 HQ = -201,096
AR = 5 MA = 1 AIC = -210,079 BIC = -169,685 HQ = -194,832
AR = 5 MA = 2 AIC = -212,127 BIC = -166,684 HQ = -194,975
AR = 5 MA = 3 AIC = -219,205 BIC = -168,712 HQ = -200,147
AR = 5 MA = 4 AIC = -220,386 BIC = -164,844 HQ = -199,422
AR = 5 MA = 5 AIC = -220,098 BIC = -159,507 HQ = -197,228

26
TAVOLA 2: REGRESSIONI DI COINTEGRAZIONE
REGRESSIONE DI COINTEGRAZIONE FORD-GM
OLS, usando le osservazioni 2010-11-18:2015-07-17 (T = 1157)
Variabile dipendente: F
Coefficiente Errore Std. rapporto t p-value
const 0,442924 0,11669 3,7957 0,0002 ***
GM 0,426245 0,00380555 112,0061 <0,0001 ***
REGRESSIONE DI COINTEGRAZIONE EXXON-CHEVRON
Variabile dipendente: XOM
const 11,6372 0,485799 23,9548 <0,0001 ***
CVX 0,686422 0,00482624 142,2271 <0,0001 ***
REGRESSIONE DI COINTEGRAZIONE COCA COLA-PEPSI
Variabile dipendente: CCE
const −15,4779 0,485569 −31,8757 <0,0001 ***
PEP 0,660519 0,00669472 98,6626 <0,0001 ***
REGRESSIONE DI COINTEGRAZIONE APPLE-GOOGLE
Variabile dipendente: AAPL
const 1,98619 1,56659 1,2678 0,2051
GOOGL 0,172015 0,00380718 45,1817 <0,0001 ***
REGRESSIONE DI COINTEGRAZIONE BRENT-WTI
Variabile dipendente: BRENT
const −2,65999 1,22651 −2,1688 0,0303 **
WTI 1,13225 0,0149739 75,6149 <0,0001 ***

27
TAVOLA 3: RISULTATI DEI TEST DI STAZIONARIETA’
TEST ADF NON
STAZIONARIETA' PREZZI
TEST ADF NON
STAZIONARIETA' RESIDUI
P-VALUE IPOTESI NULLA P-VALUE IPOTESI NULLA
FORD 0,4856 accetto
0,005946 rifiuto
GENERAL MOTORS 0,509 accetto
EXXON 0,8207 accetto
0,008916 rifiuto
CHEVRON 0,9842 accetto
COCA COLA 0,1172 accetto
0,01355 rifiuto
PEPSI 0,265 accetto
APPLE 0,8038 accetto
0,1302 accetto
GOOGLE 0,1291 accetto
BRENT 0,9656 accetto
0,04174 rifiuto
WTI 0,8671 accetto

2015.07.27_Applied Econometrics Paper - Pairs Trading_Thomas Dossi

Recommended

Recommended

More Related Content

Similar to 2015.07.27_Applied Econometrics Paper - Pairs Trading_Thomas Dossi

Similar to 2015.07.27_Applied Econometrics Paper - Pairs Trading_Thomas Dossi (12)

2015.07.27_Applied Econometrics Paper - Pairs Trading_Thomas Dossi