Clustering di Serie Temporali Finanziarie ed Evidence di Effetti di Memoria
1. Clustering di Serie Temporali Finanziarie ed
Evidenze di Effetti di Memoria
Gabriele Pompa
14/12/2012
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 1 of 24
2. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Sommario
1 Introduzione
Mercato Finanziari
Technical Trading
Pattern Recognition
2 Feedback Strategie di Investimento
Supporti & Resistenze: Probabilitá di Rimbalzo
3 Analisi Statistiche
Rimbalzi: Tempo di Ricorrenza, Durata & Fluttuazioni tipiche di
Prezzo
4 Modello di Clustering
Caratterizzazione Bayesiana del Miglior Clustering
Step MCMC, Splitting & Merging
5 Risultati
Toy Model & Serie Reali
Analisi Causa-Effetto
6 Conclusioni
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 2 of 24
3. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Ipotesi di Mercato Efficiente (EMH)
information set θt: corpus di conoscenze su cui sono basati
investimenti (profitto aspettato di una compagnia, tasso di
interesse, dividendo aspettato)
Jensen (1978): mercato efficiente rispetto a θt ⇐⇒ impossibile fare
profitti basandosi su θt =⇒ martingale: E[pt+1|p0, p1, ..., pt] = pt
incrementi del prezzo non prevedibili: modelli Random-Walk
(Bachelier 1900, Samuelson 1973...)
Time (hours)
Price(ticks)
Time (hours)
Price(ticks)
Vodaphone, 110o
giorno di trading del 2002 Vs pt+1 = pt + N(µ, σ)
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 3 of 24
4. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Alcuni "Fatti Stilizzati"
rendimenti rτ (t) = p(t + τ) − p(t) non distribuiti gaussianamente:
code piú grasse rispetto a distribuzione normale
rendimenti scorrelati rτ (t)rτ (t + T) ∼ 0 ma non indipendenti:
|rτ (t)||rτ (t + T)| e r2
τ (t)r2
τ (t + T) non trascurabili
10-4
10-3
10-2
10-1
-1.5 -1 -0.5 0 0.5 1 1.5
Probabilitydensityfunction
Log-returns
BNPP.PA
Gaussian
Student
FIG. 1. (Top) Empirical probability density function of the
normalized 1-minute S&P500 returns between 1984 and 1996.
Reproduced from Gopikrishnan et al. (1999). (Bottom) Em-
pirical probability density function of BNP Paribas unnor-
malized log-returns over a period of time τ = 5 minutes.
10-3
10-2
10-1
100
0 0.02 0.04 0.06 0.08 0.1
Cumulativedistribution
Absolute log-returns
SP500
Gaussian
Student
FIG. 2. Empirical cumulative distributions of S&P 500 daily
returns. (Top) Reproduced from Gopikrishnan et al. (1999),
in log-log scale. (Bottom) Computed using official daily close
price between January 1st, 1950 and June 15th, 2009, i.e.
14956 values, in linear-log scale.
5 minutes Returns
PDF
Autocorrelation T (minutes)
BNP Paribas, 2007/08, distribuzione rendimenti a τ = 5 min (sinistra).
Vodaphone, 2002, 110o
giorno, autocorrelazione rendimenti,
rendimenti quadrati e assoluti a τ = 1 min (destra)
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 4 of 24
5. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Technical Trading
Assunzioni principali: apertamente in contrasto con EMH
mercato sconta tutto: ”storia” del prezzo é unico θt necessario
prezzo si muove in trend: rialzista, ribassista o costante
storia ripete se stessa: investitori reagiscono allo stesso modo al
ripetersi di condizioni simili (figures =⇒ indicatori tecnici)
Time (hours)
Price(ticks)
CAPITOLO 5. ANALISI TECNICA 70
Figura 5.2: Esempio di supporto (linea verde) e di supporto (linea rossa).
Fonte: stockcharts.com
gerisce che quando il prezzo scende avvicinandosi al supporto i compratori
sono più inclini a comprare e i venditori meno inclini a vendere. Quando
il prezzo raggiunge il livello del supporto si crede che la domanda superi
l’offerta e impedisce che il prezzo cada sotto il supporto. Una resistenza è
quel livello del prezzo al quale si pensa che l’offerta sia forte abbastanza da
impedire che il prezzo salga ancora. Quando il prezzo si avvicina alla resi-
stenza, i venditori sono più inclini a vendere e i compratori diventano meno
inclini a comprare. Quando il prezzo raggiunge il livello della resistenza,
si crede che l’offerta superi la domanda in modo da impedire che il prezzo
Time (months)
Price(ticks)
Unilever, 66o
giorno, 2002, media mobile a 5min (sinistra) ed esempio
di Supporto e Resistenza Lilly Ely & Co. il 2/2/2000 (destra)
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 5 of 24
6. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Pattern Recognition (PR)
Esempi: filtro anti-spam, macchina per riciclaggio, protocollo OCR
Sistema PR α: estrae caratteristiche x da oggetto e lo associa a
classe/modello
α : x → {ω1, ω2, ..., ωc}
Classi note: Apprendimento Supervisionato tramite training set
di associazioni note
Di = {x1, ..., xni
} =⇒ classe ωi
Classi NON note: Clustering =⇒ informazioni solo da
somiglianza tra dati =⇒ serie temporali, varie metodologie:
dati grezzi, previa detrendizzazione e standardizzazione
modelli probabilistici: regressioni, apprendimento bayesiano
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 6 of 24
7. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Apprendimento Bayesiano
dato il dataset DN = {x1, ..., xN} e modelli descrittivi m ∈ M
scopo: selezionare m che descriva meglio DN secondo regola di Bayes:
P(m|DN) =
P(DN|m)P(m)
P(DN)
dove:
m∈M
P(m) = 1
Prior P(m): confidenza su m, prima di misurare DN
Likelihood P(DN|m): probabilitá di DN, se m é il modello giusto
Posterior P(m|DN): aggiornamento confidenza su m, dato DN
Modello m con parametri {θ}
⇓
(Marginal) Likelihood:
P(DN|m) = P(DN|θ, m)P(θ)dθ
too simple
too complex
"just right"
All possible data sets
P(D|mi)
D
Figure 4: The marginal likelihood (evidence) as a function of an abstract one dimensio
All possible Datasets
P(D|m)
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 7 of 24
8. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Il Dataset
DN: serie temporali sec-by-sec di 9 azioni scambiate presso LSE,
2002: Shell, Unilever, Vodaphone, Royal Bank of Scotland...
Prezzo in ticks =⇒ tick-min: 0.01, 0.25, 0.5, 1 Sterline
Serie P(t) =⇒ riscalaggio ogni T = 45, 60, 90, 180 secondi: PT (t)
Time (hours)
Price(ticks)
T = 5 min
T = 10 min
T = 15 min
Shell, 55o
giorno di trading del 2002, T = 0, 5, 10, 15 min
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 8 of 24
9. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Caratterizzazione Supporti e Resistenze
AMPIEZZA STRISCIA δ:
FLUTTUAZIONI TIPICHE
GIORNALIERE di PREZZO
Time (hours)
Price(ticks)
Heritage Financial Group, 103o
giorno, 2002 - 2 esempi di Resistenze
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 9 of 24
10. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Caratterizzazione Supporti e Resistenze
Time (hours)
Price(ticks)
Royal Bank of Scotland, 54o
giorno, 2002 - esempio di Supporto
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 10 of 24
11. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
p(rimbalzo|numero di rimbalzi precedenti)
Previous bounces (i =1,2,3,4,5)
P(bounce|i)
p(b|i = 1, 2, 3, 4, 5) - Resistenze - T = 45 secondi & RW compatibile
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 11 of 24
12. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Tempo tra Rimbalzi
log(recurrence time)
log(PDF/binwidths)
distribuzione tempo di ricorrenza - Resistenze & Supporti - T = 45 sec
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 12 of 24
13. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Tempo nei Rimbalzi: τ
log(τ)
log(PDF/binwidths)
distribuzione dimensione finestra - Resistenze & Supporti - T = 45 sec
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 13 of 24
14. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Fluttuazioni Tipiche di Prezzo attorno ai Rimbalzi
Max Fluctuation / tick-min
Occurrences
AstraZeNeca, 2002 - fluttuazioni tipiche attorno a rimbalzi su livelli di
Supporti / tick-min (0.5 Sterline) - ampiezza finestre: τ = 150
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 14 of 24
15. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Caratterizzazione Bayesiana della Miglior Partizione
dataset: DN = {xi }i=1,...,N dove xi é la serie xi = {xi1 , xi2 , ..., xiτ }
scopo: trovare migliore partizione
m = {(x4, x17, x25), (x1, x27), ..., (xN), ...}
= {C1, C2, ..., Cn}
=⇒ quella che massimizza la Posterior P(m|DN):
P(m|DN) ∝ P(DN|m)
likelihood
×
prior
P(m) =
Ck ∈m
cluster-likelihood
xi ∈Ck
Nxi
(µk, Σi,k)
likelihood di serie
× Nn(0, σp)
n clusters
in cui:
serie media intra-cluster: µk = xi Ck
serie varianza intra-cluster: σ2
k = x2
i Ck
− µ2
k
matrice di covarianza di singola serie: Σi,k = diag( δ2
i + σ2
k)
δi ampiezza striscia =⇒ dispersione intrinseca della serie xi
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 15 of 24
16. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Step MCMC
Catena nello spazio delle partizioni =⇒ proposta nuova partizione:
se Posterior aumenta: accetto!
altrimenti: soglia random u ∼ U[0:1]
3
4
5
2
5
5
4
4
3
6
4
2
6
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 16 of 24
17. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Step Splitting & Step Merging
Splitting: proposta di divisione in 2, cluster per cluster
=⇒ accettata se guadagno Likelihood é maggiore di ∆RANDOM
SPLITTING (a sx)
Merging: proposta di unione piú clusters assieme, a 2 a 2
=⇒ accettata se perdita Likelihood é inferiore di ∆RANDOM
MERGING (a dx)
N
ΔRANDOMSPLITTING
N2
N1
Δ RANDOM MERGING
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 17 of 24
18. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Serie Standard ∈ [trimbalzo − τ
2 : trimbalzo + τ
2] × [−1 : 1]
δ δ
^
TRANSLATION
RESCALING
Time (T units)
4° bounce
PriceRescaled
1
-1
Rio Tinto, giorno 202o
, 2002 - T = 45 sec - τ = 100 - centrata su 4o
rimbalzo su Resistenza - riscalata in [t4o − τ/2 : t4o + τ/2] × [−1 : 1]
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 18 of 24
19. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Toy Model
5 serie madre: {xmadre}k=1,2,3,4,5 dove (xk1
, ..., xkτ ) ∼ U[−1:1]
=⇒ partizione corretta é nota: 5 clusters
N serie figlie: {xfiglia i di madre k}i=1,...,N = N({xmadre}k, diag(σ))
Esempio di Serie Madre in [-1:1] & Figlie: fluttuazioni gaussiane
attorno ad essa
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 19 of 24
20. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Risultati: Toy Model
NumberofClusters
σ prior
correct partition:
5 clusters
Numero di Cluster Vs σprior ed esempio di partizione sub-ottimale
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 20 of 24
21. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Risultati: Serie Reali - T = 180 sec - τ = 100
PriceRescaled
Time Time
Stock tickers Trading days
Occurrences
HBOS
RBS
Es. Cluster Ck - confidenza a 1 σk e 2 σk - occorrenze stock e giorno
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 21 of 24
22. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Analisi Causa-Effetto: Serie - T = 180 sec - τ = 100
Cause-cluster
Time rightTime left
PriceRescaledOccurrences
9°
Cluster-effetto C5 - occorrenza clusters-causa - cluster-causa C9
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 22 of 24
23. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Conclusioni e Analisi Future
Si conclude che:
Confermati effetti di memoria da aumento di
p(rimbalzo|numero di rimbalzi precedenti)
Evidenze visive somiglianza serie del prezzo
Possibili effetti di causa-effetto nella dinamica degli eventi
Prospettive di analisi future:
serie piú lunghe =⇒ dinamiche stagionali
serie standardizzate ad incremento medio = 1 =⇒ esame
variazioni relative di prezzo
serie in tick-time =⇒ effetto netto transazioni
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 23 of 24
24. Introduzione Feedback Strategie di Investimento Analisi Statistiche Modello di Clustering Risultati Conclusioni
Grazie per l’attenzione!
Clustering di Serie Temporali Finanziarie ed Evidenze di Effetti di Memoria 14/12/2012 24 of 24