Pranešimas XVII mokslinės kompiuterininkų konferencijos
sekcijoje „K8. Statistiniai metodai, optimizavimas ir prognozavimas“
„Kompiuterininkų dienos – 2015“, Panevėžyje, KTU PTVF 2013-09-19
2. Įmonių vizualizavimas, padedantis
investuotojams išskirti perspektyviausias įmones
iš visos industrijos.
Aiškinamasi, kurias įmones rinka vertina
teigiamai, kaip turinčias perspektyvą, o kurias –
neigiamai.
Siekiama išsamiau įvertinti analitikų
rekomendacijas pirkti, laikyti ar parduoti
įmonių akcijas.
2
3. Problemos aktualumas
Finansiniai duomenys
Tikimybinio modelio parinkimas
Didžiausio tikėtinumo metodas
RF klasifikavimo algoritmas
Eksperimentai
Rezultatai ir išvados
3
4. Bendrosios rinkos teorijos teigia, kad idealioje
rinkoje akcijų kainos turi keistis visiškai
atsitiktinai, todėl jas numatyti >50 % tikslumu yra
neįmanoma.
Kadangi rinka nėra ideali, tai kaip daugelis tyrimų
parodė – akcijų kainų pokyčiai nėra visiškai
atsitiktiniai ir juos galima numatyti.
Panagrinėsime akcijų rinkų tendencijoms
didžiausią įtaką darančius veiksnius (pateikti
kitoje skaidrėje) –>
4
6. Vykstantys akcijų rinkų nuosmukiai parodo, kad analitikų
paskelbtų prognozių rodikliai ir rekomendacijos ne
visada atspindi tikrovę. Dėl šios ir panašių priežasčių
iškyla būtinybė vertinti pačius analitikus, maklerių
įmonių reitingus.
Barber ir kt. (2006) tyrė pagal kokius kriterijus analitikų
rekomendacijas klasifikuoti į pirkti, laikyti tikintis
tolesnio akcijų kilimo, ar parduoti akcijas su pelnu
dabar. Nustatė, kad reikia drausminti tuos tarpininkus,
kurie linkę dažniau rekomenduoti akcijas pirkti. Be to,
ištyrė, jog investicinės bankininkystės įmonių analitikai
yra konservatyvesni ilgalaikėm prognozėm, nei
nepriklausomų tyrimų įmonių analitikai.
6
7. Šiame darbe remiamasi prielaida, kad
analitikai, prognozuodami akcijų kainų kilimą ar
kritimą, patys prisideda prie įmonės finansinės
situacijos gerėjimo ar blogėjimo (paskatina tokią jų
tendenciją). Todėl darbe pasiūlyta kitokia įmonių
vertinimo metodika. Siūloma vertinti įmonės
perspektyvumą ne tik pagal akcijų kainą, analitikų
prognozes, bet ir pagal kiekvienos įmonės poziciją
dvimatėje erdvėje, kitų įmonių atžvilgiu.
7
8. Eksperimentai atliekami su sveikatos apsaugos
industrijai priklausančių įmonių (viso 64) duomenimis
(2010 m., 2011 m.) iš šių sektorių:
1. Diagnostinės medžiagos (Diagnostic Substances, 8)
2. Generiniai vaistai (Drug Generic, 4)
3. Pagrindinių medikamentų gaminiai (Drug Manufactures
Major, 5)
4. Kitų medikamentų gaminiai (Drug Manufactures Other, 9)
5. Sveikatos priežiūros planai (Health Care Plans, 6)
6. Sveikatos priežiūra namuose (Home Health Care, 2)
7. Medicinos laboratorijos ir moksliniai tyrimai (Med.
Laboratories and Research, 7)
8. Medicinos instrumentai ir reikmenys (Med. Instruments and
Supplies, 20)
9. Specialios sveikatos paslaugos (Spec. Health Services, 3)
8
9. Daugelis statistinių išvadų remiasi prielaida, kad
stebimas atsitiktinis dydis turi normalųjį skirstinį – tai
vienas plačiausiai naudojamų matematinėje statistikoje
skirstinių.
Nustatyta, kad kai kurie finansiniai duomenys yra
leptokurtotiniai (angl. leptokurtic), pasižymi didelėmis
atsitiktinėmis reikšmėmis (angl. heavy-tailed), tad
daugelis autorių parodė, kad ekonominių rodiklių
analizei taip dažnai taikomas normalusis dėsnis yra
netinkamas.
9
10. Beje, normaliajame dėsnyje
neatsižvelgiama į asimetriją tarp investuotojų
lūkesčių (tikimybė gauti pelną) ir rezultatų.
Dėl šių priežasčių investuotojų nuomonei
apie įmonės rezultatus aprašyti pasirinktas
daugiamatis asimetrinis t skirstinys, nes jame
duomenys aprašomi normaliuoju skirstiniu su
atsitiktiniu vidurkių vektoriumi ir atsitiktine
dispersija, atsižvelgiant į asimetriją ir dideles
atsitiktines reikšmes.
10
12. Tuomet asimetrinio t skirstinio
tankio funkcija turi tokį pavidalą:
.
111
2
2
),,,,(
0 0)(
1
2
2
1
2
1
dzdt
zTzzxTzxt
e
t
xp
z
d
dT
,,,, ST
12
13. Tikėtinumo funkcija
Nagrinėjamo skirstinio parametrai darbe
vertinami optimizuojant tikėtinumo funkciją:
t. y. prilyginus nuliui atitinkamas tikėtinumo
funkcijos išvestines, pavyzdžiui,
ir išsprendus gautą lygčių sistemą.
13
.0
,,,,
1,,,,,,,,
1
K
i
i
i
Xp
XpL
,min,,,,ln,,,,ln
,,,,
1
K
i
i
XpL
.,,,,,,,,
1
K
i
i
XpL
14. Asimetrinio t skirstinio tankio integravimo sritį
galima interpretuoti, pavyzdžiui, kaip:
biologinio užkrato šaltinį,
taršos šaltinį,
investuotojų lūkesčių sritį ir pan.,
su kuria yra susijusi jų tolesnė atsitiktinė sklaida,
pasiskirsčiusi pagal normalųjį dėsnį arba kokį nors kitą
elipsinį skirstinį.
Srities parametras yra esminis šio skirstinio
statistinei interpretacijai, siekiant pavaizduoti
investuotojų lūkesčių sritį.
14
0 zT
15. Tam, kad būtų galima nustatyti įmonės
poziciją dvimatėje erdvėje, darbe naudojamas
atsitiktinių miškų (angl. random forest – RF)
klasifikavimo algoritmas:
-įėjimuose naudojami akcijų kainos kitimo metų
laikotarpyje duomenys,
-išėjimuose – analitikų prognozės tiems paties metams:
kaina kils ar kris.
Klasifikavimo metu išsaugomos artumo (angl.
proximity) matricos, kuriose atsispindi, kaip viena
įmonė pagal šį parametrą yra panaši į kitas.
Atvaizdavus šias matricas dvimatėje erdvėje,
gaunami du įmonių klasteriai: viename išsidėstytos
įmonės, kurių akcijų kainos linkusios kilti, o kitame –
kristi.
15
16. Iš 2011 metų akcijų kainų (close) apskaičiuoti
asimetrinio t skirtinio parametrai
naudojami, kaip įėjimai RF klasifikavimo
algoritmui. Išėjimo duomenys nusako ar akcijų
kainos kils ar kris.
Klasifikavimo metu išsaugotos dvimatės matricos
atvaizduojamos dvimatėje plokštumoje. Ši
procedūra kartojama kiekvienam asimetrinio t
skirstinio parametrui atskirai.
Analizuojami gauti grafikai ir žiūrima, kuris
parametras geriausiai atspindi akcijų kainų kilimo
ir smukimo tendencijas.
16
,,,,
17. -1
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
0,8
-0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8
Diagnostic Substances (D) Diagnostic Substances (U) Drug Generic (U)
Drug Manufactures Major (U) Drug Manufactures Other (U) Health Care Plans (D)
Health Care Plans (U) HomeHealth Care (D) Med Lab and research (D)
Med Instruments and suppl (D) Med Instruments and suppl (U) SpecHealth Services (D)
x
y
17
18. Atlikus perspektyvumo tyrimą nustatyta, kad
akcijų kainų tendencijas geriausiai atspindi
integravimo sritį nusakantis parametras
Grafike parodyta, kaip gautos įmonių koordinatės
leidžia vizualizuoti įmonės poziciją kitų atžvilgiu.
Įmonės, kurios 2010 m. pasižymėjo
downgrade tendencija, atitinka kvadratėlius,
upgrade – rutuliukus. Nereitinguojamos įmonės
grafike neatidėtos.
18
.
19. Kaip matome, išsiskiria du klasteriai. Kuo įmonės
pozicija yra toliau nuo linkusių kristi įmonių klasterio,
tuo jos perspektyvos geresnės.
Pastebime, jog Med. Laboratories and Research
sektoriaus įmonių reitingai krito ryškiausiai kitų
sektorių atžvilgiu, o įmonių nuvertinimas ne toks
žymus.
Beje, Med. Instruments and Supplies ir Drug
Manufactures Major sektorių įmonių, kurios buvo
įvertintos teigiamai, reitingai žymiai geresni nei kitų.
Diagnostic Substances sektoriaus tiek downgrade,
tiek upgrade tendencijos sutampa ir yra panašios kaip
ir sektorių Drug Generic ir Drug Manufactures Other
upgrade tendencija.
19
20. Darbe sudarytas įmonių vizualizavimo modelis,
kurio kintamieji:
• įmonių akcijų kainos,
• tikimybinio skirstinio parametrai, aprašantys
akcijų kainų kitimą,
• analitikų reitingai.
Gauti perspektyvumo tyrimo rezultatai parodo, kad
didžiausią įtaką siekiant išsamiau įvertinti analitikų
rekomendacijas pirkti, laikyti ar parduoti įmonių
akcijas sudarytame modelyje turi asimetrinio t
skirstinio tankio integravimo srities parametras.
Darbe gautas įmonių vizualizavimas gali būti
naudingas investuotojams nustatant
perspektyviausias įmones iš visos industrijos.
20
Šiame darbe pasiūlysiu įmonių perspektyvumo tyrimo modelį, leidžiantį vertinti įmones ne tik pagal akcijų kainas ar analitikų prognozes, bet ir pagal kiekvienos įmonės vizualizavimą erdvėje kitų įmonių atžvilgiu.
Taigi darbo tikslas - ...
Siekiant šio tikslo, aiškinsimės, kurias ...
Ir sieksime, kuo išsamiau ...
Pradžioje pristatysiu pasirinktos temos aktualumą, panagrinėsime jos problematiką.
Tada parinksime tinkamiausią finansiniams duomenims tikimybinį modelį, kurio parametrus vertinsime didžiausio tikėtinumo metodu.
O pasinaudoję Random Forest klasifikavimo algoritmu, nustatysiu įmonės poziciją dvimatėje erdvėje.
Tuomet pateiksiu eksperimentų rezultatus bei suformuluosiu išvadas.
Akcijų kaina atitrūksta nuo realios įmonės vertės ryškaus kainų augimo, nuosmukio ar griūties laikotarpiais. Kaip pavyzdžiui, 2008 m. NT kainų burbulas Lietuvoje.
Pavyzdžiui, Lietuvoje įsivedus eurą, šalis tampa patrauklesnė tarptautiniams investuotojams.
Apie įmonės veiklą sprendžiama iš jos pateiktų finansinių ataskaitų. Jei įmonė neskaidriai pateikia savo finansinius duomenis, investuotojai praranda galimybę susidaryti teisingą vaizdą apie įmonės finansinę situaciją ir perspektyvas.
O investuotojai reaguodami į šią situaciją netiesiogiai pakelia arba numuša akcijų kainas.
Finansų analitikai vertinimai taip pat daro didelę įtaką įmonės finansinei situacijai – pakeldami reitingus, pritraukia investuotojus, ir taip gali pakelti kapitalą arba numušdami reitingus - pabloginti įmonės situaciją.
Analitikų rekomendacijos visuomet buvo vertinamos gana prieštaringai. Iš vienos pusės, dažniausiai jos būna paremtos technine analize (akcijų kaina prognozuojama bandant nustatyti tendencijas bei statistines analogijas, remiantis istoriniu kainų svyravimu). Iš kitos pusės, rekomendacijų šališkumas - brokerių ir maklerių įmonės linkusios paryškinti teigiamą informaciją ir nutylėti apie neigiamą, taip skatindami prekiauti ir investuoti.
Tad darbe analitikų prognozės naudojamos tik kaip pridėtinė informacija, bet ne kaip galutinis pasiūlymas pirkti ar parduoti konkrečios įmonės akcijas.
Duomenis sudaro 2011 m. (nuo sausio mėnesio iki gruodžio mėnesio) akcijų kainos ir 2010 m. analitikų pateikti reitingai apie akcijų kainų kitimo tendencijas.
Matematinėje statistikoje finansiniams duomenims aprašyti dažniausiai taikomas Gauso skirstinys.
Tačiau kai kurie duomenys yra leptokurtotiniai, t. y. pasižymi ekscesu, ir taip pat pasižymi dideliais nuokrypiais, tai autorių įrodyta, kad taip dažnai taikomas Gauso skirstinys nėra pats geriausias variantas ekonominių rodiklių analizei.
Todėl normalieji skirstiniai keičiami bendresniais (pvz., stabiliaisiais modeliais), kurie vis plačiau taikomi finansinių rinkų modeliavimui.
Darbe investuotojų nuomonei nusakyti buvo pasirinktas daug. asim. t skirstinys, nes jame duomenys aprašomi atsižvelgiant į asimetriją ir didelius kainų svyravimus.
Asimetrinis t skirstinys apibrėžiamas hierarchiniu statistiniu modeliu per daugiamatį normalųjį skirstinį, kurio vidurkio vektorius z yra taip pat pasiskirstęs pagal normalųjį skirstinį, kai abiejų šių skirstinių kovariacijų matricos priklauso nuo parametro t pasiskirsčiusio pagal gama dėsnį.
Pasinaudojus šiuo apibrėžimu asim. t skirstinio tankio funkcija išreiškiama tokiu daugialypiu integralu integruojamu puserdvėje...
Tikėtinumo funkcija gaunama apskaičiavus tankio funkcijų sandaugą. Skirstinio parametrai vertinami optimizuojant šią funkciją, t. y. ....
Skaičiavimams palengvinti tikėtinumo funkcija yra logaritmuojama, imama su minuso ženklu ir ieškoma jos minimumo.
Aprašytą modelį galima interpretuoti tokiu būdu: t. y. pavaizdavę tankio integravimo sritį, mes galime aptikti biologinio...
Nustatyta, kad jei skirtumas tarp skirstinio vidurkio ir imties vidurkio teigiamas, tai investuotojai pervertina įmonės akcijas: lūkesčiai pernelyg optimistiniai, jei neigiamas – lūkesčiai pesimistiniai.
Random forest iš anglų k. atsitiktinis miškas yra populiarus ir efektyvus sprendimo medžių grupės klasifikavimo algoritmas.
RF programinė įranga, išskyrus prognozavimą, taip pat skaičiuoja ir artumo matricas. Siekiant kiekvienam auginamam medžiui gauti artumo matricą, duomenys yra paleidžiami per medį. Jei du stebėjimai užima tą patį medžio mazgą, tai jų artumas yra padidinamas vienetu. Auginant atsitiktinį mišką, artumai yra padalinami iš medžių skaičiaus.
Rezultatas – naujos duomenų matricos, kurios atvaizduojamos dvimatėje erdvėje. Tokiu būdu gaunami du įmonių ...
Šioje skaidrėje parodyta, kaip gautos įmonių koordinatės leidžia vizualizuoti jos poziciją kitų atžvilgiu. Kadangi nustatyta, kad akcijų kainų tendencijas geriausiai atspindi srities parametras, tai čia matome būtent šio parametro tyrimo rezultatus su 2011 m. akcijų duomenimis. Įmonės, kurios 2010 m. pasižymėjo downgrade tendencija, atitinka kvadratėlius, upgrade – rutuliukus. Nereitinguojamos įmonės grafike neatidėtos.
Kaip matome, išsiskiria du klasteriai: įmonės pasižyminčios downgrade reitingo tendencija ir įmonės, pasižyminčios upgrade reitingo tendencija. Kuo įmonės pozicija yra toliau nuo linkusių kristi akcijų klasterio, tuo jos perspektyvos geresnės.