More Related Content Similar to Stock Analysis Similar to Stock Analysis (20) Stock Analysis3. 研究目的
• 利用 k 線、新聞、財報等特徵預測
「單一股票隔日收盤價與隔日開盤價的差異」
研究目的
最高價
最低價
收盤價
開盤價
https://tw.stock.yahoo.com/news_content/url/d/a/20171129/%E6%9D%B1%E8%81%AF11-
30%E5%8F%83%E5%8A%A0%E5%85%83%E5%A4%A7%E8%AD%89%E5%88%B8%E8%88%89%E8%BE%A6%E4%B9%8B%E6%B3%95%E8%AA%AA%E6%9C%83-
065519028.html
K線資料 新聞 財報
最高價
最低價
開盤價
收盤價
6. 模型架構
研究方法
台股K線資訊/財報
Feature Engineering
At what scale?
How to represent?
新聞
NLP
Word embedding, Word2Vec
Presentation/Features
LSTM
Model Training
What paras./layers should
be taken into consideration?
How to fine-tune the paras.?
10. 特徵工程(續)
資料處理與分析
• 其中,新聞訊息包括
1. NewsCNT : 個股相關新聞數量(單日)
2. Positive_CNT: 利多關鍵字數量(單日)
3. Negative_CNT: 利空關鍵字數量(單日)
4. Diff_Positive_Negative : Positive_CNT-Negative_CNT
• N 日均線包含
1. MA5:5日均線(週線)
2. MA10:10日均線(雙週線)
3. MA20:20日均線(月線)
4. MA60:60日均線(季線)
5. MA120:120日均線(半年線)
12. 新聞文字處理
資料處理與分析 特徵工程(續)
新聞內容
谷歌壓縮格式獲硬體廠支持 4K串流影片前途夯 精實新聞2014-01-03 11:37:39 記者陳苓報
導 谷歌(Google)宣布,該公司的視頻壓縮格式「VP9」獲得多數主流硬體大廠支持,未來產品
將加以支援;也就是說以後電視、智慧手機、個人電腦等,皆能播放YouTube和其他串流媒
體的4K內容,而且只需現今HD影片的一半頻寬。TechCrunch和PCWorld 2日報導,Google全球
平台合作部主管Francisco Varela表示,許多2015年機種的電視和藍光播放器,均支援VP9;電
腦和行動裝置也會在今年逐步支援。
結巴斷詞
谷歌 / 壓縮 / 格式 / 獲硬體 / 廠 / 支持 / 4K / 串流 / 影片 / 前途 / 夯 / 精實 / 新聞 / 2014 / - / 01
/ - / 0311 / : / 37 / : / 39 / 記者陳苓 / 報導 / 谷歌 / ( / Google / ) / 宣布 / , / 該 / 公司 / 的 / 視頻
/ 壓縮 / 格式 / 「 / VP9 / 」 / 獲得 / 多數 / 主流 / 硬體 / 大廠 / 支持 / , / 未來 / 產品將 / 加以
/ 支援 / ; / 也 / 就是 / 說 / 以後電視 / 、 / 智慧 / 手機 / 、 / 個 / 人 / 電腦 / 等 / , / 皆 / 能 /
播放 / YouTube / 和 / 其他 / 串流 / 媒體 / 的 / 4K / 內容 / , / 而且 / 只 / 需現 / 今 / HD / 影片 /
的 / 一半 / 頻寬 / 。 / TechCrunch / 和 / PCWorld 2 / 日 / 報導 / , / Google / 全球 / 平台 / 合作
部 / 主管 / Francisco Varela / 表示 / , / 許多 / 2015 / 年 / 機種 / 的 / 電視 / 和 / 藍光 / 播放器 / ,
/ 均 / 支援 / VP9 / ; / 電腦 / 和 / 行動 / 裝置 / 也 / 會 / 在 / 今年 / 逐步 / 支援 / 。
jieba結巴(斷詞斷句)
15. ● 短線投資人 用 5MA、10MA 看多空走勢
通常短線操作的投資人慣用 5MA 和 10MA,其被股市投資人
稱為短期移動平均線,簡稱「短線」。
● 1. 收盤價 > 5MA > 10MA :多頭市場
→ 通常表示短線呈現上漲趨勢的多頭市場
2. 收盤價 < 5MA < 10MA :空頭市場
→ 通常表示短線呈現下跌趨勢的空頭市場
3. 5MA < 收盤價 < 10MA :盤整市場
→ 通常表示短線呈現橫向趨勢的盤整市場
資料處理與分析 特徵工程(續)
尋找長線多
空格局指標
研判波段
趨勢的指標
設定進場點
的指標
月線 週線 日線
買進
N日均線
5日均線(週線)、10日均線(雙週線)
Reference
16. 資料處理與分析 特徵工程(續)
● 中線投資人用 20MA、60MA 看多空走勢
通常中線操作的投資人,慣用 20MA 和60MA,其被股市投
資人稱為 中期移動平均線,簡稱「中線」。
● 1. 收盤價 > 20MA > 60MA :多頭市場
→ 通常表示中線呈現上漲趨勢的多頭市場
2. 收盤價 < 20MA < 60MA :空頭市場
→ 通常表示中線呈現下跌趨勢的空頭市場
3. 20MA < 收盤價 < 60MA :盤整市場
→ 通常表示中線呈現橫向趨勢的盤整市場
N日均線
20日均線(月線)、60日均線(季線)
Reference
17. 資料處理與分析 特徵工程(續)
● 長線投資人用 120 MA 、 240 MA 看多空走勢
通常長線操作的投資人,慣用 120 MA 和 240 MA,其被股市
投資人稱為長期移動平均線,簡稱「長線」。
● 1. 收盤價 > 120MA > 240MA :多頭市場
→ 通常表示長線呈現上漲趨勢的多頭市場
2. 收盤價 < 120MA < 240MA :空頭市場
→ 通常表示長線呈現下跌趨勢的空頭市場
3. 120MA < 收盤價 < 240MA :盤整市場
→ 通常表示長線呈現橫向趨勢的盤整市場
N日均線
120日均線(半年線)、240日均線(年線)
Reference
18. 資料處理與分析 特徵工程(續)
陽線基本圖形 陰線基本圖形 十字線基本圖形
圖形 名稱 意義 圖形 名稱 意義 圖形 名稱 意義
大陽線 股價上升力
強
大陰線 行情疲軟,
底部支撐強
十字線 變盤線
小陽線 多方主導 小陰線 空方主導 同時線 股價將反
轉
光頭陽線 強烈趨升 光頭陰線 行情看跌 一字線 飆漲或標
跌
開盤光頭
陽線
上升力強,
但仍須謹慎
開盤光頭
陰線
行情看跌 倒丁字
線
行情看跌
收盤光頭
陽線
股價趨升 收盤光頭
陰線
股價有反彈
跡象
丁字線 會出現反
彈
K 線類型
K 線基本型態與其訊號數值化
Reference
22. 隨機指標(KD)
資料處理與分析 特徵工程(續)
• KD值可客觀的表現 市場過熱或過冷。當股價趨勢上漲時,
當日收盤價會傾向接近當日價格波動的最高價;當股價趨
勢下跌時,當日收盤價會傾向接近當日價格波動的最低價。
• 一般KD指標的參數設為9日,計算K和D時,所取的平滑值
就用3,因此指標的參數上可以看到(9,3,3)這樣的參數
• 算KD之前,須先計算 未成熟隨機值(RSV)。
Reference2Reference1
26. 實驗與其成果表現
LSTM
Many-to-One / 迴歸:開盤價與收盤價之價差比率
LSTM (256) TD
LSTM (256)
Dropout
Dropout
Dense (1)
Linear
Training : 721 samples
同向 反向
320 353
Testing : 240 samples
同向 反向
108 114
Accuracy of Up & Down: 0.486486486486
MSE of Price Difference: 0.00051753099239
Difference Ratio
27. 實驗與其成果表現
LSTM
Many-to-Many / 迴歸:隔日開盤價、收盤價
LSTM (256) TD
LSTM (256)
Dropout
Dropout
Dense (2)
Linear
Training : 721 samples
同向 反向
276 397
Testing : 240 samples
同向 反向
106 116
Accuracy of Up & Down: 0.477477477478
MSE of Price Difference: 0.000359418959146
Open
Close
Difference Ratio
28. 實驗與其成果表現
(Abs. Next Day’s
Price Difference)
(Up / Down)
LSTM
Many-to-One / 迴歸:開盤價與收盤價之價差比率 + 分類:漲跌&持平 (2 個子模型)
LSTM (256) TD
LSTM (256)
Dropout
Dropout
Dense (2)
Softmax
Dense (128)
Relu
LSTM (256) TD
LSTM (256)
Dropout
Dropout
Dense (1)
Linear
Accuracy of Up & Down: 0.5317377731529
MSE of Difference Ratio: 0.000291975799284
Difference Ratio
29. 實驗與其成果表現
Conv 1D (32)
BN + ReLu
Conv 1D (64)
BN + ReLu
Conv 1D (256)
BN + ReLu
LSTM (256) TD
Open Close
Difference Ratio
LSTM (256)
Dropout
Dropout
Dense (2)
Linear
Conv1D + LSTM
迴歸:隔日開盤價、收盤價
Accuracy of Up & Down: 0.536036036036
MSE of Difference Ratio: 0.00166205602897
Training : 721 samples
同向 反向
491 230
Testing : 240 samples
同正 反向
119 103
30. 實驗與其成果表現
Difference Ratio
Conv 1D (32)
BN + ReLu
Conv 1D (64)
BN + ReLu
Conv 1D (256)
BN + ReLu
LSTM (256) TD
LSTM (256)
Dropout
Dropout
Dense (1)
Linear
Conv1D + LSTM
迴歸:開盤價與收盤價支價差比率
Accuracy of Up & Down: 0.576576576576
MSE of Difference Ratio: 0.000836010360631
Training : 721 samples
同向 反向
514 159
Testing : 240 samples
同向 反向
128 94
31. 實驗與其成果表現
Open Close
Difference Ratio
Conv 1D (128)
BN + ReLu
Conv 1D (256)
BN + ReLu
Conv 1D (128)
BN + ReLu
Global Max Pooling
Concatenate
Dense(2)
LSTM (256) TD
LSTM (256)
Dropout
Dropout
Linear
Conv1D + LSTM (2個子模型)
迴歸:隔日開盤價、收盤價
Accuracy of Up & Down: 0.509009009009
MSE of Difference Ratio: 0.0138396338225
Training : 721 samples
同向 反向
507 166
Testing : 240 samples
同向 反向
113 109
32. 實驗與其成果表現
Difference Ratio
Conv 1D (128)
BN + ReLu
Conv 1D (256)
BN + ReLu
Conv 1D (128)
BN + ReLu
Global Max Pooling
Concatenate
Dense(1)
LSTM (256) TD
LSTM (256)
Dropout
Dropout
Linear
Conv1D + LSTM(2個子模型)
迴歸:開盤價與收盤價支價差比率
Accuracy of Up & Down: 0.540540540540
MSE of Difference Ratio: 0.000686221646366
Training : 721 samples
同向 反向
552 121
Testing : 240 samples
同向 反向
120 102
33. 實驗與其成果表現
模型結果比較
Model MSE Acc. of Up & Down
LSTM Many2One Classification - 0.965660770031
LSTM Many2One Reg.: Diff. Ratio 0.0005175309924 0.486486486486
LSTM Many2Many Reg.: O&C 0.0003594189592 0.477477477478
LSTM Many2Many Reg.+ Classification 0.0002919757993 0.531737773153
Conv1D + LSTM(V) Reg.: O&C 0.0016620560290 0.536036036036
Conv1D + LSTM(V) Reg.: Diff. Ratio 0.0008360103606 0.576576576576
Conv1D + LSTM(H) Reg.: O&C 0.0138396338225 0.509009009009
Conv1D + LSTM(H) Reg.: Diff. Ratio 0.0006862216464 0.540540540540
38. 跳空缺口
補充資料 特徵工程(續)
● 股價跳空,通常出現在 急漲 或 急跌 的走勢
● 其有4種型態,分別為
1. 普通缺口:通常發生在 盤整走勢,沒有預測趨勢的意義
2. 突破缺口:盤整後,向上(下)跳空突破,是買進(賣出)訊號
3. 逃逸缺口:趨勢加速發展,成交量大,趨勢會延續
4. 竭盡缺口:缺口會很快被填補,走勢將反轉
Reference