洞見未來，用python 與 r 結合深度學習技術預測趨勢

洞見未來，用Python 與 R
結合深度學習技術預測趨勢
丘祐瑋 – David Chiu
EMAIL: david@largitdata.com
網站: www.largitdata.com
電話: +886929094381
1

關於我
• 大數軟體有限公司創辦人
• 前趨勢科技工程師
• ywchiu.com
• 大數學堂
http://www.largitdata.com/
• 粉絲頁
https://www.facebook.com/largitdata
• R for Data Science Cookbook
https://www.packtpub.com/big-data-and-business-
intelligence/r-data-science-cookbook
• Machine Learning With R Cookbook
https://www.packtpub.com/big-data-and-business-
intelligence/machine-learning-r-cookbook
2

Machine Learning With R Cookbook (機器學習與R語言
實戰) & R for Data Science Cookbook
Author: Yu-Wei (David) Chiu
3

為什麼我們需要大數據?
4

根據個人特性精準推薦商品或服務
預測未來可能會發生的事件
10

11
在零售業
是否能預測產品銷量或客戶來客數
以擬訂銷售或進貨策略

12
在金融業
是否能預測ATM的現金需求
以決定何時補鈔

13
在製造業
是否能預測生產原料的價格波動
以決定避險或買賣策略

從資料鑒往
從資料知來14

R & Python 資料科學分析工具
16

R 語言
• AT&T貝爾實驗室暨S語言所發展出來的GNU 專案
• 提供統計分析與圖形視覺化功能的開來源程式語言
• 使用C, Fortran 程式設計的函式語言
18

R 語言
• S 語言的方言 (分支)
• 受到函數式程式設計語言Scheme 的啟發，因而
想將該功能加入到 S 語言當中
• 1992年Ross Ihaka 與 Robert Gentleman 為了
教授統計，因此開發出了 R語言
• 除了R 以外，還有S-Plus，但兩個分支走向不同，
一個走向社群，一個走向商業
19

R 語言
立即完成統計分析
• 數據處理
• 資料分析
• 報表製作
內建許多數學函式及圖形套件(也可安裝協力廠商套件)
• 可以結合其他語言：如Java, C++
• 免費且開源 http://cran.r-project.org/src/base/
容易擴充和客制化
20

21
使用 R
快速預測黃金價格

22
編輯區歷史&環境
繪圖&套件&檔案控制臺
使用 Rstudio

使用Quantmod
library(quantmod)
getMetals('gold')
chartSeries(XAUaUSD)
23

產生預測結果
library(forecast)
XAUUSD %>%
ets %>%
forecast(h=30) %>%
autoplot
24

Python 語言
動態語言 (Dynamic Language)
• 於執行時期(Runtime)執行程式碼 (不用編譯)
• Dynamic Type: 函式與變數都不需要宣告類型
直譯式語言 (Interpreted Language)
每次執行後可以直接看到結果
物件導向語言 (OOP)
可執行於多平臺 (Python VM)
25

Guido van Rossum – Python 之父
26

29
https://trends.google.com.tw/trends/explore?date=today%205-y&q=%E7%87%92%E8%82%89
使用Google Trend 預測需求

31
讀取Google Trend 資料
import pandas
df = pandas.read_csv('multiTimeline.csv',
date_parser=['週'])
df.index = df['週']
df.head()

32
繪製趨勢圖表
%pylab inline
df['燒肉'].plot(kind='line')

33
使用ARIMA 產生預測
from matplotlib import pyplot
from statsmodels.tsa.arima_model import ARIMA
X = df['燒肉'].astype(float).values
size = int(len(X) * 0.66)
train, test = X[0:size], X[size:len(X)]
history = [x for x in train]
predictions = list()
for t in range(len(test)):
model = ARIMA(history, order=(5,1,0))
model_fit = model.fit(disp=0)
output = model_fit.forecast()
yhat = output[0]
predictions.append(yhat)
obs = test[t]
history.append(obs)

34
比較實際結果與預測結果
pyplot.plot(test)
pyplot.plot(predictions, color='red')
pyplot.show()

37
R & Python 像萬能的瑞士小刀
用你的想像力才能讓他充分發揮作用

AlphaGO
使用深度學習技術打敗頂尖棋手39

Tesla
讓自動駕駛不再是夢想40

41
類神經網路
1. 加總收集到的訊號
2. 非線性轉換
3. 產生一個新的信號

42
• 來自同一個觀察的獨
立變數
• 必須要標準化
• 連續型數字
• Binary
• 類別資料
• Activation
Function
神經元

43
類神經網路
三層神經網路兩層神經網路

44
傳統類神經網路的問題
• 計算量太大，當時的電腦計算能力無法求出令人滿意的模型
• 效果並不較傳統機器學習演算法優秀

45
類神經網路的轉機
2006 – A fast learning algorithm for deep belief nets
提出用神經網路的非監督式學習來做為神經網路初始權重的指派
GPU 計算
分散式運算架構

52
Keras
Keras是一個由Python編寫而成高階類神經網路API，可接合
Tensorflow、Theano以及CNTK等深度學習框架後端
Keras 特性
• 簡易、快速設計模型原型（Keras具模組化，極簡，和可擴充性）
• 支持CNN和RNN，或二者的結合
• 可無縫切換CPU和GPU版本

53
用Keras 預測時間序列 (Python)
model = Sequential()
look_back = 1
model.add(Dense(8, input_dim=look_back, activation='relu'))
model.add(Dense(1))
model.compile(loss='mean_squared_error', optimizer='adam')
model.fit(trainX, trainY, epochs=200, batch_size=2, verbose=2)

54
用Keras 預測時間序列 (R)
model <- Sequential()
model$add(LSTM(units = 4, input_shape=c(num_steps, num_features)))
model$add(Dense(1))
keras_compile(model, loss='mean_squared_error', optimizer='adam')
keras_fit(model, X_train, y_train, batch_size = 1, epochs = 500, verbose = 1)

統一分析環境架構
關聯式資料庫支柱
佈署營運分析用的系統(BI, CRM)，確保營運系統可以滲透到
業務流程中
探索支柱
可探索、測試任意類型資料，使企業可以快速從資料中獲得
新的洞察
非關聯式支柱
做初始資料加工各類資料具有相當價值，可用在低價值資料
的存儲
57

網銀
資料
臨櫃
資料
金融
商品
客戶
資料
分群、預測模組
單一視圖
資料儲存模組
報表
展現模組
手持
裝置展現模組
分析報表模組
資料交換與整合
職員
業務主管
巨量資料
處理層
巨量資料
分析展現層
輿情、網站資料
1
3
4
5
2
數位金融Big Data 平台架構模組
58

分析語言
資料庫
分析工具
應用
層
分析
層
資料
層
網路爬蟲 Open Data資料庫
儀表板
輿情分析、房屋鑑價、使用者貼標
ATM金流分析、智慧選址
59

資料分析平台
透過瀏覽器操作
資料分析平台
分析平台可以向資料庫、Hadoop
與檔案取用資料並將分析後的數據
存儲回資料庫中
60

THANK YOU
EMAIL: david@largitdata.com
網站: www.largitdata.com
電話: 0929094381
63

洞見未來，用python 與 r 結合深度學習技術預測趨勢

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to 洞見未來，用python 與 r 結合深度學習技術預測趨勢

Similar to 洞見未來，用python 與 r 結合深度學習技術預測趨勢 (20)

More from David Chiu

More from David Chiu (8)

洞見未來，用python 與 r 結合深度學習技術預測趨勢