ae-7. 予測・判断（時系列データ，リカレントニューラルネットワーク，LSTM）

7. 予測・判断（時系列データ，
リカレントニューラルネット
ワーク，LSTM）
1
金子邦彦
（ディープラーニング，Python を使用）
（全１５回）
https://www.kkaneko.jp/cc/ae/index.html

2
太陽の黒点数の変化
1848年～1999年のデータを用いて，2000年以降を予測
（ディープニューラルネットワークによる予測）
予測

データサイエンス
• データの正しい取り扱いと活用
• 統計，数学を基礎とする
3

機械学習
• 学習による上達の能力
• 訓練データを使用して，学習を行う
4

ニューラルネットワークの原理
ニューラルネットワークのユニットは，数理により
動く
① 入力は複数
② 入力を重みづけし合計をとる
③ その合計から出力値を得る
5
0.3 × 0.1 ⇒ 0.03
-0.5 × 0.8 ⇒ -0.4
0.2 × -0.5 ⇒ -0.1
合計
-0.47
合計に
応じた出力値
0.3846

ニューラルネットワーク
機械学習の能力を持つ．コンピュータで動作．
次を特徴とする．
① 入力は複数
② 入力を重みづけし合計をとる
③ その合計から出力値を得る
6
入力
1 2 3
4 5 6
7 8 9
1 1
2 1
3 1
4 0
5 1
6 1
7 0
8 0
9 1
白黒の画像
（画素は 0 または 1）
重み w1 ～ w9
ユニット
w1
w2
w3
w4
w5
w6
w7
w8
w9
合計
・合計に，バイアスという値を
足し引きしたあと，活性化関数
が適用され出力値が得られる．
・活性化関数はさまざまな種類
シグモイド
ReLU
（2011年発表）
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
合計は，
1 × w1 + 1 × w2 + 1 × w3 +
0 × w4 + 1 × w5 + 1 × w6 +
0 × w7 + 0 × w8 + 1 × w9

ニューラルネットワークの仕組み
7
入力層
中間層
出力層
〇はユニット，線は結合
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
全結合のときは，
次層の全ユニッ
トと結合する全結合のときは，
次層の全ユニッ
トと結合する
• 前の層から結果を受けとって，次の層へ結果を
渡す
（他の結合は書
いていない）（他の結合は書
いていない）

アウトライン
8
番号項目
7-1 時系列データ
7-2 リカレントニューラルネットワーク
7-3 LSTM
7-4 演習
各自，資料を読み返したり，課題に取り組んだりも行う

全体まとめ
• 時系列データは，時間とともに，値が変化するデー
タ
• 時系列データから，周期性やトレンドなどを読み取
ることができる
• リカレントニューラルネットワーク
• 回帰により，過去の情報を保持
• 時系列データなどデータの並びを扱う能力を持つ
予測，手書き文字認識，音声認識，言葉の理解，
翻訳，テキスト生成，プログラム生成など
• 長期に及ぶ過去の情報の保持のため，LSTM が考案され
た
9

11
過去の量から，周期性を分析し活用

12
過去の量から，トレンドを分析し活用

時系列データ
時系列データは，
昨日の気温は15度
今日の気温が13度
のように，時間とともに，値が変化するデータ
13

時系列データの例
14

時系列データの特性
• 周期性：週単位，月単位，年単位
• イベント：正月，クリスマス，４月頭
• 長期的な傾向：増加傾向，一定，減少傾向
• 誤差や，突発的な変化・変動
15

Facebook イベント数の分析例
16
Taylor SJ, Letham B. 2017. Forecasting at scale. PeerJ Preprints 5:e3190v2
https://doi.org/10.7287/peerj.preprints.3190v2
曜日で色を変えてプロット ⇒ 曜日単の周期性を読み取る

Facebook イベント数の分析例
17
Taylor SJ, Letham B. 2017. Forecasting at scale. PeerJ Preprints 5:e3190v2
https://doi.org/10.7287/peerj.preprints.3190v2
周期性の分析
トレンドの分析
土日は少ない
年末年始は少ない
2015年からは増加
元データをProphet で処理した結果
元データをProphet で処理した結果

まとめ
• 時系列データは，時間とともに，値が変化する
データ
• 時系列データから，周期性やトレンドなどを読み
取ることができる
18

7-2. リカレント
19

リカレントニューラルネットワーク
20
リカレントニューラルネットワークは
回帰により過去の情報を保持する
回帰
前回の実行時での結果を，
次の実行に反映

リカレントニューラルネットワーク
• 回帰により，過去の情報を保持．前回の実行時で
の結果の一部が，次の実行に反映される
• 時系列データなど，データの並びを扱う能力を持
つ
21

フィードフォワードとリカレントニューラルネッ
トワーク
22
フィードフォワード
ネットワーク
ある層の出力を，次の層が受
け取る
リカレントニューラルネッ
トワーク
回帰により，前回の実行時での
結果の一部が，次の実行に反映
される．
回帰

リカレントニューラルネットワークの動作イメー
ジ ①
23
デ
ー
タ
の
並
び
保持
使用

ジ ②
24
デ
ー
タ
の
並
び
保持
使用
前回の実行時での
結果も使用

ジ ③
25
デ
ー
タ
の
並
び
保持
使用
前回の実行時での
結果も使用

リカレントニューラルネットワークの応用
• 時系列データを用いた予測
データの並びを扱う
• 手書き文字認識
筆記の動きを扱う
• 音声認識
音の並びを扱う
• 「言葉」の理解，翻訳，テキスト生成，プログラ
ム生成
単語の並びを扱う
26

リカレントニューラルネットワークのニュース
数学に関する教科書を人工知能が学習．数学論文の
偽物等を生成する能力を獲得
27
Andrej Karpathy のブログ記事
The Unreasonable Effectiveness of Recurrent Neural Networks. 2015.
http://karpathy.github.io/2015/05/21/rnn-effectiveness/
人工知能が生成した数学レポート人工知能が生成した C言語プログラム

リカレントニューラルネットワークの特質
• 単純なフィードフォワードのニューラルネット
ワークより，高い能力を持つ
• その分，多くの訓練データを必要とする
• 長期に及ぶ過去の情報の保持が困難（1991年,
1994年に理論的根拠が示された） ⇒ LSTM など，
改良が生まれた
28

LSTM の応用
• 単純なリカレントニューラルネットワークでは困
難な，長期に及ぶ過去の情報を扱うディープラー
ニング
30

LSTM 誕生の背景
• リカレントニューラルネットワークでは，長期に
及ぶ過去の情報の保持が困難（1991年, 1994年に
理論的根拠が示された）
• 長期に及ぶ過去の情報を保持しようとすると，問
題が発生（勾配消失や勾配爆発により，学習がう
まくいかなくなる）
31
Y Bengio 1, P Simard, P Frasconi,
Learning long-term dependencies with gradient descent is difficult,
IEEE Trans Neural Netw, 1994;5(2):157-66, doi: 10.1109/72.279181, 1994.

LSTM の仕組み
32
回帰
入力出力
状態
状態を受け取る
状態は「メモリセル」に記憶されている
ユニットの動作のたびに
状態が変化する
LSTM は，リカレント
ニューラルネットワークの一種
２つの機能
・記憶の持続 (constant error carousel)
1997年発表
・記憶の忘却 (forget gate)
1999 年発表

LSTM の特徴
• LSTMは，リカレントニューラルネットワークの
一種
• メモリセルは，状態として，同じ値の長期の記憶
の保持を可能とする
• リカレントニューラルネットワークの弱点ともい
われる「長期に及ぶ過去の情報の保持が困難」で
あることを解決
• 1997, 1999年発表の技術．その後，手書き文字認
識，音声認識，自動翻訳など数多くの応用
33

全体まとめ
• 時系列データは，時間とともに，値が変化するデー
タ
• 時系列データから，周期性やトレンドなどを読み取
ることができる
• リカレントニューラルネットワーク
• 回帰により，過去の情報を保持
• 時系列データなどデータの並びを扱う能力を持つ
予測，手書き文字認識，音声認識，言葉の理解，
翻訳，テキスト生成，プログラム生成など
• 長期に及ぶ過去の情報の保持のため，LSTM が考案され
た
34

Google Colaboratory の使い方概要 ①
36
Google Colaboratory ノートブック
コードセルの再実行や変更には，
Google アカウントでのログインが必要
実行
コードセル

テキストセル
コードセル
コードセル
• WEBブラウザでアクセス
• コードセルは
Python プログラム．
各自の Google アカウント
でログインすれば，
変更，再実行可能
Google Colaboratory の使い方概要 ②
37
実行
一番上のコードセルから順々に実行
実行

① LSTM による予測
1. 使用するページ:
https://colab.research.google.com/drive/1qxh5l0iEP
Um-QRTuEBSqBLd3V9KvqItK?usp=sharing
2. 必要な事前知識
LSTM もニューラルネットワークの一種であり，学
習のさせ方などは，ふつうのニューラルネットワー
クと同じであること
3. 各自で実行すること
実際に実行し、予測を試す．
38

39
1848年～1999年のデータを用いて，2000年以降を予測
（ディープニューラルネットワークによる予測）
予測
予測では，過去の観測値から「次の日（つまり一日
分）の予測」を行うことを繰り返している．

① 10日分のデータから
11日後を予測
② 100日分のデータから
101日後を予測
③ 1000日分のデータから
1001日後を予測
40

① 10日分のデータから
11日後を予測
② 100日分のデータから
101日後を予測
③ 1000日分のデータから
1001日後を予測
41
訓練データの量が
1/10 になる
訓練データの量が
1/100 になる
「①より②，③が良い」と思い込まないこと
（①がベスト，ということもあり得る）

みどころ
10日分のデータから
11日後を予測
42
これを
上手く使って
1848年～1999年のデータを用いて，2000年
以降を予測
太陽の黒点
数の変化
予測

LSTM も教師あり学習である
43
コンピュータ
プログラム
データ
（入力）
予測結果
１０日分のデータと，
予測結果の正解（１１日後のデータ）
訓練データ
１０日分のデータ

①
LSTM での学習の繰り返し
44
LSTM
訓練データ
1848年～1999年のデータ 2000年以降のデータ
最初の１１日分を切り出して使用

②
45
LSTM
訓練データ
少しずらして，
１１日分を切り出して使用
過去の情報が
保持される

③
46
LSTM
訓練データ
過去の情報が
保持される
最後まで使い切って
学習を終了

④
LSTMによる予測
47
LSTM
過去の情報が
保持される
予測したい部分に進んでい
く（１０日分切り出し）
予測結果が
得られる

⑤
LSTMによる予測
48
LSTM
過去の情報が
保持される
予測したい部分の最後まで
続ける（１０日分切り出し
を続ける）
予測結果が
得られる

ae-7. 予測・判断（時系列データ，リカレントニューラルネットワーク，LSTM）

Recommended

Recommended

More Related Content

Similar to ae-7. 予測・判断（時系列データ，リカレントニューラルネットワーク，LSTM）

Similar to ae-7. 予測・判断（時系列データ，リカレントニューラルネットワーク，LSTM） (8)

More from kunihikokaneko1

More from kunihikokaneko1 (20)

ae-7. 予測・判断（時系列データ，リカレントニューラルネットワーク，LSTM）

Editor's Notes