後藤 仁奈
時系列データの扱い方
2 ITOCHU Techno-Solutions Corporation
自己紹介
 名前: 後藤 仁奈
 所属: 伊藤忠テクノソリューションズ株式会社
AIビジネス推進部
 仕事内容: AIフレームワークを使ったデータ分析(主にPoC)
AIを始めて2年弱
3 Copyright © 2016 ITOCHU Techno-Solutions Corporation
本日のテーマ
数値系の時系列データを
ディープラーニングで分析してもいまいち精度があがらない・・・
時系列データとは
数値データ 画像データ 言語データ
時間の経過に従って一定の間隔で取得されたデータを時系列データといいます。
時系列データは時間とともに刻々と変化していく(前後関係を持つ)性質をもちます。
前後関係を持つという意味では自然言語も時系列データになります。
時系列分析とは
5
Copyright © 2017 ITOCHU Techno-Solutions Corporation
時系列分析
時系列分析とは、時系列データを扱う分析のことです。
「過去3か月の売上が良いから、次の月の売上も良いだろう」など、過去のデータから未来を予測する事がで
きます。
時系列でないデータ 時系列データ
独立値として扱い、
それぞれのポイン
トで分析
連続値として扱い、
時間による傾向の
変化を分析
Aさん Bさん Cさん Dさん
身
長
00:01 00:02 00:03 00:04
気
温
身長 体重
A ? 10
B ? 20
C ? 30
D ? 40
気温 湿度
00:01 ? 10
00:02 ? 25
00:03 ? 20
00:04 ? 40
時系列データをディープラーニングで分析してみる
6
Copyright © 2017 ITOCHU Techno-Solutions Corporation
時系列データにディープラーニングを使う
機械学習/DL時系列データ
7
Copyright © 2017 ITOCHU Techno-Solutions Corporation
RNN(再帰型ニューラルネット)
RNN(Recurrent Neural Network)は、内部に再帰機能を持つニューラルネットの総称で、その
機能のおかげで情報を一時的に記憶し、ふるまいを動的に変化させることができます。
LSTM(Long Short Term Memory)
LSTMはRNNの拡張的な手法で、中間層をメモリユニットと呼ばれる要素に置き換えた構造を
持ちます。
メモリユニットは、内部に「入力ゲート」「出力ゲート」「忘却ゲート」と呼ばれる3つの
ゲートを持ち、これにより長期依存を実現しています。
RNN
Y
S
X
中間層
入力層
出力層
LSTM
Y
メモリユ
ニット
X
中間層
入力層
出力層
時系列データをディープラーニングで分析してみる
8
Copyright © 2017 ITOCHU Techno-Solutions Corporation
全結合 LSTM
ほとんど精度は
向上しない…
時系列データをディープラーニングで分析してみる
9
Copyright © 2017 ITOCHU Techno-Solutions Corporation
数値系の時系列データを扱う際、
ディープラーニングだけでは限界…?
10Copyright © 2017 ITOCHU Techno-Solutions Corporation
時系列データに統計学を使う
統計分析
時系列データ=短期的な自己相関
+周期変動
+季節性
+トレンド
+外因性
時系列データを統計学で分析
11
Copyright © 2017 ITOCHU Techno-Solutions Corporation
統計を用いた代表的な時系列モデル
自己相関
【売上の上昇が3か月続いている
なら翌月の売上も良いだろう】
自己回帰移動平均モデル
(ARMA)
自己回帰和分移動平均モデル
(ARIMA)
季節性/周期性
【昨年の〇月の売上が良いから
今年の〇月も良いだろう】
季節階差(前年同期との差)
SARIMAモデル
外因性
【近くで大きなイベントがあるか
ら今日は売り上げが良いだろう】
ARIMAXモデル
ARIMAErrorモデル
統計的なアプローチでは、データの変動要因によって使用するモデルを使い分けます。
時系列データを統計学で分析
メリットとデメリット
12
Copyright © 2017 ITOCHU Techno-Solutions Corporation
時系列分析は、統計分析と機械学習/ディープラーニング分析があります。
数値系時系列分析のアプローチ方法
機械学習/DL統計分析
時系列データ
メリット
・DLで精度が出なくても、向上する可能
性がある
・分析結果を説明しやすい(要因を説明で
きる)
デメリット
・データ加工やモデルの作成に手間/時間
がかかる
メリット
・データ構造がわからなくても、ある程度
の精度が出せる
デメリット
・精度が出たとしても、説明がしにくい
(要因が断定できない)
・データによっては精度向上に限界がある
まとめ
13
Copyright © 2017 ITOCHU Techno-Solutions Corporation
時系列データの扱い方
時系列データとは
- 一定間隔の時刻で取得されている数値データ
- 前後関係を持つ自然言語データ(系列データ)
時系列データは、主に統計と機械学習/ディープラーニングによる分析アプローチがある
数値系の時系列データは、複数の変動要因が混在して構成されているため、
ディープラーニングよりも統計分析を用いるメリットが大きいかも
ディープラーニングと統計学にはそれぞれメリットデメリットがあるため、
どちらの要素も取り入れることで違う結果が得られるかも

時系列データの扱い方

  • 1.
  • 2.
    2 ITOCHU Techno-SolutionsCorporation 自己紹介  名前: 後藤 仁奈  所属: 伊藤忠テクノソリューションズ株式会社 AIビジネス推進部  仕事内容: AIフレームワークを使ったデータ分析(主にPoC) AIを始めて2年弱
  • 3.
    3 Copyright ©2016 ITOCHU Techno-Solutions Corporation 本日のテーマ 数値系の時系列データを ディープラーニングで分析してもいまいち精度があがらない・・・
  • 4.
  • 5.
    時系列分析とは 5 Copyright © 2017ITOCHU Techno-Solutions Corporation 時系列分析 時系列分析とは、時系列データを扱う分析のことです。 「過去3か月の売上が良いから、次の月の売上も良いだろう」など、過去のデータから未来を予測する事がで きます。 時系列でないデータ 時系列データ 独立値として扱い、 それぞれのポイン トで分析 連続値として扱い、 時間による傾向の 変化を分析 Aさん Bさん Cさん Dさん 身 長 00:01 00:02 00:03 00:04 気 温 身長 体重 A ? 10 B ? 20 C ? 30 D ? 40 気温 湿度 00:01 ? 10 00:02 ? 25 00:03 ? 20 00:04 ? 40
  • 6.
    時系列データをディープラーニングで分析してみる 6 Copyright © 2017ITOCHU Techno-Solutions Corporation 時系列データにディープラーニングを使う 機械学習/DL時系列データ
  • 7.
    7 Copyright © 2017ITOCHU Techno-Solutions Corporation RNN(再帰型ニューラルネット) RNN(Recurrent Neural Network)は、内部に再帰機能を持つニューラルネットの総称で、その 機能のおかげで情報を一時的に記憶し、ふるまいを動的に変化させることができます。 LSTM(Long Short Term Memory) LSTMはRNNの拡張的な手法で、中間層をメモリユニットと呼ばれる要素に置き換えた構造を 持ちます。 メモリユニットは、内部に「入力ゲート」「出力ゲート」「忘却ゲート」と呼ばれる3つの ゲートを持ち、これにより長期依存を実現しています。 RNN Y S X 中間層 入力層 出力層 LSTM Y メモリユ ニット X 中間層 入力層 出力層 時系列データをディープラーニングで分析してみる
  • 8.
    8 Copyright © 2017ITOCHU Techno-Solutions Corporation 全結合 LSTM ほとんど精度は 向上しない… 時系列データをディープラーニングで分析してみる
  • 9.
    9 Copyright © 2017ITOCHU Techno-Solutions Corporation 数値系の時系列データを扱う際、 ディープラーニングだけでは限界…?
  • 10.
    10Copyright © 2017ITOCHU Techno-Solutions Corporation 時系列データに統計学を使う 統計分析 時系列データ=短期的な自己相関 +周期変動 +季節性 +トレンド +外因性 時系列データを統計学で分析
  • 11.
    11 Copyright © 2017ITOCHU Techno-Solutions Corporation 統計を用いた代表的な時系列モデル 自己相関 【売上の上昇が3か月続いている なら翌月の売上も良いだろう】 自己回帰移動平均モデル (ARMA) 自己回帰和分移動平均モデル (ARIMA) 季節性/周期性 【昨年の〇月の売上が良いから 今年の〇月も良いだろう】 季節階差(前年同期との差) SARIMAモデル 外因性 【近くで大きなイベントがあるか ら今日は売り上げが良いだろう】 ARIMAXモデル ARIMAErrorモデル 統計的なアプローチでは、データの変動要因によって使用するモデルを使い分けます。 時系列データを統計学で分析
  • 12.
    メリットとデメリット 12 Copyright © 2017ITOCHU Techno-Solutions Corporation 時系列分析は、統計分析と機械学習/ディープラーニング分析があります。 数値系時系列分析のアプローチ方法 機械学習/DL統計分析 時系列データ メリット ・DLで精度が出なくても、向上する可能 性がある ・分析結果を説明しやすい(要因を説明で きる) デメリット ・データ加工やモデルの作成に手間/時間 がかかる メリット ・データ構造がわからなくても、ある程度 の精度が出せる デメリット ・精度が出たとしても、説明がしにくい (要因が断定できない) ・データによっては精度向上に限界がある
  • 13.
    まとめ 13 Copyright © 2017ITOCHU Techno-Solutions Corporation 時系列データの扱い方 時系列データとは - 一定間隔の時刻で取得されている数値データ - 前後関係を持つ自然言語データ(系列データ) 時系列データは、主に統計と機械学習/ディープラーニングによる分析アプローチがある 数値系の時系列データは、複数の変動要因が混在して構成されているため、 ディープラーニングよりも統計分析を用いるメリットが大きいかも ディープラーニングと統計学にはそれぞれメリットデメリットがあるため、 どちらの要素も取り入れることで違う結果が得られるかも