Successfully reported this slideshow.
Your SlideShare is downloading. ×

時系列データの扱い方

Ad

後藤 仁奈
時系列データの扱い方

Ad

2 ITOCHU Techno-Solutions Corporation
自己紹介
 名前: 後藤 仁奈
 所属: 伊藤忠テクノソリューションズ株式会社
AIビジネス推進部
 仕事内容: AIフレームワークを使ったデータ分析(主にPoC...

Ad

3 Copyright © 2016 ITOCHU Techno-Solutions Corporation
本日のテーマ
数値系の時系列データを
ディープラーニングで分析してもいまいち精度があがらない・・・

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Check these out next

1 of 13 Ad
1 of 13 Ad
Advertisement

More Related Content

Advertisement

時系列データの扱い方

  1. 1. 後藤 仁奈 時系列データの扱い方
  2. 2. 2 ITOCHU Techno-Solutions Corporation 自己紹介  名前: 後藤 仁奈  所属: 伊藤忠テクノソリューションズ株式会社 AIビジネス推進部  仕事内容: AIフレームワークを使ったデータ分析(主にPoC) AIを始めて2年弱
  3. 3. 3 Copyright © 2016 ITOCHU Techno-Solutions Corporation 本日のテーマ 数値系の時系列データを ディープラーニングで分析してもいまいち精度があがらない・・・
  4. 4. 時系列データとは 数値データ 画像データ 言語データ 時間の経過に従って一定の間隔で取得されたデータを時系列データといいます。 時系列データは時間とともに刻々と変化していく(前後関係を持つ)性質をもちます。 前後関係を持つという意味では自然言語も時系列データになります。
  5. 5. 時系列分析とは 5 Copyright © 2017 ITOCHU Techno-Solutions Corporation 時系列分析 時系列分析とは、時系列データを扱う分析のことです。 「過去3か月の売上が良いから、次の月の売上も良いだろう」など、過去のデータから未来を予測する事がで きます。 時系列でないデータ 時系列データ 独立値として扱い、 それぞれのポイン トで分析 連続値として扱い、 時間による傾向の 変化を分析 Aさん Bさん Cさん Dさん 身 長 00:01 00:02 00:03 00:04 気 温 身長 体重 A ? 10 B ? 20 C ? 30 D ? 40 気温 湿度 00:01 ? 10 00:02 ? 25 00:03 ? 20 00:04 ? 40
  6. 6. 時系列データをディープラーニングで分析してみる 6 Copyright © 2017 ITOCHU Techno-Solutions Corporation 時系列データにディープラーニングを使う 機械学習/DL時系列データ
  7. 7. 7 Copyright © 2017 ITOCHU Techno-Solutions Corporation RNN(再帰型ニューラルネット) RNN(Recurrent Neural Network)は、内部に再帰機能を持つニューラルネットの総称で、その 機能のおかげで情報を一時的に記憶し、ふるまいを動的に変化させることができます。 LSTM(Long Short Term Memory) LSTMはRNNの拡張的な手法で、中間層をメモリユニットと呼ばれる要素に置き換えた構造を 持ちます。 メモリユニットは、内部に「入力ゲート」「出力ゲート」「忘却ゲート」と呼ばれる3つの ゲートを持ち、これにより長期依存を実現しています。 RNN Y S X 中間層 入力層 出力層 LSTM Y メモリユ ニット X 中間層 入力層 出力層 時系列データをディープラーニングで分析してみる
  8. 8. 8 Copyright © 2017 ITOCHU Techno-Solutions Corporation 全結合 LSTM ほとんど精度は 向上しない… 時系列データをディープラーニングで分析してみる
  9. 9. 9 Copyright © 2017 ITOCHU Techno-Solutions Corporation 数値系の時系列データを扱う際、 ディープラーニングだけでは限界…?
  10. 10. 10Copyright © 2017 ITOCHU Techno-Solutions Corporation 時系列データに統計学を使う 統計分析 時系列データ=短期的な自己相関 +周期変動 +季節性 +トレンド +外因性 時系列データを統計学で分析
  11. 11. 11 Copyright © 2017 ITOCHU Techno-Solutions Corporation 統計を用いた代表的な時系列モデル 自己相関 【売上の上昇が3か月続いている なら翌月の売上も良いだろう】 自己回帰移動平均モデル (ARMA) 自己回帰和分移動平均モデル (ARIMA) 季節性/周期性 【昨年の〇月の売上が良いから 今年の〇月も良いだろう】 季節階差(前年同期との差) SARIMAモデル 外因性 【近くで大きなイベントがあるか ら今日は売り上げが良いだろう】 ARIMAXモデル ARIMAErrorモデル 統計的なアプローチでは、データの変動要因によって使用するモデルを使い分けます。 時系列データを統計学で分析
  12. 12. メリットとデメリット 12 Copyright © 2017 ITOCHU Techno-Solutions Corporation 時系列分析は、統計分析と機械学習/ディープラーニング分析があります。 数値系時系列分析のアプローチ方法 機械学習/DL統計分析 時系列データ メリット ・DLで精度が出なくても、向上する可能 性がある ・分析結果を説明しやすい(要因を説明で きる) デメリット ・データ加工やモデルの作成に手間/時間 がかかる メリット ・データ構造がわからなくても、ある程度 の精度が出せる デメリット ・精度が出たとしても、説明がしにくい (要因が断定できない) ・データによっては精度向上に限界がある
  13. 13. まとめ 13 Copyright © 2017 ITOCHU Techno-Solutions Corporation 時系列データの扱い方 時系列データとは - 一定間隔の時刻で取得されている数値データ - 前後関係を持つ自然言語データ(系列データ) 時系列データは、主に統計と機械学習/ディープラーニングによる分析アプローチがある 数値系の時系列データは、複数の変動要因が混在して構成されているため、 ディープラーニングよりも統計分析を用いるメリットが大きいかも ディープラーニングと統計学にはそれぞれメリットデメリットがあるため、 どちらの要素も取り入れることで違う結果が得られるかも

×