More Related Content
PPTX
ジャストシステムの形態素解析技術 その2 機械学習編 PDF
PDF
Machine learning 15min TensorFlow hub PPTX
機械学習 / Deep Learning 大全 (1) 機械学習基礎編 PDF
PDF
#経済学のための実践的データ分析 13. 最終レポートの報告 + おわりに PDF
A31 切り開けDBエンジニア 〜データ分析基盤へインサイトテクノロジーの1つの答えとは〜 by Koji Shinkubo PPTX
JSAI 1K3-2 知識ベースに基づく言語横断質問応答における訳質の影響 Similar to 時系列データの扱い方
PPTX
ディープラーニングによる時系列データの異常検知 PDF
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料) PDF
論文輪読資料「A review of unsupervised feature learning and deep learning for time-s... PPTX
PPTX
PDF
時系列解析の使い方 - TokyoWebMining #17 PDF
PDF
PDF
LSTM (Long short-term memory) 概要 PDF
[論文紹介] LSTM (LONG SHORT-TERM MEMORY) PDF
Latent ODEs for Irregularly-Sampled Time Series PDF
Time series analytics_ch01 PDF
Study aiラビットチャレンジ 深層学習Day3 PDF
Multivariate Time series analysis via interpretable RNNs PPTX
PDF
More from Yutaka Terasawa
PDF
PDF
PDF
20180717 unsupervised learning PDF
PDF
PDF
Google Colaboratoryを使って、MNISTでディープラニング! PDF
Wg for ai_dev_ops_20180713 PDF
PDF
PDF
PDF
20181114_AI×Analytics×女子部 オープニング PDF
PDF
PDF
20181114 TDAを使ったタイタニック生存者分析 時系列データの扱い方
- 1.
- 2.
2 ITOCHU Techno-SolutionsCorporation
自己紹介
名前: 後藤 仁奈
所属: 伊藤忠テクノソリューションズ株式会社
AIビジネス推進部
仕事内容: AIフレームワークを使ったデータ分析(主にPoC)
AIを始めて2年弱
- 3.
3 Copyright ©2016 ITOCHU Techno-Solutions Corporation
本日のテーマ
数値系の時系列データを
ディープラーニングで分析してもいまいち精度があがらない・・・
- 4.
- 5.
時系列分析とは
5
Copyright © 2017ITOCHU Techno-Solutions Corporation
時系列分析
時系列分析とは、時系列データを扱う分析のことです。
「過去3か月の売上が良いから、次の月の売上も良いだろう」など、過去のデータから未来を予測する事がで
きます。
時系列でないデータ 時系列データ
独立値として扱い、
それぞれのポイン
トで分析
連続値として扱い、
時間による傾向の
変化を分析
Aさん Bさん Cさん Dさん
身
長
00:01 00:02 00:03 00:04
気
温
身長 体重
A ? 10
B ? 20
C ? 30
D ? 40
気温 湿度
00:01 ? 10
00:02 ? 25
00:03 ? 20
00:04 ? 40
- 6.
- 7.
7
Copyright © 2017ITOCHU Techno-Solutions Corporation
RNN(再帰型ニューラルネット)
RNN(Recurrent Neural Network)は、内部に再帰機能を持つニューラルネットの総称で、その
機能のおかげで情報を一時的に記憶し、ふるまいを動的に変化させることができます。
LSTM(Long Short Term Memory)
LSTMはRNNの拡張的な手法で、中間層をメモリユニットと呼ばれる要素に置き換えた構造を
持ちます。
メモリユニットは、内部に「入力ゲート」「出力ゲート」「忘却ゲート」と呼ばれる3つの
ゲートを持ち、これにより長期依存を実現しています。
RNN
Y
S
X
中間層
入力層
出力層
LSTM
Y
メモリユ
ニット
X
中間層
入力層
出力層
時系列データをディープラーニングで分析してみる
- 8.
8
Copyright © 2017ITOCHU Techno-Solutions Corporation
全結合 LSTM
ほとんど精度は
向上しない…
時系列データをディープラーニングで分析してみる
- 9.
- 10.
10Copyright © 2017ITOCHU Techno-Solutions Corporation
時系列データに統計学を使う
統計分析
時系列データ=短期的な自己相関
+周期変動
+季節性
+トレンド
+外因性
時系列データを統計学で分析
- 11.
11
Copyright © 2017ITOCHU Techno-Solutions Corporation
統計を用いた代表的な時系列モデル
自己相関
【売上の上昇が3か月続いている
なら翌月の売上も良いだろう】
自己回帰移動平均モデル
(ARMA)
自己回帰和分移動平均モデル
(ARIMA)
季節性/周期性
【昨年の〇月の売上が良いから
今年の〇月も良いだろう】
季節階差(前年同期との差)
SARIMAモデル
外因性
【近くで大きなイベントがあるか
ら今日は売り上げが良いだろう】
ARIMAXモデル
ARIMAErrorモデル
統計的なアプローチでは、データの変動要因によって使用するモデルを使い分けます。
時系列データを統計学で分析
- 12.
メリットとデメリット
12
Copyright © 2017ITOCHU Techno-Solutions Corporation
時系列分析は、統計分析と機械学習/ディープラーニング分析があります。
数値系時系列分析のアプローチ方法
機械学習/DL統計分析
時系列データ
メリット
・DLで精度が出なくても、向上する可能
性がある
・分析結果を説明しやすい(要因を説明で
きる)
デメリット
・データ加工やモデルの作成に手間/時間
がかかる
メリット
・データ構造がわからなくても、ある程度
の精度が出せる
デメリット
・精度が出たとしても、説明がしにくい
(要因が断定できない)
・データによっては精度向上に限界がある
- 13.
まとめ
13
Copyright © 2017ITOCHU Techno-Solutions Corporation
時系列データの扱い方
時系列データとは
- 一定間隔の時刻で取得されている数値データ
- 前後関係を持つ自然言語データ(系列データ)
時系列データは、主に統計と機械学習/ディープラーニングによる分析アプローチがある
数値系の時系列データは、複数の変動要因が混在して構成されているため、
ディープラーニングよりも統計分析を用いるメリットが大きいかも
ディープラーニングと統計学にはそれぞれメリットデメリットがあるため、
どちらの要素も取り入れることで違う結果が得られるかも