SlideShare a Scribd company logo
時系列データ分析1
はじめに
本資料は、
現場ですぐ使える「時系列データ分析」 
(青木義充、横内大介 著)を読んで、自分
用に整理したものである。
そのため、間違いがある可能性もあるが、そ
れに対して本資料の作成者は責任を負わない
。
用語定義
時系列データ
 対象のある側面が特定の時間間隔で観測された結果の集まり。
 折れ線グラフで表現される。
 
点過程(ポイントプロセス)
 事象の生起するタイミング毎に観測された断続的な結果の集まり。
 ローソク足で表現される。
類別変量
 観測対象の分類を表す変量。
 例えば、「男性と女性」のような観測対象の区別を与えるデータ。
 棒グラフは、類別変量を要約することが目的。
棒グラフ
 類別変量の分布を表す。横軸に分類をとる。
ヒストグラム
 数値変量の分布を表す。横軸に数値をとる。 
時系列データと確率分布
仮定

目的

観測対象ないしその属性が連続時間上で変化する。

観測対象のモデル化。
つまり、観測対象を表現する、連続時間を引数とした関
数を、時系列データから求めること。

関数の形は不明
関数の数は無限に考えられる
関数の形は時間の経過とともに変化する可能性がある。
関数の形が分かったとしても、観測にはノイズが混入するためパラメータの
推定は容易ではない。

連続時間の関数を離散時間の関数に置き換える。観測時点ごとにある現象が
独立して発生するとみなす。更に、各事象発生の裏に確率分布の存在を仮定す
る。
対象の確率分布を用いたモデル化が可能になる。
データのモデル化の流れ
観測対象をモデル化したい
関数の形は不明、関数は時間と共に変化する可能性がある。
連続時間の関数を離散時間に置き換え、観測時点ごとにある現象が独立
して発生するとみなし、各事象発生の裏に確率分布の存在を仮定する。
例えば、独立同一分布として正規分布を仮定する。
仮定した分布の適合度を調べる。
・適合度検定
・ QQ プロット
適合する

仮定した分布は正しい。

適合しない
仮定を見直す。
独立同一分布であるのか?
正規分布であるのか?
独立同一分布( i.i.d )に従うとは
【定義】
データを「同一の確率分布から得られた、互いに独立な標本の集ま
り」とみなすこと。
言い換えれば、データをある1つの確率分布から無関係に複数回標
本を抽出したときの標本の集団と仮定すること。
【補足】
母集団の平均が特定の値になっているか否かを調べる t 検定でも独
立同一分布の仮定は必要となる。

この仮定では、ある時点の事象は、以前の事象とは無関係というこ
とになる。
時系列データは、独立同一分布とは限らないのではないか?
ある時点の事象は以前の事象に影響を受ける場合もあるのではない
か?
独立同一分布( i.i.d )に従うとは
どの時点のデータも同一の確率分布から独立に抽出されたと考える

時系列データ
独立同一分布( i.i.d )に従うの?
この仮定では、ある時点の事象は、以前の事象とは無関係という
ことになる。
時系列データは、独立同一分布とは限らないのではないか?
ある時点の事象は以前の事象に影響を受ける場合もあるのではな
いか?
確率分布が時間変化するという仮定をおく。
・ AR モデル(自己回帰モデル)
→ 誤差項はホワイトノイズ。
・ ARCH モデル(自己回帰条件付分散不均一モデル)
→ 誤差項の2乗は時間依存(自己相関)しているため、誤差の分
散を定数とみなせない。
・ GARCH モデル(一般化 ARCH モデル)
独立同一分布( i.i.d )に従うの?
時間変化する確率分布から抽出されたとする。

時系列データ
独立同一分布( i.i.d )に従うの?
時間変化する確率分布から抽出されたとする。

時系列データ

More Related Content

What's hot

心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する
Hiroshi Shimizu
 
DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)
Masaru Tokuoka
 
異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知
hagino 3000
 
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料 「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
Ken'ichi Matsui
 
反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか
SAKAUE, Tatsuya
 
2 6.ゼロ切断・過剰モデル
2 6.ゼロ切断・過剰モデル2 6.ゼロ切断・過剰モデル
2 6.ゼロ切断・過剰モデル
logics-of-blue
 
因果関係を時系列変化で分析
因果関係を時系列変化で分析因果関係を時系列変化で分析
因果関係を時系列変化で分析
DaikiNagamine
 
機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化
gree_tech
 
PRML読み会第一章
PRML読み会第一章PRML読み会第一章
PRML読み会第一章
Takushi Miki
 
(実験心理学徒だけど)一般化線形混合モデルを使ってみた
(実験心理学徒だけど)一般化線形混合モデルを使ってみた(実験心理学徒だけど)一般化線形混合モデルを使ってみた
(実験心理学徒だけど)一般化線形混合モデルを使ってみた
Takashi Yamane
 
Pythonで時系列のデータを分析してみよう
Pythonで時系列のデータを分析してみようPythonで時系列のデータを分析してみよう
Pythonで時系列のデータを分析してみよう
Tatuya Kobayashi
 
1 5.パラメトリックブートストラップ検定と確率分布
1 5.パラメトリックブートストラップ検定と確率分布1 5.パラメトリックブートストラップ検定と確率分布
1 5.パラメトリックブートストラップ検定と確率分布
logics-of-blue
 
5分でわかるベイズ確率
5分でわかるベイズ確率5分でわかるベイズ確率
5分でわかるベイズ確率hoxo_m
 
パターン認識と機械学習 (PRML) 第1章-「多項式曲線フィッティング」「確率論」
パターン認識と機械学習 (PRML) 第1章-「多項式曲線フィッティング」「確率論」パターン認識と機械学習 (PRML) 第1章-「多項式曲線フィッティング」「確率論」
パターン認識と機械学習 (PRML) 第1章-「多項式曲線フィッティング」「確率論」
Koichi Hamada
 
15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学
Ken'ichi Matsui
 
非ガウス性を利用した 因果構造探索
非ガウス性を利用した因果構造探索非ガウス性を利用した因果構造探索
非ガウス性を利用した 因果構造探索
Shiga University, RIKEN
 
分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門
Koichiro Gibo
 
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定
Katsuya Ito
 
言語と画像の表現学習
言語と画像の表現学習言語と画像の表現学習
言語と画像の表現学習
Yuki Noguchi
 

What's hot (20)

心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する
 
DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)
 
異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知
 
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料 「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
 
反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか
 
2 6.ゼロ切断・過剰モデル
2 6.ゼロ切断・過剰モデル2 6.ゼロ切断・過剰モデル
2 6.ゼロ切断・過剰モデル
 
因果関係を時系列変化で分析
因果関係を時系列変化で分析因果関係を時系列変化で分析
因果関係を時系列変化で分析
 
機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化
 
PRML読み会第一章
PRML読み会第一章PRML読み会第一章
PRML読み会第一章
 
(実験心理学徒だけど)一般化線形混合モデルを使ってみた
(実験心理学徒だけど)一般化線形混合モデルを使ってみた(実験心理学徒だけど)一般化線形混合モデルを使ってみた
(実験心理学徒だけど)一般化線形混合モデルを使ってみた
 
Pythonで時系列のデータを分析してみよう
Pythonで時系列のデータを分析してみようPythonで時系列のデータを分析してみよう
Pythonで時系列のデータを分析してみよう
 
1 5.パラメトリックブートストラップ検定と確率分布
1 5.パラメトリックブートストラップ検定と確率分布1 5.パラメトリックブートストラップ検定と確率分布
1 5.パラメトリックブートストラップ検定と確率分布
 
5分でわかるベイズ確率
5分でわかるベイズ確率5分でわかるベイズ確率
5分でわかるベイズ確率
 
パターン認識と機械学習 (PRML) 第1章-「多項式曲線フィッティング」「確率論」
パターン認識と機械学習 (PRML) 第1章-「多項式曲線フィッティング」「確率論」パターン認識と機械学習 (PRML) 第1章-「多項式曲線フィッティング」「確率論」
パターン認識と機械学習 (PRML) 第1章-「多項式曲線フィッティング」「確率論」
 
15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学
 
非ガウス性を利用した 因果構造探索
非ガウス性を利用した因果構造探索非ガウス性を利用した因果構造探索
非ガウス性を利用した 因果構造探索
 
分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門
 
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定
 
マーク付き点過程
マーク付き点過程マーク付き点過程
マーク付き点過程
 
言語と画像の表現学習
言語と画像の表現学習言語と画像の表現学習
言語と画像の表現学習
 

時系列データ分析