SlideShare a Scribd company logo
1 of 48
Download to read offline
分析のビジネス展開を考える
―状態空間モデルを例に
TokyoWebMining #47
2015/6/27
@horihorio
自己紹介
Twitter ID @horihorio
お仕事 データ分析コンサルタント
興味 多趣味。その痕跡 → 私の読書リスト
統計/DB/R/マーケティング/金融/会計
過去の発表 ここ
最近の出来事
 分析の仕事に関わるあらゆるお仕事をやっています
ただし、実際の分析を除く…
 自宅でもEC2でXBRLの前処理、…って何してるの?
 相変わらず、3歳児な子どもに大絶賛嫌われ中…
2015/6/27 分析のビジネス展開を考えるー状態空間モデルを例に 1 / 47
目次
1. はじめに
2. 状態空間モデルの推定方法
3. 分析のビジネス展開を考える
―状態空間モデルを例に
4. まとめ
※ 本発表の内容と意見は発表者個人に属するものであり、発表者が所
属する企業の公式見解を示すものではございません
2015/6/27 2 / 47分析のビジネス展開を考えるー状態空間モデルを例に
1. はじめに
2015/6/27 3 / 47分析のビジネス展開を考えるー状態空間モデルを例に
データ分析で相手を動かすには
2015/6/27 4 / 47分析のビジネス展開を考えるー状態空間モデルを例に
分析者が好かれること
問題設定に腹落ちして頂くこと
分析結果の見せ方、展開方法を固めること
この分析成果は、自分の手柄になりそう
などなど…
ですが、相手は「自分が出来ない/やってない分析
結果に責任を取らされる」ので、
に応えることは、結構重要
なぜそうなるの?
社内の意思決定者を考える
2015/6/27 5 / 47分析のビジネス展開を考えるー状態空間モデルを例に
関係者全員が統計に興味があり、詳しい
→ まずあり得ない
納得を頂くには、中身が見えた方が良い
入力 出力ブラックボックス
一部の機械学習手法
通りやすいモデル
入力 出力
𝑥1
𝑦𝑥2
𝑥3
状態空間モデルって
2015/6/27 6 / 47分析のビジネス展開を考えるー状態空間モデルを例に
中身が見える、分かりやすいモデルの一例
オンラインモールの購買単価 (𝑦𝑡)
= 𝑤𝑡+55 × 𝑆𝐸𝑂 100万 + 48 × リスティング 100万
+13 × アプリ𝐷𝐿数 1000 + 20 × 休日数
※数字や変数はフィクションです(参考先)
購買単価(𝑦𝑡)
𝑇
モデル構築期間 予測期間
予
測
範
囲
世間受けをGoogleに聞いてみた
2015/6/27 7 / 47分析のビジネス展開を考えるー状態空間モデルを例に
ビジネス
※画面は6/22現在
※判断基準は主観
ビジネス
初学者向け理論
オレ系
ビジネスマンの
勉強成果
ビジネスマンの
勉強成果
対照サンプルの結果(例:確率微分方程式)
2015/6/27 8 / 47分析のビジネス展開を考えるー状態空間モデルを例に
アマゾン
※画面は6/22現在
※判断基準は主観
ビジネス
初学者向け理論大学講義資料
アマゾン
大学講義資料
データ分析の仕事で思うこと
2015/6/27 9 / 47分析のビジネス展開を考えるー状態空間モデルを例に
1. データ分析は信用されない、がスタート地点
データください(結構大変)、結果は保証出来ません
→ 予算ください、の上申の優先順位は下がりがち
依頼者は分析者より情報劣位な「レモン市場」
→ そのままでは「悪貨が良貨を駆逐する」に陥る
2. そんな中、成功例が出るのは嬉しいこと
「データサイエンスブーム」で話がしやすいのは確か
3. ただ、形式的な真似はそこそこ容易に
数式は書籍や論文での公開情報、R/Python等はフリー、
計算資源もAWSなりで簡単に調達、あとは人材だけ
本発表の目的
2015/6/27 10 / 47分析のビジネス展開を考えるー状態空間モデルを例に
状態空間モデルを例に
ためにすべきことを考えます
言いかえると
のせめぎあいが生む困り事、と言えるかも
理論を正しくビジネスに適用する
融通が利かない、モデルの仮定・前提条件
vs ビジネスで実現したい想いと熱意
2. 状態空間モデルの推定方法
参考文献にもある、以下文献の抜粋引用
• 樋口『予測にいかす統計モデリングの基本』
• 佐藤、樋口『ビッグデータ時代のマーケティング』
※この章のみ、文末表現が違うが、気にしない…
2015/6/27 11 / 47分析のビジネス展開を考えるー状態空間モデルを例に
状態空間モデルとは
2015/6/27 12 / 47分析のビジネス展開を考えるー状態空間モデルを例に
線型ガウス型とすると、次の式で表現される
システムモデル
𝑥 𝑡 = 𝐹𝑡 𝑥 𝑡−1 + 𝐺𝑡 𝑣 𝑡, 𝑣 𝑡 ∼ MV𝑁(0, 𝑄𝑡)
観測モデル
𝑦𝑡 = 𝐻𝑡 𝑥 𝑡 + 𝑤𝑡, 𝑤𝑡 ∼ MV𝑁(0, 𝑅𝑡)
• 𝑦𝑡:観測される時系列データ
• 𝑥 𝑡:状態ベクトル
同時確率を分解する
2015/6/27 13 / 47分析のビジネス展開を考えるー状態空間モデルを例に
ベイズの定理 P A, B = P A B P(B) を用いると
p 𝑥1:𝑇, 𝑦1:𝑇
= p 𝑦 𝑇|𝑦1:𝑇−1, 𝑥1:𝑇 p 𝑦1:𝑇−1, 𝑥1:𝑇
= p 𝑦 𝑇|𝑦1:𝑇−1, 𝑥1:𝑇 p 𝑥 𝑇|𝑦1:𝑇−1, 𝑥1:𝑇−1 p 𝑦1:𝑇−1, 𝑥1:𝑇−1
= ⋯
= p 𝑦 𝑇|𝑦1:𝑡−1, 𝑥1:𝑡
𝑇
𝑡=1
p 𝑥 𝑇|𝑦1:𝑡−1, 𝑥1:𝑡−1
システムモデル観測モデル
システム、観測ベクトルが
与えられたときの確率
Notation:
𝑥1:𝑇 = {𝑥1, 𝑥2, ⋯ , 𝑥 𝑇}
2つのマルコフ性
2015/6/27 14 / 47分析のビジネス展開を考えるー状態空間モデルを例に
同時確率の分解は、マルコフ性を仮定し、計算可能
な形へ変形したといえる
仮定1:𝑥 𝑡の分布は、𝑥 𝑡−1のみで定まる
p 𝑥 𝑡|𝑦1:𝑡−1, 𝑥1:𝑡−1 ⟹ p 𝑥 𝑡|𝑥 𝑡−1
仮定2: 𝑦𝑡の分布は、𝑥 𝑡のみで定まる
p 𝑦𝑡|𝑦1:𝑡−1, 𝑥1:𝑡 ⟹ p 𝑦𝑡|𝑥 𝑡
状態空間モデルでの興味
2015/6/27 15 / 47分析のビジネス展開を考えるー状態空間モデルを例に
次の3つの分布の推定と言える
• 予測分布: p 𝑥 𝑡|𝑦1:𝑡−1
• フィルタ分布:p 𝑥 𝑡|𝑦1:𝑡
• 平滑化分布: p 𝑥 𝑡|𝑦1:𝑇
グラフィカルモデル(GM)表現
2015/6/27 16 / 47分析のビジネス展開を考えるー状態空間モデルを例に
状態空間モデルは、2つのマルコフ性を踏まえると、
鎖状グラフィカルモデルで書ける
𝑥1
𝑦1
𝑥2
𝑦2
𝑥0 𝑥 𝑡−1
𝑦𝑡−1
𝑥 𝑡
𝑦𝑡
𝑥 𝑇
𝑦 𝑇
GM表現上での3つの分布の違い
2015/6/27 17 / 47分析のビジネス展開を考えるー状態空間モデルを例に
• 予測分布: p 𝑥𝑡|𝑦1:𝑡−1
• フィルタ分布:p 𝑥 𝑡|𝑦1:𝑡
• 平滑化分布: p 𝑥 𝑡|𝑦1:𝑇
𝑥1
𝑦1
𝑥2
𝑦2
𝑥0 𝑥 𝑡−1
𝑦𝑡−1
𝑥 𝑡
𝑦𝑡
𝑥 𝑇
𝑦 𝑇
GM表現上での3つの分布の違い
2015/6/27 18 / 47分析のビジネス展開を考えるー状態空間モデルを例に
• 予測分布: p 𝑥 𝑡|𝑦1:𝑡−1
• フィルタ分布:p 𝑥𝑡|𝑦1:𝑡
• 平滑化分布: p 𝑥 𝑡|𝑦1:𝑇
𝑥1
𝑦1
𝑥2
𝑦2
𝑥0 𝑥 𝑡−1
𝑦𝑡−1
𝑥 𝑡
𝑦𝑡
𝑥 𝑇
𝑦 𝑇
GM表現上での3つの分布の違い
2015/6/27 19 / 47分析のビジネス展開を考えるー状態空間モデルを例に
• 予測分布: p 𝑥 𝑡|𝑦1:𝑡−1
• フィルタ分布:p 𝑥 𝑡|𝑦1:𝑡
• 平滑化分布: p 𝑥 𝑡|𝑦1:𝑇
𝑥1
𝑦1
𝑥2
𝑦2
𝑥0 𝑥 𝑡−1
𝑦𝑡−1
𝑥 𝑡
𝑦𝑡
𝑥 𝑇
𝑦 𝑇
条件付周辺分布の簡易表記
2015/6/27 20 / 47分析のビジネス展開を考えるー状態空間モデルを例に
(0|0) (1|0) (2|0) (3|0) (4|0) (5|0)
(0|1) (1|1) (2|1) (3|1) (4|1) (5|1)
(0|2) (1|2) (2|2) (3|2) (4|2) (5|2)
(0|3) (1|3) (2|3) (3|3) (4|3) (5|3)
(0|4) (1|4) (2|4) (3|4) (4|4) (5|4)
(0|5) (1|5) (2|5) (3|5) (4|5) (5|5)
状態ベクトルの時刻(𝑗)
データ増加(𝑖)
1期先
予測
フィルタ
リング
1期前
平滑化
p 𝑥𝑗|𝑦1:𝑖 ≡ (𝑗|𝑖)
式で見てみる
2015/6/27 21 / 47分析のビジネス展開を考えるー状態空間モデルを例に
1期先予測
𝑝 𝑥𝑡|𝑦1:𝑡−1 = 𝑝 𝑥𝑡, 𝑥𝑡−1|𝑦1:𝑡−1 d𝑥𝑡−1
∞
−∞
= 𝑝 𝑥𝑡|𝑥𝑡−1, 𝑦1:𝑡−1 𝑝 𝑥𝑡−1|𝑦1:𝑡−1 d𝑥𝑡−1
∞
−∞
= 𝑝 𝑥𝑡|𝑥𝑡−1 𝑝 𝑥𝑡−1|𝑦1:𝑡−1 d𝑥𝑡−1
∞
−∞
マルコフ
性
式で見てみる
2015/6/27 22 / 47分析のビジネス展開を考えるー状態空間モデルを例に
フィルタリング
𝑝 𝑥𝑡|𝑦1:𝑡 = 𝑝 𝑥𝑡|𝑦𝑡, 𝑦1:𝑡−1
=
𝑝 𝑦𝑡|𝑥𝑡, 𝑦1:𝑡−1 𝑝 𝑥𝑡|𝑦1:𝑡−1
𝑝 𝑦𝑡|𝑦1:𝑡−1
=
𝑝 𝑦𝑡|𝑥𝑡 𝑝 𝑥𝑡|𝑦1:𝑡−1
𝑝 𝑦𝑡|𝑦1:𝑡−1
ただし、分母は1時点尤度であり
𝑝 𝑦𝑡|𝑦1:𝑡−1 = 𝑝 𝑦𝑡|𝑥𝑡 𝑝 𝑥𝑡|𝑦1:𝑡−1 d𝑥𝑡
∞
−∞
式で見てみる
2015/6/27 23 / 47分析のビジネス展開を考えるー状態空間モデルを例に
尤度
𝑝 𝑦1:𝑇 = 𝑝 𝑦𝑡|𝑦1:𝑡−1
𝑇
𝑡=1
= 𝑝 𝑦𝑡|𝑥𝑡 𝑝 𝑥𝑡|𝑦1:𝑡−1 d𝑥𝑡
∞
−∞
𝑇
𝑡=1
実際は、対数尤度を用いる
log 𝑝 𝑦1:𝑇 = log 𝑝 𝑦𝑡|𝑥𝑡 𝑝 𝑥𝑡|𝑦1:𝑡−1 d𝑥𝑡
∞
−∞
𝑇
𝑡=1
式で見てみる
2015/6/27 24 / 47分析のビジネス展開を考えるー状態空間モデルを例に
平滑化
𝑝 𝑥𝑡|𝑦1:𝑇 = 𝑝 𝑥𝑡|𝑥𝑡+1, 𝑦1:𝑡 𝑝 𝑥𝑡+1|𝑦1:𝑇 d𝑥𝑡+1
∞
−∞
=
𝑝 𝑥𝑡, 𝑥𝑡+1|𝑦1:𝑡
𝑝 𝑥𝑡+1|𝑦1:𝑡
𝑝 𝑥𝑡+1|𝑦1:𝑇 d𝑥𝑡+1
∞
−∞
=
𝑝 𝑥𝑡|𝑦1:𝑡 𝑝 𝑥𝑡+1|𝑥𝑡, 𝑦1:𝑡
𝑝 𝑥𝑡+1|𝑦1:𝑡
𝑝 𝑥𝑡+1|𝑦1:𝑇 d𝑥𝑡+1
∞
−∞
= 𝑝 𝑥𝑡|𝑦1:𝑡
𝑝 𝑥𝑡+1|𝑥𝑡
𝑝 𝑥𝑡+1|𝑦1:𝑡
𝑝 𝑥𝑡+1|𝑦1:𝑇 d𝑥𝑡+1
∞
−∞
状態推定の全体フロー
2015/6/27 25 / 47分析のビジネス展開を考えるー状態空間モデルを例に
𝜃:静的パラメータ パラメータ最適化
対数尤度 l(𝜃) を最大とする 𝜃 を選択
𝜃に𝜃を固定 パラメータ固定
対数尤度 l(𝜃) を得る
for 𝑡 = 1, ⋯ , 𝑇 時間更新
• 1期先予測
• フィルタリング
• 1時点尤度計算
• 平滑化(ここでない場合もあり)
3. 分析のビジネス展開を考える
―状態空間モデルを例に
• ここから、やっと本題
• 弁護士や会計士などの専門家に仕事を依頼した経験が
あると、専門家としての振舞いや、依頼者がして欲し
いこと、などの勉強になるかも
2015/6/27 26 / 47分析のビジネス展開を考えるー状態空間モデルを例に
状態空間モデルの見せ方例
2015/6/27 27 / 47分析のビジネス展開を考えるー状態空間モデルを例に
オンラインモールの購買単価 (𝑦𝑡)
= 𝑤𝑡+55 × 𝑆𝐸𝑂 100万 + 48 × リスティング 100万
+13 × アプリ𝐷𝐿数 1000 + 20 × 休日数
※数字や変数はフィクションです(参考先)購買単価(𝑦𝑡)
𝑇
モデル構築期間 予測期間
予
測
範
囲
ARIMAモデルだと
2015/6/27 28 / 47分析のビジネス展開を考えるー状態空間モデルを例に
オンラインモールの購買単価 (𝑦𝑡)
= 𝑤𝑡+55 × 𝑆𝐸𝑂 100万 + 48 × リスティング 100万
+13 × アプリ𝐷𝐿数 1000 + 20 × 休日数
※数字や変数はフィクションです(参考先)購買単価(𝑦𝑡)
𝑇
モデル構築期間 予測期間
予
測
範
囲
オンラインモールの購買単価(𝑦𝑡)
= 0.82𝑦𝑡−1 + 0.61𝑦𝑡−2 + 0.3𝑦𝑡−3
イマイチ
良く分からない…
以降で言いたい3点
2015/6/27 29 / 47分析のビジネス展開を考えるー状態空間モデルを例に
その1
動的時系列
その3
線形回帰
その2
ベイズ推定
※これらポイントが網羅的
かは未チェックですが…
その1 動的時系列
2015/6/27 30 / 47分析のビジネス展開を考えるー状態空間モデルを例に
唐突に:ドローンの姿勢制御を考えます
※門外漢の妄想なので、間違っているかも
(1) 目標ルートを算出して設定
目的地
時間
(計算が軽い)
カルマンフィルタ?
その1 動的時系列
2015/6/27 31 / 47分析のビジネス展開を考えるー状態空間モデルを例に
(2) 一定時間後に(数秒後?)予測位置と実際の位置との
違い(予実差)を認識
目的地
時間
実
際
の
位
置
その1 動的時系列
2015/6/27 32 / 47分析のビジネス展開を考えるー状態空間モデルを例に
(3) 再度、目標ルートを算出して設定 …の繰り返し
目的地
時間
実
際
の
位
置
カルマンフィルタ?
その1 動的時系列
2015/6/27 33 / 47分析のビジネス展開を考えるー状態空間モデルを例に
(2‘) 突然タカに襲われたら
目的地
時間
実
際
の
位
置
その1 動的時系列
2015/6/27 34 / 47分析のビジネス展開を考えるー状態空間モデルを例に
(3‘) 修正が利かずに墜落
目的地
時間
実
際
の
位
置
その1 動的時系列
2015/6/27 35 / 47分析のビジネス展開を考えるー状態空間モデルを例に
困り事:時間粒度をどうするのか?
短くしたい事情
現場: 依頼者にありがちな希望(?)
モデル:予実差の修正が小さくなるため
長くしたい事情
現場: 計数作成コスト(人間の労力も含む)が高い
モデル:計算負荷が大きいため
局所解なのか?の人間チェックを要する場合
も多いため
その1 動的時系列
2015/6/27 36 / 47分析のビジネス展開を考えるー状態空間モデルを例に
「タカへの対応」は無理 → 変数は「平時」か?
不規則に行われるキャンペーン
広告ならば、突然のバズ(例:TV番組、雑誌掲載)
ひと昔のスマホ普及率の伸び
→ 突風下ではドローンは飛ばせない
データの制約はあるか?
非ネット系は、粗い粒度でしか出ないことも
では捨てるか、と言えない影響力がある
時間の間隔(やデータ選定)は、分析前に決めるのが
効率的な進行ですが、相反する事情は結構あります
その2 ベイズ推定
2015/6/27 37 / 47分析のビジネス展開を考えるー状態空間モデルを例に
1. 色々時間を要することへの理解
「最新データを追加した/変数1つ追加しただけだから、
すぐ出来るよね」
→ データの特性や手法によっては、そうでないことも
2. p値が使えない
「色々効く変数があるのは分かった。では、統計的な
基準に基づく重要度の順序を教えてくれ」
→ 重回帰ならば、p値を持ち出すところだが…
→ 正面突破するなら、各変数の確率分布を見せる。
ただ、普通のビジネスマンに、確率変数を腹落ち
して頂くのは、結構難しいし、時間がかかる。
その2 ベイズ推定
2015/6/27 38 / 47分析のビジネス展開を考えるー状態空間モデルを例に
3. 係数が動的に変わる事への理解・違和感
「データが追加されて係数を変えるのは、後出しジャ
ンケンだろ。モデルは普遍的事実を表すものだろ」
→ よくある話。誰しもが一度は通る道
4. (3. に関連して)予測時のパラメータはどうするか
観測方程式の係数
→ 変数は見えるため、判断はしやすい
システム方程式の値
→ 構造は分かり得ないので、対処は決めうち?
→ 周期性が明らかならばARIMAモデル等もあり得るが、
それって、階層ベイズモデルでは?
その3 線形回帰
2015/6/27 39 / 47分析のビジネス展開を考えるー状態空間モデルを例に
時系列だけど「回帰モデル性」を持つ利点
分かりやすい、納得して頂きやすい
ノイズ除去後の値と、その要因・内数展開が見える
時系列だけど「回帰モデル性」を持つ欠点
「よく分かった。では、
・予算内でKPIを最大にする配分を教えてくれ
・KPIを…にするために必要な予算を教えてくれ」
「もし、6ヶ月前からのアプリDL数が10%増しとした
際のKPIは、DL数を1.1倍して方程式に代入で良い?」
※光は波動なの?粒子なの?みたいな構図かも
まずは、回帰と時系列とでの予測を確認します
その3 線形回帰
2015/6/27 40 / 47分析のビジネス展開を考えるー状態空間モデルを例に
回帰モデルの予測 時系列モデルの予測
y
tx
y
予測の値域
管
轄
外
管
轄
外
学習期間
予測
[min,max]での値の補完 全て補外
その3 線形回帰
2015/6/27 41 / 47分析のビジネス展開を考えるー状態空間モデルを例に
困ること
過去の変数が変われば、本来は現在の係数も変わる
「変数は固定」と近似して良い?を知るのも大変
最適化は怖い
係数をいつ時点のものにする?が問題
モデルが複雑なので、最適解の計算が難しい。求まっても、普
通は値域の[min, max]を抜けるか、値域の制約ギリギリを取る
過去のしがらみや政治など抜きに解は求まるので、担当者には
「刺激的な数字」になるのが普通。よって、頭では理解しても、
生理的・政治的に受け入れ難いことも
割り切らず「過去の可視化」だと、分析後の展開が辛い
割り切った場合、そのリスクに見合う価値が出せるか?
→ 割り切りを伝えないのはダメ。発覚時に大変なことに
4. まとめ
2015/6/27 42 / 47分析のビジネス展開を考えるー状態空間モデルを例に
本発表の振り返り
2015/6/27 43 / 47分析のビジネス展開を考えるー状態空間モデルを例に
第2章
状態空間モデルの推定方法を概観
第3章
状態空間モデルの前提・仮定が、ビジネスの利活
用に及ぼす影響を見た
数理モデルは、モデルの前提や仮定の下でしか
語れない
前提や仮定は、分析の設計、担当者の説得方法、
モデルの運用方法、などを規定してしまう
私が考える大切なこと
2015/6/27 44 / 47分析のビジネス展開を考えるー状態空間モデルを例に
1. 理論やデータに嘘をつかない、騙さない
理論の勉強は、忠実に数理モデルを適用する大前提
困った結果への対応は、嘘やハッタリではなく、お客
様とのコミュニケーションが鉄則。嘘やハッタリは、
いずれ分かる
困る前に、先に困りポイントを営業や分析設計段階で
見抜き、お客様の合意を取り付けて潰すのが、一番美
しいのだが…
技術面で/相手の状況を見ると/期間・予算的に、等で
「出来ません」と言うべき状況もある
私が考える大切なこと
2015/6/27 45 / 47分析のビジネス展開を考えるー状態空間モデルを例に
その上で…
2. 出発点の「ビジネスの課題は?」を忘れない
ビジネスの興味は、大抵困りことの解消
簡単な方法で片付くならば、それに越したことは無い
3. 担当者の想いや野心を見抜き、念頭に置く
データ分析も、所詮はビジネス上の一つの道具
担当者に役立つならば、データ分析である必要もない
(営業の話だけど)担当者がビジネス上のキーマンなのか?
の見極めを外すと、どんなに頑張っても報われない
参考文献
2015/6/27 46 / 47分析のビジネス展開を考えるー状態空間モデルを例に
参考文献
1. 『予測にいかす統計モデリングの基本―ベイズ統計入門
から応用まで』樋口知之、講談社、2011年
2. 『ビッグデータ時代のマーケティング―ベイジアンモデ
リングの活用』佐藤忠彦、樋口 知之、講談社、2013年
3. 『時系列解析入門』北川源四朗、岩波書店、2005年
4. 『状態空間時系列分析入門』J.J.F.コマンダー、S.J.クー
プマン、和合肇(訳)、シーエーピー出版、2008年
2015/6/27 47 / 47分析のビジネス展開を考えるー状態空間モデルを例に

More Related Content

What's hot

ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定Akira Masuda
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介Naoki Hayashi
 
深層生成モデルと世界モデル
深層生成モデルと世界モデル深層生成モデルと世界モデル
深層生成モデルと世界モデルMasahiro Suzuki
 
ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択kazutantan
 
RIC-NN: A Robust Transferable Deep Learning Framework for Cross-sectional Inv...
RIC-NN: A Robust Transferable Deep Learning Framework for Cross-sectional Inv...RIC-NN: A Robust Transferable Deep Learning Framework for Cross-sectional Inv...
RIC-NN: A Robust Transferable Deep Learning Framework for Cross-sectional Inv...Kei Nakagawa
 
ノンパラベイズ入門の入門
ノンパラベイズ入門の入門ノンパラベイズ入門の入門
ノンパラベイズ入門の入門Shuyo Nakatani
 
生存時間分析数理の基礎
生存時間分析数理の基礎生存時間分析数理の基礎
生存時間分析数理の基礎Koichiro Gibo
 
Control as Inference (強化学習とベイズ統計)
Control as Inference (強化学習とベイズ統計)Control as Inference (強化学習とベイズ統計)
Control as Inference (強化学習とベイズ統計)Shohei Taniguchi
 
最適輸送入門
最適輸送入門最適輸送入門
最適輸送入門joisino
 
5分でわかるベイズ確率
5分でわかるベイズ確率5分でわかるベイズ確率
5分でわかるベイズ確率hoxo_m
 
Visual Studio CodeでRを使う
Visual Studio CodeでRを使うVisual Studio CodeでRを使う
Visual Studio CodeでRを使うAtsushi Hayakawa
 
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!takehikoihayashi
 
関数データ解析の概要とその方法
関数データ解析の概要とその方法関数データ解析の概要とその方法
関数データ解析の概要とその方法Hidetoshi Matsui
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編Hiroshi Shimizu
 
スパース推定法による統計モデリング(入門)
スパース推定法による統計モデリング(入門)スパース推定法による統計モデリング(入門)
スパース推定法による統計モデリング(入門)Hidetoshi Matsui
 
「統計的学習理論」第1章
「統計的学習理論」第1章「統計的学習理論」第1章
「統計的学習理論」第1章Kota Matsui
 
傾向スコアの概念とその実践
傾向スコアの概念とその実践傾向スコアの概念とその実践
傾向スコアの概念とその実践Yasuyuki Okumura
 

What's hot (20)

ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM) 一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
 
Stan超初心者入門
Stan超初心者入門Stan超初心者入門
Stan超初心者入門
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
深層生成モデルと世界モデル
深層生成モデルと世界モデル深層生成モデルと世界モデル
深層生成モデルと世界モデル
 
ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択
 
RIC-NN: A Robust Transferable Deep Learning Framework for Cross-sectional Inv...
RIC-NN: A Robust Transferable Deep Learning Framework for Cross-sectional Inv...RIC-NN: A Robust Transferable Deep Learning Framework for Cross-sectional Inv...
RIC-NN: A Robust Transferable Deep Learning Framework for Cross-sectional Inv...
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
 
ノンパラベイズ入門の入門
ノンパラベイズ入門の入門ノンパラベイズ入門の入門
ノンパラベイズ入門の入門
 
生存時間分析数理の基礎
生存時間分析数理の基礎生存時間分析数理の基礎
生存時間分析数理の基礎
 
Control as Inference (強化学習とベイズ統計)
Control as Inference (強化学習とベイズ統計)Control as Inference (強化学習とベイズ統計)
Control as Inference (強化学習とベイズ統計)
 
最適輸送入門
最適輸送入門最適輸送入門
最適輸送入門
 
5分でわかるベイズ確率
5分でわかるベイズ確率5分でわかるベイズ確率
5分でわかるベイズ確率
 
Visual Studio CodeでRを使う
Visual Studio CodeでRを使うVisual Studio CodeでRを使う
Visual Studio CodeでRを使う
 
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
 
関数データ解析の概要とその方法
関数データ解析の概要とその方法関数データ解析の概要とその方法
関数データ解析の概要とその方法
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編
 
スパース推定法による統計モデリング(入門)
スパース推定法による統計モデリング(入門)スパース推定法による統計モデリング(入門)
スパース推定法による統計モデリング(入門)
 
「統計的学習理論」第1章
「統計的学習理論」第1章「統計的学習理論」第1章
「統計的学習理論」第1章
 
傾向スコアの概念とその実践
傾向スコアの概念とその実践傾向スコアの概念とその実践
傾向スコアの概念とその実践
 

Viewers also liked

状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38horihorio
 
Random Forest による分類
Random Forest による分類Random Forest による分類
Random Forest による分類Ken'ichi Matsui
 
Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法Hiroki Itô
 
セグメンテーションの考え方・使い方 - TokyoR #44
セグメンテーションの考え方・使い方 - TokyoR #44セグメンテーションの考え方・使い方 - TokyoR #44
セグメンテーションの考え方・使い方 - TokyoR #44horihorio
 
Pystan for nlp
Pystan for nlpPystan for nlp
Pystan for nlpXiangze
 
マーケティングサイエンス徹底入門と実践Part2
マーケティングサイエンス徹底入門と実践Part2マーケティングサイエンス徹底入門と実践Part2
マーケティングサイエンス徹底入門と実践Part2宏喜 佐野
 
一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門Yu Tamura
 
状態空間モデル等による多変量時系列データ解析
状態空間モデル等による多変量時系列データ解析状態空間モデル等による多変量時系列データ解析
状態空間モデル等による多変量時系列データ解析businessanalytics
 
時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17horihorio
 
状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較Hiroki Itô
 
カルマンフィルタについて
カルマンフィルタについてカルマンフィルタについて
カルマンフィルタについてtiny_ak
 
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた. .
 
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京Koichi Hamada
 
ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33horihorio
 

Viewers also liked (15)

状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38
 
Random Forest による分類
Random Forest による分類Random Forest による分類
Random Forest による分類
 
Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法
 
セグメンテーションの考え方・使い方 - TokyoR #44
セグメンテーションの考え方・使い方 - TokyoR #44セグメンテーションの考え方・使い方 - TokyoR #44
セグメンテーションの考え方・使い方 - TokyoR #44
 
Pystan for nlp
Pystan for nlpPystan for nlp
Pystan for nlp
 
マーケティングサイエンス徹底入門と実践Part2
マーケティングサイエンス徹底入門と実践Part2マーケティングサイエンス徹底入門と実践Part2
マーケティングサイエンス徹底入門と実践Part2
 
一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門
 
状態空間モデル等による多変量時系列データ解析
状態空間モデル等による多変量時系列データ解析状態空間モデル等による多変量時系列データ解析
状態空間モデル等による多変量時系列データ解析
 
PyMC mcmc
PyMC mcmcPyMC mcmc
PyMC mcmc
 
時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17
 
状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較
 
カルマンフィルタについて
カルマンフィルタについてカルマンフィルタについて
カルマンフィルタについて
 
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
 
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
 
ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33
 

Similar to 分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47

Lilien, G.L. & Rangaswamy, A. (2004) Marketing Engineering: Chapter 1-2
Lilien, G.L. & Rangaswamy, A. (2004) Marketing Engineering: Chapter 1-2Lilien, G.L. & Rangaswamy, A. (2004) Marketing Engineering: Chapter 1-2
Lilien, G.L. & Rangaswamy, A. (2004) Marketing Engineering: Chapter 1-2kenichiroyamada
 
Analyze by StatsModels or Numpy
Analyze by StatsModels or NumpyAnalyze by StatsModels or Numpy
Analyze by StatsModels or NumpyToshiki NOGUCHI
 
なぜ統計学がビジネスの 意思決定において大事なのか?
なぜ統計学がビジネスの 意思決定において大事なのか?なぜ統計学がビジネスの 意思決定において大事なのか?
なぜ統計学がビジネスの 意思決定において大事なのか?Takashi J OZAKI
 
NaITE#14 メトリクス解析(データ解析)の初歩
NaITE#14 メトリクス解析(データ解析)の初歩NaITE#14 メトリクス解析(データ解析)の初歩
NaITE#14 メトリクス解析(データ解析)の初歩Asako Yanuki
 
離散時間ロジスティック回帰モデル解説
離散時間ロジスティック回帰モデル解説離散時間ロジスティック回帰モデル解説
離散時間ロジスティック回帰モデル解説akira_11
 
『人事の定量分析』(林 明文) 「第8章 分析と人事施策」 のエッセンス
『人事の定量分析』(林 明文)「第8章 分析と人事施策」のエッセンス『人事の定量分析』(林 明文)「第8章 分析と人事施策」のエッセンス
『人事の定量分析』(林 明文) 「第8章 分析と人事施策」 のエッセンスAyumu Kohiyama
 
NLP若手の回 ACL2012参加報告
NLP若手の回 ACL2012参加報告NLP若手の回 ACL2012参加報告
NLP若手の回 ACL2012参加報告Hiroyuki TOKUNAGA
 
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PILCO - 第一回高橋研究室モデルベース強化学習勉強会PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PILCO - 第一回高橋研究室モデルベース強化学習勉強会Shunichi Sekiguchi
 
#神奈川大学経営学総論 (11/15) ドメイン戦略
#神奈川大学経営学総論 (11/15) ドメイン戦略#神奈川大学経営学総論 (11/15) ドメイン戦略
#神奈川大学経営学総論 (11/15) ドメイン戦略Yasushi Hara
 
金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデルKei Nakagawa
 
R Study Tokyo03
R Study Tokyo03R Study Tokyo03
R Study Tokyo03Yohei Sato
 
データ解析のための統計モデリング入門3章後半
データ解析のための統計モデリング入門3章後半データ解析のための統計モデリング入門3章後半
データ解析のための統計モデリング入門3章後半Shinya Akiba
 
#神奈川大学経営学総論 A (10/15) 競争戦略
#神奈川大学経営学総論 A (10/15) 競争戦略#神奈川大学経営学総論 A (10/15) 競争戦略
#神奈川大学経営学総論 A (10/15) 競争戦略Yasushi Hara
 
yokyo-unv.
yokyo-unv.yokyo-unv.
yokyo-unv.hirano
 
数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro
数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro
数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga JiroJiro Iwanaga
 
NIPS KANSAI Reading Group #7: Temporal Difference Models: Model-Free Deep RL ...
NIPS KANSAI Reading Group #7: Temporal Difference Models: Model-Free Deep RL ...NIPS KANSAI Reading Group #7: Temporal Difference Models: Model-Free Deep RL ...
NIPS KANSAI Reading Group #7: Temporal Difference Models: Model-Free Deep RL ...Eiji Uchibe
 
GARCHSKモデルを用いた条件付き固有モーメントの実証分析
GARCHSKモデルを用いた条件付き固有モーメントの実証分析GARCHSKモデルを用いた条件付き固有モーメントの実証分析
GARCHSKモデルを用いた条件付き固有モーメントの実証分析Kei Nakagawa
 
第7回 KAIM 金沢人工知能勉強会 回帰分析と使う上での注意事項
第7回 KAIM 金沢人工知能勉強会 回帰分析と使う上での注意事項第7回 KAIM 金沢人工知能勉強会 回帰分析と使う上での注意事項
第7回 KAIM 金沢人工知能勉強会 回帰分析と使う上での注意事項tomitomi3 tomitomi3
 

Similar to 分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47 (20)

Lilien, G.L. & Rangaswamy, A. (2004) Marketing Engineering: Chapter 1-2
Lilien, G.L. & Rangaswamy, A. (2004) Marketing Engineering: Chapter 1-2Lilien, G.L. & Rangaswamy, A. (2004) Marketing Engineering: Chapter 1-2
Lilien, G.L. & Rangaswamy, A. (2004) Marketing Engineering: Chapter 1-2
 
Analyze by StatsModels or Numpy
Analyze by StatsModels or NumpyAnalyze by StatsModels or Numpy
Analyze by StatsModels or Numpy
 
JasstTokyo2017
JasstTokyo2017JasstTokyo2017
JasstTokyo2017
 
なぜ統計学がビジネスの 意思決定において大事なのか?
なぜ統計学がビジネスの 意思決定において大事なのか?なぜ統計学がビジネスの 意思決定において大事なのか?
なぜ統計学がビジネスの 意思決定において大事なのか?
 
NaITE#14 メトリクス解析(データ解析)の初歩
NaITE#14 メトリクス解析(データ解析)の初歩NaITE#14 メトリクス解析(データ解析)の初歩
NaITE#14 メトリクス解析(データ解析)の初歩
 
離散時間ロジスティック回帰モデル解説
離散時間ロジスティック回帰モデル解説離散時間ロジスティック回帰モデル解説
離散時間ロジスティック回帰モデル解説
 
『人事の定量分析』(林 明文) 「第8章 分析と人事施策」 のエッセンス
『人事の定量分析』(林 明文)「第8章 分析と人事施策」のエッセンス『人事の定量分析』(林 明文)「第8章 分析と人事施策」のエッセンス
『人事の定量分析』(林 明文) 「第8章 分析と人事施策」 のエッセンス
 
NLP若手の回 ACL2012参加報告
NLP若手の回 ACL2012参加報告NLP若手の回 ACL2012参加報告
NLP若手の回 ACL2012参加報告
 
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PILCO - 第一回高橋研究室モデルベース強化学習勉強会PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
 
#神奈川大学経営学総論 (11/15) ドメイン戦略
#神奈川大学経営学総論 (11/15) ドメイン戦略#神奈川大学経営学総論 (11/15) ドメイン戦略
#神奈川大学経営学総論 (11/15) ドメイン戦略
 
金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル
 
R Study Tokyo03
R Study Tokyo03R Study Tokyo03
R Study Tokyo03
 
データ解析のための統計モデリング入門3章後半
データ解析のための統計モデリング入門3章後半データ解析のための統計モデリング入門3章後半
データ解析のための統計モデリング入門3章後半
 
#神奈川大学経営学総論 A (10/15) 競争戦略
#神奈川大学経営学総論 A (10/15) 競争戦略#神奈川大学経営学総論 A (10/15) 競争戦略
#神奈川大学経営学総論 A (10/15) 競争戦略
 
yokyo-unv.
yokyo-unv.yokyo-unv.
yokyo-unv.
 
数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro
数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro
数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro
 
NIPS KANSAI Reading Group #7: Temporal Difference Models: Model-Free Deep RL ...
NIPS KANSAI Reading Group #7: Temporal Difference Models: Model-Free Deep RL ...NIPS KANSAI Reading Group #7: Temporal Difference Models: Model-Free Deep RL ...
NIPS KANSAI Reading Group #7: Temporal Difference Models: Model-Free Deep RL ...
 
GARCHSKモデルを用いた条件付き固有モーメントの実証分析
GARCHSKモデルを用いた条件付き固有モーメントの実証分析GARCHSKモデルを用いた条件付き固有モーメントの実証分析
GARCHSKモデルを用いた条件付き固有モーメントの実証分析
 
【論文紹介】PGQ: Combining Policy Gradient And Q-learning
【論文紹介】PGQ: Combining Policy Gradient And Q-learning【論文紹介】PGQ: Combining Policy Gradient And Q-learning
【論文紹介】PGQ: Combining Policy Gradient And Q-learning
 
第7回 KAIM 金沢人工知能勉強会 回帰分析と使う上での注意事項
第7回 KAIM 金沢人工知能勉強会 回帰分析と使う上での注意事項第7回 KAIM 金沢人工知能勉強会 回帰分析と使う上での注意事項
第7回 KAIM 金沢人工知能勉強会 回帰分析と使う上での注意事項
 

分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47

  • 2. 自己紹介 Twitter ID @horihorio お仕事 データ分析コンサルタント 興味 多趣味。その痕跡 → 私の読書リスト 統計/DB/R/マーケティング/金融/会計 過去の発表 ここ 最近の出来事  分析の仕事に関わるあらゆるお仕事をやっています ただし、実際の分析を除く…  自宅でもEC2でXBRLの前処理、…って何してるの?  相変わらず、3歳児な子どもに大絶賛嫌われ中… 2015/6/27 分析のビジネス展開を考えるー状態空間モデルを例に 1 / 47
  • 3. 目次 1. はじめに 2. 状態空間モデルの推定方法 3. 分析のビジネス展開を考える ―状態空間モデルを例に 4. まとめ ※ 本発表の内容と意見は発表者個人に属するものであり、発表者が所 属する企業の公式見解を示すものではございません 2015/6/27 2 / 47分析のビジネス展開を考えるー状態空間モデルを例に
  • 4. 1. はじめに 2015/6/27 3 / 47分析のビジネス展開を考えるー状態空間モデルを例に
  • 5. データ分析で相手を動かすには 2015/6/27 4 / 47分析のビジネス展開を考えるー状態空間モデルを例に 分析者が好かれること 問題設定に腹落ちして頂くこと 分析結果の見せ方、展開方法を固めること この分析成果は、自分の手柄になりそう などなど… ですが、相手は「自分が出来ない/やってない分析 結果に責任を取らされる」ので、 に応えることは、結構重要 なぜそうなるの?
  • 6. 社内の意思決定者を考える 2015/6/27 5 / 47分析のビジネス展開を考えるー状態空間モデルを例に 関係者全員が統計に興味があり、詳しい → まずあり得ない 納得を頂くには、中身が見えた方が良い 入力 出力ブラックボックス 一部の機械学習手法 通りやすいモデル 入力 出力 𝑥1 𝑦𝑥2 𝑥3
  • 7. 状態空間モデルって 2015/6/27 6 / 47分析のビジネス展開を考えるー状態空間モデルを例に 中身が見える、分かりやすいモデルの一例 オンラインモールの購買単価 (𝑦𝑡) = 𝑤𝑡+55 × 𝑆𝐸𝑂 100万 + 48 × リスティング 100万 +13 × アプリ𝐷𝐿数 1000 + 20 × 休日数 ※数字や変数はフィクションです(参考先) 購買単価(𝑦𝑡) 𝑇 モデル構築期間 予測期間 予 測 範 囲
  • 8. 世間受けをGoogleに聞いてみた 2015/6/27 7 / 47分析のビジネス展開を考えるー状態空間モデルを例に ビジネス ※画面は6/22現在 ※判断基準は主観 ビジネス 初学者向け理論 オレ系 ビジネスマンの 勉強成果 ビジネスマンの 勉強成果
  • 9. 対照サンプルの結果(例:確率微分方程式) 2015/6/27 8 / 47分析のビジネス展開を考えるー状態空間モデルを例に アマゾン ※画面は6/22現在 ※判断基準は主観 ビジネス 初学者向け理論大学講義資料 アマゾン 大学講義資料
  • 10. データ分析の仕事で思うこと 2015/6/27 9 / 47分析のビジネス展開を考えるー状態空間モデルを例に 1. データ分析は信用されない、がスタート地点 データください(結構大変)、結果は保証出来ません → 予算ください、の上申の優先順位は下がりがち 依頼者は分析者より情報劣位な「レモン市場」 → そのままでは「悪貨が良貨を駆逐する」に陥る 2. そんな中、成功例が出るのは嬉しいこと 「データサイエンスブーム」で話がしやすいのは確か 3. ただ、形式的な真似はそこそこ容易に 数式は書籍や論文での公開情報、R/Python等はフリー、 計算資源もAWSなりで簡単に調達、あとは人材だけ
  • 11. 本発表の目的 2015/6/27 10 / 47分析のビジネス展開を考えるー状態空間モデルを例に 状態空間モデルを例に ためにすべきことを考えます 言いかえると のせめぎあいが生む困り事、と言えるかも 理論を正しくビジネスに適用する 融通が利かない、モデルの仮定・前提条件 vs ビジネスで実現したい想いと熱意
  • 12. 2. 状態空間モデルの推定方法 参考文献にもある、以下文献の抜粋引用 • 樋口『予測にいかす統計モデリングの基本』 • 佐藤、樋口『ビッグデータ時代のマーケティング』 ※この章のみ、文末表現が違うが、気にしない… 2015/6/27 11 / 47分析のビジネス展開を考えるー状態空間モデルを例に
  • 13. 状態空間モデルとは 2015/6/27 12 / 47分析のビジネス展開を考えるー状態空間モデルを例に 線型ガウス型とすると、次の式で表現される システムモデル 𝑥 𝑡 = 𝐹𝑡 𝑥 𝑡−1 + 𝐺𝑡 𝑣 𝑡, 𝑣 𝑡 ∼ MV𝑁(0, 𝑄𝑡) 観測モデル 𝑦𝑡 = 𝐻𝑡 𝑥 𝑡 + 𝑤𝑡, 𝑤𝑡 ∼ MV𝑁(0, 𝑅𝑡) • 𝑦𝑡:観測される時系列データ • 𝑥 𝑡:状態ベクトル
  • 14. 同時確率を分解する 2015/6/27 13 / 47分析のビジネス展開を考えるー状態空間モデルを例に ベイズの定理 P A, B = P A B P(B) を用いると p 𝑥1:𝑇, 𝑦1:𝑇 = p 𝑦 𝑇|𝑦1:𝑇−1, 𝑥1:𝑇 p 𝑦1:𝑇−1, 𝑥1:𝑇 = p 𝑦 𝑇|𝑦1:𝑇−1, 𝑥1:𝑇 p 𝑥 𝑇|𝑦1:𝑇−1, 𝑥1:𝑇−1 p 𝑦1:𝑇−1, 𝑥1:𝑇−1 = ⋯ = p 𝑦 𝑇|𝑦1:𝑡−1, 𝑥1:𝑡 𝑇 𝑡=1 p 𝑥 𝑇|𝑦1:𝑡−1, 𝑥1:𝑡−1 システムモデル観測モデル システム、観測ベクトルが 与えられたときの確率 Notation: 𝑥1:𝑇 = {𝑥1, 𝑥2, ⋯ , 𝑥 𝑇}
  • 15. 2つのマルコフ性 2015/6/27 14 / 47分析のビジネス展開を考えるー状態空間モデルを例に 同時確率の分解は、マルコフ性を仮定し、計算可能 な形へ変形したといえる 仮定1:𝑥 𝑡の分布は、𝑥 𝑡−1のみで定まる p 𝑥 𝑡|𝑦1:𝑡−1, 𝑥1:𝑡−1 ⟹ p 𝑥 𝑡|𝑥 𝑡−1 仮定2: 𝑦𝑡の分布は、𝑥 𝑡のみで定まる p 𝑦𝑡|𝑦1:𝑡−1, 𝑥1:𝑡 ⟹ p 𝑦𝑡|𝑥 𝑡
  • 16. 状態空間モデルでの興味 2015/6/27 15 / 47分析のビジネス展開を考えるー状態空間モデルを例に 次の3つの分布の推定と言える • 予測分布: p 𝑥 𝑡|𝑦1:𝑡−1 • フィルタ分布:p 𝑥 𝑡|𝑦1:𝑡 • 平滑化分布: p 𝑥 𝑡|𝑦1:𝑇
  • 17. グラフィカルモデル(GM)表現 2015/6/27 16 / 47分析のビジネス展開を考えるー状態空間モデルを例に 状態空間モデルは、2つのマルコフ性を踏まえると、 鎖状グラフィカルモデルで書ける 𝑥1 𝑦1 𝑥2 𝑦2 𝑥0 𝑥 𝑡−1 𝑦𝑡−1 𝑥 𝑡 𝑦𝑡 𝑥 𝑇 𝑦 𝑇
  • 18. GM表現上での3つの分布の違い 2015/6/27 17 / 47分析のビジネス展開を考えるー状態空間モデルを例に • 予測分布: p 𝑥𝑡|𝑦1:𝑡−1 • フィルタ分布:p 𝑥 𝑡|𝑦1:𝑡 • 平滑化分布: p 𝑥 𝑡|𝑦1:𝑇 𝑥1 𝑦1 𝑥2 𝑦2 𝑥0 𝑥 𝑡−1 𝑦𝑡−1 𝑥 𝑡 𝑦𝑡 𝑥 𝑇 𝑦 𝑇
  • 19. GM表現上での3つの分布の違い 2015/6/27 18 / 47分析のビジネス展開を考えるー状態空間モデルを例に • 予測分布: p 𝑥 𝑡|𝑦1:𝑡−1 • フィルタ分布:p 𝑥𝑡|𝑦1:𝑡 • 平滑化分布: p 𝑥 𝑡|𝑦1:𝑇 𝑥1 𝑦1 𝑥2 𝑦2 𝑥0 𝑥 𝑡−1 𝑦𝑡−1 𝑥 𝑡 𝑦𝑡 𝑥 𝑇 𝑦 𝑇
  • 20. GM表現上での3つの分布の違い 2015/6/27 19 / 47分析のビジネス展開を考えるー状態空間モデルを例に • 予測分布: p 𝑥 𝑡|𝑦1:𝑡−1 • フィルタ分布:p 𝑥 𝑡|𝑦1:𝑡 • 平滑化分布: p 𝑥 𝑡|𝑦1:𝑇 𝑥1 𝑦1 𝑥2 𝑦2 𝑥0 𝑥 𝑡−1 𝑦𝑡−1 𝑥 𝑡 𝑦𝑡 𝑥 𝑇 𝑦 𝑇
  • 21. 条件付周辺分布の簡易表記 2015/6/27 20 / 47分析のビジネス展開を考えるー状態空間モデルを例に (0|0) (1|0) (2|0) (3|0) (4|0) (5|0) (0|1) (1|1) (2|1) (3|1) (4|1) (5|1) (0|2) (1|2) (2|2) (3|2) (4|2) (5|2) (0|3) (1|3) (2|3) (3|3) (4|3) (5|3) (0|4) (1|4) (2|4) (3|4) (4|4) (5|4) (0|5) (1|5) (2|5) (3|5) (4|5) (5|5) 状態ベクトルの時刻(𝑗) データ増加(𝑖) 1期先 予測 フィルタ リング 1期前 平滑化 p 𝑥𝑗|𝑦1:𝑖 ≡ (𝑗|𝑖)
  • 22. 式で見てみる 2015/6/27 21 / 47分析のビジネス展開を考えるー状態空間モデルを例に 1期先予測 𝑝 𝑥𝑡|𝑦1:𝑡−1 = 𝑝 𝑥𝑡, 𝑥𝑡−1|𝑦1:𝑡−1 d𝑥𝑡−1 ∞ −∞ = 𝑝 𝑥𝑡|𝑥𝑡−1, 𝑦1:𝑡−1 𝑝 𝑥𝑡−1|𝑦1:𝑡−1 d𝑥𝑡−1 ∞ −∞ = 𝑝 𝑥𝑡|𝑥𝑡−1 𝑝 𝑥𝑡−1|𝑦1:𝑡−1 d𝑥𝑡−1 ∞ −∞ マルコフ 性
  • 23. 式で見てみる 2015/6/27 22 / 47分析のビジネス展開を考えるー状態空間モデルを例に フィルタリング 𝑝 𝑥𝑡|𝑦1:𝑡 = 𝑝 𝑥𝑡|𝑦𝑡, 𝑦1:𝑡−1 = 𝑝 𝑦𝑡|𝑥𝑡, 𝑦1:𝑡−1 𝑝 𝑥𝑡|𝑦1:𝑡−1 𝑝 𝑦𝑡|𝑦1:𝑡−1 = 𝑝 𝑦𝑡|𝑥𝑡 𝑝 𝑥𝑡|𝑦1:𝑡−1 𝑝 𝑦𝑡|𝑦1:𝑡−1 ただし、分母は1時点尤度であり 𝑝 𝑦𝑡|𝑦1:𝑡−1 = 𝑝 𝑦𝑡|𝑥𝑡 𝑝 𝑥𝑡|𝑦1:𝑡−1 d𝑥𝑡 ∞ −∞
  • 24. 式で見てみる 2015/6/27 23 / 47分析のビジネス展開を考えるー状態空間モデルを例に 尤度 𝑝 𝑦1:𝑇 = 𝑝 𝑦𝑡|𝑦1:𝑡−1 𝑇 𝑡=1 = 𝑝 𝑦𝑡|𝑥𝑡 𝑝 𝑥𝑡|𝑦1:𝑡−1 d𝑥𝑡 ∞ −∞ 𝑇 𝑡=1 実際は、対数尤度を用いる log 𝑝 𝑦1:𝑇 = log 𝑝 𝑦𝑡|𝑥𝑡 𝑝 𝑥𝑡|𝑦1:𝑡−1 d𝑥𝑡 ∞ −∞ 𝑇 𝑡=1
  • 25. 式で見てみる 2015/6/27 24 / 47分析のビジネス展開を考えるー状態空間モデルを例に 平滑化 𝑝 𝑥𝑡|𝑦1:𝑇 = 𝑝 𝑥𝑡|𝑥𝑡+1, 𝑦1:𝑡 𝑝 𝑥𝑡+1|𝑦1:𝑇 d𝑥𝑡+1 ∞ −∞ = 𝑝 𝑥𝑡, 𝑥𝑡+1|𝑦1:𝑡 𝑝 𝑥𝑡+1|𝑦1:𝑡 𝑝 𝑥𝑡+1|𝑦1:𝑇 d𝑥𝑡+1 ∞ −∞ = 𝑝 𝑥𝑡|𝑦1:𝑡 𝑝 𝑥𝑡+1|𝑥𝑡, 𝑦1:𝑡 𝑝 𝑥𝑡+1|𝑦1:𝑡 𝑝 𝑥𝑡+1|𝑦1:𝑇 d𝑥𝑡+1 ∞ −∞ = 𝑝 𝑥𝑡|𝑦1:𝑡 𝑝 𝑥𝑡+1|𝑥𝑡 𝑝 𝑥𝑡+1|𝑦1:𝑡 𝑝 𝑥𝑡+1|𝑦1:𝑇 d𝑥𝑡+1 ∞ −∞
  • 26. 状態推定の全体フロー 2015/6/27 25 / 47分析のビジネス展開を考えるー状態空間モデルを例に 𝜃:静的パラメータ パラメータ最適化 対数尤度 l(𝜃) を最大とする 𝜃 を選択 𝜃に𝜃を固定 パラメータ固定 対数尤度 l(𝜃) を得る for 𝑡 = 1, ⋯ , 𝑇 時間更新 • 1期先予測 • フィルタリング • 1時点尤度計算 • 平滑化(ここでない場合もあり)
  • 27. 3. 分析のビジネス展開を考える ―状態空間モデルを例に • ここから、やっと本題 • 弁護士や会計士などの専門家に仕事を依頼した経験が あると、専門家としての振舞いや、依頼者がして欲し いこと、などの勉強になるかも 2015/6/27 26 / 47分析のビジネス展開を考えるー状態空間モデルを例に
  • 28. 状態空間モデルの見せ方例 2015/6/27 27 / 47分析のビジネス展開を考えるー状態空間モデルを例に オンラインモールの購買単価 (𝑦𝑡) = 𝑤𝑡+55 × 𝑆𝐸𝑂 100万 + 48 × リスティング 100万 +13 × アプリ𝐷𝐿数 1000 + 20 × 休日数 ※数字や変数はフィクションです(参考先)購買単価(𝑦𝑡) 𝑇 モデル構築期間 予測期間 予 測 範 囲
  • 29. ARIMAモデルだと 2015/6/27 28 / 47分析のビジネス展開を考えるー状態空間モデルを例に オンラインモールの購買単価 (𝑦𝑡) = 𝑤𝑡+55 × 𝑆𝐸𝑂 100万 + 48 × リスティング 100万 +13 × アプリ𝐷𝐿数 1000 + 20 × 休日数 ※数字や変数はフィクションです(参考先)購買単価(𝑦𝑡) 𝑇 モデル構築期間 予測期間 予 測 範 囲 オンラインモールの購買単価(𝑦𝑡) = 0.82𝑦𝑡−1 + 0.61𝑦𝑡−2 + 0.3𝑦𝑡−3 イマイチ 良く分からない…
  • 30. 以降で言いたい3点 2015/6/27 29 / 47分析のビジネス展開を考えるー状態空間モデルを例に その1 動的時系列 その3 線形回帰 その2 ベイズ推定 ※これらポイントが網羅的 かは未チェックですが…
  • 31. その1 動的時系列 2015/6/27 30 / 47分析のビジネス展開を考えるー状態空間モデルを例に 唐突に:ドローンの姿勢制御を考えます ※門外漢の妄想なので、間違っているかも (1) 目標ルートを算出して設定 目的地 時間 (計算が軽い) カルマンフィルタ?
  • 32. その1 動的時系列 2015/6/27 31 / 47分析のビジネス展開を考えるー状態空間モデルを例に (2) 一定時間後に(数秒後?)予測位置と実際の位置との 違い(予実差)を認識 目的地 時間 実 際 の 位 置
  • 33. その1 動的時系列 2015/6/27 32 / 47分析のビジネス展開を考えるー状態空間モデルを例に (3) 再度、目標ルートを算出して設定 …の繰り返し 目的地 時間 実 際 の 位 置 カルマンフィルタ?
  • 34. その1 動的時系列 2015/6/27 33 / 47分析のビジネス展開を考えるー状態空間モデルを例に (2‘) 突然タカに襲われたら 目的地 時間 実 際 の 位 置
  • 35. その1 動的時系列 2015/6/27 34 / 47分析のビジネス展開を考えるー状態空間モデルを例に (3‘) 修正が利かずに墜落 目的地 時間 実 際 の 位 置
  • 36. その1 動的時系列 2015/6/27 35 / 47分析のビジネス展開を考えるー状態空間モデルを例に 困り事:時間粒度をどうするのか? 短くしたい事情 現場: 依頼者にありがちな希望(?) モデル:予実差の修正が小さくなるため 長くしたい事情 現場: 計数作成コスト(人間の労力も含む)が高い モデル:計算負荷が大きいため 局所解なのか?の人間チェックを要する場合 も多いため
  • 37. その1 動的時系列 2015/6/27 36 / 47分析のビジネス展開を考えるー状態空間モデルを例に 「タカへの対応」は無理 → 変数は「平時」か? 不規則に行われるキャンペーン 広告ならば、突然のバズ(例:TV番組、雑誌掲載) ひと昔のスマホ普及率の伸び → 突風下ではドローンは飛ばせない データの制約はあるか? 非ネット系は、粗い粒度でしか出ないことも では捨てるか、と言えない影響力がある 時間の間隔(やデータ選定)は、分析前に決めるのが 効率的な進行ですが、相反する事情は結構あります
  • 38. その2 ベイズ推定 2015/6/27 37 / 47分析のビジネス展開を考えるー状態空間モデルを例に 1. 色々時間を要することへの理解 「最新データを追加した/変数1つ追加しただけだから、 すぐ出来るよね」 → データの特性や手法によっては、そうでないことも 2. p値が使えない 「色々効く変数があるのは分かった。では、統計的な 基準に基づく重要度の順序を教えてくれ」 → 重回帰ならば、p値を持ち出すところだが… → 正面突破するなら、各変数の確率分布を見せる。 ただ、普通のビジネスマンに、確率変数を腹落ち して頂くのは、結構難しいし、時間がかかる。
  • 39. その2 ベイズ推定 2015/6/27 38 / 47分析のビジネス展開を考えるー状態空間モデルを例に 3. 係数が動的に変わる事への理解・違和感 「データが追加されて係数を変えるのは、後出しジャ ンケンだろ。モデルは普遍的事実を表すものだろ」 → よくある話。誰しもが一度は通る道 4. (3. に関連して)予測時のパラメータはどうするか 観測方程式の係数 → 変数は見えるため、判断はしやすい システム方程式の値 → 構造は分かり得ないので、対処は決めうち? → 周期性が明らかならばARIMAモデル等もあり得るが、 それって、階層ベイズモデルでは?
  • 40. その3 線形回帰 2015/6/27 39 / 47分析のビジネス展開を考えるー状態空間モデルを例に 時系列だけど「回帰モデル性」を持つ利点 分かりやすい、納得して頂きやすい ノイズ除去後の値と、その要因・内数展開が見える 時系列だけど「回帰モデル性」を持つ欠点 「よく分かった。では、 ・予算内でKPIを最大にする配分を教えてくれ ・KPIを…にするために必要な予算を教えてくれ」 「もし、6ヶ月前からのアプリDL数が10%増しとした 際のKPIは、DL数を1.1倍して方程式に代入で良い?」 ※光は波動なの?粒子なの?みたいな構図かも まずは、回帰と時系列とでの予測を確認します
  • 41. その3 線形回帰 2015/6/27 40 / 47分析のビジネス展開を考えるー状態空間モデルを例に 回帰モデルの予測 時系列モデルの予測 y tx y 予測の値域 管 轄 外 管 轄 外 学習期間 予測 [min,max]での値の補完 全て補外
  • 42. その3 線形回帰 2015/6/27 41 / 47分析のビジネス展開を考えるー状態空間モデルを例に 困ること 過去の変数が変われば、本来は現在の係数も変わる 「変数は固定」と近似して良い?を知るのも大変 最適化は怖い 係数をいつ時点のものにする?が問題 モデルが複雑なので、最適解の計算が難しい。求まっても、普 通は値域の[min, max]を抜けるか、値域の制約ギリギリを取る 過去のしがらみや政治など抜きに解は求まるので、担当者には 「刺激的な数字」になるのが普通。よって、頭では理解しても、 生理的・政治的に受け入れ難いことも 割り切らず「過去の可視化」だと、分析後の展開が辛い 割り切った場合、そのリスクに見合う価値が出せるか? → 割り切りを伝えないのはダメ。発覚時に大変なことに
  • 43. 4. まとめ 2015/6/27 42 / 47分析のビジネス展開を考えるー状態空間モデルを例に
  • 44. 本発表の振り返り 2015/6/27 43 / 47分析のビジネス展開を考えるー状態空間モデルを例に 第2章 状態空間モデルの推定方法を概観 第3章 状態空間モデルの前提・仮定が、ビジネスの利活 用に及ぼす影響を見た 数理モデルは、モデルの前提や仮定の下でしか 語れない 前提や仮定は、分析の設計、担当者の説得方法、 モデルの運用方法、などを規定してしまう
  • 45. 私が考える大切なこと 2015/6/27 44 / 47分析のビジネス展開を考えるー状態空間モデルを例に 1. 理論やデータに嘘をつかない、騙さない 理論の勉強は、忠実に数理モデルを適用する大前提 困った結果への対応は、嘘やハッタリではなく、お客 様とのコミュニケーションが鉄則。嘘やハッタリは、 いずれ分かる 困る前に、先に困りポイントを営業や分析設計段階で 見抜き、お客様の合意を取り付けて潰すのが、一番美 しいのだが… 技術面で/相手の状況を見ると/期間・予算的に、等で 「出来ません」と言うべき状況もある
  • 46. 私が考える大切なこと 2015/6/27 45 / 47分析のビジネス展開を考えるー状態空間モデルを例に その上で… 2. 出発点の「ビジネスの課題は?」を忘れない ビジネスの興味は、大抵困りことの解消 簡単な方法で片付くならば、それに越したことは無い 3. 担当者の想いや野心を見抜き、念頭に置く データ分析も、所詮はビジネス上の一つの道具 担当者に役立つならば、データ分析である必要もない (営業の話だけど)担当者がビジネス上のキーマンなのか? の見極めを外すと、どんなに頑張っても報われない
  • 47. 参考文献 2015/6/27 46 / 47分析のビジネス展開を考えるー状態空間モデルを例に
  • 48. 参考文献 1. 『予測にいかす統計モデリングの基本―ベイズ統計入門 から応用まで』樋口知之、講談社、2011年 2. 『ビッグデータ時代のマーケティング―ベイジアンモデ リングの活用』佐藤忠彦、樋口 知之、講談社、2013年 3. 『時系列解析入門』北川源四朗、岩波書店、2005年 4. 『状態空間時系列分析入門』J.J.F.コマンダー、S.J.クー プマン、和合肇(訳)、シーエーピー出版、2008年 2015/6/27 47 / 47分析のビジネス展開を考えるー状態空間モデルを例に