Recommended
PDF
PDF
PDF
[DL輪読会]Attention Is All You Need
PPTX
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
PDF
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
PDF
PPTX
PDF
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
PPTX
PPTX
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
PDF
Probabilistic Graphical Models 輪読会 #1
PDF
PDF
PDF
PDF
PDF
PPTX
PDF
PDF
PDF
StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】
PDF
PDF
PDF
PDF
PDF
PDF
PPTX
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
PPTX
Maximum Entropy IRL(最大エントロピー逆強化学習)とその発展系について
PDF
PDF
More Related Content
PDF
PDF
PDF
[DL輪読会]Attention Is All You Need
PPTX
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
PDF
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
PDF
PPTX
PDF
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
What's hot
PPTX
PPTX
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
PDF
Probabilistic Graphical Models 輪読会 #1
PDF
PDF
PDF
PDF
PDF
PPTX
PDF
PDF
PDF
StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】
PDF
PDF
PDF
PDF
PDF
PDF
PPTX
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
PPTX
Maximum Entropy IRL(最大エントロピー逆強化学習)とその発展系について
Similar to Uplift Modelling 入門(1)
PDF
PDF
PDF
Tokyowebmining19 data fusion
PDF
PDF
Complex network ws_percolation
PDF
PDF
PDF
PDF
PDF
PDF
【schoo WEB-campus】データ分析、その前にやっておくべきこと 先生:田畑直
PDF
PDF
PDF
PDF
PDF
PDF
FIT2012招待講演「異常検知技術のビジネス応用最前線」
PDF
PDF
PDF
[R勉強会][データマイニング] プロセス・リソース・グラフと数理統計解析
More from Yohei Sato
PDF
Tokyor60 r data_science_part1
PDF
PDF
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
PPTX
PDF
PDF
PDF
PDF
PDF
PDF
PDF
R言語で学ぶマーケティング分析 競争ポジショニング戦略
PDF
PDF
エンジニアサポート新年会2012 データマイニングcross 第1部
PDF
PDF
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
PDF
異常行動検出入門 – 行動データ時系列のデータマイニング –
PDF
PDF
Uplift Modelling 入門(1) 1. Uplift Modelling入門(1)
- 費用対効果の最大化を目的とした最新データマイニング手法 -
@yokkuns: 里 洋平
yohei0511@gmail.com
2012.03.10 第21回Tokyo.R
2012年3月10日土曜日
2. AGENDA
◆ 自己紹介
◆ Uplift Modellingとは
2012年3月10日土曜日
3. AGENDA
◆ 自己紹介
◆ Uplift Modellingとは
2012年3月10日土曜日
4. 自己紹介
時系列解析や異常検知などの方法論を
実ビジネスに適用するデータマイニングエンジニア
◆ 名前: 里 洋平
◆ ID : yokkuns
◆ 職業:
データマイニングエンジニア
◆ 統計解析 パターン認識 機械学
習 データマイニング NLP 金融工学
などを勉強中
2012年3月10日土曜日
5. 6. 7. 8. 活動例: 異常検知
Anomaly detection
複数時系列から異常な振る舞いを検知する
C
A
時系列のモデリング 複数時系列の異常検知 B
時系列A 時系列A
異常な振る舞い
時系列B
時系列C 時系列B 時系列C
異常な振る舞いの時系列を検出
例1:トラフィック異常検知 例2:CM効果のノイズ除去
トラフィックA ケースA
CM効果
トラフィックB ケースB
トラフィックC 調査 ケースC
異常な振る舞いをしている 異常な振る舞いをしているケースを
トラフィックの原因を調査する 除外して、CMの効果を算出する
85
2012年3月10日土曜日
9. 活動例: 時系列解析と異常検知
Anomaly detection
新しいデータと過去時系列モデルの乖離から異常検出
8000.0000
異常スコア推移 3.0000
モデル構築
異常値
◇例 : ARIMAモデル 2.2500
5970.7500 1.5000
0.7500
3941.5000 0
異常スコアの算出
-0.7500
◇例 : 対数損失
1912.2500 -1.5000
-2.2500
-117.0000 -3.0000
t
4/ 週
4/ 1週
4/ 8週
5/ 週
5/ 週
5/ 週
5/ 週
5/ 週
6/ 週
6/ 週
6/ 週
6/ 週
7/ 週
7/ 週
7/ 週
7/ 8週
週
4
25
2
9
16
23
30
6
13
20
27
4
11
25
1
1
1
4/
86
2012年3月10日土曜日
10. 活動例: 時系列解析と影響分析
TV Commercial Effects
時系列的な振る舞いの特徴から各KPIへのCMの影響度を算出
イベン
CM時系列 ト
新規
登録
CM ARPP
U
ARPU
各KPIの時系列
その他
外部
継続率
要因
ケース
87
2012年3月10日土曜日
11. 12. AGENDA
◆ 自己紹介
◆ Uplift Modellingとは
2012年3月10日土曜日
13. Uplift Modellingとは
費用対効果の最大化を目的とした最新のデータマイニング手法
介入による行動変化をモデル化し効果を最大化する
介入による4つの行動パターン
介入を受けた場合の反応
No あまのじゃく 無関心
YES テッパン 説得可能!
YES No
介入を受けなかった場合の反応
2012年3月10日土曜日
14. これまでのマーケティングモデル
顧客を有望な顧客とそうでない顧客に分類し
有望な顧客だけをターゲットにする事で費用対効果を向上させる
◆ 浸透モデル
・既に製品を購入した顧客を特徴づけるモデル
◆ 購入モデル
・最近購入した顧客を特徴づけるモデル
・浸透モデルに似てるが、最近の履歴に注目し、顧客の特性の変化を捉える
◆ レスポンスモデル
・マーケティング活動に反応して購入した顧客を特徴づけるモデル
2012年3月10日土曜日
15. これまでのマーケティングモデル
顧客を有望な顧客とそうでない顧客に分類し
有望な顧客だけをターゲットにする事で費用対効果を向上させる
◆ 浸透モデル
・既に製品を購入した顧客を特徴づけるモデル
◆ 購入モデル
・最近購入した顧客を特徴づけるモデル
・浸透モデルに似てるが、最近の履歴に注目し、顧客の特性の変化を捉える
◆ レスポンスモデル
・マーケティング活動に反応して購入した顧客を特徴づけるモデル
2012年3月10日土曜日
16. レスポンスモデリング
処置群の反応データを用いて
レスポンスをモデル化し、ターゲットを決める
Training Data 従来のレスポンスモデリング
反応なし 反応あり
処置群
処置群 分類結果
反応あり の場合
良いターゲット
予測対象
2012年3月10日土曜日
17. レスポンスモデリングの課題
処置群だけで学習しているため
介入による行動変化を考慮出来ていない
Training Data 従来のレスポンスモデリング
反応なし 反応あり
あまのじゃく 説得可能!
処置群
処置群
無関心 テッパン
分類結果
反応あり の場合
良いターゲット
予測対象
2012年3月10日土曜日
18. レスポンスモデリングの課題
処置群だけで学習しているため
介入による行動変化を考慮出来ていない
Training Data 従来のレスポンスモデリング
介入しなければ
反応した
反応なし 反応あり
あまのじゃく 説得可能!
処置群
処置群
無関心 テッパン
介入しなくても
反応した 分類結果
反応あり の場合
良いターゲット
予測対象
2012年3月10日土曜日
19. 処置群と対照群を用いた学習
処置群と対照群の両方を学習データとする事で
介入による行動変化を捉える
Training Data
反応なし 反応あり
あまのじゃく 説得可能!
処置群
処置群
無関心 テッパン
対照群
説得可能! あまのじゃく
対照群
無関心 テッパン
予測対象
2012年3月10日土曜日
20. 処置群と対照群を用いた学習
処置群と対照群の両方を学習データとする事で
介入による行動変化を捉える
Training Data
反応なし 反応あり
あまのじゃく 説得可能!
処置群
処置群
無関心 テッパン
対照群
説得可能! あまのじゃく
対照群
無関心 テッパン
予測対象
2012年3月10日土曜日
21. 処置群と対照群を用いた学習
処置群と対照群の両方を学習データとする事で
介入による行動変化を捉える
Training Data
反応なし 反応あり
あまのじゃく 説得可能!
処置群
処置群
無関心 テッパン
対照群
説得可能! あまのじゃく
対照群
無関心 テッパン
予測対象
2012年3月10日土曜日
22. Uplift Modelling
単純な 反応あり ・ 反応なし ではなく
介入による行動変化をモデル化しターゲットを決める
Training Data Response Uplift Modelling
L R
あまのじゃく
説得可能!
処置群
処置群
無関心
テッパン
分類結果
R の場合
あまのじゃく
対照群
説得可能! 良いターゲット
対照群
無関心
テッパン
予測対象
2012年3月10日土曜日
23. 分割基準
行動変化によるレスポンス率増と
その重要性を最大化する分割を行う
L R
あまのじゃく
処置群(T)
説得可能!
無関心
テッパン
UL UR
あまのじゃく
対照群(C)
説得可能!
無関心
テッパン
2012年3月10日土曜日
24. 分割基準
行動変化によるレスポンス率増と
その重要性を最大化する分割を行う
L R
あまのじゃく
処置群(T)
説得可能!
無関心
テッパン
UL UR
あまのじゃく
対照群(C)
説得可能!
無関心
テッパン
◆ 行動変化によるレスポンス率の増分
◆ 重要性 (t統計量の2乗)
2012年3月10日土曜日
25. 分割基準
行動変化によるレスポンス率増と
その重要性を最大化する分割を行う
L R
あまのじゃく
処置群(T)
説得可能!
無関心
テッパン
UL UR
あまのじゃく
対照群(C)
説得可能!
無関心
テッパン
◆ 行動変化によるレスポンス率の増分
◆ 重要性 (t統計量の2乗)
2012年3月10日土曜日
26. 分割基準
行動変化によるレスポンス率増と
その重要性を最大化する分割を行う
L R
あまのじゃく
処置群(T)
説得可能!
無関心
テッパン
UL UR
あまのじゃく L
対照群(C)
説得可能!
無関心
テッパン
◆ 行動変化によるレスポンス率の増分
◆ 重要性 (t統計量の2乗) L R
2012年3月10日土曜日
27. 介入による行動変化の定式化
介入による行動変化を
介入効果とグループ効果の相互作用として表現
L R
介入による効果 介入による効果
処置群(T)
グループ効果 グループ効果
相互作用 相互作用
UL UR
介入による効果 介入による効果
対照群(C)
グループ効果 グループ効果
相互作用 相互作用
※Cの介入効果 = Lのグループ効果 = CR相互作用 = TL相互作用 = CL相互作用 = 0 とおく
2012年3月10日土曜日
28. 介入による行動変化の推定
相互作用はRグループとLグループの増分の差で推定される
L R
介入による効果 介入による効果
処置群(T)
グループ効果 グループ効果
相互作用 相互作用
UL UR
介入による効果 介入による効果
対照群(C)
グループ効果 グループ効果
相互作用 相互作用
※Cの介入効果 = Lのグループ効果 = CR相互作用 = TL相互作用 = CL相互作用 = 0 とおく
2012年3月10日土曜日
29. 介入による行動変化の推定値の誤差と重要性
介入による行動変化は回帰係数として算出され
その重要性はt統計量で与えられる
T:1, C:0 R:1, L:0 Xi1Xi2
基準値
介入効果
グループ効果
相互作用
◆ 標準誤差の算出 ◆ t統計量の2乗
2012年3月10日土曜日
30. 分割基準
行動変化によるレスポンス率増と
その重要性を最大化する分割を行う
L R
あまのじゃく
処置群(T)
説得可能!
無関心
テッパン
UL UR
あまのじゃく L
対照群(C)
説得可能!
無関心
テッパン
◆ 行動変化によるレスポンス率の増分
◆ 重要性 (t統計量の2乗) L R
2012年3月10日土曜日
31. AGENDA
◆ 自己紹介
◆ Uplift Modellingとは
2012年3月10日土曜日
32. 33. Rでの実行は?
まだパッケージが存在しない
2012年3月10日土曜日
34. Rでの実行は?
まだパッケージが存在しない
2012年3月10日土曜日
35. Rでの実行は?
まだパッケージが存在しない
iAnalysisと共同開発予定!
2012年3月10日土曜日
36. 謝辞
Uplift Modellingの存在はisseing333さんが教えてくださいました!
ありがとうございます!
2012年3月10日土曜日
37. 次回以降の
発表者・LTを募集しています!
2012年3月10日土曜日
38. 39. 40. 参考資料
◆ t統計量
http://en.wikipedia.org/wiki/T-statistic
◆ 線形回帰
http://ja.wikipedia.org/wiki/%E7%B7%9A
%E5%BD%A2%E5%9B%9E%E5%B8%B0
◆ Real-World Uplift Modelling with Significance-Based Uplift Trees
http://stochasticsolutions.com/sbut.html
2012年3月10日土曜日