Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
階層ベイズによる       OneマーケティングOne to Oneマーケティング         入門       @shima_x                    2013/3/11
階層ベイズモデルを使って マイクロマーケティング    を行うことが 今回の分析の目的です
まずなぜ階層ベイズモデルが必要か   について説明します
はじめに従来の頻度統計学とベイズ統計学の違いを   説明します
頻度統計とベイジアン統計の違い
ネイマン-ピアソン統計の基本的な考え方    サンプリングを繰り返していけば誤差がなくなって      真の値(母数※)をぴったり推定できる!                           母集団                     ...
ベイジアン統計の基本的な考え方  リサンプリングが作り出す分布は 真の値に近づいていくに違いない!            母集団           (母平均)      標本の標本の分布→      標本の標本の分布→母数の推定値 標本   ...
リサンプリングとは                                      リサンプリン                                      グされた標本                         ...
ブートストラップとベイズ推定• Bootstrap法とは「復元」抽出によって作られた標本(サンプルサイ  Bootstrap法とは「復元」抽出によって作られた標本(サンプルサイ  ズはサンプルN  ズはサンプルNに同じとする)に対して統計処理を...
ベイズ推定の利点と注意点利点不適解への対処 • 誤差分散が負になる、といった計算上のエラーを避けられる • 標本数が少ないことに起因する不適解を回避できる場合がある漸近的な信頼区間 • 信頼区間=ここ(下限)からここ(上限)までの間にこの母数が...
ベイズ推定実施時の注意点ベイズ推定は、リサンプリングを何回も繰り返す • 徐々に安定した値に近づいていくが、最初の数百回は不安定な   ので、その数値は使わない(バーンイン期間) • リサンプリング回数ーバーンイン期間で、数値の変動幅がある  ...
ここで前置き(small talk)は終わりですここで前置き(small talk)は終わりです
Let’s start business talk
マーケティング活動の高度化には個に関する情報が必要不可欠である異質な構造の背後に存在する共通性の構造も有益な情報として生かされるべき
したがって異質性と共通性に関する情報を同時にデータか      ら抽出することは重要
しかし、これらの情報は単純には抽出できない
なんか方法ないの?
できるんです!そう、モデリングならね
ということでここからは2ということでここからは2項ロジットモデルを例とし     た階層ベイズの必要性の説明
階層ベイズモデルを利用した  2項ロジットモデル買うべきか買わないべきか どうしたらいいんだ… どうしたらいいんだ…?
階層ベイズモデルとは?      統計モデルのパラメータに階層構造を持たせてベイズ推定する高性能なモデル     問題:事前分布をどう設定すべきか 古典的なベイズモデル    不確実性を考慮してハ    イパーパラメータを確率      変数と...
なぜ階層ベイズか?        超パラメータを確率変数とすることで        ノンパラメトリックと同等の頑健性             パラメータ     複雑さ      超パラメータ    頑健性最尤推定        一意に決定  ...
ユーザの選択行動モデルユーザは様々な選択行動をしている   インストールする        アイテムAを買う                   アイテムA                   アイテムB                   ア...
ユーザの選択行動モデル         選択駆動への影響を知ることで        効率的な施策を実行することが出来る 広告          β1        β2                  アイテムA               ...
2項ロジットモデル         アイテムを買う・買わないのような           二択の選択行動モデル 広告          β1        β2                    購入するレコメンド  ・          ...
2項ロジットモデル   ロジスティック曲線の回帰モデルで表現各変数の回帰係数を市場反応パラメータとして解釈する                                         購入する 広告          β1       ...
ユーザ毎にパラメータを知りたい       市場反応パラメータをユーザ毎に求めて      ユーザに合わせた施策を行えるようにしたい                                       購入する 広告       βh1...
2項ロジットモデルの限界ユーザによる違いは考慮されていないため 個々でみると非効率的な部分もある
ユーザ毎のパラメータが知りたい 市場反応パラメータはユーザ毎に違うはずしかし、ユーザ毎に推定するほどのデータはない                      ?                  ?          ?            ...
ユーザ毎のパラメータが知りたいユーザは一人一人違うものの、共通な部分もある 共通部分を全ユーザの情報を用いて推定する個人毎に回帰するにはデ    大まかな傾向は全体で推定ータが少ないが・・・     個人毎に微調整
ユーザ毎のパラメータが知りたい共通部分を全ユーザの情報を用いて推定する独自部分       共通部分
階層ベイズ2            階層ベイズ2項ロジットモデルの構築                 共通パラメータV ,Δも確率変数                 共通パラメータVB,Δも確率変数            多変量正規分布と逆...
階層ベイズ2項ロジットモデルのベイズ推定        階層ベイズ2                       ,Δについて適当に初期値を設定する                  βh,VB,Δについて適当に初期値を設定する        ...
階層ベイズ2項ロジットモデルのベイズ推定        階層ベイズ2                    ,Δを固定して                      を固定してβ                  VB,Δを固定してβhの事後分...
階層ベイズ2項ロジットモデルのベイズ推定        階層ベイズ2                   サンプリングされたβ                   サンプリングされたβhを目的変数とする                  多変量...
階層ベイズ2項ロジットモデルのベイズ推定        階層ベイズ2                  Δ とβhを固定してVBを発生させる                       を固定してV                       ...
階層ベイズ2項ロジットモデルのベイズ推定        階層ベイズ2                  M回以降(バーンイン期間)の繰り返しについて                     それぞれのパラメータを保存する            ...
実際の分析では?       ネステッドロジスティックモデルのようなモデルを使用する                 来店の有無                                                          ...
分析事例
実際にどんな使い方をされているのか?◆ 目的 当該店舗に対するユーザ個々のロイヤリティ算出◆ 手法 ・階層ベイズモデル ・カルマンフィルタ(非線形の場合は粒子フィルタ) ・MCMC ・データ拡大(ユーザのブランドロイヤリティ算出)  時系列でユ...
実際にどんな使い方をされているのか?前回来店か らの日数     βh1 降水量    βh2  …  …  …  …                Modelチラシ掲載                                     ...
実際にどんな使い方をされているのか?前回来店か らの日数     βh1 降水量    βh2  …  …  …  …                Model              近い数値を持つユーザをセグメチラシ掲載         ...
実際にどんな使い方をされているのか?消費者異質性と消費者共通性のモデル化の概念           消費者間の関係を表す主体間行動モデル           消費者間の関係を表す主体間行動モデル                 (事前分布)  ...
実際にどんな使い方をされているのか?     消費者異質性と消費者共通性のモデル化の概念                        集団全体で共通の分散値                        集団全体で共通の分散値        ...
このような方法がマーケティングにおける階層ベイズモデル利用の          典型
モデルの構築
モデルの仮定 1.消費者の来店生起行動は個人ごとに異質だと考えるが、   部分的に消費者間共通性も存在する 2.来店生起行動に影響する疑似家庭内在庫金額(後述)の   形成メカニズムは消費者ごとに異質である(個人ごとの   パラメータをもつ)が...
モデル化             来店効用のモデル化個人i個人iのt時点における来店総効用              正規分布に従う確率項       来店効用の確定項            ※説明変数の数は設定                ...
モデル化    来店効用のモデル化前スライドの数式を以下を用いて書き直す                 パラメータをまとめたベクトル                 = 時系列パラメタ       観測変数       (疑似家庭内在庫金額は...
モデル化            来店生起のモデル化         非集計プロビットモデルによるモデル化来店生起確率                    モデルの識別性確保のため1とする                    モデルの識別性確...
モデル化            疑似家庭内在庫金額のモデル化 商品カテゴリを示す疑似家庭内在庫金額       購買金額         消費金額    Cの影響を調整するパラメータ     の影響を調整するパラメータ           平均...
モデル化        消費者異質性のモデル化:階層モデル           全消費者共通のパラメタ( 時系列) ← セグメント化する           全消費者共通のパラメタ(not時系列) セグメント化する             商品...
モデル化                     時変係数のモデル化①tt,i , βjt,iのモデル化                        j=1, … ,6②wt,i のモデル化                      時間変化...
モデル化 プロビットモデルにおけるデータ拡大データ拡大ってなんなの?
モデル化       プロビットモデルにおけるデータ拡大 マルコフ連鎖モンテカルロ法の一種   (ギブスサンプラーの亜種)総効用ut,iをパラメータの一種と考え(uat,iとする)、観測デ総効用u をパラメータの一種と考え(u とする)ータ(y...
モデル化プロビットモデルにおけるデータ拡大データ拡大の必要性
モデル化            プロビットモデルにおけるデータ拡大  非集計プロビットモデルに積分が含まれていることもあり、一般状態空間モデルの枠組  みが必要となる  非集計プロビットモデルの積分問題は、総効用u  非集計プロビットモデルの積...
モデル化プロビットモデルにおけるデータ拡大切断正規分布の適用
モデル化         プロビットモデルにおけるデータ拡大正の領域だけを定義域としてもつ正規分布、負の領域だけを定義域として持つ正規分布を考える 総効用u 総効用ut,iをパラメータの一種     個人 のt時点の平滑化推定値        ...
モデル化 プロビットモデルにおけるデータ拡大非集計プロビットモデルの データ拡大による評価
モデル化            プロビットモデルにおけるデータ拡大        来店生起確率               データ拡大によってパラメータ化された総効用yt,iのかわりに t,i, Ztpt,i)に整合的な at,iを導入すること...
モデル化   状態空間モデルカルマンフィルタの適用
モデル化           状態空間モデル状態変数の時間発展式も線形ガウス型  本稿の状態空間モデルは線形ガウス状態空間モデルとなる状態空間モデルはシステムモデルと観測モデルで表現される  現在までに示されたモデルとの関係は次スライドの様になる
モデル化         状態空間モデル              状態空間モデルで                               扱うのはここ          ギブスサンプラー階層モデル                 システ...
モデル化          状態空間モデルシステムモデル観測モデル
MCMC法                    MCMC法                同時事後分布の算出                                 計算にはこれを使う①       ②       ③        ...
MCMC法 MCMC法各生成分布の役割
MCMC法                    MCMC法       DAGを用いた視覚的な同時事後分布の分解       DAGを用いた視覚的な同時事後分布の分解       事前分布    事前分布     事前分布   事前分布初期分...
MCMC法                           MCMC法                          推定の全体フロー手順0                                                ...
MCMC法                           MCMC法                          推定の全体フロー手順0                                                ...
MCMC法                 MCMC法                 各手順詳細手順 :MCM のエルゴード性により、最終的な事後分布は初期値には依存しなくなる。手順0:     エルゴード性により、最終的な事後分布は初期値に...
MCMC法          MCMC法          各手順詳細事前分布:逆ガンマ分布   尤度関数:正規分布自然共役分布により事後分布は逆ガンマ分布となる
MCMC法          MCMC法          各手順詳細事前分布の定義                         j = 1,…,6事後分布の定義             j = 1,…,6
MCMC法               MCMC法               各手順詳細                  例ではブランドカテゴリが2以上あるので多変量正規分布                  例ではブランドカテゴリが 以上...
MCMC法             MCMC法             各手順詳細候補サンプルを発生させるために用いたランダムウォークを以下に示す                                 Σδ, Σλ = diag(0....
MCMC法            MCMC法            各手順詳細  事前分布:正規分布を仮定   尤度関数:正規分布共役関係が成立するので、多変量回帰モデルにおける平均共役関係が成立するので、多変量回帰モデルにおける平均未知、分散...
MCMC法              MCMC法              各手順詳細事前分布  Hδを縦につなげたベクトル   クロネッカー積事後分布
MCMC法                 MCMC法                 各手順詳細                   事前分布:事前分布:正規分布を仮定   逆ウィシャート分布を仮定   尤度関数:正規分布共役関係が成立するの...
MCMC法       MCMC法       各手順詳細事前分布事後分布
MCMC法MCMC法各手順詳細
付 録
データ拡大           多項プロビットモデルへの応用J個のブランドが選択肢とあると仮定し、識別性確保のため選択肢Jに対する相対効用の算 個のブランドが選択肢とあると仮定し、識別性確保のため選択肢Jに対する相対効用の算          ...
データ拡大           多項プロビットモデルへの応用個人iの時点tでの選択肢j個人iの時点tでの選択肢jの選択確率(多項プロビットモデル)
データ拡大      多項プロビットモデルへの応用つまり
データ拡大             ギブスサンプラーの適用 各選択肢の式に示す分布の切断領域は,yt,i=jのときは以下の式になる上に示す個々の条件付き分布f(・上に示す個々の条件付き分布f(・|・)は、多変量正規分布の条件付き分布の議論を援用...
データ拡大       パラメータ化した潜在効用と観測値y       パラメータ化した潜在効用と観測値yの関係                          相対効用uaj,t,iがほかの選択肢の相対効用                 ...
データ拡大         具体的な利点                  選択データy                  選択データyt,iに整合的な                  潜在変数uat,iを発生                ...
付録状態空間モデル
線形ガウス型状態空間モデル                 基本的考え方時系列表現         直接観測できないベクトル                        システム・ノイズ         観測ノイズ状態推定          ...
線形ガウス型状態空間モデル          一期先予測システムモデル   観測値から潜在変数を予測
線形ガウス型状態空間モデル        フィルタリング観測モデル             一期先予測            一時点尤度
線形ガウス型状態空間モデル          平滑化                   システムモデルフィルタリング    一期先予測
線形ガウス型状態空間モデル                     カルマンフィルタ  状態xの平均と分散  状態 の平均と分散     一期先予測     フィルタリング    固定区間平滑化※F,G,Hはそれぞれのモデルにあった定型の行列を...
参考文献[1]Rで階層ベイズモデル, @yokkuns  http://www.slideshare.net/yokkuns/r-16189019[2]Amosを使ったベイズ推定, 小杉考司  http://www.slideshare.net...
Upcoming SlideShare
Loading in …5
×

階層ベイズによるワンToワンマーケティング入門

17,580 views

Published on

  • Sex in your area is here: ❤❤❤ http://bit.ly/369VOVb ❤❤❤
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Dating direct: ❤❤❤ http://bit.ly/369VOVb ❤❤❤
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

階層ベイズによるワンToワンマーケティング入門

  1. 1. 階層ベイズによる OneマーケティングOne to Oneマーケティング 入門 @shima_x 2013/3/11
  2. 2. 階層ベイズモデルを使って マイクロマーケティング を行うことが 今回の分析の目的です
  3. 3. まずなぜ階層ベイズモデルが必要か について説明します
  4. 4. はじめに従来の頻度統計学とベイズ統計学の違いを 説明します
  5. 5. 頻度統計とベイジアン統計の違い
  6. 6. ネイマン-ピアソン統計の基本的な考え方 サンプリングを繰り返していけば誤差がなくなって 真の値(母数※)をぴったり推定できる! 母集団 (母平均) 標本 標本 A 標本 標本 E 標本 B C D 標本平均A 標本平均A 標本平均E 標本平均E 標本平均B 標本平均B 標本平均C 標本平均C 標本平均D 標本平均D 標本平均の平均→ 標本平均の平均→母平均※平均や分散などの母集団の分布の特徴を示すもの
  7. 7. ベイジアン統計の基本的な考え方 リサンプリングが作り出す分布は 真の値に近づいていくに違いない! 母集団 (母平均) 標本の標本の分布→ 標本の標本の分布→母数の推定値 標本 標本 A 標本 標本 E 標本 B C D
  8. 8. リサンプリングとは リサンプリン グされた標本 1標本抽出 リサンプリン グされた標本Sampling 2 ・・・・ 標本 Re-sampling Sample 復元抽出と非復元抽出とがある サンプルサイズ(N サンプルサイズ(N) リサンプリン グされた標本 B
  9. 9. ブートストラップとベイズ推定• Bootstrap法とは「復元」抽出によって作られた標本(サンプルサイ Bootstrap法とは「復元」抽出によって作られた標本(サンプルサイ ズはサンプルN ズはサンプルNに同じとする)に対して統計処理を行う方法• ベイズ推定は更にそれを進化させ、 1. 統計的推定値を確率変数だと考え (ある幅をもって推定する) 2. 事前情報を考慮し (回帰分析の残差は正規分布するだろう、など) 標本分布から作られる推定値のリサンプリングにより(MCMC 3. 標本分布から作られる推定値のリサンプリングにより(MCMC 法) 4. 事後分布の代表値を母数の推定値とする という手法である。
  10. 10. ベイズ推定の利点と注意点利点不適解への対処 • 誤差分散が負になる、といった計算上のエラーを避けられる • 標本数が少ないことに起因する不適解を回避できる場合がある漸近的な信頼区間 • 信頼区間=ここ(下限)からここ(上限)までの間にこの母数がある確 率が~、という形で推定することができる注意点 • 恣意的な仮説(事前分布)になってないか • 計算が収束しないことがある
  11. 11. ベイズ推定実施時の注意点ベイズ推定は、リサンプリングを何回も繰り返す • 徐々に安定した値に近づいていくが、最初の数百回は不安定な ので、その数値は使わない(バーンイン期間) • リサンプリング回数ーバーンイン期間で、数値の変動幅がある リサンプリング回数ーバーンイン期間で、数値の変動幅がある 程度小さくなれば「収束した」とする 程度小さくなれば「収束した」とするそこで、論文に記載する事項として、以下のものが必要である • 事前分布にどのような仮定を追いたか • リサンプリングは何回に設定したか • バーンイン期間は何回に設定したか • 収束判定基準はどのような統計量で、どのような数値にしたか
  12. 12. ここで前置き(small talk)は終わりですここで前置き(small talk)は終わりです
  13. 13. Let’s start business talk
  14. 14. マーケティング活動の高度化には個に関する情報が必要不可欠である異質な構造の背後に存在する共通性の構造も有益な情報として生かされるべき
  15. 15. したがって異質性と共通性に関する情報を同時にデータか ら抽出することは重要
  16. 16. しかし、これらの情報は単純には抽出できない
  17. 17. なんか方法ないの?
  18. 18. できるんです!そう、モデリングならね
  19. 19. ということでここからは2ということでここからは2項ロジットモデルを例とし た階層ベイズの必要性の説明
  20. 20. 階層ベイズモデルを利用した 2項ロジットモデル買うべきか買わないべきか どうしたらいいんだ… どうしたらいいんだ…?
  21. 21. 階層ベイズモデルとは? 統計モデルのパラメータに階層構造を持たせてベイズ推定する高性能なモデル 問題:事前分布をどう設定すべきか 古典的なベイズモデル 不確実性を考慮してハ イパーパラメータを確率 変数として扱う 階層ベイズモデル
  22. 22. なぜ階層ベイズか? 超パラメータを確率変数とすることで ノンパラメトリックと同等の頑健性 パラメータ 複雑さ 超パラメータ 頑健性最尤推定 一意に決定 手動で設定 不使用 ×MAP推定 推定 一意に決定 手動で設定 手動で設定 △古典的なベイズ推定 事後分布を推定 手動で設定 手動で設定 ○ノンパラメトリックベイ 事後分布を推定 事後分布を推定 (手動で設定) ◎ズ階層ベイズモデル 事後分布を推定 (手動で設定) 事後分布を推定 ◎
  23. 23. ユーザの選択行動モデルユーザは様々な選択行動をしている インストールする アイテムAを買う アイテムA アイテムB アイテムBを買う インストールしない アイテムC アイテムCを買う
  24. 24. ユーザの選択行動モデル 選択駆動への影響を知ることで 効率的な施策を実行することが出来る 広告 β1 β2 アイテムA アイテムAレコメンド ・ Model アイテムB アイテムB ・ ・ アイテムC アイテムCその他 β3
  25. 25. 2項ロジットモデル アイテムを買う・買わないのような 二択の選択行動モデル 広告 β1 β2 購入するレコメンド ・ Model ・ ・ 購入しないその他 β3
  26. 26. 2項ロジットモデル ロジスティック曲線の回帰モデルで表現各変数の回帰係数を市場反応パラメータとして解釈する 購入する 広告 β1 購入確率レコメンド β2 ・ Model ・ ・ 購入しないその他 β3
  27. 27. ユーザ毎にパラメータを知りたい 市場反応パラメータをユーザ毎に求めて ユーザに合わせた施策を行えるようにしたい 購入する 広告 βh1 購入確率レコメンド βh2 ・ Model ・ ・ 購入しないその他 βh3
  28. 28. 2項ロジットモデルの限界ユーザによる違いは考慮されていないため 個々でみると非効率的な部分もある
  29. 29. ユーザ毎のパラメータが知りたい 市場反応パラメータはユーザ毎に違うはずしかし、ユーザ毎に推定するほどのデータはない ? ? ? ?
  30. 30. ユーザ毎のパラメータが知りたいユーザは一人一人違うものの、共通な部分もある 共通部分を全ユーザの情報を用いて推定する個人毎に回帰するにはデ 大まかな傾向は全体で推定ータが少ないが・・・ 個人毎に微調整
  31. 31. ユーザ毎のパラメータが知りたい共通部分を全ユーザの情報を用いて推定する独自部分 共通部分
  32. 32. 階層ベイズ2 階層ベイズ2項ロジットモデルの構築 共通パラメータV ,Δも確率変数 共通パラメータVB,Δも確率変数 多変量正規分布と逆ウィッシャート分布を事前分布とする Zh Xh V0事前分布IW(v0,V0) VB v0 βh yh Σ0事前分布MVN(Δ0,Σ0) Δ Δ0
  33. 33. 階層ベイズ2項ロジットモデルのベイズ推定 階層ベイズ2 ,Δについて適当に初期値を設定する βh,VB,Δについて適当に初期値を設定する Zh Xh V0事前分布IW(v0,V0) VB v0 βh yh Σ0事前分布MVN(Δ0,Σ0) Δ Δ0
  34. 34. 階層ベイズ2項ロジットモデルのベイズ推定 階層ベイズ2 ,Δを固定して を固定してβ VB,Δを固定してβhの事後分布からサンプリング Zh Xh V0事前分布IW(v0,V0) VB v0 βh yh Σ0事前分布MVN(Δ0,Σ0) Δ Δ0
  35. 35. 階層ベイズ2項ロジットモデルのベイズ推定 階層ベイズ2 サンプリングされたβ サンプリングされたβhを目的変数とする 多変量回帰モデルからΔ 多変量回帰モデルからΔの事後分布を得る Zh Xh V0事前分布IW(v0,V0) VB v0 βh yh Σ0事前分布MVN(Δ0,Σ0) Δ Δ0
  36. 36. 階層ベイズ2項ロジットモデルのベイズ推定 階層ベイズ2 Δ とβhを固定してVBを発生させる を固定してV Zh Xh V0事前分布IW(v0,V0) VB v0 βh yh Σ0事前分布MVN(Δ0,Σ0) Δ Δ0
  37. 37. 階層ベイズ2項ロジットモデルのベイズ推定 階層ベイズ2 M回以降(バーンイン期間)の繰り返しについて それぞれのパラメータを保存する Zh Xh V0事前分布IW(v0,V0) VB v0 βh yh Σ0事前分布MVN(Δ0,Σ0) Δ Δ0
  38. 38. 実際の分析では? ネステッドロジスティックモデルのようなモデルを使用する 来店の有無 第一階層 1p0 = 1- p1 1 1 p1 来店意思決定 無 有 カテゴリ生起 第2階層 階層 2 p0 = 1- p1 2 2 p1 カテゴリ購買意思決定 購買無 購買有 ブランド選択 第3階層 階層 3 p0 = 1- p1 3 P13=1 – pa3 – pb3 – ・・・ - py3 ブランド選択意思決定 Aブランド購入 ブランド購入 ・・・ Zブランド購入 ブランド購入
  39. 39. 分析事例
  40. 40. 実際にどんな使い方をされているのか?◆ 目的 当該店舗に対するユーザ個々のロイヤリティ算出◆ 手法 ・階層ベイズモデル ・カルマンフィルタ(非線形の場合は粒子フィルタ) ・MCMC ・データ拡大(ユーザのブランドロイヤリティ算出) 時系列でユーザのロイヤリティを把握し、 ユーザ個々に対するマーケティング活動を目指す
  41. 41. 実際にどんな使い方をされているのか?前回来店か らの日数 βh1 降水量 βh2 … … … … Modelチラシ掲載 購入するロスリーダ βhn商品の平均 購入確率 値引き率 平均来店間隔 αh1 購入しない来店手段 αh2 … … … Model 年齢 αhn
  42. 42. 実際にどんな使い方をされているのか?前回来店か らの日数 βh1 降水量 βh2 … … … … Model 近い数値を持つユーザをセグメチラシ掲載 購入するロスリーダ βhn ント分けするような効果を持ち、商品の平均 購入確率 値引き率 ユーザの共通部分によるパラメ ータ算出を行う 平均来店間隔 αh1 購入しない来店手段 αh2 … … … Model 年齢 αhn
  43. 43. 実際にどんな使い方をされているのか?消費者異質性と消費者共通性のモデル化の概念 消費者間の関係を表す主体間行動モデル 消費者間の関係を表す主体間行動モデル (事前分布) 集団共通のパラメータ 集団共通のパラメータ 全消費者共通のパラメータ 全消費者共通のパラメータ ・・・ (各個人の属性) 分布の形状は同じ
  44. 44. 実際にどんな使い方をされているのか? 消費者異質性と消費者共通性のモデル化の概念 集団全体で共通の分散値 集団全体で共通の分散値 ある消費者i ある消費者iの属性の関数で表現される平均ある消費者iある消費者iの市場反応などを示すパラメータ この分布には時間に依存しない構造(共通な関数形及び分布形)をもつ制約を課す 階層ベイズモデルでは、さらに各個人の行動データを表現する各 人の尤度関数(主体内行動)を定める
  45. 45. このような方法がマーケティングにおける階層ベイズモデル利用の 典型
  46. 46. モデルの構築
  47. 47. モデルの仮定 1.消費者の来店生起行動は個人ごとに異質だと考えるが、 部分的に消費者間共通性も存在する 2.来店生起行動に影響する疑似家庭内在庫金額(後述)の 形成メカニズムは消費者ごとに異質である(個人ごとの パラメータをもつ)が、その背後に消費者間の共通性も 有する。消費者間の共通性は消費者の行動特性、人口動 態的特性で説明できる 3.消費者の来店意思決定は、連続的に変動する潜在効用を 導入し表現する 4.潜在効用には時系列的影響要素(トレンド、週周期、前 回来店からの日数)と回帰成分(降水量、チラシ掲載ロ スリーダー※商品平均値引率、掲載商品数)が影響する 5.来店有無(実際には潜在効用)に対して説明変数が与え る影響は、時間の進展に伴い滑らかに変動する※ロスリーダー商品:チラシに掲載すると集客効果が大きい商品
  48. 48. モデル化 来店効用のモデル化個人i個人iのt時点における来店総効用 正規分布に従う確率項 来店効用の確定項 ※説明変数の数は設定 によって変わる 添え字のt 添え字のtは当該時点を、 iは人を指す
  49. 49. モデル化 来店効用のモデル化前スライドの数式を以下を用いて書き直す パラメータをまとめたベクトル = 時系列パラメタ 観測変数 (疑似家庭内在庫金額は推定値) 時系列モデル用に変形する
  50. 50. モデル化 来店生起のモデル化 非集計プロビットモデルによるモデル化来店生起確率 モデルの識別性確保のため1とする モデルの識別性確保のため とする 識別性確保のため
  51. 51. モデル化 疑似家庭内在庫金額のモデル化 商品カテゴリを示す疑似家庭内在庫金額 購買金額 消費金額 Cの影響を調整するパラメータ の影響を調整するパラメータ 平均消費金額 (推定値) ← 0より大きいという制約を課す より大きいという制約を課す (ホールドアウトデータから算出) 疑似家庭内消費金額に与える疑似家庭内在庫金額の影響度(推定値)
  52. 52. モデル化 消費者異質性のモデル化:階層モデル 全消費者共通のパラメタ( 時系列) ← セグメント化する 全消費者共通のパラメタ(not時系列) セグメント化する 商品カテゴリ数次元の誤差項 (商品カテゴリ数×消費者共通パラメタ)次元の回帰係数行列 商品カテゴリ数×消費者共通パラメタ 次元の回帰係数行列 商品カテゴリ数したがって パラメータの背後にある関係を 回帰式を使って説明している※
  53. 53. モデル化 時変係数のモデル化①tt,i , βjt,iのモデル化 j=1, … ,6②wt,i のモデル化 時間変化を生み出す確率的変動項③システムモデルの分散θ③システムモデルの分散θi,sys のモデル化
  54. 54. モデル化 プロビットモデルにおけるデータ拡大データ拡大ってなんなの?
  55. 55. モデル化 プロビットモデルにおけるデータ拡大 マルコフ連鎖モンテカルロ法の一種 (ギブスサンプラーの亜種)総効用ut,iをパラメータの一種と考え(uat,iとする)、観測デ総効用u をパラメータの一種と考え(u とする)ータ(yt,i , Zt,i)に整合的になるようにサンプリングを行うータ(y 仮想的に疑似観測データを発生⇒ 仮想的に疑似観測データを発生サンプリングは切断正規分布 切断正規分布から行うサンプリングは切断正規分布から行う
  56. 56. モデル化プロビットモデルにおけるデータ拡大データ拡大の必要性
  57. 57. モデル化 プロビットモデルにおけるデータ拡大 非集計プロビットモデルに積分が含まれていることもあり、一般状態空間モデルの枠組 みが必要となる 非集計プロビットモデルの積分問題は、総効用u 非集計プロビットモデルの積分問題は、総効用ut,iが仮に観測できれば、積分計算は不 要になる 観測モデルをy でなくu 観測モデルをyt,iでなくut,iに対して設けることで、観測モデルが回帰モデルになる つまり離散選択を回避し、回帰モデルを採用することになる (0,1などの離散値ではなく連続数として扱える!) 0,1などの離散値ではなく連続数として扱える!) この代替法が理論面※からも問題なく、また計算技術の面からも容易に実現できるので あれば、離散選択モデルの活用範囲が格段に広がる! あれば、離散選択モデルの活用範囲が格段に広がる!※理論的説明は付録に収める
  58. 58. モデル化プロビットモデルにおけるデータ拡大切断正規分布の適用
  59. 59. モデル化 プロビットモデルにおけるデータ拡大正の領域だけを定義域としてもつ正規分布、負の領域だけを定義域として持つ正規分布を考える 総効用u 総効用ut,iをパラメータの一種 個人 のt時点の平滑化推定値 個人iの 時点の平滑化推定値 としuat,iとした としu これにより取扱いやすいデータが手元に用意できる これにより取扱いやすいデータが手元に用意できる 取扱いやすいデータ
  60. 60. モデル化 プロビットモデルにおけるデータ拡大非集計プロビットモデルの データ拡大による評価
  61. 61. モデル化 プロビットモデルにおけるデータ拡大 来店生起確率 データ拡大によってパラメータ化された総効用yt,iのかわりに t,i, Ztpt,i)に整合的な at,iを導入することにより、消費者の来店生起行動の のかわりに(y に整合的なu に整合的な観測モデルは以下で表現できる
  62. 62. モデル化 状態空間モデルカルマンフィルタの適用
  63. 63. モデル化 状態空間モデル状態変数の時間発展式も線形ガウス型 本稿の状態空間モデルは線形ガウス状態空間モデルとなる状態空間モデルはシステムモデルと観測モデルで表現される 現在までに示されたモデルとの関係は次スライドの様になる
  64. 64. モデル化 状態空間モデル 状態空間モデルで 扱うのはここ ギブスサンプラー階層モデル システムモデル FFBS M-H法 観測モデル 説明変数 相対変数 来店有無
  65. 65. モデル化 状態空間モデルシステムモデル観測モデル
  66. 66. MCMC法 MCMC法 同時事後分布の算出 計算にはこれを使う① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩
  67. 67. MCMC法 MCMC法各生成分布の役割
  68. 68. MCMC法 MCMC法 DAGを用いた視覚的な同時事後分布の分解 DAGを用いた視覚的な同時事後分布の分解 事前分布 事前分布 事前分布 事前分布初期分布 モデルの尤度 状態ベクトルの分布事前分布
  69. 69. MCMC法 MCMC法 推定の全体フロー手順0 ※1 潜在効用のサンプリング 手順1 消費者iに対して時点数 だけサンプリング 消費者 に対して時点数Tだけサンプリング に対して時点数 MCMCの繰り返しループ の繰り返しループ For r=1 to R 状態ベクトルのサンプリング 手順2 消費者iに対して時点数 だけサンプリング 消費者 に対して時点数Tだけサンプリング に対して時点数 消費者のループ 消費者総数 回)のループ 消費者総数(I回 のループ 手順3 システムノイズのサンプリング ※1 手順4 消費者のループの終点 手順5 ※2 ※2 MCMCのループの終点 のループの終点 手順6
  70. 70. MCMC法 MCMC法 推定の全体フロー手順0 ※1 潜在効用のサンプリング 手順1 消費者iに対して時点数 だけサンプリング 消費者 に対して時点数Tだけサンプリング に対して時点数 MCMCの繰り返しループ の繰り返しループ For r=1,R 状態ベクトルのサンプリング 手順2 消費者iに対して時点数 だけサンプリング 消費者 に対して時点数Tだけサンプリング に対して時点数 最終的に算出したい値に適応させるため 消費者のループ 消費者総数 回)のループ に、サンプリリング手順は潜在効用値か 消費者総数(I回 のループ 手順3 システムノイズのサンプリング ら行う※1 手順4 消費者のループの終点 手順5 ※2 ※2 MCMCのループの終点 のループの終点 手順6
  71. 71. MCMC法 MCMC法 各手順詳細手順 :MCM のエルゴード性により、最終的な事後分布は初期値には依存しなくなる。手順0: エルゴード性により、最終的な事後分布は初期値には依存しなくなる。 したがって、それらしい値を与えればよい。
  72. 72. MCMC法 MCMC法 各手順詳細事前分布:逆ガンマ分布 尤度関数:正規分布自然共役分布により事後分布は逆ガンマ分布となる
  73. 73. MCMC法 MCMC法 各手順詳細事前分布の定義 j = 1,…,6事後分布の定義 j = 1,…,6
  74. 74. MCMC法 MCMC法 各手順詳細 例ではブランドカテゴリが2以上あるので多変量正規分布 例ではブランドカテゴリが 以上あるので多変量正規分布当該例の場合、尤度関数と事前分布は共役な関係ではないためM-Hアルゴリ当該例の場合、尤度関数と事前分布は共役な関係ではないため 共役な関係ではないため アルゴリズムを用いる特にここでは酔歩M-Hアルゴリズムを用いる特にここでは酔歩 アルゴリズムを用いる
  75. 75. MCMC法 MCMC法 各手順詳細候補サンプルを発生させるために用いたランダムウォークを以下に示す Σδ, Σλ = diag(0.01, 0.01) とした。 以下に示す採択確率 が0.4程度となるように 程度となるように 調整するのが最も良い ひとつ前のステップで とされている。 あることを意味する採択確率 δを対数変換の影響を調整するヤコビアン。採択確率の計算は対数 を対数変換の影響を調整するヤコビアン。採択確率の計算は対数 変換前の空間で行わなければならない。(λの計算では不要) 変換前の空間で行わなければならない。( の計算では不要)
  76. 76. MCMC法 MCMC法 各手順詳細 事前分布:正規分布を仮定 尤度関数:正規分布共役関係が成立するので、多変量回帰モデルにおける平均共役関係が成立するので、多変量回帰モデルにおける平均未知、分散共分散既知の場合のベイズ推測(正規分布×未知、分散共分散既知の場合のベイズ推測(正規分布×正規尤度→正規分布)を援用できる規尤度 正規分布)を援用できる
  77. 77. MCMC法 MCMC法 各手順詳細事前分布 Hδを縦につなげたベクトル クロネッカー積事後分布
  78. 78. MCMC法 MCMC法 各手順詳細 事前分布:事前分布:正規分布を仮定 逆ウィシャート分布を仮定 尤度関数:正規分布共役関係が成立するので、多変量回帰モデルにおける平均共役関係が成立するので、多変量回帰モデルにおける平均既知、分散共分散未知の場合のベイズ推測(逆ウィシャート分布×正規尤度→逆ウィシャート分布)を援用できる分布×正規尤度 逆ウィシャート分布)を援用できる
  79. 79. MCMC法 MCMC法 各手順詳細事前分布事後分布
  80. 80. MCMC法MCMC法各手順詳細
  81. 81. 付 録
  82. 82. データ拡大 多項プロビットモデルへの応用J個のブランドが選択肢とあると仮定し、識別性確保のため選択肢Jに対する相対効用の算 個のブランドが選択肢とあると仮定し、識別性確保のため選択肢Jに対する相対効用の算 識別性確保のため選択肢 相対効用出を行う パラメータベクトル uの説明変数 の説明変数
  83. 83. データ拡大 多項プロビットモデルへの応用個人iの時点tでの選択肢j個人iの時点tでの選択肢jの選択確率(多項プロビットモデル)
  84. 84. データ拡大 多項プロビットモデルへの応用つまり
  85. 85. データ拡大 ギブスサンプラーの適用 各選択肢の式に示す分布の切断領域は,yt,i=jのときは以下の式になる上に示す個々の条件付き分布f(・上に示す個々の条件付き分布f(・|・)は、多変量正規分布の条件付き分布の議論を援用 f(することで、次のような1することで、次のような1変量の切断正規分布となる
  86. 86. データ拡大 パラメータ化した潜在効用と観測値y パラメータ化した潜在効用と観測値yの関係 相対効用uaj,t,iがほかの選択肢の相対効用 相対効用u よりも必ず大きくならなければy =jとならな よりも必ず大きくならなければyt,i=jとならな いことからくる条件 (k≠j) ブランドkの効用値と比較してk ブランドkの効用値と比較してk以外のブランドの効用値の方 が高いため、y =kとなることはない が高いため、yt,i=kとなることはない この2つの条件を満たせばy =jが成立する この2つの条件を満たせばyt,i=jが成立する以上によりuat,iの発生は1変量の切断正規分布から乱数を発生するだけであり以上によりu の発生は1その履行は容易であることが示された
  87. 87. データ拡大 具体的な利点 選択データy 選択データyt,iに整合的な 潜在変数uat,iを発生 潜在変数u多重積分の計算が不要になる 回帰モデルにおける被説明変数が観測され たこととみなせる離散選択モデルが線形回帰モデルに帰着できるプロビットモデルにおける最大の問題であった多重積分を行わずともモデルの推定を行える多重積分を行わずともモデルの推定を行える
  88. 88. 付録状態空間モデル
  89. 89. 線形ガウス型状態空間モデル 基本的考え方時系列表現 直接観測できないベクトル システム・ノイズ 観測ノイズ状態推定 観測区間より先の状態を推定 現在の観測値から現在の状態を推定 (ただし、t<T) 現在までの観測値に基づいて過去の状態を推定
  90. 90. 線形ガウス型状態空間モデル 一期先予測システムモデル 観測値から潜在変数を予測
  91. 91. 線形ガウス型状態空間モデル フィルタリング観測モデル 一期先予測 一時点尤度
  92. 92. 線形ガウス型状態空間モデル 平滑化 システムモデルフィルタリング 一期先予測
  93. 93. 線形ガウス型状態空間モデル カルマンフィルタ 状態xの平均と分散 状態 の平均と分散 一期先予測 フィルタリング 固定区間平滑化※F,G,Hはそれぞれのモデルにあった定型の行列を作成し、 は最尤推定によって求める はそれぞれのモデルにあった定型の行列を作成し、Qは最尤推定によって求める はそれぞれのモデルにあった定型の行列を作成し、
  94. 94. 参考文献[1]Rで階層ベイズモデル, @yokkuns http://www.slideshare.net/yokkuns/r-16189019[2]Amosを使ったベイズ推定, 小杉考司 http://www.slideshare.net/KojiKosugi/amos-16660816[3]ビッグデータ時代のマーケティング, 佐藤忠彦・樋口知之, 講談社

×