Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

ベイジアンモデリングによるマーケティングサイエンス〜状態空間モデルを用いたモデリング

18,674 views

Published on

状態空間モデルの概要とマーケティング施策等の周期性・モデル表現について解説しています

Published in: Marketing
  • スライド見させていただきました。非常に分かりやすかったです。こちらの22ページ目にある特定時点での割引実施効果をRのdlmを用いて実装したいのですが教えていただけますか?
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

ベイジアンモデリングによるマーケティングサイエンス〜状態空間モデルを用いたモデリング

  1. 1. 第43回  TokyoWebMining @sanoche16 1
  2. 2. 名前:@sanoche16 職業:コンサルタント 得意:マーケティングサイエンス 好き:R,  Python,  Linux,  PHP,  Ruby 2
  3. 3. 本⽇日の発表に含まれる内容はすべて個⼈人の ⾒見見解であり、必ずしも所属団体の⾒見見解では ありません。 3
  4. 4. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 4
  5. 5. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 5
  6. 6. PDCA サイクル 6 多岐に渡って、より精度度の⾼高い分析・予測が求められている セグメンテー ション ポジショニング ターゲティング マーケティング戦略略と戦術 考 慮 事 項 求 め ら れ る 分 析 手 法 製品 (Product) 価格 (Price) 流流通 (Place) 販促 (Promotion) •  市場・顧客の 細分化 ?  顧客はどの単位で 分けるべきか ?  マーケティング施 策の単位を作成 •  優先セグメン トを明確化 ?  収益性の⾼高いセグ メントはどれか ?  今後成⻑⾧長するセグ メントはどれか •  売るべき商 品・サービ スの明確化 ?  どんな商品が 求められてい るか •  提供価格の 決定・原価 の管理理 ?  いくらで商品 を売るべきか ?  どこまで質を ⾼高めるべきか •  チャネルの 選定 ?  どこで商品を 売るべきか •  販促活動に よる売上拡 ⼤大 ?  誰にコストを かけるべきか ?  いくらまでコ ストをかける べきか クラスター分析 アソシエー ション分析 回帰分析 離散選択モデル 階層ベイズ (LTV計測) 時系列分析 因子分析 主成分分析 コレスポンデ ンス分析 MDS 回帰分析 ニューラル ネットワーク 決定木 項目反応 理論 最適化 ※分析手法は様々なシーンで活用できるため、よく利用される観点で一例 を示した
  7. 7. 7 単純な⼿手法によるモデリング • 線形回帰分析により特定の商品の購買確 率率率を予測 • 投⼊入変数として、年年齢、最終購買⽇日、年年 間購買回数を利利⽤用 分析結果と問題点 • 良良いと予測された顧客は説明変数の最⼤大 (or  最⼩小)の値を持つ顧客になってしまう ➔  本来は優先すべきではない顧客を優先 してしまう 顧客 年齢 最終 購買日 年間購買 回数 新商品 購買有無 Aさん 24歳 14/12/01 15階 有 Bさん 42歳 15/02/06 12階 無 Cさん 36歳 15/01/10 9階 有 … … … … … 顧客 年齢 最終 購買日 年間購買 回数 予測購買 確率 Xさん 2歳 14/02/27 42階 89% Yさん 4歳 14/02/25 28階 88% Zさん 4歳 14/02/26 29階 88% … … … … … 4.3 2.6 5.3 0 1 2 3 4 5 6 年齢 最終購買日 年間購買回数 標準化偏回帰係数 線形回帰分析 予測確率高
  8. 8. 8 説明変数を多い場合はかなり不安定なモデルとなってしまう ※1)  http://escience.anu.edu.au/lecture/cg/Spline/printCG.en.html 3次スプライン B-‐‑‒スプライン ガウス型基底関数 基底変換を⽤用いたアプローチ 3次スプライン関数の式: 推定するパラメータベクトル Ø  利利⽤用する説明変数は1つ Ø  推定するパラメータは数⼗十 にもなる ※1
  9. 9. 9 頻度度主義でのアプローチ データ数:0 •  情報は⼀一切切なし ベイズ統計を⽤用いたアプローチ •  事前分布を更更新 •  分散が⼩小さくなり、推定値の確 からしさを分布で表現 データ数:1 データ数:2 •  データはたまたま取れた値のみ 利利⽤用できる •  データの広がり(=分散)は 分からない •  事前分布を設定 •  (無情報事前分布や勘と経験か ら) •  標本分散を利利⽤用して⺟母分散を推 定可能 •  但し、2つのデータの近さからの み推定される(=不不安定) •  事前分布を更更新 •  分散が⼩小さくなり、推定値の確 からしさを分布で表現 事前分布を更新 事前分布を更新
  10. 10. u  マーケティングの領領域では、現在も⾮非常に多くの統計的 ⼿手法を⽤用いた分析が求められている –  きちんとしたモデリングにはそれなりの柔軟性が必要 u  柔軟なモデリングを⾏行行うためには必要なパラメータはか なり多くなってしまう –  パラメータが多くても安定的なモデルの構築が必要になる u  ベイジアンモデリングを利利⽤用することで、安定的かつ柔 軟なモデリングを⾏行行うことが可能になる –  事前分布を設定することで、スパースなデータに対しても安定 的なモデリングが可能になる 10
  11. 11. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 11
  12. 12. 12 時点の変化に関わる影響 ü  週末になったので、来客数が増加 した ü  夏になったので、来客数が増加し た 特定時点での要因による影響 ü  割引を実施したので、来客数が増 加した ü  たまたま⾬雨が降降ったので、来客数 が増加した あるレストランの⽇日別来店者数 割引実施 週末
  13. 13. 13 あるレストランの⽇日別来店者数 観測値:実際に取得されたデータ トレンド:観測値から特定時点の要因を排除した潜在的な値 •  トレンドの変化を抽出することで時点の変化に関わる影響を分析 •  トレンドと観測値を⽤用いて、特定時点での要因による影響を分析
  14. 14. 14 具体例例 q  以下の3つの条件を満たす形で変化するデータについて考える 1.  時点の変化に伴う変化量量は、1時点前の変化量量と同様となる傾向がある 2.  時点の変化に伴って⼀一定のノイズが発⽣生する 3.  実際の観測に伴って⼀一定のノイズが発⽣生する •  t時点における変動している変数をµtと置 く •  (仮定1から)µtは、µt-µt-1=µt-1-µt-2を満た す µt=2µt-1-µt-2 •  (仮定2から)ノイズをvtのN(0, σ1 2)に従 う正規分布とする(更新ノイズ) •  t時点における観測値をytと置く •  (仮定3から)ノイズをwtのN(0,  σ2 2)に 従う正規分布とする(観測ノイズ) 時点の変化に関わる影響 特定時点での要因による影響 µt-2 µtµt-1 yt-2 yt-1 yt ytはyt-1からの影響は受けず、µtからの影響のみ受けるトレンド
  15. 15. 15 時点の変化に関わる影響 特定時点での要因による影響 ベクトル・行列で表現 一般化 システムモデル 観測モデル 状態ベクトル 線形ガウス状態空間モデル
  16. 16. u  状態空間モデルでは、潜在変数を含む状態ベクトルを⽤用 いて時系列列データの分析を⾏行行う –  時点の変化に伴って推移するトレンド成分を抽出することで、 トレンドの動きとトレンドと実測値の関係の分析が可能になる u  線形ガウス状態空間モデルはシステムモデル・観測モデ ルの2つにより構成される –  システムモデルにより時点の変化による影響を分析 –  観測モデルに特定時点の要因による影響を分析 16
  17. 17. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 17
  18. 18. 18 あるレストランの⽇日別来店者数 2nd week1st week トレンドの週平均 トレンドの週平均 (月) (火) (水) (木) (土) (金) (日) (月) (火) (水) (木) (土) (金) (日) 時点の変化に関わる曜日の影響のみをモデルとして表現 時点の変化の関係をシステムモデルに組み込んでいく
  19. 19. 19 時点の変化に関わる影響 特定時点での要因による影響 曜日効果の取込 状態ベクトルを拡張することで、曜⽇日効果も表現できる 観測モデルへの反映 Ø  観測モデルはその時点の 成分以外は排除する
  20. 20. u  状態ベクトルに対して、1週間の和がゼロとなるような 成分を加えることで、曜⽇日効果を組込むことが可能 –  観測モデルでは、実測値に影響を与える成分をその時点のもの に限定することで、時点の変化による影響と区別する 20
  21. 21. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 21
  22. 22. 22 あるレストランの⽇日別来店者数 割引実施 時点の変化に関わらず一定の値を持つ成分を表現 ⼀一定の値を持つ成分をシステムモデルに組み込み、割引効果を測定 割引の実施は、時点の変化とは無 関係に、特定の日のみ影響を与え る
  23. 23. 23 時点の変化に関わる影響 特定時点での要因による影響 時点によらない項の組込 時点によらない成分を組込むことで、値引き効果も表現できる 観測モデルへの反映 ftはt時点の値引きの 有無を表すフラグ
  24. 24. u  マーケティング変数は、システムモデルで時点の変化を 排除することでモデルへの組み込みが可能 –  不不定期な割引など、周期性がないマーケティング施策に関する 変数は、時点の変化による影響がないようにモデルに組み込む 24
  25. 25. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 25
  26. 26. 26 1期先予測とフィルタリングを⽤用いて状態ベクトルの分布を推定 概要 t-‐‑‒1時点までの実測値のデータを利利⽤用して、t期にお けるxtの分布を考える 予測分布 フィルタ分布 分布 t時点まので実測値のデータを利利⽤用してt時点でのxt の分布を考える t-1のフィルタ分布 t-1の予測分布 i時点の状態 予測 予測 予測 フィルタリング フィルタリング i時点のデータ を利用
  27. 27. 27 過去を振り返って状態ベクトルを表現し、定性的な⽰示唆が得られる i時点の状態 予測 予測 予測 フィルタリング フィルタリング i時点のデータ を利用 固定区間平滑滑化アルゴリズム ü  予測分布とフィルタ分布によりT時点までのデータを⽤用いてp(xT|yT)がわかってい る →  T-‐‑‒1から逐次的に状態ベクトルを求められる フィルタ分布 予測分布
  28. 28. 28 フィルタリング q  逐次学習型の状態空間モデルにおけるパラメータ推定では、予測分布・フィルタリン グ・平滑滑化を繰り返すことで、状態ベクトルを求めていく •  線形ガウス状態空間モデルにおいて、利用 される •  最小化する推定誤差にガウス分布を仮定 •  計算速度が速い •  ⾮非線形の状態空間モデルに対応するフィ ルタリングアルゴリズム •  粒粒⼦子(パーティクル)を発⽣生させてノン パラメトリックに最適解を求める カルマンフィルタ パーティクルフィルタ バッチ学習を行う際にはフィルタリングではなく、MCMCの利用も可能
  29. 29. u  Stanを⽤用いたMCMCでのパラメータ推定の例例は下記に完全版があ ります(データもあります) 29
  30. 30. u  状態空間モデルでは、予測分布・フィルタ分布・平滑滑化 分布の3つを利利⽤用し、トレンドの推定・予測を⾏行行う –  予測分布により⼀一期先の予測を⾏行行う –  フィルタ分布に特定時点における状態ベクトルの分布を表現す る –  平滑滑化分布により以前の時点における状態ベクトルの分布を表 現する u  カルマンフィルタを利利⽤用することで⾼高速な計算・オンラ イン学習が可能 30
  31. 31. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 31
  32. 32. u  状態空間モデルとはシステムモデルと観測モデルを⽤用い て、分析を⾏行行うメタモデル –  システムモデルと観測モデルは⾃自由に設定できる –  ⾮非線形のモデルを利利⽤用した場合は、パーティクルフィルタを利利 ⽤用することで、状態ベクトルを求めることが可能 u  パラメータの推定は必ずしも逐次学習をする必要はない –  バッチ処理理にはMCMCを⽤用いた推定が可能 32
  33. 33. u  状態空間モデルの概要 v  予測にいかす統計モデリングの基本  樋⼝口知之(2011) v  データ同化⼊入⾨門  樋⼝口知之(2011) v  時系列列解析⼊入⾨門  北北川源四郎郎(2005) v  Rによるベイジアン動的線形モデル  G.ペトリス,  S.ペトローネ,  P.カンパニョー リ,  和合  肇,  萩原  淳⼀一郎郎(2013) u  状態空間モデルの活⽤用について v  時系列列解析⼊入⾨門  北北川源四郎郎(2005) u  その他 v  RStanで『予測にいかす統計モデリングの基本』の売上データの分析をトレース してみた  berobero11(2013) v  逐次モンテカルロ/(粒粒⼦子|パーティクル|モンテカルロ)フィルタを実装してみた   teramonagi(2014) 33
  34. 34. ご静聴ありがとうございました。 34

×