More Related Content
PDF
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~ PDF
PPTX
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章 PDF
なぜ統計学がビジネスの 意思決定において大事なのか? PDF
PDF
『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの PDF
PDF
More from . .
PDF
PDF
統計モデリングで癌の5年生存率データから良い病院を探す PDF
Stanの紹介と応用事例(age heapingの統計モデル) PDF
PDF
PDF
データ解析で割安賃貸物件を探せ!(山手線沿線編) LT PDF
PDF
とある病んだ院生の体内時計(サーカディアンリズム) PDF
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた PDF
100人のための統計解析 和食レストラン編
- 1.
- 2.
- 3.
第2章 和食レストラン
過去3か月に来店経験ある人に対して,
平日夜の利用に関するアンケートデータ(1000人分)
調査
ID
年齢 性別家族構成
CM
イメージ
来店
回数
利用
金額
定食 麺 丼 デザート
サイド
メニュー
ソフト
ドリンク
お酒
5 54 女性 未婚 3 0 0 1 0 1 0 0 0 0
9 46 女性 未婚 2 0 0 1 0 0 0 0 0 0
11 27 女性 未婚 3 0 0 1 1 0 0 0 1 0
12 35 女性 未婚 3 1 2200 1 0 1 0 0 1 0
… … … … … … … … … … … … … …
908 33 男性 既婚(子供なし) 3 0 0 1 1 1 0 0 0 0
965 35 男性 既婚(子供なし) 3 6 700 1 1 1 0 0 0 1
979 46 男性 既婚(子供なし) 4 1 2000 1 1 0 0 1 0 1
987 34 男性 既婚(子供なし) 3 0 0 1 1 1 0 0 0 0
昼夜問わず
メニュー注文経験
1来店あたりの
典型的な利用金額
平日夜の来店回数
- 4.
書籍の手法&結論
CMイメージ お酒 年齢定食 女性
• 来店回数×利用金額 を 総利用金額 と定義し,
応答変数 として重回帰
• Rでは以下と同じ
– lm( 総利用金額 ~
年齢 + 性別 + 既婚(子供なし) + 既婚(子供あり) + CMイメージ +
定食 + 麺 + 丼 + デザート + サイドメニュー + ソフトドリンク + アルコール,
data=d)
• 結論: 総利用金額upするには,
- 5.
- 6.
- 7.
はじめは 散布図行列
• corrplot{corrplot}
– キレイ 散布図が表示できない
• pairs {graphics}
– インストール不要 相関係数出すにはカスタム必要
• ggpairs {GGally}
– キレイ {ggplot2}に慣れが必要
☺ ☹
☺ ☹
☺ ☹
- 8.
- 9.
- 10.
- 11.
- 12.
- 13.
教科書
通称: 久保本, 久保緑本,久保岩波本
訂正情報: http://hosho.ees.hokudai.ac.jp/~kubo/ce/IwanamiBookErrata.html
- 14.
- 15.
- 16.
- 17.
- 18.
- 19.
- 20.
- 21.
計算時間
来店回数 × 利用金額の
RMSE (円)
個体差なしモデル 6 min (Stan) 4607
個体差ありモデル 60 min (Stan) 1272
(参考) 重回帰 lm() < 1 s 4623
予測値
(円)
誤差
(円)
以降では 個体差なしモデル を紹介
- 22.
- 23.
- 24.
- 25.
結果 | 回帰係数
•夜間に来店する確率 up:
– 年齢 CMイメージ 女性 定食
• 常連度 up:
– 年齢 デザート CMイメージ 女性
• 1来店あたりの利用金額 up:
– 既婚(子供なし) 女性 既婚(子供あり)
お酒 年齢
- 26.
- 27.
- 28.
参考URL (予定含む)
• 散布図行列のRコードと説明
–http://heartruptcy.blog.fc2.com/blog-entry-147.html
• BUGSコード, Stanコードと説明
– http://heartruptcy.blog.fc2.com/blog-entry-148.html