More Related Content
Similar to Optimizing AIC in Questionnaire Analysis
Similar to Optimizing AIC in Questionnaire Analysis (20)
Optimizing AIC in Questionnaire Analysis
- 2. 4/19/2014 2
自己紹介
Twitter ID: @tanimocchi
(もっちぃ)
数学科出身、博士(情報科学)
所属:タヒにかけ半導体
仕事:マーケティングなのか?
新規事業開拓なのか?
統計解析は必要! だと信じてる
統数研公開講座には時折参加してますので、ご一緒の際は宜しくお願いします。
アンケート設計・分析にも従事 ← 今回はココからネタ作成
ちなみに、Rは第30回のTokyo.Rでインストールしました。
⇒ 今回の資料には、やっとRのコード片(極僅か)が登場します!
38th Tokyo.R
- 9. 4/19/2014 9
目的変数に関係なさげな説明変数
仮定1:紹介対象製品は、誰でも割と容易に購入可能
実際には、そうでない場合もあるので、常に成り立つわけではないん
だけど、細かい事は気にしないって事で
仮定2:紹介対象製品は、広い意味で割と知られている
「何ぞこの仮定?」 って思うかもだけど、業界だったら、x86互換
チップといった場合の“x86”が何かは広く知られている、そんな感じ
38th Tokyo.R
採用中製品
次期採用予定品
採用ポイント
∋紹介対象製品
購入ルート
情報収集ルート
×あんま関係ないでしょ……多分w
- 14. 4/19/2014 14
有意確率に着目してStep繰返し実行
有意確率が10%以下の変数だけからなるモデルが得られる
まで、変数指定を実施しながら、Stepを実施。
前処理で、csvファイルを関係する変数だけのものに修正
R内部で処理するとしんどいので、変数選択とかはスクリプト(awkと
かsedとかgrepとかそんなんで)で適当に実施し、Rコマンドを生成
38th Tokyo.R
ほげほげ <- read.csv("ファイル名.csv", header=TRUE)
ほげほげ.glm <- glm(formula = 紹介対象製品名~,data=ほげほげ, family=binomial)
sink(“ほげほげ.txt")
print(summary(ほげほげ.glm))
print(extractAIC(ほげほげ.glm))
#
# ここで一旦途絶えて、“ほげほげ.txt”をスクリプトで処理していたり……
#
ほげほげ.glm <- glm(formula = 紹介対象製品名~ 生き残った変数1+生き残った変数2
+……,data=ほげほげ, family=binomial)
sink(“ほげほげ2.txt")
ほげほげ.glm2 <- step(ほげほげ.glm)
print(summary(ほげほげ.glm2))
- 15. 4/19/2014 15
まぁこれ、アカンやつですよね
説明変数に、「採用中製品」しかない!
とはいえ、他の紹介対象製品での結果含めて眺めてみると、並んだ
製品名は、「確かに移りたいかもなぁ」とか「それ使ってたら移りたくな
いよねぇ」とか思えるようなものではあった。
「カテゴリー」または「展示品(製品の使い様)」が無いのは寂し
い! ⇒ AICを改善するバッチリな変数追加がしたい!
「採用のポイント」、実は有意な相関が見られないって、設問間の全2
×2クロス表の分析や市場特性から、事前に分かっていたり……
38th Tokyo.R
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.2524 0.1125 -28.919 < 2e-16 ***
採用中製品1 2.7092 0.1694 15.998 < 2e-16 ***
採用中製品2 1.3652 0.2004 6.813 9.56e-12 ***
採用中製品3 0.5151 0.2274 2.265 0.0235 *
AIC: 1135.3
- 18. 4/19/2014 18
結果:他の変数はそのまま同じで改善
38th Tokyo.R
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.2524 0.1125 -28.919 < 2e-16 ***
採用中製品1 2.7092 0.1694 15.998 < 2e-16 ***
採用中製品2 1.3652 0.2004 6.813 9.56e-12 ***
採用中製品3 0.5151 0.2274 2.265 0.0235 *
AIC: 1135.3
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.3674 0.1307 -25.757 < 2e-16 ***
採用中製品1 2.6983 0.1698 15.895 < 2e-16 ***
採用中製品2 1.3925 0.2020 6.894 5.42e-12 ***
採用中製品3 0.5172 0.2277 2.271 0.0231 *
カテゴリーX 0.3182 0.1680 1.894 0.0582 .
AIC: 1133.8 紹介対象製品が属するカテゴリー