Tokyo r30 anova

11,039 views

Published on

Rによる分散分析

  • Be the first to comment

Tokyo r30 anova

  1. 1. Rによるやさしい統計学分散分析(後半)TOKYO.R #30簑田 高志
  2. 2. 目次1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ※ スクリーンショットや機能等はMac版となります。基本的にはWindowsも同じものがあるはずです。
  3. 3. 目次1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ※ スクリーンショットや機能等はMac版となります。基本的にはWindowsも同じものがあるはずです。今回はここまで
  4. 4. 目次1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ※ スクリーンショットや機能等はMac版となります。基本的にはWindowsも同じものがあるはずです。
  5. 5. • 名前 :簑田 高志• Twitter :aad34210• ブログ :http://pracmper.blogspot.com/• 仕事 :ビジネスアナリスト• R歴 :3年程度自己紹介
  6. 6. 目次1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ※ スクリーンショットや機能等はMac版となります。基本的にはWindowsも同じものがあるはずです。
  7. 7. 分散分析(おさらい)• 分散分析3つ以上の平均値を比較するための統計的方法2つの平均値を比較する方法は「t検定」テキスト160p~から• Rにおける関数 oneway.test aov anova
  8. 8. 目次1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ※ スクリーンショットや機能等はMac版となります。基本的にはWindowsも同じものがあるはずです。
  9. 9. 二元配置分散分析(対応なし)うちのミネラルウォーター商品って、銘柄ごとに温度が違えば、おいしさって違うのかな。おーい、ちょっとしらべてくれーはいはい、了解しましたっと。データのフォーマットはこれでよさそうだな。これで分析にかけてみよう。
  10. 10. 二元配置分散分析(対応なし)課題:自社商品は銘柄ごとに温度が変わると美味しさがかわるのか?条件が2つあるので、二元配置分散分析(対応なし)でいけそう
  11. 11. 二元配置分散分析(対応なし)2つの条件の組み合わせによって母平均が異なるかどうかを検定 二元配置分散分析
  12. 12. 二元配置分散分析(対応なし)• ミネラルウォータのおいしさに関する実験データ• この中で「温度の違い」、「銘柄の違い」がどちらも母平均に影響を及ぼしている このような平均に違いをもたらす原因を「要因」 ある要因の中に含まれているここの条件を「水準」上記データでいうと、要因: 冷蔵(冷蔵庫)、常温(常温)水準: イカアン、ボスビック、ビビッテル
  13. 13. 二元配置分散分析(対応なし)• 主効果:それぞれの要因ごとの効果 “温度の違い”(冷蔵か常温に違いがある)• 交互作用効果:2つ以上の要因が組み合わされた場合に生じる効果。単純に2つの要因の足し算ではない 温度が冷たい場合、5点押し上げる ビビッテルは温度が低いと美味しくない→ 単純な足し算ではない主効果交互作用効果
  14. 14. 二元配置分散分析(対応なし)• 実際に分析1. 帰無仮説と対立仮説の設定• これまでの検定と同じように1つの仮説では無く、「主効果」、「交互作用効果の設定が必要• 要因A(温度)の主効果− 帰無仮説:温度が違っても美味しさの得点の母平均は等しい− 対立仮説:温度の違いによって美味しさ得点の母平均は異なる• 要因B(銘柄)の主効果− 帰無仮説:銘柄が違ってもおいしさ得点の母平均は等しい− 対立仮説:銘柄の違いによって、母平均は異なる• 要因Aと要因Bの交互作用効果− 帰無仮説:温度と銘柄の組み合わせに相性の良し悪しはない− 対立仮説:温度と銘柄の組み合わせに相性の良し悪しがある2. 有意水準• 5%
  15. 15. 二元配置分散分析(対応なし)• Rで分析#データの準備##乱数を発生させ、おいしさ得点を生成##set.seed関数で常に同じ得点が出るように設定set.seed(10)taste_points <- abs(round(rnorm(30) * 10 , digits = 0))+1##温度temp <- factor(c(rep("refrige", 15), rep("normal_temp",15)))##ボトル名bottle_name <- factor(c(rep("evian", 15), rep("volvic",15) , rep("vittel",15)))
  16. 16. 二元配置分散分析(対応なし)• Rで分析#データの準備set.seed(256) #乱数の再現taste_points <- as.integer(runif(30 , min = 1 , max = 20))#温度temp <- factor(c(rep("refrige", 15), rep("normal_temp",15)))#ボトル名bottle_name <- factor(rep(c(rep("evian", 5), rep("volvic",5) , rep("vittel",5)),2))
  17. 17. 二元配置分散分析(対応なし)• Rで分析summary(aov(taste_points~temp*bottle_name))分散分析関数目的変数 説明変数
  18. 18. 二元配置分散分析(対応なし)• Rで分析帰無仮説の棄却 or 採択1. 温度の主効果: 5%水準で有意な効果が無い2. 銘柄の主効果: 5%水準で有意な効果が無い3. 温度・銘柄の交互作用効果:5%水準で有意な効果はある(p = 0.042)
  19. 19. 二元配置分散分析(対応なし)• Rで分析Interaction.plotで図示interaction.plot(temp , bottle_name , taste_points)Vittel:冷たいほうが美味しいVolvic:あまり変わらないEvian:冷たいほうが美味しくないP187のように、交差しているため交互作用効果がある
  20. 20. 二元配置分散分析(対応なし)• Rで分析Interaction.plotで図示interaction.plot(bottle_name , temp , taste_points)常温:Evianが美味しい冷蔵庫:Vittelが美味しいP187のように、交差しているため交互作用効果がある
  21. 21. 二元配置分散分析(対応なし)• まとめ1.主効果と交互作用効果2.仮説の立て方3.aov関数4.Interaction.plot5.交互作用が起こっているグラフの見方
  22. 22. 次回
  23. 23. 交互作用があって、温度によって差がありそうだってことはわかったげ・・・でもさー、もしかして評価した人のバイアスってかかってない??そこも評価してみてよー
  24. 24. 目次1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめやるかもね
  25. 25. ご静聴ありがとうございました

×