Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Doing Baysian Data Analysis Chapter19

282 views

Published on

Published in: Education
  • Be the first to comment

  • Be the first to like this

Doing Baysian Data Analysis Chapter19

  1. 1. + Chapter 19 Metric Predicted Variablewith Multiple Nominal Predictors
  2. 2. + Contents  19.1 Bayesian Multifactor ANOVA  19.2 Repeated Measures, a.k.a. Within-Subject Designs  19.3 R Code  19.4 Exercises 1
  3. 3. + Poem  Sometimes I wonder just how it could be, that Factors aligned so you’d end up with me. All of the priors made everyone think, that Our interaction was destined to shrink.  あなたが一直線に並べた要因が私と一緒になってしまったら、 いったいどの様になってしまうのか、私は時々不思議に思う。 全ての事前分布のために、私たちの交互作用が縮小する運命に あると誰もが考える。 2
  4. 4. + Outline  複数の名義尺度の説明変数を用いたモデル  多変量ANOVAと同様、説明変数間での交互作用を想定  ただし、F分布ではなく、階層事前分布を使用  支持政党や民族によって収入を予測するモデル  用いる腕が利き腕か否かや刺激の種類によって反応時間を予測する モデル 3
  5. 5. + Outline 4
  6. 6. + 19.1 Bayesian Multifactor ANOVA  ぞれぞれの名義尺度変数のβの合計は0という制約条件はイキ  各変数(の水準)の効果をベースラインと足し合わせる 5
  7. 7. + 19.1.1 Interaction of Nominal Predictors  同じグラフでも異なる解釈が存在、左のグラフの矢印は交互作 用を示す  一方の変数の水準を固定した時、もう一方の変数の各水準の交 互作用の逸脱度の和はゼロ 6
  8. 8. + 19.1.1 Interaction of Nominal Predictors  中央のグラフは、X2に依存したX1の効果  右のグラフは、X1に依存したX2の効果 7
  9. 9. + 19.1.1 Interaction of Nominal Predictors  ベースラインからの平均逸脱度は“主効果”  他の変数を固定した時の平均逸脱度は“単純効果”  交互作用がある場合、“主効果”と“単純効果”は等しくない 8
  10. 10. + 19.1.2 The Hierarchical Prior  各変数と交互作用に対して、それぞれ超事前分布を置く 9
  11. 11. + 19.1.2 The Hierarchical Prior  Yiは正規分布、簡略化のためとANOVAと比較しやするするた めに、分散の均一性を仮定  各変数と交互作用に対して、個別に超事前分布を置くため、一 つの変数の効果が分かったとしても、他の変数の効果に関する 情報は得られない  一方で、変数内の各水準の逸脱度は、同変数内の他の水準の逸 脱度に対する情報を与える(超事前分布、事前分布が共通のた め) 10
  12. 12. + 19.1.3 An Example in R and BUGS  4つの学部と3つの職階で平均給与のモデルを作る  Y:平均給与 X1:学部 X2:職階  各水準の組み合わせでサンプル数が大きく異なると、通常の ANOVAでは計算上問題が生じるが、BANOVAでは問題ない 11
  13. 13. + 19.1.3 An Example in R and BUGS  非線形の交互作用が認められる  化学先攻の准教授の例)$89,117 → $78,179 12
  14. 14. + 19.1.4 Interpreting the Posterior  BFIN vs CEDP : 95%HDIがゼロから大きく乖離 → 有意な 差  CEDP vs THTR : 95%HDIがゼロを含む→ 有意な差はない  同様に、FT1 vs FT2、FT2 vs FT3も有意な差 13
  15. 15. + 19.1.4 Interpreting the Posterior  ただし、各変数の主効果は、あくまでも“平均の効果”  全ての学部においてFT2とFT3の差異は同じではなく、実際に は交互作用の影響がある  そのため、相互作用を無視して各水準の効果を語るのは誤り 14
  16. 16. + 19.1.4.1 Combining Metric and Nominal Predictors : ANCOVA  勤続年数を加味した上で、学部や職階による影響を評価したい  そこで“共変量”を加味した“共分散分析 : ANCOVA”を行う  ANCOVA : 線形回帰とANOVAの合わせ技、ANOVAと同様に各 水準の逸脱度の和はゼロ  共変量の係数は、水準毎に変えることが可能  総合的な傾きと水準毎の傾きに分離  水準毎の傾きの和はゼロ  水準毎の傾きは正規分布(もしくはt分布)  繰り返しのある線形回帰と本質的には同質、しかし多変量への 拡張の方法が異なる(逸脱度の和がゼロ) 15
  17. 17. + 19.1.4.2 Interaction Contrasts  “交互作用の比較”: 差異の差異、“主効果の比較”の外積 16
  18. 18. + 19.1.4.2 Interaction Contrasts  (CHEM.FT1−CHEM.FT3)−(THTR.FT1−THTR.FT3)は有意  (BFIN.FT1−BFIN.OTHER)−(OTHER.FT1−OTHER.OTHER)は 有意ではない 17
  19. 19. + 19.1.5 Noncrossover Interactions, Rescaling, and Homogeneous Variances  データを非線形変換した場合、非加算的な項も変化するため、 交互作用を考える際、スケールが重要になる  政党と性別による収入の例)対数変換により交互作用はなくなる  スケールは単一ではなく、慣例的に決められる 18
  20. 20. + 19.1.5 Noncrossover Interactions, Rescaling, and Homogeneous Variances  左のグラフでは、対数変換により交互作用が消失  交互作用から非交互作用への変換は、線分が交わらず、傾きの符号 が同じ場合にのみ可能  中央のグラフの様に線分が交差する場合は、交互作用は残る  右のグラフは、中央のグラフのX1とX2を入れ替えたもので、 傾きの符号が異なるため、相互作用は残る  水準内の分散を変えることでも交互作用は消失する  変換により分散の均一性を担保できるかは不明  担保できない場合は、均一とみなせる様にデータを変換するか、不 均一な分散を許容できる様にモデルを変更する必要がある 19
  21. 21. + 19.2 REPEATED MEASURES, A.K.A. WITHIN-SUBJECT DESIGNS  同じ被験者に条件を変え、繰り返しテストを行う方法を“繰り 返し測定デザイン”もしくは“被験者内デザイン”と呼ぶ  説明変数に個々の被験者の効果を3番目の効果として追加  刺激の種類と利き腕か否かの例)  2次、3次の相互作用も加味、ただし計算が大変 20
  22. 22. + 19.2 REPEATED MEASURES, A.K.A. WITHIN-SUBJECT DESIGNS  被験者のパラメータを推定するための事前分布を与えるため、 他の被験者の推定値に関する情報を得ることができる  また、被験者間をまたいだ“グループレベル”での超事前分布と 事前分布を与えることで、被験者レベルではなく、グループレ ベルでの“shrinkage”が実現可能 21
  23. 23. + 19.2 REPEATED MEASURES, A.K.A. WITHIN-SUBJECT DESIGNS  一方、被験者への負荷の観点からデータ収集には制約があり、 被験者一人から一つのデータしか収集できないケースがある  その場合でも、BANOVAは実行可能だが、データ数よりもパラ メータ数の方が多くなってしまい、パラメータ推定が極めて困 難になるため、モデルのパラメータ数を削減する必要がある  被験者の効果がベースラインにのみ影響するモデルに修正  被験者の効果と処理パターンの効果の交互作用を削除 22
  24. 24. + 19.2.1 Why Use a Within-Subject Design? And Why Not?  “被験者内デザイン”は“被験者間デザイン”より精度が高い  同じ被験者からテスト条件を変えて、繰り返しデータ取得した方が 精度が高くなる  他の被験者からデータ取得した場合、被験者間での水準効果の差異 はランダムサンプリングの影響を強く受けるため、制度が落ちる  しかしながら、“被験者内デザイン”にも問題がある  同じ被験者でも常に同じ状態にある訳ではなく、同じ被験者と言い がたい(学習効果や疲労などの影響)  学習効果や疲労の影響が全ての実験条件で等しい場合、実験条 件(の順番)をランダマイズすることで、その影響は排除可能  しかしながら、実際には影響が全ての実験条件で等しいとは限 らず、影響が比較可能とは言い切れない 23
  25. 25. + 19.2.1 Why Use a Within-Subject Design? And Why Not?  さらに、次の実験への持ち越し効果も考えられる  持ち越し効果を数学的に解明することは不可能  持ち越し効果が強く疑われる場合、“被験者間デザイン”に立ち戻り つつ、被験者間のノイズを極力排除するために多くの被験者で実験 を行うようにする  一般的に全てのモデルは観察の独立性を仮定しているが、繰り 返し測定の場合、この仮定の正当性は弱いため、実験条件をラ ンダマイズして、持ち越し効果を最小化する様に努める必要が ある 24

×