Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

混合モデルを使って反復測定分散分析をする

43,489 views

Published on

2014年12月21日第7回DARM勉強会で行われた「混合モデルを使って反復測定分散分析をする」の資料です。

Published in: Education
  • Be the first to comment

混合モデルを使って反復測定分散分析をする

  1. 1. 混合モデルを使って 反復測定分散分析をする 井関龍太 (理研BSI-トヨタ連携センター) 第7回DARM勉強会(2014.12.21) ※この発表は個人の見解に基づくものであり, 所属する組織の公式見解によるものではありません
  2. 2. 本日の概要 混合モデルとは 混合モデルによる反復測定分散分析 混合モデルを活用する 欠測値に強い 材料の違いを変量効果で表す 試行系列の効果を組み込む 事後検定をどうするか 今後の課題 1
  3. 3. 本日の概要 混合モデルとは 混合モデルによる反復測定分散分析 混合モデルを活用する 欠測値に強い 材料の違いを変量効果で表す 試行系列の効果を組み込む 事後検定をどうするか 今後の課題 2
  4. 4. 混合モデルとは 名称は違うがだいたい同じ (一般線形)混合モデル マルチレベルモデル 階層線形モデル 分野によって強調する部分や主な利用法が違う 反復測定分散分析の文脈では,混合モデ ルがよく用いられる 固定効果と変量効果を柔軟に組み合わせて (混ぜて)分析する 「混合要因計画」と混同しそうなのが難点 3
  5. 5. 固定効果と変量効果 固定効果:考慮したい水準をすべて含む 実験の文脈でいえば,研究者が意図的にコン トロールしている変数 主にカテゴリカルだが,そうでないこともあ る(SOAの水準は250, 500, 750 msなど) 変量効果:考慮しようとするすべての水 準を含まない 各水準は母集団から抽出した標本であると考 える(たとえば,個々の参加者,参加者が属 する集団,個々の刺激など) 4
  6. 6. 通常の分散分析と混合モデル 通常の分散分析 要因効果:固定効果 誤差効果:変量効果 変量効果は,特殊な 仮定を置いて固定効 果の推定法を用いて 算出している 変量効果を通常のモ デルから増やすこと はできない 混合モデル 要因効果:固定効果 誤差効果:変量効果 変量効果を実際に推 定する(仮定の置き 方も柔軟に変更可) 変量効果をたくさん 設定できる 変量傾き効果も設定 できる 5
  7. 7. 柔軟なモデル化によるメリット ネストした複雑なデザインを扱える 例1:名詞と動詞の再生成績を比べたい すべての水準(すべての単語)をリストアップし ているとは考えられない また,語によっておぼえやすさが均質でなさそう →参加者に加えて単語を変量効果に設定 例2:3つのニューロンから20~25ずつのシ ナプスを採取(Aarts et al., 2014) 独立のデータとして扱うのは不適切 かといって,ニューロンごとに平均したらN = 3 になってしまい,検出力不足 →ニューロンとシナプスの両方を変量効果に設定 6
  8. 8. 本日の概要 混合モデルとは 混合モデルによる反復測定分散分析 混合モデルを活用する 欠測値に強い 材料の違いを変量効果で表す 試行系列の効果を組み込む 事後検定をどうするか 今後の課題 7
  9. 9. 混合モデルを使って分散分析する 混合モデルを使って分散分析を行う方法 を具体的に学ぶ まず,通常の分散分析を再現する そのあとで拡張的な利用法の例を見ていく Rによる混合モデル分析 無数のパッケージ:nlme,lme4,glmmML, MCMCglmm,pedigreemm,lqmm, minque……etc.(まだまだ増えそう) →どれを使っていくか? 8
  10. 10. 最尤法と制約付き最尤法 ML REML 固定効果の扱い 既知 未知 変量効果の分散 過少推定 不偏 モデルフィット 平均+分散 モデル 分散モデルのみ 尤度比検定 可能 不可 9 分散分析の代替として使うならREML(釣り合い型 デザインで同じモデルを組めば結果は一致する)
  11. 11. 代表的な2つのRパッケージ nlme lme4 開発状況 安定している 活発 実行速度 遅い 速い 推定アルゴリズム 古い 新しい 自由度の推定 不可 サポートパッケー ジがある 10 一般的な分散分析モ デルでもけっこう推 定不能になる このあとは基本的に lme4を使用
  12. 12. しかし,lme4は…… p値を出力しない 混合モデルでは分母の自由度(ddf)を決定 することが難しい さまざまな議論があり,“正解”がない (結果として,検定も困難) なので,そもそも分母の自由度を出さないの がlme4の方針 p値なんてなくてもいい,とまで悟りき れないならどうするか? lme4の出力を使って再計算を行うパッケージ 11
  13. 13. REMLにおけるddf推定法 名称 説明 状況 residual 残差自由度 非推奨 containment 変量効果も考慮 Rのnlmeパッケージ 非推奨 between-within 通常の分散分析のdf 非推奨 Satterthwaite Welch- Satterthwaiteの発展 SASのオプション Keward-Roger (1997) Wald統計量の発展版 SASのオプション 現在評価が高い ブートストラップ ブートストラップで 推定 Rのpbkrtestパッケー ジで使える Kenward-Roger (2009) 1997年版の アップデート ? 12
  14. 14. パッケージの依存関係 依存元パッケージの仕様が変わると依存パッ ケージが使えなくなることがあるので注意 13 lme4パッケージ pbkrtestパッケージ lmerTestパッケージ REML推定 Kenward-Roger 分散分析表
  15. 15. ここからの分析に必要なパッケージ Rの「lmerTest」パッケージをインストー ルしておく 必要なパッケージもいっしょに入る 「lmerTest」パッケージを起動して準備 しておく 起動すると,lme4のlmer関数やstatsのstep 関数がマスクされる(そして,lmerTestのも のに置き換えられる)のがわかる 14
  16. 16. モデル式を作ろう Rでは「モデル式」を使って統計モデルを 指定する 回帰モデル,分散分析モデルなど 「モデル式」は,データフレームと対応 づけて指定するのが簡単 単回帰式の例:y ~ A 15 y A 12 2 9 3 5 5 8 3 11 4 分析に使うデータ フレームのヘッダ と対応させる
  17. 17. モデル式の基本的なルール 主な記号の使い方 「~」…右辺と左辺をつなぐ (「=」と考えるとよい) 「+」…同じ辺の中で複数の変数をつなぐ 例:「y ~ A + B」は,独立変数AとBを使って従属 変数yへの回帰を指定する式 「:」…交互作用を表す 例:「y ~ A + B + A:B」は2つの独立変数AとB に交互作用項A:Bを加えた回帰式 「*」…主効果と交互作用を一度に指定する 例:「y ~ A * B」は「y ~ A + B + A:B」と同じ 16
  18. 18. 関数の中での使い方 関数(モデル式, data=データフレーム名) 例:lm(y ~ A + B, data = dat) 17 y A B 12 2 4 9 3 5 5 5 3 8 3 4 11 4 2 分析に使うデータ フレームのヘッダ と対応させる データフレームを 「dat」という変数名 で保存している場合
  19. 19. lmerに特有のルール 「()」は変量効果を表す 実験者がコントロールしきれない変数による 効果を当てる(参加者,刺激,その他) 刺激による違いを統制したい場合 「(1|stim)」…stimというヘッダの列に刺激 の違いを表す変数を入力してある場合 各項目に異なる切片を仮定する 参加者効果(被験者内要因)を表す場合 「(1|s)」…sというヘッダの列に参加者の違 いを表す変数を入力してある場合 各参加者に異なる切片を仮定する 18
  20. 20. 反復測定デザインのモデル式 変量効果として参加者ID及び参加者ID×被験者内 効果の交互作用を指定する  sAデザイン:y ~ A + (1|s)  sABデザイン:y ~ A * B + (1|s) + (1|s:A) + (1|s:B)  AsBデザイン:y ~ A * B + (1|s) 被験者内要因がひとつのときは,参加者ID×被験者内効果の交互 作用は指定しない(推定不能になる)  ABsCデザイン:y ~ A * B * C + (1|s)  AsBCデザイン:y ~ A * B * C + (1|s) + (1|s:B) + (1|s:C)  ABsCDデザイン:y ~ A * B* C * D + (1|s) + (1|s:C) + (1|s:D) 19
  21. 21. lmer関数を適用した後にanovaする > m1 <- lmer(y ~ A + (1|s), data = dat) > anova(m1, ddf = “Kenward-Roger”) ddfを指定しなかった場合,デフォルトの Satterthwaiteが使われる さっそく試してみよう sA:一要因被験者内計画 sAB:二要因被験者内計画 早く終わったら通常の分散分析をした場合の結果 と比較してみてください lmer関数による分析 20
  22. 22. データ例:sAデザイン Loftus & Masson(1994)のTable 2 自由再生実験の人工データ 20語の単語リストをおぼえてから自由再生 単語ごとの学習時間を操作 a1=1秒 a2=2秒 a3=5秒 N = 10 21
  23. 23. データ例:sABデザイン  Maxwell & Dalaney (2004)のTable 12.1 反応時間実験の人工データ 文字“T”と”I”の弁別課題 A要因:ノイズとして他の文字を同時提示 a1=ノイズなし a2=ノイズあり B要因:提示位置(画面中央からの距離) b1=0° b2=4° b3=8° N = 10 22
  24. 24. 推定がうまくいかないときは エラーチェックの設定を変えてみる 収束基準を上げてみる 実行するマシンによって結果が違うことも… (ハイスペックなマシンのほうがよい?) 23 > options(lmerControl = list(check.nobs.vs.nlev = "ignore", check.nlev.gtr.1 = "ignore", check.nobs.vs.nRE = "ignore")) > options(lmerControl(optCtrl = list(maxfun = 500000)))
  25. 25. 本日の概要 混合モデルとは 混合モデルによる反復測定分散分析 混合モデルを活用する 欠測値に強い 材料の違いを変量効果で表す 試行系列の効果を組み込む 事後検定をどうするか 今後の課題 24
  26. 26. 混合モデルを活用する ここまでの話:混合モデルを使って反復 測定分散分析ができることを確認した ただし,これだけならふつうの分散分析を 使っても同じ 混合モデルを使うことに,具体的にどん なメリットがあるのか? 欠測値に強い 材料の違いによる影響をうまく組み込める くりかえし試行を平均しないで分析できる 25
  27. 27. こんなデータ,どうする? 被験者内計画の実験だけど,一部の水準 だけデータがない人がいる…… 偶然の事故 マシンエラー 不測のトラブル 研究上の制約 縦断的測定(一週間後に 再テストなども含む) 水準への割り付けが条件 つきになっている(基準を達成した場合のみテス ト,エラー試行はRTを除外するなど) 26 a1 a2 a3 10 13 13 6 NA 8 11 14 14 NA 23 25 16 18 NA … … …
  28. 28. 欠測セルがあるデータ 通常の分散分析:欠測セルがあると困る タイプⅣ平方和という手段もあるが,この方 法の評価は高くない ふつうはリストワイズ削除するしかない 混合モデル:ランダムな理由による欠測 値をうまく扱える MNAR(特定の値に限って欠測しやすく,そ のことが他の変数によって説明がつかない) でなければ,そのまま分析できる 27
  29. 29. 欠測データを分析してみる 先ほど使用した,sA,sABデザインの データにランダムに欠測を作ってみよう Rのsample関数が,以下のように使えるので ランダムに5個の欠測を作るなら以下のよう にすればよい sA,sABデザインのデータ例に欠測を作って,欠 測なしの場合と比較してみよう 28 > sample(乱数の最大値,出力の個数) > dat$y[sample(nrow(dat), 5)] <- NA
  30. 30. 本日の概要 混合モデルとは 混合モデルによる反復測定分散分析 混合モデルを活用する 欠測値に強い 材料の違いを変量効果で表す 試行系列の効果を組み込む 事後検定をどうするか 今後の課題 29
  31. 31. 材料の違いによる効果を組み込む 「それ,材料の効果じゃない?」 材料のすべての組み合わせを網羅できない状 況で起こる 言語を材料とする研究でよく問題になる 言語心理学者はどう対応しているか? 参加者を誤差項とする分析(F1)と材料を誤 差項とする分析(F2)の両方を行う →両方の分析で有意になれば,確かな結論が 得られる 30 ……本当に?
  32. 32. F1×F2分析の問題点 結果が一致しないときの解釈が曖昧 実際,しばしば一致しない 多くの場合,F2は検出力不足 F1が有意でなく,F2だけ有意になったりする と解釈困難 そもそも2回分析すると,検定の多重性 に抵触するのでは? この点はあまり議論されないが,おそらく問 題がある 31
  33. 33. 結果をまとめる方法はある 擬似F値(F’)またはその簡便法である min F’を計算する min F’=(F1×F2)/(F1+F2) df1=ndfF1 df2=(F1+F2)2/(F1 2/ddfF2+F2 2/ ddfF1) しかし,どちらの方法にしても検出力は かなり低くなる 現状では,F1×F2分析のほうがふつうに用い られている 32
  34. 34. 混合モデルによる解決 混合モデルなら複数の変量効果を扱える 参加者と材料を同時に変量効果としてモデル 化すればよい 一度に検定できる F1×F2分析の他の合成方法(F’やmin F’)よ り検出力が高い Locker et al.(2003)のデータを例とし て分析 変量効果として項目の効果を加える 33
  35. 35. データ例:Locker et al.(2003) sABデザイン(2×2)の語彙判断課題 subject:参加者の違いを表す(N = 38) item:項目の違いを表す(N = 39) rt:反応時間 freq:ターゲット語と音韻的に近い語の頻度 (高・低の2水準;0.5/-0.5でコード化) size:ターゲット語と意味的に関連する単語 の数(大・小の2水準;0.5/-0.5でコード 化) エラー試行の除外により一部の組み合わせに欠測 34
  36. 36. F1×F2分析をしてみる Locker et al.(2003)のデータを参加者 ごと(subject),項目ごと(item)に平 均して,それぞれ分散分析する 分析用データの変換に手間がかかりそう な場合は,添付資料のconverge関数を使 ってください converge(データフレーム, c(平均せずに残し たい変数の名前), y = 従属変数の変数名) 35 > converge(dat, c("subject", "freq", "size"), y = "rt")
  37. 37. 混合モデルによる分析 1. まずは,参加者のみのモデルを考える  sABデザインのデータとして参加者を変量効 果として扱う 2. 次に,項目のみのモデルを考える  項目は条件にクロスしている(ネストしてい ない)のでABsデザインになることに注意  変量効果は(1|item)のみ 3. 最後に,参加者と項目の両方を変量効果 にしたモデルを作る  1と2を組み合わせる 36
  38. 38. 本日の概要 混合モデルとは 混合モデルによる反復測定分散分析 混合モデルを活用する 欠測値に強い 材料の違いを変量効果で表す 試行系列の効果を組み込む 事後検定をどうするか 今後の課題 37
  39. 39. 試行系列の効果を組み込む 反応時間実験の典型的な分析方法 同一条件に属する複数の試行のデータを平均 し,平均値を各条件の代表値として分析 →しかし,この総計(aggregation)による 方法には問題がある 総計に基づく分析は,観測の独立性の仮 定に反する(Baayen & Milin, 2010) 時系列効果:練習(減少)と疲労(増加) 直前の試行での反応の影響(反応に長くか かった試行の後は速く反応できないなど) 38
  40. 40. 混合モデルによる解決 混合モデルでは,総計しなくてもそのま ま分析できる 実は,Locker et al.のデータですでに総計し ないモデルによる分析を行った 通常の分散分析で総計しない分析を行わない 理由のひとつは,欠測セルが多くなりすぎる ことにあると思われる(特に,反応時間) →混合モデルなら反応時間実験で起こりそう なランダムな欠測に強い →さらに,積極的に時系列や先行反応の効果 を組み込める 39
  41. 41. データ例:lexdec(languageR) 語彙判断課題のデータ:多くの変数があ るので,一部のみ説明 Subject:参加者の違いを表す RT:反応時間(対数変換済み) exp関数を適用することでもとの単位に戻せる Word:単語の違いを表す Frequency:単語の頻度(対数変換済み) Correct:反応の正誤 NativeLanguage:母語が英語か否か Trial:試行番号 40
  42. 42. 時系列効果の検討 “Trial”をモデルに組み込む 練習または疲労効果を除去 ここでは,固定効果として考える(試行番号 はランダムに付けられるわけではなく,いつ 終わるかは実験者が決めている) 母語×頻度の共分散分析モデルとして分析 Trialなしとありのモデル “Word”も変量効果として組み込む lexdecでは分散分析の結果はあまり変わらないが, モデル適合はよくなる(extractAICで確認) 41
  43. 43. 先行反応時間の影響を考慮 一試行前の反応時間を独立変数に加える 前の試行での遅延反応の影響を除く 一試行めについては,他の値で置き換える (平均反応時間がよく用いられる) 先行反応時間の変数を作る 固定効果として組み込んでみよう PrevCorrectと比較してみよう 42 > prevRT <- unlist(tapply(lexdec$RT, list(lexdec$Subject), function(x) c(mean(x), x[1:length(x)-1])))
  44. 44. 本日の概要 混合モデルとは 混合モデルによる反復測定分散分析 混合モデルを活用する 欠測値に強い 材料の違いを変量効果で表す 試行系列の効果を組み込む 事後検定をどうするか 今後の課題 43
  45. 45. 事後検定という問題 ここまでの話:混合モデルを使うと通常 の反復測定分散分析よりも広い範囲の構 造のデータを扱えることを確認した しかし,基本的にメインの分析についての議 論で,事後検定については扱ってこなかった 分散分析における事後検定 たいていの場合,フォーマルな分析法をやや 逸脱した習慣に基づいており,解説も少ない しかし,実験研究では,特定の交互作用や対 比較の検討のほうが全体の分析よりも解釈に とって直截的・重要であるように思える 44
  46. 46. lmerTestをさらに活用する lmerTestパッケージには,事後検定に関 係する以下の関数がある lsmeans difflsmeans step 以下では,これらの関数について順に説 明する しかし,その前に…… 45
  47. 47. LSMEANSについて lsmeans(最小二乗平均) SASのLSMEANSステートメントに由来する 名称 母集団周辺平均の予測値:線形モデルを使っ て,非釣り合い型のデータのときに,釣り合 い型デザインに対応する平均を算出する SASのステートメントでは,指定した効果に おける各水準の一対比較の結果を返す lmerTestパッケージのlsmeans関数もこの機能を 再現している 46
  48. 48. lsmeans関数 lsmeans(モデル,test.effs = 検定したい 効果) 各セルの最小二乗平均の検定結果を返す (各セルの平均が0と異なるかの検定) 混合モデルに基づく信頼区間を簡単に出力で きる 例:test.effs = “A:B” test.effsを指定しないとすべての組み合わせの結 果を返す 47
  49. 49. difflsmeans関数 difflsmeans(モデル,test.effs = 検定し たい効果) 最小二乗平均の差分の検定結果を返す (交互作用対比,多重比較に相当) 関心のある比較の組み合わせを選び,必要で あればp値を調整すればよい 出力されるp値は,対応するt値とdfから計算し た値に一致するので調整はされていない様子 例:test.effs = “A:B” test.effsを指定しないとすべての組み合わせの結 果を返す 48
  50. 50. step関数 step(モデル, ddf = “自由度推定法”) 有意でなかった効果を自動的に削除して,検 定結果,lsmeansとdifflsmeansの結果を併せ て出力する ddf = “Kenward-Roger”を指定すると pbkrtestパッケージをロードする keep.effs = “残したい効果”と指定すること で,有意でなくても特定の効果を残すことも できる その他もいろいろオプションあり (test.effsも指定できるなど) 49
  51. 51. それでも単純主効果の検定がしたい difflsmeansの出力は,サブセットに対す る検定(水準別誤差項による単純主効果 の検定)の結果とは異なる 統計学的には,difflsmeans(対比)のほう がより適切 どうしても単純主効果の検定がしたい場 合は,単純にサブセットに対して混合モ デルによる分析をくりかえせばよい 欠測のない同じデータに同じモデルを適用し た場合の反復測定ANOVAと一致 50
  52. 52. 多重比較にこだわる? 同様に,difflsmeansによる主効果の水準 間比較は,水準別誤差項に基づく多重比較 の結果とも異なる どちらがよいかは考え方によると思われる 一般的な分散分析の事後検定としての多重 比較の統計量算出法にそろえたいのなら, 水準の対ごとに統計量を算出しp値を調整 すればよい F値を使う→水準対ごとのanovaの結果 t値を使う→水準対ごとのdifflsmeasnの結果 51
  53. 53. 事後検定のまとめ lmerTestのstep関数を使うと簡単 一括ですべてを出力してくれる difflsmeansの出力は必要なものを取捨選択すべき 効果の指定をお任せにして大丈夫? モデルをよく検討し,残すべきものはkeepすべき 伝統的な分散分析のやり方に合わせたい なら必要な部分ごとに分析をくりかえす スタンダードなやり方についてのコンセンサ スは,まだまだこれからな気がします 52
  54. 54. 本日の概要 混合モデルとは 混合モデルによる反復測定分散分析 混合モデルを活用する 欠測値に強い 材料の違いを変量効果で表す 試行系列の効果を組み込む 事後検定をどうするか 今後の課題 53
  55. 55. 1.効果量を報告したい 統計的帰無仮説検定:効果量の報告が義 務づけられる 分散分析はその典型 混合モデルの場合にどうするか 調整済みR2を報告する(Nakagawa & Schielzeth, 2013) 調整済みR2からf2を計算する(Selya et al., 2012) →ここでは,lme4を使った場合のf2の計算に ついて考えてみる 54
  56. 56. R2からf2へ 局所的効果量(個別の独立変数ごとの効 果量)としてのR2からf2への変換式 f2 = (R2 AB-R2 A)/(1-R2 AB) B=関心のある独立変数 A=他のすべての変数の集合 R2 AB =AとBによって説明される分散の割合 つまり,関心のある独立変数を含むモデルと 含まないモデルの比較に基づく ここで,R2の計算は,変量効果によって説明され る分散を一定にして行わなければならない 55
  57. 57. Rで混合モデルのR2を計算する MuMInパッケージのr.squaredGLMM関数 を使う 「モデル」部分は,lmer関数の推定結果(帰 り値)を保存した変数名を指定する R2mとR2cの2つの返り値 R2m:固定効果によって説明される分散による R2c:固定効果と変量効果の両方によって説明さ れる分散による ただし,現状(version 1.10.5)では,実験 段階の機能であるとのこと 56 > r.squaredGLMM(モデル)
  58. 58. Rで混合モデルのf2を計算する 関心のある効果を含むモデルと含まない モデルを推定 m1:y ~ A + B + A:B + (1:s) + (1:s:A) + (1|s:B) m2:y ~ A + B + (1:s) + (1:s:A) + (1|s:B) R2を算出し,f2に変換 57 > r1 <- r.squaredGLMM(m1)[1] > r2 <- r.squaredGLMM(m2)[1] > (r1 – r2) / (1 - r1)
  59. 59. 以上の手続きで一応計算はできるが… 本当にこのやり方で問題ないかは,まだ はっきりしない点が残る r.squaredGLMM関数に関する問題: まだ開発中である 変量効果のコントロールが想定どおりか不明 反復測定分散分析の結果と一致しない 分散分析の結果が一致する場合でも,このやり方 で計算したf2と分散分析に基づくf2は一致しない ただし,分散分析のf2の算出法自体にバリエーシ ョンがあること,アプローチ自体が異なることを 考えると,誤りではないのかもしれない 58
  60. 60. 2.共分散構造の指定 変量効果の共分散構造を指定することで, 球面性を仮定しないモデルが組める 59 Kowalchuk et al.(2004) ここまで使っ てきたのは通 常の分散分析 と同じ構造
  61. 61. 共分散構造のバリエーション 他にもいろいろな構造が選べる 60 Kowalchuk et al.(2004)
  62. 62. 共分散構造を変えたいが…… 悩ましいところ nlmeパッケージ:共分散構造を指定できる lme4パッケージ:共分散構造を簡単に指定す る手段がない いちおう対策らしき話はある (Bates et al. “Fitting Linear Mixed-Effects Models using lme4”) 将来的発展に期待…… 現時点では,共分散構造の変更をしたい ならSASを使うのが確実かもしれない 61
  63. 63. 3.変量傾きモデルの活用 ここまで扱ってきたのは,実はすべて 変量切片モデル 変量切片:参加者や項目によってベースライ ン(切片)のみが異なることを仮定 変量傾き:固定効果の影響(切片+傾き)が 参加者や項目ごとに異なることを仮定 62 y ~ A + (1|subject) + (1|item) y ~ A + (1+A|subject) + (1+A|item)
  64. 64. 変量傾きモデルの長所 仮定としてどちらが自然か? 変量切片: 参加者ごとに基本的な記憶能力が異なる 単語ごとに認識にかかる時間が異なる 変量傾き: 参加者ごとに学習時間の操作の有効性も異なる 単語ごとにプライミングの起こりやすさも異なる 多くの場合,変量傾きも加えるほうが直 感に合った説明になる 常にできるだけ多くの変量傾きを加えたほう がよいとする意見もある(Winter , 2013) 63
  65. 65. 変量傾きモデルはつらいよ 一般に,変量傾きモデルのほうが変量切 片モデルよりも検出力が下がる 変量切片モデルは,タイプⅠエラー率が高い という見方も(Winter, 2013) 実際問題として推定が難しい 変量傾きの指定を乱発するとlmerでは頻繁に 推定不能・モデル識別不能に陥る lme4,lmerTestのどちら側についてもエラーが起 こることがある ただし,これは適切なモデルを指定できていない せいかもしれない 64
  66. 66. まとめ1:いますぐできること lmerTestによる混合モデルで,より拡張 的な分散分析ができる 欠測セル(ランダムな理由によるもの)が あっても計算できる 参加者に加えて材料・項目の効果を統制した 分析を一度にできる 試行ごとのデータを総計しないで分析できる 同様に,例えば,3つのニューロンから違った数 のシナプスを採取したデータなども分析できる step関数やサブセットの分析を活用する ことで下位検定も行える 65
  67. 67. まとめ2:少し検討が必要なこと 効果量を報告したい 適切なR2を算出する ICC(クラス内相関;分散説明率に相当)を 報告するという案もある 共分散構造の指定 変量傾きモデルの活用 どちらも解決には技術的発展を待つ (あるいは,SASを使う) 推定できるようになったら,今度はモデル評 価について考えていく必要がある 66
  68. 68. 文献  Aarts, E., Verhage, M., Veenvliet, J. V., Dolan, C. V., & van der Sluis, S. (2014). A solution to dependency: Using multilevel analysis to accommodate nested data. Nature Neuroscience, 17, 491-496.  Baayen, R. H., Davidson, D. J., & Bates, D. M. (2008). Mixed- effects modeling with crossed random effects for subjects and items. Journal of Memory and Language, 59, 390-412.  Baayen, R. H., & Milin, P. (2010). Analyzing reaction times. International Journal of Psychological Research, 3(2), 12-28.  Kowalchuk, R. K., Keselman, H. J., Algina, J., & Wolfinger, R. D. (2004). The analysis of repeated measurements with mixed- model adjusted F tests. Educational and Psychological Measurement, 64, 224-242.  Locker, L., Jr., Hoffman, L., & Bovaird, J. A. (2007). On the use of multilevel modeling as an alternative to items analysis in psycholinguistic research. Behavior Research Methods, 39, 723- 730. 67
  69. 69.  Loftus, G. R., & Masson, M. E. J. (1994). Using confidence intervals in within-subject designs. Psychonomic Bulletin & Review, 1, 476-490.  Maxwell, S. E., & Delaney, H. D. (2004). Designing experiments and analyzing data (2nd edition). Mahwah, NJ: Lawrence Erlbaum Associates.  Nakagawa, S., & Schielzeth, H. (2013). A general and simple method for obtaining R2 from generalized linear mixed-effects models. Methods in Ecology and Evolution, 4, 133-142.  Selya, A. S., Rose, J. S., Dierker, L. C., Hedeker, D., & Mermelstein, R. J. (2012). A practical guide to calculating Cohen’s f2, a measure of local effect size, from PROC MIXED. Frontiers in Psychology, 3, 111.  Winter, B. (2013). Linear models and linear mixed effects models in R with linguistic applications. arXiv:1308.5499. [http://arxiv.org/pdf/1308.5499.pdf] 68

×