Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

第4回DARM勉強会 (構造方程式モデリング)

7,611 views

Published on

第4回DARM勉強会発表資料
「構造方程式モデリング」
報告ガイドラインの概要

Published in: Education

第4回DARM勉強会 (構造方程式モデリング)

  1. 1. 構造方程式モデリング(Structural  Equa,on  Modeling)広島大学総合科学研究科  博士課程後期3年  竹林由武 DARM勉強会#42013.06.22
  2. 2. 構造方程式モデリング(Structural Equation Modeling: SEM)•  検証的因子分析+パス解析 (+α)•  潜在変数と観測変数を組み合わせて様々な分析モデルを表現可能潜在変数 観測変数 =直接測定できない要因=直接測定可能な要因
  3. 3. 構造方程式モデリング(Structural Equation Modeling: SEM)•  検証的因子分析 (Confirmatory Factor Analysis: CFA)直接観測できない構成概念を記述  複数の観測変数を縮約構成概念 観測変数1 誤差1 観測変数2 誤差2 観測変数3 誤差3
  4. 4. 構造方程式モデリング(Structural Equation Modeling: SEM)•  パス解析 (Path Analysis: PA)構成概念と構成概念  観測変数と観測変数   の関係性を検討  観測変数⇒構成概念構成概念A 構成概念B
  5. 5. 構造方程式モデリング(Structural Equation Modeling: SEM)•  構造方程式モデリング PAとCFAを統合的に評価構成概念A 構成概念B 観測変数  1 観測変数  2 観測変数  3 誤差  1 誤差  2 誤差  3 観測変数  4 観測変数  5 観測変数  6 誤差  1 誤差  2 誤差  3
  6. 6. reporting guidelineMueller, R. O., & Hancock, G. R. (2008). StructuralEquation Modeling. In G. R., Hancock & R. O. Mueller(Eds.), The Reviewer’s Guide to Quantitative Methods inthe Social Sciences. (pp. 281-288) New York: Routledge.ガイドの編者!!
  7. 7. 項目 テーマ セクション 1 仮説モデル•競合モデルの構築   I 2 パス図の呈示 I 3 潜在変数の定義 I  (M) 4 観測変数の定義 M 5 潜在変数に対する観測変数の数 M 6 統制変数の扱い M 7 サンプリング法•サンプル数   M 8 欠損データ•外れ値の処理 M,  (R) 9 統計ソフトの情報•推定法の明示 M,  (R) I = introduction, M = method, R = results, D = discussionガイドの項目概要
  8. 8. 項目 テーマ セクション 10 収束,過剰推定,モデルの識別性の問題 R 11 観測変数の要約統計量の明示   R 12 二段階分析プロセスの遵守   R 13 適合度指標 R 14 モデルの比較  (尤度比検定,情報量基準) R 15 最終的なモデルの正当性   R 16 潜在因子の信頼性と妥当性   R 17 推定値の有意性 R,  (D) 18 モデルの解釈に関わる言葉使い D I = introduction, M = method, R = results, D = discussionガイドの項目概要
  9. 9. レポーティングガイド 項目1: 詳細•  十分に理論を統括し検討モデルが設定されている•  競合モデルが呈示されている SEMの強み  アプリオリな理論の評価を補助する能力 事後的な理論生成> 文献レビューによる,構成概念の明確な定義,概念間の関連に関する強い論拠が必要
  10. 10. レポーティングガイド 項目2: 詳細•  概念モデルの理解や統計モデルの特定を促すために,パス図が示されている •  可能中限り,構造方程式と測定方程式の双方を図示する•  仮説モデルと解析結果の双方のパス図を乗せるのが望ましい  
  11. 11. レポーティングガイド パス図  観測変数 潜在変数 誤差変数  因果 (的なもの) 相関 (共分散)
  12. 12. レポーティングガイド 構造方程式    誤差 構成概念A 構成概念B 誤差 潜在変数A 潜在変数B γ η = γζ + ς潜在変数B 潜在変数A 誤差 パス係数
  13. 13. レポーティングガイド 測定方程式    x1 x2 x3 誤差  1 誤差  2 誤差  3 y1 y2 y3 誤差  1 誤差  2 誤差  3 潜在変数A 潜在変数B λx1 λx 2 λx3λy1 λy2 λy3x1 = λx1ζ + δ1x2 = λx 2ζ + δ2x3 = λx 3ζ + δ3y1 = λy1η + ε1y2 = λy 2η + ε2y3 = λy3η + ε3
  14. 14. レポーティングガイド 構造方程式+測定方程式    x1 x2 x3 誤差  1 誤差  2 誤差  3 y1 y2 y3 誤差  1 誤差  2 誤差  3 誤差 潜在変数A 潜在変数B γ λx1 λx 2 λx3λy1 λy2 λy3
  15. 15. レポーティングガイド 構造方程式+測定方程式(RAM構造)     ζηx1x2x3y1y2y3!"##########$%&&&&&&&&&&=0 0 0 0 0 0 0 0γ 0 0 0 0 0 0 0λx1 0 0 0 0 0 0 0λx2 0 0 0 0 0 0 0λx3 0 0 0 0 0 0 00 λy1 0 0 0 0 0 00 λy2 0 0 0 0 0 00 λy3 0 0 0 0 0 0!"############$%&&&&&&&&&&&&ζηx1x2x3y1y2y3!"##########$%&&&&&&&&&&+ζςδ1δ2δ3ε1ε2ε3!"##########$%&&&&&&&&&&
  16. 16. レポーティングガイド 項目3: 詳細•  潜在因子が定義され、それらの潜在変数としてのステータスが指定されている  原因 結果観測変数 cause    indicatoreffect    indicator潜在変数 latent    factoremergent    factorεεεε
  17. 17. レポーティングガイド formative vs. reflective  latent  factoreffect  indicator  1effect  indicator  2effect  indicator  3emergent  factorcause  indicator  1cause  indicator  2cause  indicator  3εεεε17 formativemodelreflectivemodelどちらのモデルで構成概念を測定するのが適切か要検討
  18. 18.   formative model       reflective modelライフストレスηY1:  将来の心配Y2:  睡眠への支障Y3:心拍の亢進ライフストレスηX1:  職の喪失X2:家族の死X3:離婚εεεε主成分分析モデル 因子分析モデル 18 概念の変化は全ての項目に影響を与える概念の変化に,全ての項目の変化が寄与するとは限らないformative vs. reflective
  19. 19. レポーティングガイド 項目4: 詳細•  全ての観測変数が定義されている•  観測変数が関連する因子のindicatorとしての適切性が示されている (必要に応じて)•  exogenous vs. endogenous   例えば…     a)  latent  factorのeffect  indicatorはendogenous                    b)  emergent  factorのcause  indicatorはexogenous)     c)  潜在変数と関連しない変数  (stand  alone  variables:  性別など)  exogenous endogenous
  20. 20. レポーティングガイド 項目4: 詳細・既に確立された指標であるならば,引用文献を明示・観測変数の尺度水準を明示  連続変数以外では特別な推定手続きが必要    変数名 内容 例2 値変数(Binary variable) 2 カテゴリ 診断有/無合格/不合格順序変数(Ordinal variable) 順序あり•3 カテゴリ以上 中卒/高卒/大卒名義変数(Nominal variable) 順序のなし•3カテゴリ以上 未婚/既婚/離別/死別打ち切り変数(Censored variable) ある範囲を超えると値が観察されない 勉強時間,賃金,塾の費用カウント変数(Count variable) 何らかのイベントが生じた回数 殺人の件数,自殺未遂の回数
  21. 21. レポーティングガイド 項目5: 詳細• 潜在因子が十分な数の適切な観測変数で示されている   ⇒識別性,因子の信頼性や妥当性を考慮  • 潜在因子のindicatorの性質が述べられている    識別性      >        方程式の数  >  求める母数の数    ⇒  一意の解が得られない                    ※方程式の数=標本共分散の下三角要素            (観測変数をnとすると,n(n+1)/2) f1 x1 e1 a1 s e11 1 観測変数が1つの場合  求める母数の数=3  (s    a1    e11)  方程式の数=  1  ⇒識別性なし s=潜在変数の分散,a1=パス係数,  e11=誤差
  22. 22. レポーティングガイド 項目5: 詳細観測変数が2つの場合   求める母数の数=5  (s    a1  a2  e11  e22)   方程式の数=  3   ⇒識別性なし 観測変数が3つの場合        求める母数の数=6          (a1,  a2,  a3,    e11,  e22,  e33)        方程式の数=  6   ⇒識別性あり    f1x1 e1a11e111x2a2e2e221x3a3 e3e331観測変数が4つの場合   求める母数の数=6            (a1,  a2,  a3,  a4,  e11,  e22,  e33,  e44)      方程式の数=  10   ⇒識別性あり  f1x1 e1a11e111x2a2 e2e221x3a3e3e331x4a4e4e441f1x1 e1a1se111x2a2 e2e221indicator数 3 4以上であれば制約を置かずに識別可能実用的には4 6で全てパス係数が.6 .7以上が理想的
  23. 23.    indicatorが少ない場合の対処  ⇒母数を固定することで,求める母数を少なくする          f1 x1 e1 a1 1 1 1 観測変数が1つの場合     因子の分散を固定⇒  s=1      測定誤差を固定⇒  e11=1    信頼性係数から算出する誤差分散で固定     ⇒誤差分散=(1-­‐信頼性係数)×観測変数の分散                        求める母数の数=1  (a1)           方程式の数=  1           ⇒識別可能  項目5: 詳細
  24. 24.     indicatorが少ない場合の対処  ⇒母数を固定することで,求める母数を少なくする         観測変数が2つの場合 因子パタンor誤差分散に等値制約   因子パタン: a1=a2=0        誤差分散:     e11=e22=0              求める母数の数=3  (“s,  e11,  e12”  or  “s,  a1,  a2”)   方程式の数=  3    f1 x1 e1 0 s e11 1 x2 0 e2 e22 1 項目5: 詳細
  25. 25.     観測変数が多い場合にはparcelingを考慮する    parceling (小包化変数):   いくつかの観測変数を合成(小包化)し,indicatorにする             小包の作り方は複数あるので,Coffman & MacCallum(2005)を参照適当に小包を作ってはだめ項目5: 詳細f1x1 e1a11e111x2a2 e2e221x3a3 e3e331x4 e4a4e441x5a5 e5e551x6a6e6e661f1x1+x2+x3 e1a11e111x4+x5+x6a2e2e221
  26. 26.     •  理論的に関連する統制変数がどのようにモデルに組み込まれたか説明されている•  統制変数は分析から除外せず,モデルに含む方が望ましい•  統制変数は一つの潜在変数のindicatorにすべきではない•  統制変数をモデル含んだ場合,統制変数とアウトカムの関係は基本的に線形非線形を想定⇒他母集団同時分析など 項目6: 詳細
  27. 27.     •  サンプリング方法やサンプルサイズが明示され,指定されている サンプリング法 (詳細は徳岡君)   a) random (ランダム)    b) stratified (層化)    c) cluster (クラスター)• 項目7: 詳細 サンプル数       推定値につき少なくとも5ケース以上        ADFの場合はもっと制約は緩い  
  28. 28. simsemで例数設計f1y1 y3y2e1 e2 e3f2y4 y6y3e4 e5 e6.50.51 .51 .51 .51 .51 .51.70 .70 .70 .70 .70 .701 1>  popModel  <-­‐  "    f1  =~  0.7*y1  +  0.7*y2  +  0.7*y3    f2  =~  0.7*y4  +  0.7*y5  +  0.7*y6    f1  ~~  1*f1    f2  ~~  1*f2    f1  ~~  0.5*f2    y1  ~~  0.51*y1    y2  ~~  0.51*y2    y3  ~~  0.51*y3    y4  ~~  0.51*y4    y5  ~~  0.51*y5    y6  ~~  0.51*y6    “  >  analyzeModel  <-­‐  "    f1  =~  y1  +  y2  +  y3    f2  =~  y4  +  y5  +  y6    " >  Output  <-­‐  sim(NULL,  n=50:1000,                                                              model  =  analyzeModel,                                                            generate  =  popModel,  std.lv  =  TRUE,                                                              lavaanfun  =  "cfa")
  29. 29. >  summary(Output) simsemで例数設計
  30. 30. 200 600 10000510152025chisqNValue200 600 100050001000015000aicNValue200 600 100050001000015000bicNValue200 600 10000.000.050.100.15rmseaNValue200 600 10000.900.940.98cfiNValue200 600 10000.800.901.001.10tliNValue200 600 10000.020.060.10srmrNValue>  plotCutoff(Output,  0.05)
  31. 31. >  Cpow  <-­‐  getPower(Output)  >  findPower(Cpow,  ”N”,  0.80)    >  plotPower(Output,  powerParam=c("f1=~y1",  "f1~~f2")) 200 400 600 8000.00.20.40.60.81.0f1=~y1NPower200 400 600 8000.00.20.40.60.81.0f1~~f2NPower
  32. 32. •  欠損値や外れ値の処理の仕方が述べられている> 処理方法と欠損割合を報告する> 推奨される欠損値処理                         a)  完全情報最尤推定法  (Mplus•Lavaanはデフォルト)                         b)  多重代入法    (詳細は第3回DARM資料を参照)                          ※平均値代入  or  リスト(ペア)ワイズ削除はだめ              > はずれ値の処理       単変量: 通常zscoreの±3       多変量: mahalanobisの距離(D2)で判定              ⇒ D2<.001を削除  • 項目8: 詳細
  33. 33. −4 −2 0 2 4 6−20212345 67891011121314151617181920212223 2425262728293031323334353637383940414243444546474849 5051525354 55565758596061626364656667 686970 717273 7475767778798081828384858687888990919293 949596979899100101102103 104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161 162163164165166167168169170171172173174 175176177178179180181182183184185186187188189190191192193194195196 197198199200201202203204205206207 208209210211212213214215216217218219220221222223224 2252262272282292302312322332342352362372382392402412422432442452462472482492502512522532542552562572582592602612622632642652662672682692702712722732742752762772782792802812822832842852862872882892902912922932942952962972982993000 5 10 15 20 250.00.20.40.60.81.0Ordered squared robust distanceCumulativeprobability2922821421382251321122301991361812214223921033295260763820125341326212927114822016173270110175108727147273298702515425415315219478170351322414928224342611886029628416621289259742069452169771772914492911052761181631222052471042881142041071451282972482558821127326417216217126971741847187272294242551022272281501302654311641492365820312532277361111724123121281119801912322312671431132507919745180131465313525372862991822871371061402091906516551217275519224398666179156202196278207158681769519266218101245209016830083852831572806129097237268307115462258183214109882229186111694822611513424963108571419518550252592332168613927419867289155116392359312410092112612681722191932345617816715213184246172082159964847526312012713341891512409616125615923238312852001032932571414429122227924422340 22 146 16097.5%Quantile−4 −2 0 2 4 6−202Outliers based on 97.5% quantile224014616022222324427912345 678910111213141516171819202123 24252627282930313233343536373839414243444546474849 5051525354 55565758596061626364656667 686970 717273 7475767778798081828384858687888990919293 949596979899100101102103 104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145147148149150151152153154155156157158159161 162163164165166167168169170171172173174 175176177178179180181182183184185186187188189190191192193194195196 197198199200201202203204205206207 208209210211212213214215216217218219220221224 225226227228229230231232233234235236237238239240241242243245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278280281282283284285286287288289290291292293294295296297298299300−4 −2 0 2 4 6−202Outliers based on adjusted quantile12345 67891011121314151617181920212223 2425262728293031323334353637383940414243444546474849 5051525354 55565758596061626364656667 686970 717273 7475767778798081828384858687888990919293 949596979899100101102103 104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161 162163164165166167168169170171172173174 175176177178179180181182183184185186187188189190191192193194195196 197198199200201202203204205206207 208209210211212213214215216217218219220221222223224 225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300mvoutlierパッケージ>  library(mvoutlier)  >  ap.plot(x,  alpha=.01)
  34. 34. •  使用した統計ソフト (パッケージ)の名前とバージョンが報告されている•  パラメタの推定法が指定され,前提となる仮定が述べられているデフォルトは最尤法が多い最尤法の前提   ⇒多変量正規性多変量正規性の検定  ⇒1変量ずつ尖度•歪度を検討  (e.g.,  尖度<7,  歪度<2)   ⇒Mardiaの多変量尖度検定  (1.96以上で逸脱)項目9: 詳細
  35. 35. MVNパッケージで多変量尖度検定plotが直線から逸脱してなければ,OK
  36. 36. a)  収束の問題:デフォルトの反復回数で収束しない    対処⇒反復回数を増やす    b)  ヘイウッドケース: 誤差分散が0 or 負の値をとる   対処①  :誤差分散が負の値をとる変数を分析から除外する   対処②  誤差分散を0に固定   対処③  ADF推定法を用いる  c)  not positive definite(相関行列に1以上の値が含まれる)  項目10: 詳細収束,過剰推定,モデルの識別性に関わる問題が報告され,議論されている
  37. 37. 行列内に1以上の値が含まれる                  問題の原因となる行列   ①  標本共分散  (相関)行列   ②  情報行列   ③  推定のための重み行列   ④  モデルから構成される共分散行列   ⑤  母数行列  (←問題なし)   Task 1.000 Rela,ons .937 1.000 Management .908 .906 1.000 Auribute .985 1.010 .951 1.000 not positive definite
  38. 38. ①標本共分散  (相関)行列における原因と対処   原因A:  観測変数間に完全な線形関係がある            対処:他の変数から線形従属となっている変数を生成   原因B:  欠損値が含まれる      対処:欠損値代入   原因C:  カテゴリカル変数の相関行列     対処:推定法(WLS,  WLSMV)   原因D:  観測変数の数より標本が少ない場合                      対処:標本数を増やす   原因E:  識別性の問題     対処:母数を固定など  not positive definite
  39. 39. ②  情報行列     原因:識別性の問題     対処:母数固定など    ③  推定のための重み行列が原因     対処:標本数を増やす,推定法をGLS,  ULS,MLに    ④  モデルから構成される共分散行列が原因     主成分分析であればモデルに原因なし     正統な理由があればULSで解を求めることが可能        初期値設定によって対処可能である場合もある       not positive definite
  40. 40. •観測変数の要約統計量が提示されている•ローデータへのアクセス方法が呈示されている    サンプルサイズ     相関(共分散)行列     標準誤差     平均,信頼性      項目11:詳細
  41. 41. •  潜在変数間の構造的な関連を含むモデルにおいて,二段階分析プロセスに準じてまとめられている     測定モデルの検討⇒構造モデルの検討    項目12:詳細A B# # ## #2#3# # ## #2#3
  42. 42. 13.  適合度 項目13:詳細適合度は以下の指標から総合的に判断する基準値の参照元を明示する a)  絶対的指標: データとモデルの共分散行列の類似度           (absolute  indices)      b)  増分的指標: 独立モデルと比較して,分析モデルによって       (incremental  indices)     データの適合が改善した度合い c)  倹約的指標:    モデルの複雑さを考慮した,モデルのデータ         (parsimonious  indices)    に対する近似度   指標 内容 基準 a)  SRMR モデルで説明できなかった分散の大きさ .08以下 b)  CFI 自由度を考慮した乖離度の改善の大きさ .95以上 c)  RMSEA 1自由度あたりの乖離度の大きさ .05以下
  43. 43. 競合モデルにおいて,統計的検定や情報量基準を用いた比較がされている  > モデル間にネスト関係あり   ⇒  尤度比検定:                    2つのモデルのχ2値の差 (⊿χ2)  の有意性    > ネスト関係なし   ⇒  情報量基準      AIC,  BIC,  aBIC  (値が小さいほど当てはまりがよい)  項目14:詳細
  44. 44. 15.  モデルの再特定 事後的に特定されたモデルにおいて,理論的,統計的な正当性が呈示されている   > wald検定      パスを0とした場合を帰無仮説とし,棄却されなけれ     ば(C.R.  が1.96未満)パスを減らす      >  LM検定,修正指数 (modification index)   パスを増やして,χ2値が有意に減少  (3.84)すれば,      パスを追加    ※最近は   減少が10以上とする   場合が多い        (Mplusのデフォは10)  項目15:詳細
  45. 45. •  誤差共分散を仮定する   ⇒理論的な正当性が必要     項目15:詳細v2 v1 v5 v4 v6 e2 e1 e1
  46. 46. •  潜在因子の質が信頼性と妥当性の観点から述べられている    >妥当性                  effect  indicatorへのパスの平均が.50以上            > 信頼性                    coeffient  H  (Hancock,  &  Mueller,  2001)                                          .70以上が良い  項目16:詳細H =1/ 1+ ( i2/1− i2i=1k∑#$%&(i2=  因子負荷の2乗
  47. 47. •  標準化,非標準化パラメータ推定値が統計的有意性に関する情報と共に提供されている•  主要な構造的アウトカムに対するR2値が呈示されている  推定値         ⇒標準化、非標準化の双方を乗せるの望ましい      有意性  (z値,  R2値,  パス図なら*)を明示      項目17:詳細
  48. 48. •モデルの適合が良くても,あくまで,観察データの関係に対する説明の一つとして耐えうるもの  モデルが確証された         (a  model  was  confirmed)    理論が真であると証明された         (a  theory  was  proven  to  be  true)         などと表現しない   • 個々のパラメタの推定結果の解釈で,  因果を言及するの悪くない (反論はある)項目18:詳細

×