Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

分類分析 (taxometric analysis)

1,893 views

Published on

第一回精神科診断学セミナー

Published in: Science
  • Be the first to comment

分類分析 (taxometric analysis)

  1. 1. 0 200 400 600 800 1000 0.040.050.060.07 Categorical Comparison Data 50 Cuts MeanDifference 0 200 400 600 800 1000 0.040.050.060.07 Dimensional Comparison Data 50 Cuts MeanDifference Taxometric  analysis   理論とRによる実装 統計数理研究所 リスク解析戦略研究センター 特任助教 竹林由武 15/11/29 北村メンタルヘルス学術振興財団 第1回精神科診断学セミナー   匠ソホラ6階セミナールーム:  9:30-­‐16:30
  2. 2. 発表の構成 2 理 論 書き方 実 装 各分析手法の理論解説 研究を始める前に知っておきたい 論文執筆上のチェックポイント Rによるtaxometric分析の実施 出力結果の解釈
  3. 3. 発表の構成 3 理 論 書き方 実 装 各分析手法の理論解説 研究を始める前に知っておきたい 論文執筆上のチェックポイント Rによるtaxometric分析の実施 出力結果の解釈
  4. 4. はじめに •  本発表の内容は、引用文献の記載がない箇所 の内容は、以下の書籍・論文を参照 4 Ruscio, J., Haslam, N., & Ruscio, A. M. (2006). Chapter9: Taxometric checklist, Introduction to the taxometric method: A practical guide. Routledge. Taxometric分析の解説書 実施する理由, 他のモデルとの比較, 分析手続きの詳細, 実施・報告上のポイント を簡潔かつ網羅的に解説。 Taxometric分析の概説論文 上記の本の9章のチェックポイントを、 最新の知見を踏まえてアップデート
  5. 5. 連続的 はじめに •  Taxometric分析 提唱者: Paul Meehl, Ph.D 分析の目的: 5 非連続的 Waller, N. G., & Meehl, P. E. (1998). Multivariate taxometric procedures: Distinguishing types from continua. Sage Publications, Inc. 測定概念の分布の性質を検討
  6. 6. 構成概念の測定 •  Correlated item 6 症状   A 症状 D   症状   B 症状 C 症状 E   相関のある観測変数群
  7. 7. 構成概念の測定 •  Common cause model 7 症状   A 症状 D   症状   B 症状 C 症状 E   構成   概念 e1 e2 e3 e4 e5 観測変数間の相関を、   共通する潜在変数で   表現 観測変数   =  indicator
  8. 8. 構成概念の得点の分布 •  潜在変数の推定→因子得点の分布 8 ! A D! ! B C E! ! e1 e2 e3 e4 e5
  9. 9. 用語 •  Taxon: 分類, 9 非連続的,  カテゴリ カル,  質的な違い Waller, N. G., & Meehl, P. E. (1998). Multivariate taxometric procedures: Distinguishing types from continua. Sage Publications, Inc. 連続的,  次元的   程度の違い Dimensional   ConAnuous   QuanAtaAve     Taxonic   Categorical   QualitaAave   taxon complement
  10. 10. taxometric分析の研究例 •  事例 : 概要 目的:青年の自殺念慮の分布は連続的か検討 患者: 大うつ病の青年 (12歳-18歳)334名 研究デザイン:横断研究 測定指標:Suicidal Ideation Questionnaire 結果:青年うつ病患者の自殺念慮は連続的 10 Liu,  R.  T.,  Jones,  R.  N.,  &  Spirito,  A.  (2015).  Is  adolescent  suicidal  ideaAon  conAnuous  or   categorical?  A  taxometric  analysis.  Journal  of  abnormal  child  psychology,  1-­‐8.
  11. 11. taxometric分析の研究例 •  事例 : 概要 目的:サイコパシー傾向の分布は連続的か検討 患者: 犯罪者4865名 研究デザイン:横断研究 測定指標:Psychopathy Checklist̶Revised 結果:サイコパシー傾向は連続的 11 Liu,  R.  T.,  Jones,  R.  N.,  &  Spirito,  A.  (2015).  Is  adolescent  suicidal  ideaAon  conAnuous  or   categorical?  A  taxometric  analysis.  Journal  of  abnormal  child  psychology,  1-­‐8.
  12. 12. Taxometric分析 •  事例 : 概要 目的:問題賭博の分布は連続的か質的か検討 患者: 犯罪者4865名 研究デザイン:横断研究 測定指標:the Problem Gambling Severity Index (PGSI)       病的賭博の診断基準 結果:問題賭博の分布は非連続的 12 Liu,  R.  T.,  Jones,  R.  N.,  &  Spirito,  A.  (2015).  Is  adolescent  suicidal  ideaAon  conAnuous  or   categorical?  A  taxometric  analysis.  Journal  of  abnormal  child  psychology,  1-­‐8. 研究の問いと結果   構成概念が連続的か否かのみなので、極めてクリア
  13. 13. Taxometric分析のインパクト ・理論への示唆  質的 ‒ 単一 (少数)のリスクファクター  連続 ‒ 複合的なリスクファクター ・研究法への示唆  連続的 ‒ 連続得点で評価  質的 ‒ 群間比較デザインが適切 13 当該概念の捉え方そのものに影響を与える重大な知見 結果はシンプル、しかしインパクトはでかい
  14. 14. 分析手法 •  代表的な方法 Mean Above Minus Below A Cut (MAMBAC) MAXimum EIGenvalue (MAXCOV) Latent Mode (L-MODE) •  その他の方法 MAXimum COVariance (MAXCOV) MAXimum SLOPE (MAXSLOPE) 14 代表的な方法を中心に解説します
  15. 15. MAMBAC 群間差のプロットに基づく: 15 非連続的 連続的 凸型   明確なピークが存在 U型  (お椀型)   明確なピークなし  
  16. 16. MAMBAC プロットの作成手順: i) 2つのindicatorを用意 ii) 一方の変数 (変数A)を任意の間隔で区切る iii) 各区分点で、区分点以上以下で2群に分ける iv) 各群でもう一方の変数 (変数B)の,   平均値・群間差を算出 v) 各区分点をx軸、群間差をy軸にプロット 16
  17. 17. MAMBACプロットへの道 17 outputindicator input indicator 二つのindicatorを用意 非連続的データの場合
  18. 18. MAMBACプロットへの道 18 input  indicatorのカットポイントを設定 5点区切りのカットポイントを設定 ※ カットポイントの設定点は任意
  19. 19. MAMBACプロットへの道 19 低群の平均 33.22 高群の平均 57.25 カットポイント毎、高・低群分け、群間平均値差算出 カットオフ 20 群間差 = ¦24.03¦
  20. 20. MAMBACプロットへの道 20 低群の平均 35.02 高群の平均 75.01 群間差 = ¦40.01¦ 2群が明確に分かれるポイントで群間差最大 カットオフ 40
  21. 21. MAMBACプロットへの道 21 低群の平均 53.32 高群の平均 76.85 群間差 = ¦23.53¦ indicatorの両極では群間差が低め カットオフ 40
  22. 22. 22 Xのcutpoint 低群の平均 高群の平均 Yの群間差 15 31 55.35 23.95 20 33 57.25 24.03 25 34 62.22 27.94 30 35 70.51 35.79 35 35 74.36 39.41 40 35 75.01 40.00 45 35 75.01 40.00 50 35 75.01 40.00 55 36 75.08 39.04 60 40 75.42 35.00 65 48 76.27 27.97 70 53 76.85 23.53 75 55 76.86 22.03 80 55 83.42 28.46 cutpoint真ん中くらいで群間差ピーク
  23. 23. 23 群間差のプロットにピークが認められる = 質的 25 30 35 40 20 40 60 80 X1 X2 MAMBACプロット完成 23 input indicatorのcut point outputindicatorの群間差 output indicatorのピーク値で分割したtaxon群の割合 = taxon base rate rate
  24. 24. MAMBACプロットへの道 24 二つのindicatorを用意 連続的データの場合 outputindicator input indicator
  25. 25. MAMBACプロットへの道 25 低群の平均 28.61 高群の平均 45.36 カットポイント毎、高・低群分け、群間平均値差算出 カットオフ 19 群間差 = ¦16.75¦
  26. 26. MAMBACプロットへの道 26 低群の平均 40.22 高群の平均 48.98 中央付近の値では、群間差が低くなる カットオフ 29 群間差 = ¦8.75¦
  27. 27. MAMBACプロットへの道 27 低群の平均 45.14 高群の平均 66.82 極値付近で、群間差が最大になる カットオフ 29 群間差 = ¦21.68¦
  28. 28. 28 Xのcutpoint 低群の平均 高群の平均 Yの群間差 19 28.61 45.36 16.75 24 33.61 45.99 12.38 29 36.87 47.17 10.30 34 40.22 48.98 8.75 39 42.69 51.71 9.01 44 44.11 54.54 10.43 49 44.95 60.46 15.51 54 45.14 66.82 21.68 極値で群間差が大きくなる
  29. 29. 29 群間差にピークなくお椀型 = 連続的 MAMBACプロット完成 29 input indicatorのcut point outputindicatorの群間差 cut pointの両極値で群間差ピーク
  30. 30. MAXCOV 2変数間の共分散に基づく: 30 非連続的 連続的 凸型   ピークが存在 平行型   明確なピークなし  
  31. 31. MAXCOV プロットの作成手順: i) 3つのindicatorを用意 ii)  1つの変数の任意の間隔で集団を分割 iii)  下位集団ごとに、残りの2変数間の共分散を求める v) 分割区間をx軸、共分散をy軸にプロット 31
  32. 32. MAXCOVプロットへの道 3つのindicatorを用意 32 平均・SD n mean sd Ind1 (input) 1000 0 1 Ind2 (output) 1000 0 1 Ind3 (output) 1000 0 1 分散・共分散 (相関) Ind1 Ind2 Ind3 Ind1 1 0.54 0.48 Ind2 0.54 1 0.48 Ind3 0.48 0.48 1 inputを分割、分割区間ごとにoutputの共分散を算出
  33. 33. MAXCOV 33 0 -­‐1 -­‐2 +1 +2 OUTPUT  indicator  間の共分散が、0付近で区間で最も大きくなる -­‐2.75 -­‐1.75 -­‐0.75 0.25 1.25 2.25 input  indicatorを5分割、各区間の下位集団の共分散   非連続的データの場合
  34. 34. MAXCOVプロットへの道 34 inputの区間 outputの共分散 -2 0 -1 0.09 0 0.33 1 0.20 2 0
  35. 35. 35 群間差のプロットにピークが認められる = 質的 MAXCOVプロット完成 35 input indicatorの分割集団 outputindicatorの共分散 共分散ピークのindicatorの値 = hitmax value Hitmaxで分割したtaxon群の割合 = taxon base rate rate Hitmax   この値で標本を分割すると、最 も精度よくtaxon  とcomplement を分けられる
  36. 36. MAXCOV 36 0 -­‐1.3 -­‐2.6 +1.3 +2.6 OUTPUT  indicator  間の共分散、明確なピークがない -­‐3.52 -­‐2.22 -­‐0.92 0.38 1.68 2.98 input  indicatorを5分割、各区間の下位集団の共分散   連続的データの場合
  37. 37. MAXCOVプロットへの道 37 inputの区間 outputの共分散 -2 0.10 -1 0.22 0 0.27 1 0.24 2 0.36 OUTPUT  indicator  間の共分散、明確なピークがない
  38. 38. 38 共分散のプロットに明確なピークなし = 連続的 MAXCOVプロット完成 38 input indicatorの分割集団 outputindicatorの共分散 明確なピークなし
  39. 39. 39 共分散のプロットに明確なピークなし = 連続的 MAXCOVプロット完成 39 input indicatorの分割集団 outputindicatorの共分散区間を増やしてみるとより明らか (にピークなし)
  40. 40. MAXEIG 複数の変数の(条件付き)固有値のプロットに基づく: 40 非連続的 連続的 凸型   明確なピークが存在 平行型   明確なピークなし  
  41. 41. MAXEIG プロットの作成手順: i) 3つ以上のindicatorを用意 ii)  1つの変数の任意の間隔で集団を分割 iii)  下位集団ごとに、残りの変数間の固有値を求める v) 分割区間をx軸、固有値をy軸にプロット 41 共分散 =  2変数間の共変関係を表す   固有値  =  3変数以上の変数間の共変関係を表す   共分散が固有値に置き換わっただけで原理は一緒  
  42. 42. L-­‐MODE 因子得点の分布に基づく: 42 非連続的 連続的 因子得点の分布   ピークが二つ以上 因子得点の分布   ピークが一つ  
  43. 43. L-­‐MODE プロットの作成手順: i) 3つ以上のindicatorを用意 ii) Indicatorを観測変数とした因子分析を実施 iii) 因子得点を算出 (Bartlett法) iv) 因子得点の分布をプロット 43 ! e1 e2 e3 e4
  44. 44. L-­‐MODE taxon base rateの推定: 44 因子得点のピークが二つ 各ピークの平均値を算出 平均値が.50付近 平均値でbase rateを算出 平均値 < .50 左のピーク値でbase rate算出 平均値 > .50 右のピーク値でbase rate算出
  45. 45. 統計指標に基づく連続性の判断 •  目視による判断は心許ない •  Comparative Fit Index (CCFI) データに基づくプロットと、シミューレションによ る理想のプロットの間の距離に基づいて、データの プロットが連続と非連続のどちらに近いか判断 45 CCFIの値 判断 0.00-­‐0.39 連続 0.40-­‐0.60 どちらとも言えない 0.61-­‐01.0 非連続
  46. 46. ComparaAve  Curve  Fit  Index 46 データからのプロット (実線) 連続な場合の理想的プロット 非連続な場合の理想的プロット データからのプロット (実線) CCFIは理想(シミュレーション)と現実(データ)間の距離に基づき算出 非連続型に近いのか、連続型に近いのか、指標で判断できる MAXIEIGのプロット: CCFI = 0.94
  47. 47. ComparaAve  Curve  Fit  Index 47 理想と現実の距離 FitRMSR = (yres.data − ysim.data∑ ) N 2 CCFI = FitRMSR•dim (FitRMSR•dim + FitRMSR•cat ) CCFI = 0.5 (0.5+ 0.2) = 0.71 dimの距離が大きく、catの距離が小さいと CCFI = 0.2 (0.2 + 0.5) = 0.29 dimの距離が大きく、catの距離が小さいと 連続と非連続どちらが近いか 全てのtaxometric分析の手続きで利用可能
  48. 48. 発表の構成 48 理 論 書き方 実 装 各分析手法の理論解説 研究を始める前に知っておきたい 論文執筆上のチェックポイント Rによるtaxometric分析の実施 出力結果の解釈
  49. 49. Taxometric分の実施・報告ガイドライン 49 最新の実証研究の知見を踏まえ、 アップデート Ruscio, J., Haslam, N., & Ruscio, A. M. (2006). Chapter9: Taxometric checklist, Introduction to the taxometric method: A practical guide. Routledge.
  50. 50. 論文化チェックリスト  ✅ 分析を実施する科学的な合理性があるか? ✅ データが分析に適切か? ✅ 多様な分析手続きが適切に用いられているか? ✅ 結果が適切に提示され、解釈されているか? ✅ 結果のimplicationが明確に述べられているか? Ruscio, J., Haslam, N., & Ruscio, A. M. (2006). Introduction to the taxometric method: A practical guide. Routledge. 50 5つの項目をチェック John Ruscio http://www.tcnj.edu/~ruscio/
  51. 51. 論文化チェックリスト  ✅ 分析を実施する科学的な合理性があるか? ✅ データが分析に適切か? ✅ 多様な分析手続きが適切に用いられているか? ✅ 結果が適切に提示され、解釈されているか? ✅ 結果のimplicationが明確に述べられているか? Ruscio, J., Haslam, N., & Ruscio, A. M. (2006). Introduction to the taxometric method: A practical guide. Routledge. 51 5つの項目をチェック John Ruscio http://www.tcnj.edu/~ruscio/ taxometric分析を適切に実施するためのポイントを紹介します
  52. 52. ✅ データの適切性 A. 標本サイズ B.  taxonのサイズ C. indicator数 D. 順序カテゴリデータの場合のカテゴリ数 E.  indicatorの妥当性 F.  群内相関 52
  53. 53. ✅ データの適切性 A. 標本サイズ ・Meehl (1995)の基準  300人以上 (Meehl, 1995) ・Ruscio et al. (2010)のシミュレーション   連続的:300人以上   非連続的:100人以下でも検出可能 53 少なくとも300人以上が必要 Ruscio,  J.,  Walters,  G.  D.,  Marcus,  D.  K.,  &  Kaczetow,  W.  (2010).  Comparing  the  relaAve  fit  of  categorical  and     dimensional  latent  variable  models  using  consistency  tests.  Psychological  Assessment,  22(1),  5.
  54. 54. ✅ データの適切性 B. Taxonのサイズ  ・Meehl (1995)の基準    標本の10%以上  ・Ruscio et al. (2010)のシミュレーション    標本の5%以上10%未満でも、誤分類は稀  ・Ruscio et al. (2004, 2010)の推奨 54 標本の5%以上かつ50人以上   疾患群、非疾患群の分類を対象とするなら、有病率に基づいて見積もると良い Ruscio,  J.,  Walters,  G.  D.,  Marcus,  D.  K.,  &  Kaczetow,  W.  (2010).  Comparing  the  relaAve  fit  of  categorical  and     dimensional  latent  variable  models  using  consistency  tests.  Psychological  Assessment,  22(1),  5.
  55. 55. ✅ データの適切性 記載例) 結果の節 55 Liu,  R.  T.,  Jones,  R.  N.,  &  Spirito,  A.  (2015).  Is  adolescent  suicidal  ideaAon  conAnuous  or   categorical?  A  taxometric  analysis.  Journal  of  abnormal  child  psychology,  1-­‐8. 標本の適切性 The first recommends the base rate, or the proportion of cases in the whole sample assigned to the putative taxon should be ≥10% [47] or 5% [13]. The PGSI base rate (0.086) is sufficient, but the DSM-IV rate (0.046) is smaller than the recommended heuristic.
  56. 56. ✅ データの適切性 C. indicatorの数 ・MAMBAC/MAXSLOPE = 2,  MAXIEIG/L-MODE 3 Ruscio et al. (2010)のシミュレーション   indicator数=3でも妥当な推定結果 indicator数が多いほど結果が明瞭   indicator数=2の場合:     標本サイズ600以上10件法以上で安定 56 Ruscio,  J.,  Walters,  G.  D.,  Marcus,  D.  K.,  &  Kaczetow,  W.  (2010).  Comparing  the  relaAve  fit  of  categorical  and     dimensional  latent  variable  models  using  consistency  tests.  Psychological  Assessment,  22(1),  5.
  57. 57. ✅ データの適切性 D. 順序カテゴリカルindicator ・4件法以下の尺度    indicator数 < 5で結果が不安定 ・カテゴリ数 < 4 で不正確になる 57 Ruscio,  J.,  Walters,  G.  D.,  Marcus,  D.  K.,  &  Kaczetow,  W.  (2010).  Comparing  the  relaAve  fit  of  categorical  and     dimensional  latent  variable  models  using  consistency  tests.  Psychological  Assessment,  22(1),  5.
  58. 58. ✅ データの適切性 E. indicatorの妥当性  - 群間の標準平均値差  - 群内の共分散 (相関)  - indicatorの歪度 (skew)  - 十分な信頼性・因子負荷 58
  59. 59. ✅ データの適切性 群間の標準平均値差  - taxon群とcomplement群間の標準化平均値差   ・事前の検討:尺度のカットオフ値等で群分け   ・事後の検討:推定されたtaxon base rate          に基づく群分け 59 標準化平均値差、d  =  1.25以上  
  60. 60. ✅ データの適切性 群内相関 - taxon群とcomplement群の各群内での  indicatorの相関 - taxonが存在するなら、局所独立なので、  群内相関は理想的には0 60 群内相関、r  =  0.25以下  
  61. 61. ✅ データの適切性 歪度・因子負荷 - indicatorの歪度が高いと、分析結果が不正確 - 信頼性低、因子負荷低のindicatorは、  当該の構成概念を適切に反映していない。 61 先行研究で十分に信頼性と妥当性が   確認されている尺度を用いる   indicator選定のために、taxometric分析実施前に行うのもあり
  62. 62. ✅ データの適切性 記載例) 結果の節 62 Liu,  R.  T.,  Jones,  R.  N.,  &  Spirito,  A.  (2015).  Is  adolescent  suicidal  ideaAon  conAnuous  or   categorical?  A  taxometric  analysis.  Journal  of  abnormal  child  psychology,  1-­‐8. 群間差 The second requirement is for a large between-groups effect size between the putative taxon and non-taxon members of Cohen s d > 1.25 [13,47]. All the items meet this assumption (Table 2). 群内分散 (相関) The third assumption is that there is little nuisance covariance, which refers to the correlations between indicator variables within the taxon and non-taxon groups. A correlation of r < 0.3 has been recommended previously, and that the correlation between items across the whole sample is greater than the correlation between items in the taxon [13]. Neither of the measures met this assumption,
  63. 63. 記載例) 結果の節 ✅ データの適切性 63 群間差記述統計としてまとめて記載 Orlando,  C.  M.,  Broman-­‐Fulks,  J.  J.,  Whitlock,  J.  L.,  CurAn,  L.,  &  Michael,  K.  D.  (2015).   Nonsuicidal  Self-­‐Injury  and  Suicidal  Self-­‐Injury:  A  Taxometric  InvesAgaAon.  Behavior  Therapy. 信頼性・因子負荷等  方法の節で指標の説明で述べればよい
  64. 64. 記載例) 結果の節 ✅ データの適切性 64 因子分析によるindicatorの選択 Liu,  R.  T.,  Jones,  R.  N.,  &  Spirito,  A.  (2015).  Is  adolescent  suicidal  ideaAon  conAnuous  or   categorical?  A  taxometric  analysis.  Journal  of  abnormal  child  psychology,  1-­‐8.
  65. 65. ✅ データの適切性 その他. 以下のような標本の操作は原則禁止 i) 標本の追加・混合 ii) サブグループ化 iii) complement memberをトリミング 65 taxonが得られる恣意的に標本操作をするのはNG
  66. 66. ✅ 多様な分析手続き ・一貫性テスト(consistency test)を必ず実施  多様な分析手続き間で、連続・非連続の  結果が一貫しているか検討 主な方法:  異なる分析手法間での一貫性  異なるindicator間での一貫性 66
  67. 67. ✅ 多様な分析手続き ・一貫性テスト  複数の方法から得られたCCFIを平均  判断の基準は一つずつの場合と一緒    67 CCFIの値 判断 0.00-­‐0.39 連続 0.40-­‐0.60 どちらとも言えない 0.61-­‐01.0 非連続 他にも一貫性の検討手法が存在するが、CCFIに基づくのが最も良い
  68. 68. 発表の構成 68 理 論 書き方 実 装 各分析手法の理論解説 研究を始める前に知っておきたい 論文執筆上のチェックポイント Rによるtaxometric分析の実施 出力結果の解釈
  69. 69. Ruscioのページ クリックして、「Manual  2014-­‐07-­‐29.rdata」をダウンロード.  任意のフォルダに保存 69
  70. 70. Manual  2014-­‐07-­‐29.rdata RまたはRStudioで開く これだけで準備完了!! 70
  71. 71. Taxometric分析に必要なコード 71 サンプルデータ  (読み込んだ.rdataに入ってる)   カテゴリカル:TS1〜TS4 連続:DS1〜DS4 #  先頭6行のみ表示 データセットの中身
  72. 72. Taxometric分析に必要なコード >  MAMBAC(TS2) >  MAXEIG(TS2) >  LMode(TS2) これだけで、taxometric分析に必要な全ての結果が出力される!! indicator3つでMAXCOV,  4つ以上でMAXEIG 72
  73. 73. 出力の見方 73 プロットが自動で出力される   0 200 400 600 800 1000 0.070.080.090.100.110.12 Categorical Comparison Data 50 Cuts MeanDifference 0 200 400 600 800 1000 0.070.080.090.100.110.12 Dimensional Comparison Data 50 Cuts MeanDifference この出力がそのまま論文に掲載できる   非連続の場合の理想と比較 連続の場合の理想と比較 (MAMBAC)
  74. 74. 出力の見方 74 プロットが自動で出力される   この出力がそのまま論文に掲載できる   非連続の場合の理想と比較 連続の場合の理想と比較 (MAXEIG) -1.0 -0.5 0.0 0.5 1.0 0.00.51.01.52.0 Categorical Comparison Data 25 Windows Eigenvalue -1.0 -0.5 0.0 0.5 1.0 0.00.51.01.52.0 Dimensional Comparison Data 25 Windows Eigenvalue
  75. 75. 出力の見方 75 プロットが自動で出力される   この出力がそのまま論文に掲載できる   非連続の場合の理想と比較 連続の場合の理想と比較 (LMODE) -2 -1 0 1 2 0.00.10.20.30.40.50.6 Categorical Comparison Data Factor Scores Density -2 -1 0 1 2 0.00.10.20.30.40.50.6 Dimensional Comparison Data Factor Scores Density
  76. 76. 出力の見方 76 サンプルサイズ、indicatorの数、cutpointの値など、基礎情報
  77. 77. 出力見方 77 Taxon  base  rate   (MAMBAC) 指標の全組み合わせでMAMBAC   1.  全体の平均   2.  indicatorごとの平均   3.  indicatorごとの平均の平均   論文では、赤線で囲った値を報告すればよい
  78. 78. 出力の見方 78 Taxon  base  rate   (MAXEIG) 指標の全組み合わせでMAXEIG   hitmax値とtaxon群の割合     1.  全組み合わせの平均       2.  indicatorごとの平均  
  79. 79. 出力の見方 79 Taxon  base  rate   (LMODE) 2峰の因子得点のピーク値の平均に基づいて、taxon  base  rate算出   各群のindicatorごとの因子得点の平均値を算出  
  80. 80. 出力の見方 80 indicatorの記述統計量  (平均、SD、歪度、尖度) 標本全体 taxon群 complement群 非連続の場合には、各群の値と人数の報告、連続であれば全体のみ 歪度(skew)の値をチェック   3〜2以下が目安
  81. 81. 出力の見方 81 indicatorの妥当性 dが1.25以上がチェック 論文で必ず報告
  82. 82. 出力の見方 82 indicator間の相関 (全サンプル) 記述統計として、平均・SDとともに報告した方が良い
  83. 83. 出力の見方 83 indicator間の相関 各相関の平均は、論文に必ず報告 群内で、indicator間に   大きな相関がないか   チェック 各相関の平均
  84. 84. 出力の見方 84 CCFI CCFIで連続か非連続か判断
  85. 85. 他の分析手法との比較 85 taxometric LCA  /  LPA 前提 indicatorの妥当性   群内分散低 多変量正規性   局所独立性 結果 連続か非連続の2値判断   taxon  base  rateに基づく、   群の構成割合   所属確率に基づく、   群の構成割合、   各群への所属確率   強み 連続モデルかどうかの判 断に強い   indicatorの分布に関する 強い制約はない クラス分けに強い   クラスの特徴を詳細に検 討できる。 使い分けの私見   連続か質的かの知見がないまたは乏しい  →  taxometricを実施   質的である可能性が高い  →  LCAで質の特徴を検討
  86. 86. 最近のトレンド:Factor  mixture  model 86 症状   A 症状 D   症状   B 症状 C 症状 E   factor e1 e2 e3 e4 e5 factorは   連続潜在変数     classは   カテゴリ潜在変数 因子モデル  +  潜在クラス分析 class ※イメージ:LModeをSEMの枠組みで検討
  87. 87. FFM 87 Class  1 Class  2 ! A D! ! B C E! factor e1 e2 e3 e4 e5 ! A D! ! B C E! factor e1 e2 e3 e4 e5 因子得点の平均や因子負荷が異なるクラスが抽出される ※イメージ:多母集団同時分析の母集団が未知なモデル
  88. 88. TaxometricとFMMを併用 •  FMMでは因子モデルの潜在変数の分布を検 討するので、Taxometricと目的が一致 •  感度解析的に両者を使用 •  Taxometricで質的・連続を判断し、質的な らFMMで詳細な検討がベスト (私見) 88 Bernstein,  A.,  SAckle,  T.  R.,  Zvolensky,  M.  J.,  Taylor,  S.,  Abramowitz,  J.,  &  Stewart,  S.   (2010).  Dimensional,  categorical,  or  dimensional-­‐categories:  tesAng  the  latent  structure   of  anxiety  sensiAvity  among  adults  using  factor-­‐mixture  modeling.  Behavior  Therapy,   41(4),  515-­‐529. 参考
  89. 89. おまけ:FFMのMplusコード 89 ANALYSISやVARIABLEコマンドは   潜在クラス分析と一緒     MODELコマンドに因子分析モデルを指定     MODEL:   %OVERALL%    f  on  item1  –  item6;
  90. 90. TAKE  HOME  MESSAGE 90 •  Taxometric, 潜在変数の分布の連続性を、観 測変数間の関連指標のプロットで判断 •  indicatorの妥当性を群間差等で必ずチェック •  連続性の判断はCCFIの値を参照 •  複数の分析法とindicator構成で一貫性テスト

×