Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Rで潜在ランク分析

4,006 views

Published on

Rで潜在ランク分析を実行する関数を作りました

Published in: Software

Rで潜在ランク分析

  1. 1. Rで潜在ランク分析 清水裕士 広島大学 HiroshimaR#3
  2. 2. 自己紹介 • 清水裕士 – 専門:社会心理学 グループダイナミクス – 所属:広島大学大学院総合科学研究科 助教 – 趣味:心理統計・ソフトウェア開発 • 連絡先 – ブログ:http://norimune.net – Twitter: @simizu706 HiroshimaR#3
  3. 3. 潜在ランク分析 • 潜在的な順序グループを推定する HiroshimaR#3
  4. 4. 日本語でおk・・・? HiroshimaR#3
  5. 5. 潜在ランク分析 • 因子分析と混合分布モデルの中間 – 因子分析のように,潜在的な次元得点を推定 – クラスタ分析のように,潜在的なグループを推定 – ・・・日本語で(以下略 HiroshimaR#3
  6. 6. おさらい:因子分析 • 複数の変数から,潜在的な変数を推定 – 因子:変数の共通部分を取り出したもの – 因子は正規分布で連続量 因子 項目 項目 項目 項目 HiroshimaR#3
  7. 7. おさらい:混合分布モデル • 複数の変数から,潜在的なグループを推定 – データは複数の正規母集団から抽出された – 潜在的な母集団をデータから探り当てる HiroshimaR#3
  8. 8. • 順序性を持った潜在的なグループ – 因子が一次元上に得点化される – データは,質の異なるグループから抽出されたと 考える その中間の分析 順序 因子 項目 項目 項目 項目 HiroshimaR#3
  9. 9. 潜在ランク理論のサイト • 提唱者 – 荘島宏二郎さん(大学入試センター) • Webサイト – http://www.rd.dnc.ac.jp/~shojima/ntt/jindex HiroshimaR#3
  10. 10. 潜在ランク分析あれこれ • Shojima (2007) – ニューラルテスト理論 • 自己組織化マップを用いた,潜在ランク分析 • ノンパラメトリックな項目反応理論として提案 • 入力データは二値か順序 • Shojima (2008) – 潜在ランク理論 • 潜在的な順序グループを推定する一般モデルの提案 • 推定アルゴリズムをEMアルゴリズムに拡張 • テスト理論として,教育学やテスト学の分野で採用 • 清水・大坊(2014) – 心理学の分野で,潜在ランク分析を適用 HiroshimaR#3
  11. 11. 【宣伝乙】 • 清水・大坊(2014) 心理学研究 85巻5号 HiroshimaR#3
  12. 12. 潜在ランク分析の使いどころ • テストや心理尺度は,「1点」の意味が不明 – 実質科学的な違いはほとんどない場合が多い – しかし,クライエント・生徒は,その違いを過剰に評価してし まう • 例:GHQ60(0~60点)の1点の違いはほぼない • 例:テストが78点から80点に上がった!・・・測定誤差の範囲 • 解像度をあえて減らすメリット – ランクが違えば,実質科学的にも意味がある – クライエントや生徒に対するフィードバックも容易 – 各ランクに対して,質的な記述が可能 • 例:ランク1は健康な人,ランク2は社会活動に障害,ランク3では不 安症状が,ランク4ではうつ症が出始めている・・・など HiroshimaR#3
  13. 13. 本発表 • Rで潜在ランク分析を実行する関数を作った – いまのところ,入力データは連続変量のみ – 荘島さんが作成したExametrikaは順序も可能 • LRA() – Webからソースを読み込めます – source("http://bit.ly/latent_rank") HiroshimaR#3
  14. 14. LRA関数の推定方法 • 自己組織化マップ(SOM=Tの場合) – Self Organizing Map: SOM – k-means法+位相制約 • 中心値が順序性を持つようにクラスタリングする – ノンパラメトリックな潜在ランク分析 • 生成位相マップ(SOM=Fの場合 デフォルト) – Generative Topographic Mapping: GTM – 混合正規分布モデル+位相制約 • 各正規分布の平均値が順序性を持つように制約する – パラメトリックな潜在ランク分析 HiroshimaR#3
  15. 15. LRA()の使いかた • 引数 – data:データを入れます – rank:推定するランク数を入れます – neighbor:位相制約の強さを入れます • 0.05~0.1あたりが妥当 0.07がデフォルト – SOM:TRUEで自己組織化マップになる • デフォルトはFALSEで,生成位相マップ • 例 – result <- LRA(dat, 4) – 必須なのは,データとランク数だけ HiroshimaR#3
  16. 16. サンプルデータ • 2014年のプロ野球データ – 両リーグの規定打数1/3以上の野手 141名 – http://baseball-data.com/から入手 HiroshimaR#3
  17. 17. サンプルデータ • 今回使う変数は4つ – 打率:AVG – 安打数:HIT – 本塁打数:HR – 打点:RBI – これらの変数で,打力のランクを推定する HiroshimaR#3
  18. 18. 分析例 • とりあえず,10ランクぐらいでやってみる result <- LRA(dat,10) summary(result) HiroshimaR#3
  19. 19. ランクが高いほど,打力も高い HiroshimaR#3
  20. 20. summary()の出力 • 潜在度数 – 各ランクの潜在的な度数 • 項目参照プロファイル – 各ランクの平均値 – 個々の変数では,ランクで逆転している可能性がある • 順序配置条件については後述 • 順位相関 – 潜在ランクと各変数との順位相関 • 因子分析における因子負荷量のようなもの • 今回は,安打数と打点が潜在ランクの推定に貢献している HiroshimaR#3
  21. 21. 順序配置条件 • 潜在ランクが順序性をもつ前提条件 – 連続変量版の基準は,提案されてない – 勝手に基準を作ってみた • 主成分得点がランクで単調増加する – より大きいランクで主成分得点が小さくなったら,順序配置条 件が満たされていない • 弱順序配置条件 – 弱順序配置条件が満たされないと,警告が出る • 強順序配置条件も考えられる – すべての変数がランクで単調増加 – 今回の関数では,弱順序配置条件のみ HiroshimaR#3
  22. 22. テスト参照プロファイル • 潜在ランクの主成分得点を確認 plot(result) ※result$stdで得点を出力 HiroshimaR#3
  23. 23. 項目参照プロファイル • 各変数のランクごとの平均値推移を確認 plot(result,1) – 打率の分布(1番目の変数だから1を入力) HiroshimaR#3
  24. 24. 50ランクぐらい推定した場合 非線形な関係性を表現できる HiroshimaR#3
  25. 25. ランク・メンバーシッププロファイル • 回答者の各ランクへの所属確率 – 総和が1になる – 離れたランクの所属確率が高い場合もある HiroshimaR#3
  26. 26. 鳥谷(阪神) • plot(result$res[14,],type=“l”) – ランク9以上に所属する確率が高い HiroshimaR#3
  27. 27. 新井兄(阪神) • plot(result$res[115,],type=“l”) – ランク1か,ランク4のどちらかに所属する HiroshimaR#3
  28. 28. 情報量規準 • AIC()を使う AIC(result) • 情報量規準の使いどころ – ランク数決定の参考に • しかし,混合分布モデルを用いているので, AICやBICは厳密にはモデル選択には使えない – 今回は,6ランクがAIC最小 HiroshimaR#3
  29. 29. 6ランクの結果 HiroshimaR#3
  30. 30. 各ランクの特徴 • ※出力は,別のソフトウェアのもの HiroshimaR#3
  31. 31. ランクによる打席数 HiroshimaR#3
  32. 32. 各ランクへの所属 ランク 所属メンバー 上田, 谷繁, 梅野, 堂上, 白崎, 石原, 相川, 荒波, 井端, 金城, 桑原, 荒木, 多村, 鶴岡, 松井, 高橋, 大野, 金子, 岡田, サブロー, 島内, 脇谷, ボウカー, 根元, 聖澤, 牧田, 鶴岡, 原, 川端, 谷口, 森本, 市川, 荻野 大和, 荒木, 橋本, 山崎, 黒羽根, 今成, 森岡, 木村, 新井, 平野, 中島, 嶋, 渡辺, 本多, 坂口, 加藤, 近藤, 明石, ハフマン 福留, 田中, 堂林, エルナンデス, 藤井, 亀井, グリエル, 松山, 飯原, 會澤, 新井, 小窪, 後藤, 炭谷, 木村, 細川, 駿太, 小谷野, 枡田, 大谷, 吉村, デスパイネ 上本, 石川, 片岡, 梵, 中村, キラ, 今宮, 西川, 岡島, 鈴木, 安達, ヘルマン, 藤田, 秋山, 角中, 大引, 松井, 今江, 伊藤, 西田, 井口 村田, 阿部, バルディリス, 平田, ロペス, 和田, ブランコ, アンダーソン, ロサリオ, ジョーンズ, 浅村, クルーズ, ミランダ, 松田 山田, 菊池, 丸, 鳥谷, 大島, 川端, 坂本, ゴメス, 梶谷, 雄平, マートン, 森野, ルナ, 長野, エルドレッド, 畠山, 筒香, バレンティン, 栗山, 中村, 李, 柳田, 中田, 糸井, ペーニャ, 長谷川, 陽, 内川, T−岡田, 銀次, 中村, メヒア 6 5 4 3 2 1 HiroshimaR#3
  33. 33. ランクの解釈 • ランク1~ランク2 – ベンチ – 下位打者 • ランク3 – ここぞというときの代打 • ランク4 – 1番~2番のアベレージヒッター • ランク5 – 控えクリーンナップ • ランク6 – 正クリーンナップ HiroshimaR#3
  34. 34. ランクによる年俸格差 HiroshimaR#3
  35. 35. その他の出力 • rank – 回答者の所属ランク • res – ランクメンバーシッププロファイル • 回答者の,各ランクへの所属確率 • varis – 各ランクの変数の分散 HiroshimaR#3
  36. 36. まとめ • 潜在ランク分析 – 潜在的な順序グループを推定 – 因子分析と混合分布モデルの間 • Rで関数を作ってみた – 連続変数のみ – 今後は順序尺度バージョンも・・・ • 結論 – 来年も頑張れ鳥谷!広島でも頑張れ新井(兄)! – 次のスライドをめくるのを忘れるな HiroshimaR#3
  37. 37. 【第2回】 ベイズ推定WS 【告知】 • Stanによるベイズ推定の可能性と課題 – 専修大学 岡田謙介先生を講師に – Rで動くrstanを用いた,勉強会 • 3月4日(火) – 広島大学総合科学部 – http://kokucheese.com/event/index/265495/ – 主催:広島ベイズ塾 HiroshimaR#3

×