0
反応時間データをどう分析し図示するか        阪上 辰也 @            2012-12-02 LET 中部支部 第80回支部研究大会@名古屋大学シンポジウム: 統計手法を用いたデータ分析とその解釈 ―何が必要でどう利用すべきか―
Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
1. 経緯と目的“... so we should use the best tools wehave available. Rarely, however, is thattool statistical hypothesis testing...
仮説検定は最良な方法?
1. 経緯と目的「ふだんから自分自身の用いるデータ解析手法に常に疑問を持つ.それに関して他人と議論する.統計学誤用を避ける基本わざとはこのように誰もが実践できる簡単なものだ」             (久保, 2003)
疑問は持つが相談・議論しづらい...
1. 経緯と目的「近年では,線形混合効果(linear mixedeffects)モデルを使った分析方法が推奨されている」              (山下・杉浦, 2011)
線形混合効果モデルとは?
1. 経緯と目的• 統計的仮説検定の是非• モデル選択とは何か•    ってすばらしい
Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
反応時間データは正規分布する?
正規分布しないとしたら t 検定や分散分析は  マズイのでは?
具体例
2. 正規分布が前提?• Jiang & Nekrasova (2007) の replication  • 日本人英語学習者149名の反応時間  • 項目例: “on the other [ hand / bed ]”
2. 正規分布が前提?1. 正規性の検定2. 可視化で分布を観察
ここで
 とは何か• 統計処理を目的とするプログラミング言語• 無償+オープンソースのソフトウェア• 作者:Ross Ihaka & Robert Gentleman (R & R)   •   Ross Ihaka and Robert Gentle...
要するに統計ソフト
  の何が良いのか• 無償で使えてうれしい• 処理の種類が豊富でうれしい• 図が美しくてうれしい
Excel (笑) や SPSS (笑) は... • 高くて買うのがつらい • 処理が信頼できずつらい • 図が美しくなくてつらい
ExcelSPSS
2. 正規分布が前提?> x <- c(2533, ... , 1078)> x2 <- sample(x, size=5000)> shapiro.test(x2) Shapiro-Wilk normality testdata: xW = ...
2. 正規分布が前提?• 正規性の検定:shapiro.test() を実行• 検定時の帰無仮説=「正規分布している」• p < .05 となれば正規分布していない
Histogram of x            350            300            250            200Frequency            150            100         ...
正規分布してない
2. 正規分布が前提?• t 検定や分散分析は使えない • 現実には使う研究が多々あるが...• 別の分布や解析手法が必要
Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
3. 検定かモデル選択かhttp://hosho.ees.hokudai.ac.jp/~kubo/ce/2005/kubo/kuboJES2005.pdf から引用
3. 検定かモデル選択か•モデルとは...•   ある現象を簡単に説明するもの•モデル選択とは...•   分布図に “うまく” 引ける線(方程式)を探すこと
モデル選択: 分布にどんな線が引けそうかhttp://www.slideshare.net/isseing333/tokyo-webmining-1v2-10041726 から引用
3. 検定かモデル選択か• 検定  • 新しい要因や関係の存在を確実に示すとき• モデル選択  • 予測精度が高いモデルを作るとき  • どういう分布になるかを見つける
結局は使い分け
ただし
Histogram of x            350            300            250            200Frequency            150            100         ...
正規分布してない
従来の検定はやはりマズイ
Agenda1. 発表の経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
Agenda1. 発表の経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
Histogram of x            350            300            250            200Frequency            150            100         ...
正規分布してない
どういう分布か
Histogram of x            350            300            250            200Frequency            150            100         ...
ポアソン分布っぽい気が...
http://ja.wikipedia.org/wiki/%E3%83%9D%E3%82%A2%E3%82%BD%E3%83%B3%E5%88%86%E5%B8%83 より引用
「ぽい」のままでは  マズイので
一般化線形モデル  の登場
http://hosho.ees.hokudai.ac.jp/~kubo/ce/LinksGlm.html から引用
4. 一般化線形モデル•   Generalized Linear Model (GLM)     •   「何でもかんでも正規分布ってのはおかしいだろう」         という方向への拡張(久保, 2012)     •   データのばらつ...
4. 一般化線形モデル•   GLM ではうまくいかない場合...    •   過分散:二項分布やポアソン分布で期待されるより        も大きなばらつきが見られた場合    •   データとして定量化も識別もされていない個体差     ...
一般化線形混合モデル•   GLM の強化版•   個体差等による効果をランダム効果として組み込む•   全個体が ”ある” 確率分布にしたがうと仮定する•   R の glmmML package で実行可能
ごちゃごちゃいいましたが
つまり
これまでの問題点を解決できそうな手法
Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
5. まとめ• 何でもかんでも正規分布ではない   • 正規性・分布の確認 → GLM へ• 検定かモデル選択かの使い分け   • 「ゆーいだ,ゆーいだ」で済ませない• 反応時間の解析には GLMM が有用(かも)
反応時間を取ったら
まずは作図だ
Histogram of x            350            300            250            200Frequency            150            100         ...
もちろん
List of References•   近藤公久・Takeo N. Wydell (2011). 単語音読潜時に与える音節単位の影響: 音訓差と    比較して. 第14回認知神経心理学研究会 抄録集, pp. 26-27.•   粕谷英一...
反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか
Upcoming SlideShare
Loading in...5
×

反応時間データをどう分析し図示するか

1,564

Published on

LET 中部支部第80回支部研究大会シンポ資料

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,564
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
15
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Transcript of "反応時間データをどう分析し図示するか"

  1. 1. 反応時間データをどう分析し図示するか 阪上 辰也 @       2012-12-02 LET 中部支部 第80回支部研究大会@名古屋大学シンポジウム: 統計手法を用いたデータ分析とその解釈 ―何が必要でどう利用すべきか―
  2. 2. Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
  3. 3. Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
  4. 4. 1. 経緯と目的“... so we should use the best tools wehave available. Rarely, however, is thattool statistical hypothesis testing.” (Johnson, 1999)
  5. 5. 仮説検定は最良な方法?
  6. 6. 1. 経緯と目的「ふだんから自分自身の用いるデータ解析手法に常に疑問を持つ.それに関して他人と議論する.統計学誤用を避ける基本わざとはこのように誰もが実践できる簡単なものだ」 (久保, 2003)
  7. 7. 疑問は持つが相談・議論しづらい...
  8. 8. 1. 経緯と目的「近年では,線形混合効果(linear mixedeffects)モデルを使った分析方法が推奨されている」 (山下・杉浦, 2011)
  9. 9. 線形混合効果モデルとは?
  10. 10. 1. 経緯と目的• 統計的仮説検定の是非• モデル選択とは何か•    ってすばらしい
  11. 11. Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
  12. 12. Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
  13. 13. 反応時間データは正規分布する?
  14. 14. 正規分布しないとしたら t 検定や分散分析は マズイのでは?
  15. 15. 具体例
  16. 16. 2. 正規分布が前提?• Jiang & Nekrasova (2007) の replication • 日本人英語学習者149名の反応時間 • 項目例: “on the other [ hand / bed ]”
  17. 17. 2. 正規分布が前提?1. 正規性の検定2. 可視化で分布を観察
  18. 18. ここで
  19. 19.  とは何か• 統計処理を目的とするプログラミング言語• 無償+オープンソースのソフトウェア• 作者:Ross Ihaka & Robert Gentleman (R & R) • Ross Ihaka and Robert Gentleman. R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics, 5(3):299-314, 1996. • http://biostat.mc.vanderbilt.edu/twiki/pub/Main/JeffreyHorner/JCGSR.pdf
  20. 20. 要するに統計ソフト
  21. 21.   の何が良いのか• 無償で使えてうれしい• 処理の種類が豊富でうれしい• 図が美しくてうれしい
  22. 22. Excel (笑) や SPSS (笑) は... • 高くて買うのがつらい • 処理が信頼できずつらい • 図が美しくなくてつらい
  23. 23. ExcelSPSS
  24. 24. 2. 正規分布が前提?> x <- c(2533, ... , 1078)> x2 <- sample(x, size=5000)> shapiro.test(x2) Shapiro-Wilk normality testdata: xW = 0.8128, p-value < 2.2e-16> hist(x2, breaks=”FD”)
  25. 25. 2. 正規分布が前提?• 正規性の検定:shapiro.test() を実行• 検定時の帰無仮説=「正規分布している」• p < .05 となれば正規分布していない
  26. 26. Histogram of x 350 300 250 200Frequency 150 100 50 0 0 2000 4000 6000 8000 10000 12000 x
  27. 27. 正規分布してない
  28. 28. 2. 正規分布が前提?• t 検定や分散分析は使えない • 現実には使う研究が多々あるが...• 別の分布や解析手法が必要
  29. 29. Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
  30. 30. Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
  31. 31. 3. 検定かモデル選択かhttp://hosho.ees.hokudai.ac.jp/~kubo/ce/2005/kubo/kuboJES2005.pdf から引用
  32. 32. 3. 検定かモデル選択か•モデルとは...• ある現象を簡単に説明するもの•モデル選択とは...• 分布図に “うまく” 引ける線(方程式)を探すこと
  33. 33. モデル選択: 分布にどんな線が引けそうかhttp://www.slideshare.net/isseing333/tokyo-webmining-1v2-10041726 から引用
  34. 34. 3. 検定かモデル選択か• 検定 • 新しい要因や関係の存在を確実に示すとき• モデル選択 • 予測精度が高いモデルを作るとき • どういう分布になるかを見つける
  35. 35. 結局は使い分け
  36. 36. ただし
  37. 37. Histogram of x 350 300 250 200Frequency 150 100 50 0 0 2000 4000 6000 8000 10000 12000 x
  38. 38. 正規分布してない
  39. 39. 従来の検定はやはりマズイ
  40. 40. Agenda1. 発表の経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
  41. 41. Agenda1. 発表の経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
  42. 42. Histogram of x 350 300 250 200Frequency 150 100 50 0 0 2000 4000 6000 8000 10000 12000 x
  43. 43. 正規分布してない
  44. 44. どういう分布か
  45. 45. Histogram of x 350 300 250 200Frequency 150 100 50 0 0 2000 4000 6000 8000 10000 12000 x
  46. 46. ポアソン分布っぽい気が...
  47. 47. http://ja.wikipedia.org/wiki/%E3%83%9D%E3%82%A2%E3%82%BD%E3%83%B3%E5%88%86%E5%B8%83 より引用
  48. 48. 「ぽい」のままでは マズイので
  49. 49. 一般化線形モデル の登場
  50. 50. http://hosho.ees.hokudai.ac.jp/~kubo/ce/LinksGlm.html から引用
  51. 51. 4. 一般化線形モデル• Generalized Linear Model (GLM) • 「何でもかんでも正規分布ってのはおかしいだろう」 という方向への拡張(久保, 2012) • データのばらつきがポアソン分布や二項分布などの 正規分布以外の確率分布を仮定できる • R の glm() 関数+ AIC() 関数で良いモデルを探す
  52. 52. 4. 一般化線形モデル• GLM ではうまくいかない場合... • 過分散:二項分布やポアソン分布で期待されるより も大きなばらつきが見られた場合 • データとして定量化も識別もされていない個体差 (例:学習歴,学習環境)が影響した場合 • 原因不明の個体差の効果を組み込んだモデルが必要
  53. 53. 一般化線形混合モデル• GLM の強化版• 個体差等による効果をランダム効果として組み込む• 全個体が ”ある” 確率分布にしたがうと仮定する• R の glmmML package で実行可能
  54. 54. ごちゃごちゃいいましたが
  55. 55. つまり
  56. 56. これまでの問題点を解決できそうな手法
  57. 57. Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
  58. 58. Agenda1. 経緯と目的2. 正規分布が前提?3. 検定かモデル選択か4. 一般化線形モデル5. まとめ
  59. 59. 5. まとめ• 何でもかんでも正規分布ではない • 正規性・分布の確認 → GLM へ• 検定かモデル選択かの使い分け • 「ゆーいだ,ゆーいだ」で済ませない• 反応時間の解析には GLMM が有用(かも)
  60. 60. 反応時間を取ったら
  61. 61. まずは作図だ
  62. 62. Histogram of x 350 300 250 200Frequency 150 100 50 0 0 2000 4000 6000 8000 10000 12000 x
  63. 63. もちろん
  64. 64. List of References• 近藤公久・Takeo N. Wydell (2011). 単語音読潜時に与える音節単位の影響: 音訓差と 比較して. 第14回認知神経心理学研究会 抄録集, pp. 26-27.• 粕谷英一 (2012). 一般化線形モデル, 共立出版• 久保拓弥 (2012). データ解析のための統計モデリング入門 データ解析のための統 計モデリング入門: 一般化線形モデル・階層ベイズモデル・MCMC, 岩波書店• 杉浦正利・山下淳子 (2011). 「アイトラッキングを使った言語処理過程の研究」 藤 村逸子・滝沢直宏編『言語研究の技法−データの収集と分析』pp. 159-177, ひつじ 書房• 山下淳子・杉浦正利 (2011). 「反応時間を使った言語処理過程の研究」藤村逸子・ 滝沢直宏編『言語研究の技法−データの収集と分析』pp. 141-158, ひつじ書房• Yoko Nakano & Marian Wang (2011).An Eye-Tracking Study on Ambiguous Relative- Clause Attachments in L2 English for Japanese Learners of English,信学技報, vol. 111, no. 170, pp. 79-82.
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×