Your SlideShare is downloading. ×
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Let中部2012シンポスライド
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Let中部2012シンポスライド

3,271

Published on

2012年12月01日(土)外国語教育メディア学会(LET) …

2012年12月01日(土)外国語教育メディア学会(LET)
中部支部第80回支部研究大会でのシンポジウム
『統計手法を用いたデータ分析とその解釈—何が必要でどう利用すべきか—』にて,「より好ましい統計解析と図示方法」のスライドです。

0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
3,271
On Slideshare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
14
Comments
0
Likes
4
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. より好ましい統計手法1 —Resampling Methods—
  • 2. 例えばこんなデータ 3
  • 3. データはきったない 4
  • 4. とりあえず平均 5
  • 5. なんか違うけど...  まあいいか。 「t  検定・分散分析は  n  が大きければ,  前提が満たされなくても頑健性(robustness)を持つ。」 6
  • 6. Q-­‐Q  Plot 7
  • 7. 外れ値を含む場合の対処方法 橋本(2011)• 一定基準以上(平均値±2/3SDなど)の 値を取り除く。• データを変換(対数変換・逆変換)する。• 何もしない。
  • 8. 外れ値は外していいの?• 明らかに反応がおかしい場合 Yes• 特殊な集団を対象とした実験の場合 No• 実験デザインを考えて,サンプルサイズ が小さくなる場合 No
  • 9. Resampling手元の観測データ(標本)を使って,再度サンプリング(再抽出)を行い,新しい標本を複数作り,その統計量を推定する方法。
  • 10. Resamplingのイメージ 3 7 8 5 4 1 9 2 3 5 6 3 1 2 67 M  =  4.9 9 8 9個の抽出を M  =  5.0    1,000回程度繰り返す
  • 11. ... N
  • 12. はじめのデータに適用
  • 13. Resampling 大きく2つに分類• Bootstrapping (Jackknife)• Permutation (Randomization) tests
  • 14. Bootstrappinghttp://blog.templatemonster.com/2012/10/04/bootstrap-templates-launch/ h"p://images.yourdic3onary.com/jackknife Jackknife http://www.lhup.edu/~dsimanek/museum/themes/NewtonsThird.htm
  • 15. 4 1 3 7 8 5 2 3 5 9 6 6 3 1 27 9 8 同じものを再度抽出 (リサンプリング)することを 許すのが Bootstrapping 許さないのがJackknife
  • 16. Resampling 大きく2つに分類• Bootstrapping (Jackknife)• Permutation (Randomization) Tests
  • 17. 並べ替え検定Permutation/Randomization Tests R. Fisher• 母集団の分布(正規分布など)の仮定なし。• 小さいサンプルで外れ値が含まれている ときには,パラメトリック検定よりも有効。• 常に正しい p 値を得ることができる。• 推測統計よりも,考え方がシンプル。
  • 18. ノンパラでいいのでは?• 分布の仮定が必要ないということと, 外れ値が含まれている場合に有効とい う点ではノンパラと同じ。• しかし,ノンパラもパラメトリック検 定と同様に,特定の確率分布を基に p 値の推定を行う。 21
  • 19. ノンパラでいいのでは?• パラメトリック検定やノンパラメトリ ック検定で推定しようとしている・近 似(approximation)を行っている p の 正しい値 = Permutation (Randomization) testsで  得られる p 値 22
  • 20. Howell  (2002)“I  believe  that  in  a  short  Dme  they   will  overtake  what  are  now  the   more  common  nonparametric   tests,  and  may  eventually   overtake  the  tradiDonal   parametric  tests”  (p.  692). 23
  • 21. “The  day  .  .  .  has  come.” R版ではノンパラなし 24
  • 22. 以心伝心 25
  • 23. 並べ替え検定の例Permutation/Randomization Tests
  • 24. Permutation/Randomization Tests
  • 25. Permutation/Randomization Testsn  =  12  で  2  群に  6  個のデータ すべての組み合わせ   12!/6!/6!  =  924差が30以上の組み合わせは54組 54  /  924  =  0.058  (これが  p  値)
  • 26. p  値の比較
  • 27. 母集団への一般化 どちらも同じものだが呼び名が違う• 並べ替え検定(Permutation Test) → 推定の対象は母集団(研究向き)• 確率化検定(Randomization Test) → 手元のサンプルのみ(実践向き) 31
  • 28. どうやってやればいいですか? 32
  • 29. より好ましい統計手法2 —Effect Sizes—
  • 30. 差が大きいのはどちら?
  • 31. 差が大きいのはどちら?
  • 32. 効果量  統計的検定の問題-­‐  サンプルサイズが影響。-­‐  有意差あり・なしのみの判断。-­‐  p  値は実質的な差を示さない。
  • 33. 効果量  効果量(effect  size)-­‐  サンプルサイズに影響されない。-­‐  効果の大小を示す。-­‐  実質的な差を確認できる。
  • 34. 効果量 d = 0.2 / r = 0.1効果量 d = 0.2 / r = 0.1
  • 35. <さらに発展編>統計的有意差検定さようなら? 39
  • 36. 一般化線形モデル GLM  (Generalized  Linear  Model)検定 帰無仮説検定である要因の影響を調べる。 まったく別のものではなく発展させたものモデル選択 データを最もよく説明しているモデルを選ぶ。 40
  • 37. “A picture is worth a thousand p values.” (Loftus, 1993)より好ましい図示方法 —Visualization—
  • 38. 分布を見せる 42
  • 39. 「隠れる」「隠される」情報がない100 90 *** CALL 80 *** 70 60 50 40 30 20 10 0 10 20 40 OK Better
  • 40. 個別のデータも見せる 0.700 0.600 0.500 0.400Oxy-Hb(mM-mm) 0.300 0.200 0.100 0.000 Normal Scanning 44 -0.100
  • 41. 個別のデータも見せる 45
  • 42. 論旨に合った図示方法前田啓朗 (2008). WBTを援用した授業で成功した学習者・ 成功しなかった学習者. ARELE, 19, 253–262.
  • 43. 再現性は科学の基本• データの二次利用を推奨すべき。 例えば,使用したデータを(個人情報に 気をつけて)オンラインなどで公開。• ソフトウェアのスクリプトも公開 すれば,誰でも再現ができる。
  • 44. 再現性は科学の基本 http://www.apa.org/pubs/journals/arc/
  • 45. まとめ•  “Resampling”  -­‐-­‐-­‐  強力なツール•「効果量」-­‐-­‐-­‐  実質的な意味•「p  値」よりも「図」で語る•    再現性を重視する風土を!
  • 46. 推薦書籍(入門編)www.mizumot.com/lablog

×