### 草薙 2013 nagoyar11　復元抽出と乱数シミュレーションによる信頼区間の検討

1. 1. 復元抽出と 乱数シミュレーションを ⽤いた信頼区間の検討
2. 2. kusanagi@nagoya-u.jp Nagoya R #11 2013/12/5 名古屋⼤学国際開発研究科
3. 3. 信頼区間 • ⺟数がどのような数値の範囲にあるか – Cf. 予測区間（標本値の推定範囲） – 統計量（標本から求められる⺟集団の⺟数の推定 量） – 確率 • 95%, 99% – 求め⽅ • • • • パラメトリック ノンパラメトリック 確率分布に基づく計算 ブートストラップ
4. 4. 信頼区間 • 情報量の多さ – スケールが失われない – 推定の正しさも加味される • APAでも報告を推奨されている（APA, 2009） • 統計的仮説検定に依存せず，効果量，検 定⼒などと合わせ吟味すべき
5. 5. 信頼区間 • 確率分布に基づく⺟平均の計算例 – 正規分布を考える – 点推定：標本の平均値（M）→⺟平均（μ）の 推定値とみなす – 区間推定: M ± t（df, 任意の確率）×(SD/√N) – Nが∞時，t値は約1.96（95%）になる
6. 6. 信頼区間 • Rで計算してみる – ⾃作関数 pmci pmci <‐ function(data) { l1 <‐ mean(data)‐qt(0.975, length(data)‐ 1)*(sd(data)/sqrt(length(data))) u1 <‐ mean(data)+qt(0.975, length(data)‐ 1)*(sd(data)/sqrt(length(data))) l2 <‐ mean(data)‐qt(0.995, length(data)‐ 1)*(sd(data)/sqrt(length(data))) u2 <‐ mean(data)+qt(0.995, length(data)‐ 1)*(sd(data)/sqrt(length(data))) list("95%CI:lower"=l1, "95%CI:upper"=u1,  "99%CI:lower"=l2, "99%CI:upper"=u2) }
7. 7. 信頼区間 • 可視化したり報告したり – 95% CI [下限, 上限]
8. 8. リサンプリング • 確率分布に基づく計算 – 条件が多い – 数学的にもやや複雑 – 理想化が激しい – 条件を取っ払い計算機の⼒で代⽤しよう！
9. 9. リサンプリング • リサンプリングとは – 標本から再度標本を作り出す統計⼿法全般 • 様々な⽅法 – パラメトリック • 標本値から得られた確率密度関数に従う乱数を⽣成す る⽅法（モンテカルロ法） – ノンパラメトリック • 元標本を複数抽出することによってブートストラップ 標本を作り出す⼿法 • 復元抽出（replacement）： – 抽出の重複を認めるか – 認める／認めない（ジャックナイフ法）
10. 10. リサンプリング • 理屈 – 元標本から⽣成された⼤数のブートストラッ プ標本の分布は⺟分布に近似する • 標本は⺟集団の⼀部 • 標本値を再度選ぶのは⺟集団からもう⼀個取るの と同じ
11. 11. 乱数シミュレーション • ⼿順 – あるテスト，30個の標本を得た – 元標本から推定されたμとσはそれぞれ，73.21, 10,24だった – その分布に従う30個（ブートストラップ標本サ イズ）の乱数を1000個作る（ブートストラップ 標本数，B） – そのブートストラップ標本毎に平均値を求める – 1000個のブートストラップ平均値の分布は⺟平 均値の分布に近似するだろう →可視化したりできるし，順序区間を信頼区間と みなすことによって区間を推定できる！
12. 12. 乱数シミュレーション • Rでやってみる – bsm <- numeric(0) – for(i in 1:1000){bs <- rnorm(30,73.21,10.24); bsm[i] <- mean(bs)} – hist(bsm) – quantile(bsm, c(0.025, 0.975))
13. 13. 復元抽出 • ブートストラップ信頼区間の計算法 – パーセンタイル法 • ⼀番シンプル • ブートストラップ標本それぞれにおける統計量の 順序区間を信頼区間とみなす – パーセンタイルt法 – BCa法 – ベーシック法…
14. 14. 復元抽出 • ⼿順 – あるテスト，30個の標本（元標本）を得た – 30個から重複有りで，30個標本値を取り出す （ブートストラップ標本） – そのブートストラップ標本毎に平均値を求め る – 1000個のブートストラップ平均値の分布は⺟ 平均値の分布に近似するだろう →可視化したりできるし，順序区間を信頼区間 とみなすことによって区間を推定できる！
15. 15. 復元抽出 • Rでやってみよう！ – bsm <- numeric(0) – for(i in 1:1000){bs <- sample(dat, 30, replace=T);bsm[i] <- mean(bs)} – quantile(bsm, c(0.025, 0.975))
16. 16. 応⽤ • 基本的にどんな統計量でもできる – – – – – – 平均差 平均差の検定のt値，有意確率 効果量 回帰係数 相関係数 信頼性係数 – 形態素習得研究におけるGSM（草薙, 2013a）
17. 17. 応⽤ • ⼆変数の標準化平均差（Cohenʼs d）の ブートストラップ信頼区間 • • • • • • • • bootd(tests, 1000, 10) \$summary Min. 1st Qu.  Median    Mean 3rd Qu.    Max. ‐1.4590 ‐0.4546 ‐0.2484 ‐0.2233  0.0000  0.8784 \$`95%CI` 2.5%      97.5% ‐0.8994050  0.5433483 bootd <‐ function(x, n.boot, n.sub) { meany = numeric(0) for(i in 1:n.boot) { subs <‐ x[sample(nrow(x),n.sub,replace=TRUE),] y[i] <‐ c((mean(subs[,1])‐ mean(subs[,2]))/(sqrt((sd(subs[,1])^2+sd(subs[,2])^2)/2))) meany[i] <‐mean(y) } par(mfrow=c(1,3)) boxplot(y, ylab="score")  plot(meany, xlab="", ylab="score") hist(y, ylab="frequency",  xlab="score", main="") list("summary"=summary(y),"95%CI"=quantile(y,p=c( 0.025,0.975)), "sd"=sd(y)) }
18. 18. 応⽤ • ブートストラップ標本における標準化平均差の累積順位 – 追⾏確率関数の推定 • 上記のデータだと1000回中687個のデータが負の効果量を取った ということ。 • 同条件で実験した場合，⼤体69%は同じ符号の効果量を取りそう だといえる
19. 19. 可視化 草薙（2013b） ⺟平均値 Point estimate Flat adverb Point estimate Effect size d 95% CI 0.19 [0.36, 0.74] 526 [492, 559] Adj-ly adverb 効果量 95% CI 509 [484, 538]
20. 20. 可視化 Reading time (ms) 草薙（2013b） Flat adverb ly adverb 700 600 500 400 slow straight different late close quick deep safe
21. 21. ただし • ブートストラップは元標本に依存する – 適⽤でない場合も勿論ある • あくまでも，ひとつのシミュレーション 的データとして解釈すべき • ⼀回ごとに違う数値になる
22. 22. 復元抽出と 乱数シミュレーションを ⽤いた信頼区間の検討 やってみようず！ 草薙邦広（2013a）「形態素習得研究とリサンプリング」 Nagoya R #10, 名古屋⼤学国際開発研究科. http://www.slideshare.net/Kunihiro_KUSANAGI/nagoyar‐24447878  草薙邦広 (2013b) 「第⼆⾔語としての英語における単純形副詞のオンライン処理：⾃⼰ペース読み課題 を⽤いた予備的検討」 第82回外国語教育メディア学会中部⽀部秋季研究⼤会. 中部⼤学. http://www.slideshare.net/Kunihiro_KUSANAGI/let2013‐flatadverb