Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
復元抽出と
乱数シミュレーションを
⽤いた信頼区間の検討
kusanagi@nagoya-u.jp
Nagoya R #11
2013/12/5
名古屋⼤学国際開発研究科
信頼区間
• ⺟数がどのような数値の範囲にあるか

– Cf. 予測区間(標本値の推定範囲)
– 統計量(標本から求められる⺟集団の⺟数の推定
量)
– 確率
• 95%, 99%

– 求め⽅
•
•
•
•

パラメトリック
ノンパラメトリ...
信頼区間
• 情報量の多さ

– スケールが失われない
– 推定の正しさも加味される

• APAでも報告を推奨されている(APA,
2009)
• 統計的仮説検定に依存せず,効果量,検
定⼒などと合わせ吟味すべき
信頼区間
• 確率分布に基づく⺟平均の計算例

– 正規分布を考える
– 点推定:標本の平均値(M)→⺟平均(μ)の
推定値とみなす
– 区間推定: M ± t(df, 任意の確率)×(SD/√N)
– Nが∞時,t値は約1.96(95%)にな...
信頼区間
• Rで計算してみる
– ⾃作関数 pmci

pmci <‐ function(data)
{
l1 <‐ mean(data)‐qt(0.975, length(data)‐
1)*(sd(data)/sqrt(length(da...
信頼区間
• 可視化したり報告したり
– 95% CI [下限, 上限]
リサンプリング
• 確率分布に基づく計算

– 条件が多い
– 数学的にもやや複雑
– 理想化が激しい
– 条件を取っ払い計算機の⼒で代⽤しよう!
リサンプリング
• リサンプリングとは

– 標本から再度標本を作り出す統計⼿法全般

• 様々な⽅法

– パラメトリック

• 標本値から得られた確率密度関数に従う乱数を⽣成す
る⽅法(モンテカルロ法)

– ノンパラメトリック

• 元標...
リサンプリング
• 理屈

– 元標本から⽣成された⼤数のブートストラッ
プ標本の分布は⺟分布に近似する
• 標本は⺟集団の⼀部
• 標本値を再度選ぶのは⺟集団からもう⼀個取るの
と同じ
乱数シミュレーション
• ⼿順

– あるテスト,30個の標本を得た
– 元標本から推定されたμとσはそれぞれ,73.21,
10,24だった
– その分布に従う30個(ブートストラップ標本サ
イズ)の乱数を1000個作る(ブートストラップ
標...
乱数シミュレーション
• Rでやってみる

– bsm <- numeric(0)
– for(i in 1:1000){bs <- rnorm(30,73.21,10.24); bsm[i] <- mean(bs)}
– hist(bsm)
...
復元抽出
• ブートストラップ信頼区間の計算法
– パーセンタイル法

• ⼀番シンプル
• ブートストラップ標本それぞれにおける統計量の
順序区間を信頼区間とみなす

– パーセンタイルt法
– BCa法
– ベーシック法…
復元抽出
• ⼿順

– あるテスト,30個の標本(元標本)を得た
– 30個から重複有りで,30個標本値を取り出す
(ブートストラップ標本)
– そのブートストラップ標本毎に平均値を求め
る
– 1000個のブートストラップ平均値の分布は⺟
...
復元抽出
• Rでやってみよう!

– bsm <- numeric(0)
– for(i in 1:1000){bs <- sample(dat, 30, replace=T);bsm[i]
<- mean(bs)}
– quantile(b...
応⽤
• 基本的にどんな統計量でもできる
–
–
–
–
–
–

平均差
平均差の検定のt値,有意確率
効果量
回帰係数
相関係数
信頼性係数

– 形態素習得研究におけるGSM(草薙, 2013a)
応⽤
• ⼆変数の標準化平均差(Cohenʼs d)の
ブートストラップ信頼区間
•
•
•
•
•
•
•
•

bootd(tests, 1000, 10)
$summary
Min. 1st Qu.  Median    Mean 3rd...
応⽤
• ブートストラップ標本における標準化平均差の累積順位
– 追⾏確率関数の推定

• 上記のデータだと1000回中687個のデータが負の効果量を取った
ということ。
• 同条件で実験した場合,⼤体69%は同じ符号の効果量を取りそう
だとい...
可視化

草薙(2013b)

⺟平均値
Point estimate
Flat adverb

Point estimate
Effect size d

95% CI

0.19

[0.36, 0.74]

526

[492, 559]...
可視化

Reading time (ms)

草薙(2013b)
Flat adverb
ly adverb

700
600
500
400
slow

straight different

late

close

quick

dee...
ただし
• ブートストラップは元標本に依存する
– 適⽤でない場合も勿論ある

• あくまでも,ひとつのシミュレーション
的データとして解釈すべき
• ⼀回ごとに違う数値になる
復元抽出と
乱数シミュレーションを
⽤いた信頼区間の検討
やってみようず!
草薙邦広(2013a)「形態素習得研究とリサンプリング」 Nagoya R #10, 名古屋⼤学国際開発研究科.
http://www.slideshare.net/K...
Upcoming SlideShare
Loading in …5
×

草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

1,726 views

Published on

草薙邦広「復元抽出と乱数シミュレーションを用いた信頼区間の検討」2013年12月7日. Nagoya R #11, 名古屋大学国際開発研究科.

  • Be the first to comment

  • Be the first to like this

草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

  1. 1. 復元抽出と 乱数シミュレーションを ⽤いた信頼区間の検討
  2. 2. kusanagi@nagoya-u.jp Nagoya R #11 2013/12/5 名古屋⼤学国際開発研究科
  3. 3. 信頼区間 • ⺟数がどのような数値の範囲にあるか – Cf. 予測区間(標本値の推定範囲) – 統計量(標本から求められる⺟集団の⺟数の推定 量) – 確率 • 95%, 99% – 求め⽅ • • • • パラメトリック ノンパラメトリック 確率分布に基づく計算 ブートストラップ
  4. 4. 信頼区間 • 情報量の多さ – スケールが失われない – 推定の正しさも加味される • APAでも報告を推奨されている(APA, 2009) • 統計的仮説検定に依存せず,効果量,検 定⼒などと合わせ吟味すべき
  5. 5. 信頼区間 • 確率分布に基づく⺟平均の計算例 – 正規分布を考える – 点推定:標本の平均値(M)→⺟平均(μ)の 推定値とみなす – 区間推定: M ± t(df, 任意の確率)×(SD/√N) – Nが∞時,t値は約1.96(95%)になる
  6. 6. 信頼区間 • Rで計算してみる – ⾃作関数 pmci pmci <‐ function(data) { l1 <‐ mean(data)‐qt(0.975, length(data)‐ 1)*(sd(data)/sqrt(length(data))) u1 <‐ mean(data)+qt(0.975, length(data)‐ 1)*(sd(data)/sqrt(length(data))) l2 <‐ mean(data)‐qt(0.995, length(data)‐ 1)*(sd(data)/sqrt(length(data))) u2 <‐ mean(data)+qt(0.995, length(data)‐ 1)*(sd(data)/sqrt(length(data))) list("95%CI:lower"=l1, "95%CI:upper"=u1,  "99%CI:lower"=l2, "99%CI:upper"=u2) }
  7. 7. 信頼区間 • 可視化したり報告したり – 95% CI [下限, 上限]
  8. 8. リサンプリング • 確率分布に基づく計算 – 条件が多い – 数学的にもやや複雑 – 理想化が激しい – 条件を取っ払い計算機の⼒で代⽤しよう!
  9. 9. リサンプリング • リサンプリングとは – 標本から再度標本を作り出す統計⼿法全般 • 様々な⽅法 – パラメトリック • 標本値から得られた確率密度関数に従う乱数を⽣成す る⽅法(モンテカルロ法) – ノンパラメトリック • 元標本を複数抽出することによってブートストラップ 標本を作り出す⼿法 • 復元抽出(replacement): – 抽出の重複を認めるか – 認める/認めない(ジャックナイフ法)
  10. 10. リサンプリング • 理屈 – 元標本から⽣成された⼤数のブートストラッ プ標本の分布は⺟分布に近似する • 標本は⺟集団の⼀部 • 標本値を再度選ぶのは⺟集団からもう⼀個取るの と同じ
  11. 11. 乱数シミュレーション • ⼿順 – あるテスト,30個の標本を得た – 元標本から推定されたμとσはそれぞれ,73.21, 10,24だった – その分布に従う30個(ブートストラップ標本サ イズ)の乱数を1000個作る(ブートストラップ 標本数,B) – そのブートストラップ標本毎に平均値を求める – 1000個のブートストラップ平均値の分布は⺟平 均値の分布に近似するだろう →可視化したりできるし,順序区間を信頼区間と みなすことによって区間を推定できる!
  12. 12. 乱数シミュレーション • Rでやってみる – bsm <- numeric(0) – for(i in 1:1000){bs <- rnorm(30,73.21,10.24); bsm[i] <- mean(bs)} – hist(bsm) – quantile(bsm, c(0.025, 0.975))
  13. 13. 復元抽出 • ブートストラップ信頼区間の計算法 – パーセンタイル法 • ⼀番シンプル • ブートストラップ標本それぞれにおける統計量の 順序区間を信頼区間とみなす – パーセンタイルt法 – BCa法 – ベーシック法…
  14. 14. 復元抽出 • ⼿順 – あるテスト,30個の標本(元標本)を得た – 30個から重複有りで,30個標本値を取り出す (ブートストラップ標本) – そのブートストラップ標本毎に平均値を求め る – 1000個のブートストラップ平均値の分布は⺟ 平均値の分布に近似するだろう →可視化したりできるし,順序区間を信頼区間 とみなすことによって区間を推定できる!
  15. 15. 復元抽出 • Rでやってみよう! – bsm <- numeric(0) – for(i in 1:1000){bs <- sample(dat, 30, replace=T);bsm[i] <- mean(bs)} – quantile(bsm, c(0.025, 0.975))
  16. 16. 応⽤ • 基本的にどんな統計量でもできる – – – – – – 平均差 平均差の検定のt値,有意確率 効果量 回帰係数 相関係数 信頼性係数 – 形態素習得研究におけるGSM(草薙, 2013a)
  17. 17. 応⽤ • ⼆変数の標準化平均差(Cohenʼs d)の ブートストラップ信頼区間 • • • • • • • • bootd(tests, 1000, 10) $summary Min. 1st Qu.  Median    Mean 3rd Qu.    Max. ‐1.4590 ‐0.4546 ‐0.2484 ‐0.2233  0.0000  0.8784 $`95%CI` 2.5%      97.5% ‐0.8994050  0.5433483 bootd <‐ function(x, n.boot, n.sub) { meany = numeric(0) for(i in 1:n.boot) { subs <‐ x[sample(nrow(x),n.sub,replace=TRUE),] y[i] <‐ c((mean(subs[,1])‐ mean(subs[,2]))/(sqrt((sd(subs[,1])^2+sd(subs[,2])^2)/2))) meany[i] <‐mean(y) } par(mfrow=c(1,3)) boxplot(y, ylab="score")  plot(meany, xlab="", ylab="score") hist(y, ylab="frequency",  xlab="score", main="") list("summary"=summary(y),"95%CI"=quantile(y,p=c( 0.025,0.975)), "sd"=sd(y)) }
  18. 18. 応⽤ • ブートストラップ標本における標準化平均差の累積順位 – 追⾏確率関数の推定 • 上記のデータだと1000回中687個のデータが負の効果量を取った ということ。 • 同条件で実験した場合,⼤体69%は同じ符号の効果量を取りそう だといえる
  19. 19. 可視化 草薙(2013b) ⺟平均値 Point estimate Flat adverb Point estimate Effect size d 95% CI 0.19 [0.36, 0.74] 526 [492, 559] Adj-ly adverb 効果量 95% CI 509 [484, 538]
  20. 20. 可視化 Reading time (ms) 草薙(2013b) Flat adverb ly adverb 700 600 500 400 slow straight different late close quick deep safe
  21. 21. ただし • ブートストラップは元標本に依存する – 適⽤でない場合も勿論ある • あくまでも,ひとつのシミュレーション 的データとして解釈すべき • ⼀回ごとに違う数値になる
  22. 22. 復元抽出と 乱数シミュレーションを ⽤いた信頼区間の検討 やってみようず! 草薙邦広(2013a)「形態素習得研究とリサンプリング」 Nagoya R #10, 名古屋⼤学国際開発研究科. http://www.slideshare.net/Kunihiro_KUSANAGI/nagoyar‐24447878  草薙邦広 (2013b) 「第⼆⾔語としての英語における単純形副詞のオンライン処理:⾃⼰ペース読み課題 を⽤いた予備的検討」 第82回外国語教育メディア学会中部⽀部秋季研究⼤会. 中部⼤学. http://www.slideshare.net/Kunihiro_KUSANAGI/let2013‐flatadverb 

×