SlideShare a Scribd company logo
1 of 20
1




情報統計学


        区間推定
区間推定                            2


• たった一組のデータで求めた値が,母平均の値に一
  致する可能性は少ない。
• 区間を求める「区間推定」を考える
  求める区間の幅はできるだけ狭く
  定めた区間内にパラメータが入っている確率はできるだけ
   大きくなるように


• 同時に満たすことは難しい
  確率に条件を付ける
    • 信頼度 1-α を定める。
    • 求めた推定区間の中にパラメータが入っている確率が
      1-α 以上になる区間のなかで,幅をできるだけ狭くする
信頼区間   3
母平均 μ の区間推定(母分散 σ2 が既知の場合)   4
母平均 μ の区間推定(母分散 σ2 が既知の場合)   5
シミュレーション                           6

• R の関数 rnorm は N(0, 1) に従う乱数を生成
   これを母集団と考えて, 10 個の乱数(標本)をとり,
    母平均の信頼度 1-α=0.95 の信頼区間を作る
シミュレーション   7
8




乱数によっては,母平均 μ=0 を
含む場合と,含まない場合がある
9

• 区間推定を 100 回繰り返して,確かめてみる。
    区間を 100 個作る。
   > for(i in 1:100){
    print(conf.interval(rnorm(10), 0.95, 1))
   }


• 関数 sim.conf.interval
    シミュレーションの回数,標本数,信頼度
    標本数 n=10 ・信頼度 1-α=0.95 ・シミュレーション回数 5 回
    sim.conf.interval(5, 10, 0.95)
10

• シミュレーション回数を 100 回にして, 100 組の信頼区間
• 真の母平均の値 μ=0 を含まない信頼区間だけを表示
11

• グラフにして表示
• r <- sim.conf.interval(100, 10, 0.95)
• plot.conf.interval(r)




                              100
                              80
                              60
                         gy

                              40
                              20
                              0




                                    -2    -1   0    1   2

                                               gx
母平均 μ の信頼区間(母分散 σ2 が未知のとき)       12

• 母分散 σ2 が未知のときは,先ほどの方法は使えない
• ここで次の性質を使う。( σ2 は未知なため, σ は使えない)
母平均 μ の信頼区間(母分散 σ2 が未知のとき)   13

• P69
母平均 μ の信頼区間(母分散 σ2 が未知のとき)   14
信頼区間の計算   15
シミュレーション   16
gy

          0   20   40        60   80   100




     -2
     -1
     0

gx
     1
     2
                                             17
信頼区間の幅                           18




         母分散が未知の場合は母分散のかわりに,不偏
           推定値の標本不偏分散を用いているため
              ・信頼区間の幅がすべて同じ
             ・信頼区間の幅が変わっている
演習                                        19

• N(0,1) に従う乱数を 999 個作成し,小さいほうから 25 番目,
  975 番目の値を求め, qnorm 関数より, α=0.025 の値, α =
  0.975 の値と比較せよ。
   並べ替えは sort 関数で行うことができる
     • sort(x) で x を小さい順に並べ替える
         – その 1 番目の値を見るためには, sort(x)[1]
レポート                                 20

• N(0,1) に従う乱数を 16 個発生させ,その平均を求めることを
  999 回繰り返す。
  999 個の平均の,平均を求めよ。
  小さいほうから 25 番目の値と、 975 番目の値を求めよ。

More Related Content

More from t2tarumi

K090 仮説検定
K090 仮説検定K090 仮説検定
K090 仮説検定t2tarumi
 
K050 t分布f分布
K050 t分布f分布K050 t分布f分布
K050 t分布f分布t2tarumi
 
K030 appstat201203 2variable
K030 appstat201203 2variableK030 appstat201203 2variable
K030 appstat201203 2variablet2tarumi
 
K020 appstat201202
K020 appstat201202K020 appstat201202
K020 appstat201202t2tarumi
 
K010 appstat201201
K010 appstat201201K010 appstat201201
K010 appstat201201t2tarumi
 
000 統計学入門 目標
000 統計学入門 目標000 統計学入門 目標
000 統計学入門 目標t2tarumi
 
086 独立性の検定
086 独立性の検定086 独立性の検定
086 独立性の検定t2tarumi
 
076 母比率の推定
076 母比率の推定076 母比率の推定
076 母比率の推定t2tarumi
 
080 統計的推測 検定
080 統計的推測 検定080 統計的推測 検定
080 統計的推測 検定t2tarumi
 
070 統計的推測 母集団と推定
070 統計的推測 母集団と推定070 統計的推測 母集団と推定
070 統計的推測 母集団と推定t2tarumi
 
060 期待値・中心極限定理
060 期待値・中心極限定理060 期待値・中心極限定理
060 期待値・中心極限定理t2tarumi
 
050 確率と確率分布
050 確率と確率分布050 確率と確率分布
050 確率と確率分布t2tarumi
 
040 相関
040 相関040 相関
040 相関t2tarumi
 
030 2変数の集計
030 2変数の集計030 2変数の集計
030 2変数の集計t2tarumi
 
020 1変数の集計
020 1変数の集計020 1変数の集計
020 1変数の集計t2tarumi
 
010 統計学とは
010 統計学とは010 統計学とは
010 統計学とはt2tarumi
 

More from t2tarumi (16)

K090 仮説検定
K090 仮説検定K090 仮説検定
K090 仮説検定
 
K050 t分布f分布
K050 t分布f分布K050 t分布f分布
K050 t分布f分布
 
K030 appstat201203 2variable
K030 appstat201203 2variableK030 appstat201203 2variable
K030 appstat201203 2variable
 
K020 appstat201202
K020 appstat201202K020 appstat201202
K020 appstat201202
 
K010 appstat201201
K010 appstat201201K010 appstat201201
K010 appstat201201
 
000 統計学入門 目標
000 統計学入門 目標000 統計学入門 目標
000 統計学入門 目標
 
086 独立性の検定
086 独立性の検定086 独立性の検定
086 独立性の検定
 
076 母比率の推定
076 母比率の推定076 母比率の推定
076 母比率の推定
 
080 統計的推測 検定
080 統計的推測 検定080 統計的推測 検定
080 統計的推測 検定
 
070 統計的推測 母集団と推定
070 統計的推測 母集団と推定070 統計的推測 母集団と推定
070 統計的推測 母集団と推定
 
060 期待値・中心極限定理
060 期待値・中心極限定理060 期待値・中心極限定理
060 期待値・中心極限定理
 
050 確率と確率分布
050 確率と確率分布050 確率と確率分布
050 確率と確率分布
 
040 相関
040 相関040 相関
040 相関
 
030 2変数の集計
030 2変数の集計030 2変数の集計
030 2変数の集計
 
020 1変数の集計
020 1変数の集計020 1変数の集計
020 1変数の集計
 
010 統計学とは
010 統計学とは010 統計学とは
010 統計学とは
 

K080 区間推定

  • 1. 1 情報統計学 区間推定
  • 2. 区間推定 2 • たった一組のデータで求めた値が,母平均の値に一 致する可能性は少ない。 • 区間を求める「区間推定」を考える  求める区間の幅はできるだけ狭く  定めた区間内にパラメータが入っている確率はできるだけ 大きくなるように • 同時に満たすことは難しい  確率に条件を付ける • 信頼度 1-α を定める。 • 求めた推定区間の中にパラメータが入っている確率が 1-α 以上になる区間のなかで,幅をできるだけ狭くする
  • 4. 母平均 μ の区間推定(母分散 σ2 が既知の場合) 4
  • 5. 母平均 μ の区間推定(母分散 σ2 が既知の場合) 5
  • 6. シミュレーション 6 • R の関数 rnorm は N(0, 1) に従う乱数を生成  これを母集団と考えて, 10 個の乱数(標本)をとり, 母平均の信頼度 1-α=0.95 の信頼区間を作る
  • 9. 9 • 区間推定を 100 回繰り返して,確かめてみる。  区間を 100 個作る。 > for(i in 1:100){ print(conf.interval(rnorm(10), 0.95, 1)) } • 関数 sim.conf.interval  シミュレーションの回数,標本数,信頼度  標本数 n=10 ・信頼度 1-α=0.95 ・シミュレーション回数 5 回  sim.conf.interval(5, 10, 0.95)
  • 10. 10 • シミュレーション回数を 100 回にして, 100 組の信頼区間 • 真の母平均の値 μ=0 を含まない信頼区間だけを表示
  • 11. 11 • グラフにして表示 • r <- sim.conf.interval(100, 10, 0.95) • plot.conf.interval(r) 100 80 60 gy 40 20 0 -2 -1 0 1 2 gx
  • 12. 母平均 μ の信頼区間(母分散 σ2 が未知のとき) 12 • 母分散 σ2 が未知のときは,先ほどの方法は使えない • ここで次の性質を使う。( σ2 は未知なため, σ は使えない)
  • 13. 母平均 μ の信頼区間(母分散 σ2 が未知のとき) 13 • P69
  • 14. 母平均 μ の信頼区間(母分散 σ2 が未知のとき) 14
  • 17. gy 0 20 40 60 80 100 -2 -1 0 gx 1 2 17
  • 18. 信頼区間の幅 18 母分散が未知の場合は母分散のかわりに,不偏 推定値の標本不偏分散を用いているため ・信頼区間の幅がすべて同じ ・信頼区間の幅が変わっている
  • 19. 演習 19 • N(0,1) に従う乱数を 999 個作成し,小さいほうから 25 番目, 975 番目の値を求め, qnorm 関数より, α=0.025 の値, α = 0.975 の値と比較せよ。  並べ替えは sort 関数で行うことができる • sort(x) で x を小さい順に並べ替える – その 1 番目の値を見るためには, sort(x)[1]
  • 20. レポート 20 • N(0,1) に従う乱数を 16 個発生させ,その平均を求めることを 999 回繰り返す。  999 個の平均の,平均を求めよ。  小さいほうから 25 番目の値と、 975 番目の値を求めよ。