Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

第5回Zansa勉強会

1,604 views

Published on

第5回Zansa勉強会の資料です。

Published in: Education
  • Be the first to comment

第5回Zansa勉強会

  1. 1. 第5回 Zansa 勉強会 推定について 三留 弘太郎 Graduate school of Mathematical Sciences, University of Tokyo March 26, 2012 . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  2. 2. 自己紹介 名前: 三留 弘太郎(みとめ こうたろう). 研究: 微小ノイズを持つ常微分方程式. 趣味: ビリヤードを始めました. 職種: アクチュアリー. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  3. 3. 今日の流れ 1 導入 2 点推定 3 区間推定 4 仮説検定 5 まとめ . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  4. 4. 導入 1/3 ある実験で,水の沸点を 9 回測定して,以下のような結果を得た. このとき,水の沸点は何℃か? 100.0 100.1 101.0 99.3 97.8 100.2 98.5 100.1 101.0 100.0 実験結果(単位:℃) . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  5. 5. 導入 2/3 素朴に考えると 単純にデータを全て足して,9 で割った値 99.78 ℃ ぐらい のよう に思える. Remark (記法) 統計の世界では,i 番目のデータを xi と書く.また,xi の平均を ∑n i=1 xi /n = x と書く.つまり,小文字の上にバーがついていた ら単純平均を表す. 今回の場合は, 1 x = (100.0 + 100.1 + · · · + 100.1 + 101.0) 9 = 99.78 である. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  6. 6. 導入 3/3 この直感に根拠を与えたい. そのために. .. 点推定 真の値を実験データから推定する方法. 区間推定 上の推定の精度を測る. # 前提: 統計学は,実際の測定値(実現値)から真のパラメータ (期待値など)を推定することを目的としている. " ! まとめると. .. 実際の観測値 . . . 分かっていること. 真のパラメータ . . . 推定したいもの. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  7. 7. 仮定 平均 0,分散 σ 2 の正規分布に従う独立同分布な誤差 ε1 , ε2 , . . . を 用いて,実験結果が xi = (真の値) + (誤差) = µ + εi と書けると仮定する.このとき xi も平均 µ,分散 σ 2 の正規分布 に従うことに注意. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  8. 8. 復習 一般に,確率変数 X に対して以下のように平均と分散を定義する. 平均: µ= E [X ] 分散: σ2= Var [X ] = E [(X − µ)2 ] = E [X 2 ] − µ2 また,正規分布は以下で定義される分布であった. Remark (正規分布) 確率変数 X が平均 µ,分散 σ 2 の正規分布に従うとは ∫ a ( ) 1 (x − µ)2 P(X ≤ a) = √ exp − dx 2πσ 2 −∞ 2σ 2 と書けることを言う. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  9. 9. 第5回 Zansa  点推定・区間推定・仮説検定 三留 弘太郎. . . . . . Ϭ͘ϱ Ϭ͘ϰ Ϭ͘ϯ Ϭ͘Ϯ Ϭ͘ϭ Ϭ͘Ϭ Ϭ͘ϭͲ Ϭ͘ϮͲ Ϭ͘ϯͲ Ϭ͘ϰͲ Ϭ͘ϱͲ Ϭ ϱϬ͘Ϭ ϭ͘Ϭ ϱϭ͘Ϭ Ϯ͘Ϭ ϱϮ͘Ϭ ϯ͘Ϭ ϱϯ͘Ϭ ϰ͘Ϭ ϱϰ͘Ϭ ṇ॔ศᕸ΅Ǭศᕸ ;ʅсϬ͕ʍсϭ͕ĂсϭͿ 正規分布の図
  10. 10. 点推定 1/3 実験データからどのようにして Question: µ を決定すれば良いのだろうか? 一つの考え方 x の単純平均 x は x1 + x2 + · · · + xn x= n ε1 + ε2 + · · · + εn =µ+ n と書けるが,大数の法則から n が大きいと (ε1 + ε2 + · · · + εn )/n は 0 に近づく. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  11. 11. 点推定 2/3 つまり, データの単純平均は,データ数が大きいほど 誤差の影響のない真の値(期待値)に近づく. このことを根拠に,µ を x で推定することには一定の合理性があ るように思える. では, 正規分布のもう一つのパラメータ  σ 2 はどうやって推定したらよいのか? . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  12. 12. 点推定 3/3 モーメント法 大数の法則により,xi2 の単純平均は xi2 の期待値に近づく.これ を式で書けば x1 + x2 + · · · + xn 2 2 2 → E [X 2 ] = µ2 + σ 2 n となる.µ は既に実験データで推定できていたので x1 + x2 + · · · + xn 2 2 2 µ2 + σ 2 = n と推定すれば,σ 2 も実験データから推定することができる.この § ¤ モーメント法 ¥ ような手法を¦ という. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  13. 13. 区間推定 1/9 上の点推定はどの程度信用できるのか? 真の値からどのくらいズレているのか? サンプル数を増やすことによってどのくらい精度は上がって いるのか? この問題提起に対して,確率の言葉 を使って回答を与えるのが区間推定. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  14. 14. 区間推定 2/9 (正規分布の性質 (1)) 平均 µ,分散 σ 2 の正規分布に従うサンプルたちの単純平均 X は, 平均 µ,分散 σ 2 /n を持つ正規分布に再び従う. (正規分布の性質 (2)) サンプルたちの単純平均 x が平均 µ,分散 σ 2 /n の正規分布に従 うならば, x −µ √ σ 2 /n は平均 0,分散 1 の標準正規分布に従う. これらの性質から,x を考える代わりに標準正規分布に従うサン プル Z について考察すればよいことが言える. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  15. 15. 区間推定 3/9 区間推定の概要 区間推定では # 推定したい値(今回は µ)が 100α パーセント(例えば 95 パーセントなど) の確率である区間 [θL (x1 , . . . , xn ), θU (x1 , . . . , xn )] に入る. ! という言い方で結論を述べる.この区間のことを 100α パーセン ト信頼区間という.この区間の幅はなるべく短く取ることが望ま しい. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  16. 16. 区間推定 4/9 例えば,平均 0,分散 1 の標準正規分布に従うサンプル Z につ いて P(θL ≤ Z ≤ θU ) = 0.95 となる θL , θU の組はたくさんあるが,この区間 [θL , θU ] が一番短 くなるのは, P(Z ≥ θU ) = P(Z ≤ θL ) = 0.025 となるときである.このとき,正規分布の対称性から θU = −θL であることが分かるので,θU だけ分かれば十分である. Definition (上側 100α パーセント点) 標準正規分布に従うサンプル Z について P(Z ≥ Zα ) = α (0 α 1) となる Zα を,標準正規分布の上側 100α パーセント点という. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  17. 17. 第5回 Zansa  点推定・区間推定・仮説検定 三留 弘太郎. . . . . . Ϭ͘ϲ Ϭ͘ϰ Ϭ͘Ϯ Ϭ͘Ϭ Ϭ͘ϮͲ Ϭ͘ϰͲ Ϭ͘ϲͲ Ϭ ϱϬ͘Ϭ ϭ͘Ϭ ϱϭ͘Ϭ Ϯ͘Ϭ ϱϮ͘Ϭ ϯ͘Ϭ ϱϯ͘Ϭ ϰ͘Ϭ ϱϰ͘Ϭ Ⅼ ṇ॔ศᕸୖഃɲⅬ 正規分布の上側確率
  18. 18. 区間推定 5/9 区間推定の実際の方法 x −µ Z=√ σ 2 /n は平均 0,分散 1 の標準正規分布に従うのだった.よって, x −µ 0.95 = P(−Z0.025 ≤ √ ≤ Z0.025 ) σ 2 /n √ √ = P(x − Z0.025 σ 2 /n ≤ µ ≤ x + Z0.025 σ 2 /n) となる. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  19. 19. 区間推定 6/9 区間推定の主張 結論: もしも σ 2 が分かっていれば,95 パーセントの確率で √ √ 真の平均 µ は区間 [x − Z0.025 σ 2 /n, x + Z0.025 σ 2 /n] に入る. 別の言い方をすれば,95 パーセントの確率で,µ と x の誤差は √ Z0.025 σ 2 /n の範囲に収まる. しかし,今回 σ 2 は分かっていない. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  20. 20. 区間推定 7/9 t-検定 ∑n モーメント法で推定した σ 2 の推定値は,1/n i=1 (xi − x)2 で あった.これに少し調整を加えた 1 ∑ n s2 = (xi − x)2 n−1 i=1 を,不偏分散と呼ぶ.著しい性質として E [s 2 ] = σ 2 が成り立つ √ (不偏性).これを用いて Z = (x − µ)/ σ 2 /n の代わりに x −µ t=√ s 2 /n と置いて区間推定を行う. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  21. 21. 区間推定 8/9 t-分布 Definition (t-分布) 上で定義される t は「自由度 n − 1 の t-分布」と呼ばれる分布に 従う.この分布にも上側確率 α 点 tα (n − 1) が定義される.すな わち, P(t ≥ tα (n − 1)) = α が成り立つ. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  22. 22. 区間推定 9/9 やってみた 今回のケースでは, 1∑ n x= xi = 99.78 n i=1 1 ∑ n 2 s = (xi − x)2 = 1.149 n−1 i=1 であり t0.025 (9 − 1) = 2.306 なので,真の期待値 µ は 95 パーセン トの確率で閉区間 √ √ [x − t0.025 (8) s 2 /n, x + t0.025 (8) s 2 /n] = [98.96, 100.60] に入る,と言える. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  23. 23. 仮説検定 1/3 新しい疑問 この実験から,水の沸点は 100 ℃であると言えるだろうか? この疑問に対して,確率の言葉を用いた判断基準を用意してくれ るのが仮説検定である. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  24. 24. 仮説検定 2/3 仮説検定の考え方 1 検定したい仮説(帰無仮説)として H0:µ =100 ℃を設ける. 2 H0 の対立仮説として,今回は H1 :µ ̸=100 ℃と置く. 注意すること 仮説に対する意思決定として,以下のようなケースが考えられる. H0 が正しい H1 が正しい  H0 を受容 妥当な判断 第二種の誤り H0 を棄却 第一種の誤り 妥当な判断 $ 第一種,二種の誤りの確率を同時に小さくすることはできない. 仮説検定では,第一種の誤りをしてしまう確率を ε 未満に 抑えながら,第二種の誤りをしてしまう確率をなるべく小さく するように判断する.この ε を有意水準と呼ぶ. % . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  25. 25. 仮説検定 3/3 具体的な方法 1 有意水準 5 パーセントで検定したいと思う. 2 H0 が正しいと仮定する. 3 この仮定の下では,µ = 100 のはずである. √ 4 すると,t = (x − µ)/ s 2 /n の値が計算できる. 5 このときの t の値が [−t0.025 , t0.025 ] の範囲に収まっていれ ば,95 パーセントの確率で仮説 H0 は実現値と矛盾しないと みなせる.この場合,H0 を受容する(棄却しない) .そうで ないときには H0 を棄却する. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  26. 26. まとめ (点推定) (モーメント法) 母数 λ1 , λ2 , . . . , λk を持つ分布に従うデータ x1 , x2 , . . . , xn が与え られたとする.このとき, 1∑ n g1 (λ1 , . . . , λk ) = E [X ] = xi n i=1 . . . 1∑ k n gk (λ1 , . . . , λk ) = E [X k ] = xi n i=1 ˆ ˆ という λ に関する連立方程式を解いて得られる λ1 , . . . , λk を以っ て λ1 , λ2 , . . . , λk の推定値とみなす. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  27. 27. まとめ (区間推定) (正規分布のパラメータ µ の区間推定) 同じ正規母集団に従うデータ x1 , . . . , xn が与えられたとする.分 散 σ 2 が未知のとき,正規分布の期待値 µ の 100(1 − ε) パーセン ト信頼区間は [ √ √ ] x − tε/2 (n − 1) s 2 /n, x + t ε/2 (n − 1) s 2 /n で与えられる.ここで, 1∑ n x = xi サンプルの単純平均  n i=i 1 ∑ n s2 = (xi − x)2 不偏分散 n−1 i=1   tε/2 (n − 1)   上側 ε/2 点 . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  28. 28. まとめ (仮説検定) (仮説検定) 同じ正規母集団に従うデータ x1 , . . . , xn が与えられたとする.分 散 σ 2 が未知のとき,正規分布の期待値 µ の有意水準 ε の仮説検 定は以下の手順で行う. 1 帰無仮説 H0 :µ = µ0 を設ける. 2 対立仮説として H1 :µ ̸= µ0 と置く. √ 3 t = (x − µ)/ s 2 /n を計算する. 4 t ∈ [−tε/2 , tε/2 ] ならば H0 を受容,そうでないときは棄却 する. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定
  29. 29. ご清聴ありがとうございました. . . . . . . 三留 弘太郎 第5回 Zansa  点推定・区間推定・仮説検定

×