Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

カイ2乗分布について

2,045 views

Published on

  • Be the first to comment

カイ2乗分布について

  1. 1. カイ2乗分布について 西尾泰和 13年11月8日金曜日 1
  2. 2.   参考文献 • Pearson(1900) “X. On the Criterion that a given System of Deviations from the Probable in the Case of a Correlated System of arisen from Random Sampling” • Fisher(1924) “ON A DISTRIBUTION YIELDING THE ERROR FUNCTION OF SEVERAL WELL KNOWN STATISTICS” • PSU(2013): https://onlinecourses.science.psu.edu/stat414/node/154 • MIT(2008): http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/ 6-436j-fundamentals-of-probability-fall-2008/lecture-notes/MIT6_436JF08_lec14.pdf     13年11月8日金曜日 2
  3. 3.   今日の流れ • カイ2乗分布の「自由度」とか「正規分布の2乗の和 がカイ2乗分布になる」とかがスッキリしないので 論文を読んでみよう • Fisher(1924)を紹介 • Pearson(1900)を紹介 • 「正規分布の2乗の和がカイ2乗分布」を証明する     13年11月8日金曜日 3
  4. 4.     • まずFisher(1924)の内容: • 最近明らかになった事実の多くがchisq, z, tという single family of distributionに関係している* • これらの分布の関係について整理してみよう Fisher(1924), * chisqはカイ2乗のこと、入力しにくいので置き換えた   13年11月8日金曜日 4
  5. 5.     • error functionを実験誤差と関連付けて考えがち • だけどそれって • 複数の観測値の組み合わせ • 間接的にしかerror functionと関連してない • 複数の観測から得られた統計値 Fisher(1924) p.494   13年11月8日金曜日 5
  6. 6.     • 多くの統計量はデータが多くなれば正規分布に近づ く傾向がある。しかしいくつかの重要な統計量は正 規分布に近づかない • それ以外でも通常入手可能な小さいサンプル数では far from normalだ Fisher(1924) p.494   13年11月8日金曜日 6
  7. 7.     • その状況で有意性の検定をするのはinadequateであ りmay be very misleading • test of significanceだけじゃなくtest of goodnes of fitが 大事! Fisher(1924) p.494   13年11月8日金曜日 7
  8. 8.     • 1900年 ピアソンがカイ2乗 test of goodness を考案 • このchisqの分布は正規分布ではない • mの具体的な値とは無関係 • n’つまりクラスの個数がパラメータになる(2以上) • 数表は2∼で作られた Fisher(1924) p.495   13年11月8日金曜日 8
  9. 9.     • Pearsonは小さい値の項を無視した • しかし実際にはこの項はdo not tend to zero • not small at all • 結果として、Pearson以降の25年間に作られた検 定の大部分は修正が必要だ • 「な、なんだってー!」 Fisher(1924) p.495   13年11月8日金曜日 9
  10. 10.     • ラッキーなことにPearsonの式は再利用できる • ただし、n’を読み替える: 「自由度+1」に。 not as the number of frequency classes, but as one more than the number of degree of freedom • r行c列の分割表なら n’ = cr ! (n’ - 1) = (c - 1)(r - 1) Fisher(1924) p.495   13年11月8日金曜日 10
  11. 11.     • n = n’ - 1 をパラメータに使うほうが便利 • 表が2からじゃなくて1から始まるようになるし • n個の標準正規分布からのサンプルを2乗して足した ものがchisq(n)に従うし • chisq(n)の平均がnになるし。 Fisher(1924) p.495   13年11月8日金曜日 11
  12. 12.     • ここまでがFisher(1924)の主張 • 本当は「Pearsonは間違っている」と指摘した 論文を読みたかったが、どれかわからなかった • ここからPearson(1900)の話     13年11月8日金曜日 12
  13. 13.     • この論文の目的: investigate a criterion of the probability on any theory of an observed system of errors, and to apply it to the determination of goodness of fit in the case of frequency curves. Pearson(1900)   13年11月8日金曜日 13
  14. 14.     Pearson(1900)   13年11月8日金曜日 14
  15. 15.     Pearson(1900)   13年11月8日金曜日 15
  16. 16.     確率を求めたい 極座標に変換して 部分ごとに積分すると… Pearson(1900)   13年11月8日金曜日 16
  17. 17.     Pearson(1900)   13年11月8日金曜日 17
  18. 18.     結論 nが奇数のとき nが偶数のとき nが適度に大きければどちらでも大差ない Pearson(1900)   13年11月8日金曜日 18
  19. 19.     • よくわからないし、 間違っているらしいし 深追いは避けておこう…     13年11月8日金曜日 19
  20. 20.     • 懸案の 「正規分布に従う確率変数Xを2乗すると  それはカイ2乗分布に従う」を証明しよう     13年11月8日金曜日 20
  21. 21.     • X~N(0, 1)のときX^2~chisq(1)を示したい • 流れ: • N(0, 1)のPDFからX^2のCDFを求める • 微分してX^2のPDFを求める • chisq(1)であることを確認する PSU(2013)   13年11月8日金曜日 21
  22. 22.         13年11月8日金曜日 22
  23. 23.     • 一般の場合を証明したい • Z^2~chisq(k)でX^2~chisq(1)であるとき Z^2+X^2~chisq(k+1)を証明すればよい     13年11月8日金曜日 23
  24. 24.     積分の方法がわからない…   13年11月8日金曜日 24
  25. 25.     超幾何関数が出てきた!→この方針はやめよう http://ja.wikipedia.org/wiki/%E8%B6%85%E5%B9%BE%E4%BD%95%E7%B4%9A%E6%95%B0 13年11月8日金曜日 25
  26. 26.     • 以下の3点を仮定すれば簡単に証明できる • 1: Moment Generating Function(MGF)が 決まれば確率分布は一意に決まる • 2: 独立した確率分布の和のMGFは、 それぞれのMGFの積 • 3: chisq(k)のMGFは(1 - 2t)^(-k/2)     13年11月8日金曜日 26
  27. 27.     • chisq(k)のMGFは(1 - 2t) ^ (-k/2) • chisq(1)のMGFは(1 - 2t) ^ (-1/2) • chisq(1)に従う確率変数をk個足すとMGFは (1 - 2t) ^ (-1/2)をk回掛けたもの、つまり (1 - 2t) ^ (-k/2)になる • これはchisq(k)のMGFである     13年11月8日金曜日 27
  28. 28.     • MGFの定義 ラプラス変換との関連性… MIT(2008)   13年11月8日金曜日 28
  29. 29.   補足(光成さんの指摘) これがMoment Generating Functionと呼ばれる理由 MIT(2008)   13年11月8日金曜日 29
  30. 30.     • Inversion theorem(先ほどの1に相当) Its proof is omitted... 僕もomitします! MIT(2008)   13年11月8日金曜日 30
  31. 31.     •「 2: 独立した確率分布の和のMGFは、 それぞれのMGFの積」を証明する MIT(2008)   13年11月8日金曜日 31
  32. 32.         13年11月8日金曜日 32
  33. 33.     • 「3: chisq(k)のMGFは(1 - 2t)^(-k/2)」 を証明する     13年11月8日金曜日 33
  34. 34.         13年11月8日金曜日 34
  35. 35.     • まとめ • 証明できた。     13年11月8日金曜日 35

×