Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Rbinom(n=10 size, prob)で sizeとprobが未知なのに「size」を推定する

575 views

Published on

2019/04/13/tokyoR/LT

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

Rbinom(n=10 size, prob)で sizeとprobが未知なのに「size」を推定する

  1. 1. twitterアカウント:@AsaKiriSun 第77回R勉強会@東京(#TokyoR) 2019/04/13
  2. 2. twitterアカウント:@AsaKiriSun 第77回R勉強会@東京(#TokyoR) 2019/04/13 1989年静岡生まれ。RGui派でベイズ派。 理論統計に関する話なら、だいたいしゃ べれる気がする。最近一番申し訳なかっ たことは、井之頭公園で一人手漕ぎボー トをしたらカップルの船に激突したこと。 >個人サイト AsaKiriSunの日記 トイレの見取り図です (といれのみとりずです)
  3. 3. twitterアカウント:@AsaKiriSun 第77回R勉強会@東京(#TokyoR) 2019/04/13 統計の問題で使用頻度が正規分布の次に使用頻度が高い二項分布。 でも、みんな二項分布で prob ばかりもてはやしすぎじゃないだ ろうか?もう一つのパラメーター size にもっと興味をもったって いいじゃないか。 実際に、調べてみれば二項分布の size の推定に関する理論は存在 する。でも、微妙に惜しい感じなのだ。この惜しさをみなさんも 一緒に味わってほしい。
  4. 4. • 気になる • 統計の勉強で一番最初に扱う • データ例も豊富 • 理論研究山ほど rbinom(n,size,prob) のprob のイメージ
  5. 5. • 興味がない • 扱ってるのを見たことがない • データ例もない • 理論研究なさそう • Rのパッケージもない。 rbinom(n,size,prob) のsize のイメージ
  6. 6. twitterアカウント:@AsaKiriSun 第77回R勉強会@東京(#TokyoR) 2019/04/13 みなさんの中の二項分布のパラメーターのイメージも大体似たよ うなものじゃないだろうか。でも、これは我々がsizeに興味を 持っていないだけで、ちゃんと調べればsizeにも「これは !」と 愛したくなるポイントが出てくるはずである。 とりあえずsizeの推定手法の論文をあさってみることにした。
  7. 7. • モーメント法を利用した手法(1941) • ベイズを使用した手法(1986) • 順序統計量を使用した手法(2008) rbinom(n,size,prob) のsizeの主要な推定手法
  8. 8. twitterアカウント:@AsaKiriSun 第77回R勉強会@東京(#TokyoR) 2019/04/13 3本だけ・・・?ちゃんと調べたのか?みなさんもそうお思いか もしれない。でも、本当に見つからないのだ。ベイズを使用した 手法の引用数が100未満なのである。一通りみてそんな感じな のだ。 気を取り直して今回は、理論も説明しやすいモーメント法を使用 した手法とベイズを使用した手法の2つを紹介していこう。
  9. 9. モーメント法を利用した手法 • 、 1940年代の手法だけあって式もシンプルだ。 実装もすぐすんだ。人間にやさしい。 うまく動くか数値シミュレーションしてみよう。
  10. 10. 10000回シミュレーションしてみた rbinom(n=10,size=200,prob=0.5) rbinom(n=10,size=200,prob=0.01)
  11. 11. twitterアカウント:@AsaKiriSun 第77回R勉強会@東京(#TokyoR) 2019/04/13 だめだ。 prob=0.5のときには、それなりにうまく推定できてるように見え たが、prob=0.01にした途端size<0となるような推定値を返すよう になってしまった。あと、とんでもなく大きな値も返す時もある。 他の論文をあたると、probが小さいと理論的に真の値に推定値に 収束しないことがあるらしい。あと、漸近分布も存在しないから 信頼区間も作れない。 気を取り直してベイズ手法で推定をしてみよう。
  12. 12. • 、 ベイズを利用した手法 上の式を与えたもとで事後期待値を使用するらしい。 ベイズを使うならそりゃそうなるだろう、という立式だ。 シンプル is ベスト。こういうのは大体うまくいくはず。 モーメント法と同じ条件でシミュレーションしてみよう。
  13. 13. 1000回シミュレーションしてみた rbinom(n=10,size=200,prob=0.5) rbinom(n=10,size=200,prob=0.01)
  14. 14. twitterアカウント:@AsaKiriSun 第77回R勉強会@東京(#TokyoR) 2019/04/13 悪くはないが、良くもない・・・ モーメント法のように破綻した推定値を返すことはなけど、今回 のようなシンプルなケースですらバイアスが大きすぎる。理論上 は一致性を持つらしいけど全然収束はしない。 ベイズなので信用区間は簡単に計算できるのは強みではある。 あと計算時間がかかるのは完全に自分のせいだ。
  15. 15. • モーメント法を利用した手法(1941) • probが小さいと破綻する。 • ベイズを使用した手法(1986) • モーメント法のように破綻はしない • 悪くはないが良くもない。 rbinom(n,size,prob) のsizeの手法まとめ
  16. 16. twitterアカウント:@AsaKiriSun 第77回R勉強会@東京(#TokyoR) 2019/04/13 では次に、これを使うための実データを見つけなければならない。 ただ、この世にはsizeが不明な状況がめったに存在しない・・・ なんとかしてひねり出したデータと結果で今回の発表を閉めたい と思う。
  17. 17. 10年分の船舶転覆回数データから船舶の数を求める https://jtsb.mlit.go.jp/jtsb/ship/ship-accident-toukei.php運輸安全委員会、船舶事故の統計 > #モーメント法 > c(n1_hat,p_hat) [1] 82.6509028 0.6497207 > #ベイズ > n2_hat;#推定値 [1] 364.0308 > n.interval#信用区間 [1] 70 1801
  18. 18. twitterアカウント:@AsaKiriSun 第77回R勉強会@東京(#TokyoR) 2019/04/13 船の専門家じゃないのでよくわからないが、 絶対に少ない

×