Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

R120234【メソ研】003

1,567 views

Published on

  • Be the first to comment

R120234【メソ研】003

  1. 1. 2013年2月23日ベイズ統計への接近:基礎1
  2. 2. ベイズの定理 P(B|A)P(A) P(A|B) = P(B)
  3. 3. 18c 後半トーマス・ベイズ(Thomas Bayes)基本公式ベイズ確率論、ベイズ統計学21cに入ってからの爆発的利用 via テクノロジー経済学、心理学、人口知能、Web技術 ?
  4. 4. 人間の常識や経験を活かすことができる従来の統計 母数分布の法則(検定、推定)* 数の法則から 人間の法則へベイズの定理 人間の判断や行動原理*母数文法を前提とするベイズ統計論もあるので正確な表現ではない
  5. 5. 1サイコロを振って6がでる確率 6 12トランプを1枚抜いて、絵札がでる確率 52*ジョーカーを抜いた場合 1ケーキを食べる、食べない確率 2メソ研に行く、行かない確率 ? 1 2 1ジャンケンでチョキをだす確率 3
  6. 6. ケーキを食べる、食べない確率 お腹減った 食べた 甘いもの好き 行為・判断 (食べる・食べない)健康診断の結果 試行(trial) 食べなかった 太り気味 判断材料 事象(event)
  7. 7. 行動原理を単純にモデル化すると もし∼∼だったら、∼∼する 原因(判断材料) 結果 事象:原因と結果の確率的な連鎖
  8. 8. ベイズの定理 P(B|A)P(A) P(A|B) = P(B)【もし∼∼だったら、∼∼する確率】に対して、その【原因】(もし∼∼だったら)の確からしさを事前確率として設定する(それが原因となり得る確率)事前確率の設定に常識・経験を活かす →人間味のあるデータ処理
  9. 9. 例題・問題1があります・上級クラスの学生は、 この問題に5回に3回正解する・中級クラスの学生は、 この問題に5回に1回正解する 【データ】・問題1をA君が解答した担任の先生は、A君が上級クラスに所属する確率は60% 、中級クラスに所属する確率は40%と考えている。 【事前確率(経験値)】A君が問題1に正解した時、事前確率はどのように変化するのか?
  10. 10. 60% 3/5 : 40% 1/5上級クラス所属確率 中級クラス所属確率 60% × 3/5 : 40% × 1/5 0.6 × 0.6 : 0.4 × 0.2 0.36 : 0.08 9 : 2 9/11 ≒ 82% 2/11 ≒ 18%
  11. 11. 担任の先生の信念【事前確率(経験値)】担任の先生は、A君が上級クラスに所属する確率は60% 、中級クラスに所属する確率は40%と考えていた。 問題1にA君が正解した○ ベイズ更新A君が上級クラスに所属する確率は82% 、中級クラスに所属する確率は18%になった。【事後確率(経験値の更新)】
  12. 12. 【事前確率】 結果 【事後確率(経験値の更新)】 ベイズ更新【事前確率】 結果 学習 【事後確率(経験値の更新)】
  13. 13. ベイズ統計への接近 P(B|A)P(A) P(A|B) = P(B) 少しだけ確率の話、でも簡単
  14. 14. 同時確率(AとBが同時に起こる確率) U A B A∩BU:標本空間(universal set)A∩B:AとBの積事象(intersection, cap)例:4択問題の問1と問2にあてずっぽうで正解する確率 1 1 1 × = 4 4 16
  15. 15. 条件付き確率(Aであることが分かった後にBが起こる確率) U A B B|A条件付き確率    →Aに占めるA∩Bの面積と考えると分かりやすい P(A∩B) P(B|A) = P(A)
  16. 16. 例:ジョーカーを抜いた1組52枚のトランプがあります。  抜いた1枚のカードがハートで、絵札である確率は?(「ハートで且つ絵札である確率」ではない。ハートであることが分かった後に絵札である確率)→ハート(全体)に占める絵札(部分)の確率(面積)! U A B B|A P(A∩B) P(B|A) = P(A)
  17. 17. U A B B|A P(A∩B) ラッシュモデルのP(B|A) = P(A) 受験者能力(θ)と 項目難易度(δ)の 3 & 推定のためにも 52 3 条件付き確率は使 = = 13 13 われています 52
  18. 18. 例:抜いた1枚のカードが絵札で、ハートである確率  →絵札(全体)に占めるハート(部分)の確率(面積)! A B U A|B P(A∩B)P(A|B) = P(B) 3 & 52 3 1 = = = 12 12 4 52
  19. 19. 条件付き確率の変形 P(A∩B) P(B|A) = 両辺に P(A)をかける P(A) P(A∩B) = P(B|A) P(A) 乗法定理 P(A∩B) P(A|B) = 両辺にP(B)をかける P(B) P(A∩B) = P(A|B) P(B) 乗法定理 A B A∩B
  20. 20. P(A∩B) = P(B|A) P(A) P(A∩B) = P(A|B) P(B) P(A|B) P(B) = P(B|A) P(A)ベイズの定理 P(B|A)P(A) P(A|B) = P(B)
  21. 21. 例:抜いた1枚のカードが絵札で、ハートである確率 A B A: ハート A|B B:絵札 P(B|A)P(A) P(A|B) = P(B) 3 13 13 × 52 & = = 3 13 ÷ 12 3 1 13 × 52 52 = = 4 12 12 52
  22. 22. 条件付き確率の値と一致 A BU A|B P(A∩B)P(A|B) = P(B) 3 & 52 3 1 = = = 12 12 4 52
  23. 23. ベイズの発展定理 P(B|A)P(A)ベイズの定理 P(A|B) = P(B)A:原因や仮定(Hypothesis)B:Aのもとで得られた結果やデータ(Data) P(D|H)P(H)ベイズの発展定理 P(H|D) = P(D) P(H|D) データ(D)の原因確率
  24. 24. データ D原因 H1 原因 H2 原因 H3 原因 H4
  25. 25. P(D) = P(D∩H1) + P(D∩H2) + P(D∩H3) + P(D∩H4) P(A∩B) = P(B|A) P(A) 乗法定理P(D) = P(D|H1)P(H1) + P(D|H2)P(H2) + P(D|H3)P(H3) + P(D|H4)P(H4)D D∩H1 D∩H2 D∩H3 D∩H4 H1 H2 H3 H4
  26. 26. ベイズの発展公式に代入 P(D|H)P(H) P(H|D) =ベイズの展開公式 P(D) P(D|H1)P(H1)P(H1|D) = P(D|H1)P(H1) + P(D|H2)P(H2) + P(D|H3)P(H3) + P(D|H4)P(H4) D D∩H1 D∩H2 D∩H3 D∩H4 H1 H2 H3 H4
  27. 27. P(D|H1)P(H1)P(H1|D) = P(D|H1)P(H1) + P(D|H2)P(H2) + P(D|H3)P(H3) + P(D|H4)P(H4) P(H1|D) 事後確率:データDが原因H1から得られる確率 P(D|H1) 尤度:原因H1のもとでデータDが得られる確率 P(H1) 事前確率:データDを得る前の原因H1の確からしさ
  28. 28. ベイズ統計への接近:基礎1• 事象は原因と結果の確率的な連鎖• 人間の経験や常識を「事前確率」として取り込む• 計算された事後確率は、次の事前確率として利用される→ベイズ更新→経験の更新→学習 もし∼∼だったら、∼∼する 原因(判断材料) 結果

×