SlideShare a Scribd company logo
1 of 44
Doing Bayesian Data Analysis 輪読会
Chapter 9
Gunosy Inc.
吉田宏司
2013/08/24
9章 Bernoulli Likelihood with Hierarchical Prior
• 目次
– 9.1 A Single Coin from a Single Mint
– 9.2 Multiple Coins from a Single Mint
– 9.3 Multiple Coins from Multiple Mints
– 9.4 Summary
– 9.5 R Code
– 9.6 Exercises
– (mint = 造幣局)
2013/08/24
8章の内容と9章の内容
• 8章では、独立な2個のパラメータを推定する問
題について考えた
– Ex) コインの表裏の確率に関するパラメータは、コイ
ン間で影響し合わない
• 9章では、従属な2個以上のパラメータを推定す
る問題について考える
– Ex) あるコインの表裏の確率に関するパラメータは、
コイン工場のパラメータを通して、別のコインの表
裏の確率に関するパラメータに影響を与える
2013/08/24
パラメータとハイパーパラメータ
• 2種類のパラメータ
– パラメータ : データに直接的に影響を与えるパラメー
タ
• Ex) コインのパラメータ
– ハイパーパラメータ:別のパラメータに影響をあた
えることで、間接的にデータに影響を与えるパラ
メータ
• Ex) コイン工場のパラメータ
2013/08/24
ハイパーパラメータの利点
• パラメータ間の従属関係を考えることの2つの利
点
– 1. 同時事後確率を考えるときに、モデルの構造を変
更しないで良い
– 2. 従属関係は、その事後分布から、比較的効率的な
モテカルロサンプリングをモチベートする
2013/08/24
9.1 A SINGLE COIN FROM A SINGLE MINT
• コインが1個の場合の尤度と事前確認を復習する
• コインの表裏の確率は、ベルヌーイ分布を用い
て、以下の式で表せる
p ( y | θ ) = bern ( y | θ )
= θy ( 1 – θ ) 1- y
( 表 : y = 1、裏 : y = 0 )
( θ : コインの表が出る確率に関するパラメータ )
2013/08/24
パラメータの独立性
• 試行(コイン投げ)ごとに、表裏が出るパラメータ
は独立と仮定した
• N 回の試行中、 z 回表が出る同じ確率は、以下の式
で表せる
p ( y1, y1, …, | θ1, θ2, …, ) = Π p ( yi |θi )
= θz ( 1 - θ )N-z
– N = 1 の場合は、前ページの以下の式と同じ
p ( y | θ ) = bern ( y | θ )
= θy ( 1 – θ ) 1- y
2013/08/24
パラメータ θ の事前確率
• パラメータ θ の事前確率 p(θ) について考える
• コイン投げの例では、 p(θ) として、ベータ分布を仮
定していた
• ベータ分布
beta ( θ | a, b ) = θa-1 ( 1 - θ )b-1 / B(a, b)
– a, bは、ベータ分布のパラメータ、B(*, *) はベータ関数
– 平均 μ 、サンプルサイズ Z を用いて、a, bは以下のように
表せる
a = μ K
b = (1-μ) K
2013/08/24
パラメータ θ の事前確率
• サンプルサイズ K は、confidenceに影響を与える
• ここでは、K は定数だと考え、事前分布は以下
の式で表す
p( θ | μ) = beta ( θ | μK, ( 1–μ)K )
2013/08/24
hierachical models
• μ を定数ではなく、0 ~ 1の値をとる確率変数と
考えるhierachical modelsの領域に入っていく…
– μ を定数ではなく、0 ~ 1の値をとる確率変数と考える
→ コイン工場のコイン作りに対する信念の不確かさを
表す
p ( μ ) = beta( μ | Aμ, Bμ ) (Aμ, Bμは定数)
Ex) 大きいμ → 表が出やすいコイン作りばかりする工
場
小さいμ → 裏が出やすいコイン作りばかりする工
場2013/08/24
hierachical models
• 変数間の関係を表したhierachial
modelsの図
– i 番目のコイン投げの表裏 yi は、パラ
メータ θ のベルヌーイ分布から生成さ
れる
– θ は、パラメータ a, b のベータ分布か
ら生成される
– a, b は、それぞれ μK, (1-μ)K に等しい
– μ は、パラメータ Aμ, Bμ のベータ分布
から生成される
2013/08/24
hierachical modelsへのベイズルールの適用
• ベイズルールを適用する
p ( θ, μ | y ) = p ( y | θ, μ ) p ( θ, μ ) / p ( y )
= p ( y | θ ) p ( θ | μ ) p (μ) / p ( y )
2013/08/24
9.1.1 Posterior via Grid Approximation
• 事後分布をGrid Approximationする
– θ と μ の値域は、[0, 1]で有限なので、Grid
Approximationはtractableで、グラフも簡単に作れる
2013/08/24
Posterior via Grid Approximation 事前分布
• 事前分布の図
– p ( μ ) = beta( μ | 2, 2 )
– p( θ | μ ) = beta( θ | μ100, (1-μ)100)
2013/08/24
Posterior via Grid Approximation事前分布
• μ は、0.5付近をとる確率が大きいが、uncertaintyは大き
い(右上の図)
• θ は、μ と同じくらいの値を取りやすい(真ん中上と右
下の図)
2013/08/24
Posterior via Grid Approximation尤度
• 尤度の図
– データ D : 表 9 回、裏 3 回
– 尤度 : p ( D | θ ) = θ9 ( 1 – θ )3
2013/08/24
Posterior via Grid Approximation事後確率
• 事後確率の図
2013/08/24
Posterior via Grid Approximation 事後確率
• 事後確率 = 尤度 × 事前確率
= ×
2013/08/24
certainty の大きな μ の場合の事前分布
• μ の certainty を0.5周辺で大きくする
– p ( μ ) = beta( μ | 20, 20 )
– p ( θ | μ ) = beta( θ | μ6, (1-μ)6 )
2013/08/24
certainty の大きな μ の場合の尤度
• さっきと同じデータ
– データ D : 表 9 回、裏 3 回
– 尤度 : p ( D | θ ) = θ9 ( 1 – θ )3
2013/08/24
certainty の大きな μ の場合の事後分布
• 事後確率の図
– μ は、certainty高かったので、あまり変わらず、θ だ
けとんがる
2013/08/24
certainty の大きな μ の場合の事後分布
• 事後確率 = 尤度 × 事前確率
= ×
2013/08/24
9.2 MULTIPLE COINS FROM A SINGLE MINT
• 9.1
– コインは1個で、複数回の試行でパラメータ θ は同じ
ものだった
• 9.2
– コインは複数個で、それぞれ異なるパラメータ θj を
持つ
– コインは複数個あるけど、同じmint(工場)で作られ
てるとする
– 同じmintで作られてるので、パラメータ μ は複数個の
コインで同一とする
– コインは独立に作られてるので、θjはμに関して条件
付き独立とする
2013/08/24
9.2 MULTIPLE COINS FROM A SINGLE MINT
9.1では θ, yi → 9.2では θj, yij
2013/08/24
9.1.2 Posterior via Grid Approximation
• 9.1.1の内容を、コインが2個(θ1, θ2)の場合で
行う
2013/08/24
Posterior via Grid Approximation 事前確率
• 事前確率
2013/08/24
Posterior via Grid Approximation 尤度
• 尤度
– データ D1 : 表 3 回、裏 13 回
– データ D2 : 表 4 回、裏 1 回
– 尤度 : p ( D1 | θ1 ) = θ1
3 ( 1 – θ1 )13
– 尤度 : p ( D1 | θ2 ) = θ2
4 ( 1 – θ2 )1
2013/08/24
Posterior via Grid Approximation 事後確率
• 事後確率
– データ数の大きかった 1 の方がデータの平均値に事後
確率も集まりやすい
2013/08/24
Posterior via Grid Approximation 事前確率
μ と θ の依存関係が強い場合
• 事前確率
– μ と θ の依存関係が強い場合
2013/08/24
Posterior via Grid Approximation 事前確率
μ と θ の依存関係が強い場合
• 尤度、データはさっきと同じ
– データ D1 : 表 3 回、裏 13 回
– データ D2 : 表 4 回、裏 1 回
– 尤度 : p ( D1 | θ1 ) = θ1
3 ( 1 – θ1 )13
– 尤度 : p ( D1 | θ2 ) = θ2
4 ( 1 – θ2 )1
2013/08/24
Posterior via Grid Approximation 事後確率
μ と θ の依存関係が強い場合
• 事後確率
– さっきよりも θ2 が θ1 の方によってる
– μ と θ の依存関係が強いので、μを通して、データの
影響が別のパラメータθへの影響も強くなる
2013/08/24
9.2.2 Posterior via Monte Carlo Sampling
• モデルをより現実的なものにするために、パラ
メータ K も導入する
– サンプルサイズKは、9.2.1まで定数だった
– K が大 → θj は μ に近くなりやすい
– K が小 → θj は μ からはなれて広がりやすい
– 実際には、 K の値を事前に知ることはできず、「異
なるコインの試行結果が似かよってたら、K は大きい
だろう」、「異なるコインの試行結果があんまり似
てなかったら、K は小さいだろう」みたいにという証
拠になる
2013/08/24
9.2.2 Posterior via Monte Carlo Sampling
• パラメータ K (図中ではκ)
は、定数ではなくて、事前
分布から生じる(ここでは
ガンマ分布を使用)
• パラメータは全部で J + 2 個
– θ1 〜 θJ, μ, κ
2013/08/24
ガンマ分布
– s: shape parameter, 分布のな
だらかさを表す
– r: rate parameter, (=1/scale)
– m: s / r
– sd: √s / r
2013/08/24
κ の事前分布にガンマ分布を用いた場合
• さっきはK=5で固定してたのを、ガンマ分布の平均を5.0、
標準偏差を0.01にして同じような結果を出してみる
2013/08/24
κ の事前分布にガンマ分布を用いた場合
2013/08/24
• ガンマ分布のサンプルサイズκを75.0に変えてみる
• μ と θ1, θ2 の依存関係が強くなる
κ の事前分布にガンマ分布を用いた場合
• コイン3個の試行で、3個とも似たような結果だった場合
• コイン工場のパラメータ μ の推定の確かさは高い
• κ の平均値が大きくなる
2013/08/24
κ の事前分布にガンマ分布を用いた場合
2013/08/24
• コイン3個の試行で、3個ともバラバラな結果だった場合
• コイン工場のパラメータ μ の推定の確かさは低い
• κ の平均値は小さくなる
9.2.3 Outliers and Shrinkage of Individual
Estimates
• 多くのコインが似たような結果を出すと、κ は
大きくなり、θ と μ の依存関係も強くなる
– 異なるコインの θ が同じような分布になる
2013/08/24
Outliers and Shrinkage
• コイン5個投げて、1個変なコインがいた
(Outliers)
– κ が小さい時は、θ5 は実際の分布に近づくが、κ が大
きい時は、他のコインの θ の分布に近づく
(Shrinkage)
2013/08/24
9.2.5 Number of Coins and Flips per Coin
• データ増やすと、よりcertainにモデル推定が可
能になる
• データの増やし方
– コインごとの投げ数を増やす
– コインの数を増やす
• ハイパーパラメータの推定が目的の場合はこっち
• 個々のコインのバイアスではなくて、コイン工場のパラメー
タを推定したい時とか
2013/08/24
9.3 MULTIPLE COINS FROM MULTIPLE MINTS
• コイン工場に関するパラメータ μ, κ が工場ごと
にことなる場合
• 工場ごとのパラメータが独立な場合と従属な場
合の2つを考える
2013/08/24
9.3.1 Independent Mints
• μc, κc は、コイン毎に異なるが、同じガンマ分布
から生成される
μ, κ が同じの場合 μc, κc がバラバラの場合
2013/08/24
9.3.2 Dependent Mints
• μc, κc が、コイン毎に異なり、
異なるガンマ分布から生成さ
れる
– ガンマ分布のパラメータsc, rcは、
平均 μγ, 標準偏差 σγ で表される
– μγ と σγ は一様分布から生じる
2013/08/24

More Related Content

What's hot

Rsgt2021 exploratory testing
Rsgt2021 exploratory testingRsgt2021 exploratory testing
Rsgt2021 exploratory testingNoriyuki Nemoto
 
イントラネット検索・「ジーラ・ドキュメント・サーチ」の機能と特徴
イントラネット検索・「ジーラ・ドキュメント・サーチ」の機能と特徴イントラネット検索・「ジーラ・ドキュメント・サーチ」の機能と特徴
イントラネット検索・「ジーラ・ドキュメント・サーチ」の機能と特徴opengroove
 
enNetforum Toyama Presentation
enNetforum Toyama PresentationenNetforum Toyama Presentation
enNetforum Toyama PresentationForum
 
Jaws2008 Presen12
Jaws2008 Presen12Jaws2008 Presen12
Jaws2008 Presen12umekoumeda
 
Persona design method / ペルソナ概論
Persona design method / ペルソナ概論Persona design method / ペルソナ概論
Persona design method / ペルソナ概論Katsumi TAZUKE
 
Googleマイビジネス 即日登録&多店舗運用支援「ライクルGMB」サービス概要
Googleマイビジネス 即日登録&多店舗運用支援「ライクルGMB」サービス概要Googleマイビジネス 即日登録&多店舗運用支援「ライクルGMB」サービス概要
Googleマイビジネス 即日登録&多店舗運用支援「ライクルGMB」サービス概要AkihitoImai
 
Loftwork 20090416
Loftwork 20090416Loftwork 20090416
Loftwork 20090416武 河野
 
GIGAPOD OFFICEHARD
GIGAPOD OFFICEHARDGIGAPOD OFFICEHARD
GIGAPOD OFFICEHARDtripodworks
 
はたLuck(店舗変革プラットフォーム)
はたLuck(店舗変革プラットフォーム)はたLuck(店舗変革プラットフォーム)
はたLuck(店舗変革プラットフォーム)晶紀 佐藤
 
【個股產業分析】功率放大器產業分析
【個股產業分析】功率放大器產業分析【個股產業分析】功率放大器產業分析
【個股產業分析】功率放大器產業分析Collaborator
 
第4回「気候変動対策の次期枠組みに向けて」資料 2/3 (井上氏)
第4回「気候変動対策の次期枠組みに向けて」資料 2/3 (井上氏)第4回「気候変動対策の次期枠組みに向けて」資料 2/3 (井上氏)
第4回「気候変動対策の次期枠組みに向けて」資料 2/3 (井上氏)IDDP UK
 
【予約管理システムChoiceRESERVE】ご紹介資料
【予約管理システムChoiceRESERVE】ご紹介資料【予約管理システムChoiceRESERVE】ご紹介資料
【予約管理システムChoiceRESERVE】ご紹介資料Yohsuke Hoshino
 
Mashup and new paradigm - マッシュアップ技術とインターネットの新しい潮流
Mashup and new paradigm - マッシュアップ技術とインターネットの新しい潮流Mashup and new paradigm - マッシュアップ技術とインターネットの新しい潮流
Mashup and new paradigm - マッシュアップ技術とインターネットの新しい潮流Yusuke Kawasaki
 
Decade 20081226
Decade 20081226Decade 20081226
Decade 20081226goukaicom
 

What's hot (20)

114th
114th114th
114th
 
Rsgt2021 exploratory testing
Rsgt2021 exploratory testingRsgt2021 exploratory testing
Rsgt2021 exploratory testing
 
イントラネット検索・「ジーラ・ドキュメント・サーチ」の機能と特徴
イントラネット検索・「ジーラ・ドキュメント・サーチ」の機能と特徴イントラネット検索・「ジーラ・ドキュメント・サーチ」の機能と特徴
イントラネット検索・「ジーラ・ドキュメント・サーチ」の機能と特徴
 
enNetforum Toyama Presentation
enNetforum Toyama PresentationenNetforum Toyama Presentation
enNetforum Toyama Presentation
 
Jaws2008 Presen12
Jaws2008 Presen12Jaws2008 Presen12
Jaws2008 Presen12
 
XS Japan 2008 Ganeti Japanese
XS Japan 2008 Ganeti JapaneseXS Japan 2008 Ganeti Japanese
XS Japan 2008 Ganeti Japanese
 
XS Japan 2008 App Data Japanese
XS Japan 2008 App Data JapaneseXS Japan 2008 App Data Japanese
XS Japan 2008 App Data Japanese
 
Persona design method / ペルソナ概論
Persona design method / ペルソナ概論Persona design method / ペルソナ概論
Persona design method / ペルソナ概論
 
Googleマイビジネス 即日登録&多店舗運用支援「ライクルGMB」サービス概要
Googleマイビジネス 即日登録&多店舗運用支援「ライクルGMB」サービス概要Googleマイビジネス 即日登録&多店舗運用支援「ライクルGMB」サービス概要
Googleマイビジネス 即日登録&多店舗運用支援「ライクルGMB」サービス概要
 
100420
100420100420
100420
 
0423io
0423io0423io
0423io
 
Lp3
Lp3Lp3
Lp3
 
Loftwork 20090416
Loftwork 20090416Loftwork 20090416
Loftwork 20090416
 
GIGAPOD OFFICEHARD
GIGAPOD OFFICEHARDGIGAPOD OFFICEHARD
GIGAPOD OFFICEHARD
 
はたLuck(店舗変革プラットフォーム)
はたLuck(店舗変革プラットフォーム)はたLuck(店舗変革プラットフォーム)
はたLuck(店舗変革プラットフォーム)
 
【個股產業分析】功率放大器產業分析
【個股產業分析】功率放大器產業分析【個股產業分析】功率放大器產業分析
【個股產業分析】功率放大器產業分析
 
第4回「気候変動対策の次期枠組みに向けて」資料 2/3 (井上氏)
第4回「気候変動対策の次期枠組みに向けて」資料 2/3 (井上氏)第4回「気候変動対策の次期枠組みに向けて」資料 2/3 (井上氏)
第4回「気候変動対策の次期枠組みに向けて」資料 2/3 (井上氏)
 
【予約管理システムChoiceRESERVE】ご紹介資料
【予約管理システムChoiceRESERVE】ご紹介資料【予約管理システムChoiceRESERVE】ご紹介資料
【予約管理システムChoiceRESERVE】ご紹介資料
 
Mashup and new paradigm - マッシュアップ技術とインターネットの新しい潮流
Mashup and new paradigm - マッシュアップ技術とインターネットの新しい潮流Mashup and new paradigm - マッシュアップ技術とインターネットの新しい潮流
Mashup and new paradigm - マッシュアップ技術とインターネットの新しい潮流
 
Decade 20081226
Decade 20081226Decade 20081226
Decade 20081226
 

Viewers also liked

Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』
Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』
Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』Koji Yoshida
 
uCoz презентация.kz1
uCoz презентация.kz1uCoz презентация.kz1
uCoz презентация.kz1Blue_Meanie
 
KeynoteRudolph Steiner haarlem College 13 oktober 2015
KeynoteRudolph Steiner haarlem College 13 oktober 2015KeynoteRudolph Steiner haarlem College 13 oktober 2015
KeynoteRudolph Steiner haarlem College 13 oktober 2015Jan Gijselhart
 
uCoz презентация (kz)
uCoz презентация (kz)uCoz презентация (kz)
uCoz презентация (kz)Blue_Meanie
 
Hotle Buena Vista Travel Agents
Hotle Buena Vista Travel AgentsHotle Buena Vista Travel Agents
Hotle Buena Vista Travel AgentsBOakly
 
Ucoz presentation-1
Ucoz presentation-1Ucoz presentation-1
Ucoz presentation-1Blue_Meanie
 
Optimizing Search Engines using Clickthrough Data
Optimizing Search Engines using Clickthrough DataOptimizing Search Engines using Clickthrough Data
Optimizing Search Engines using Clickthrough DataKoji Yoshida
 
Toddlers programme
Toddlers programmeToddlers programme
Toddlers programmeAzreen Aj
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...Koji Yoshida
 
Kesihatan pergigian warga emas
Kesihatan pergigian warga emasKesihatan pergigian warga emas
Kesihatan pergigian warga emasAzreen Aj
 
HTTP 완벽 가이드 9~10장
HTTP 완벽 가이드 9~10장HTTP 완벽 가이드 9~10장
HTTP 완벽 가이드 9~10장Hyejin Oh
 

Viewers also liked (19)

Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』
Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』
Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』
 
uCoz презентация.kz1
uCoz презентация.kz1uCoz презентация.kz1
uCoz презентация.kz1
 
Runet figures
Runet figuresRunet figures
Runet figures
 
Nieuwe media 30 sept
Nieuwe media 30 septNieuwe media 30 sept
Nieuwe media 30 sept
 
KeynoteRudolph Steiner haarlem College 13 oktober 2015
KeynoteRudolph Steiner haarlem College 13 oktober 2015KeynoteRudolph Steiner haarlem College 13 oktober 2015
KeynoteRudolph Steiner haarlem College 13 oktober 2015
 
uCoz презентация (kz)
uCoz презентация (kz)uCoz презентация (kz)
uCoz презентация (kz)
 
Hotle Buena Vista Travel Agents
Hotle Buena Vista Travel AgentsHotle Buena Vista Travel Agents
Hotle Buena Vista Travel Agents
 
Ucoz presentation-1
Ucoz presentation-1Ucoz presentation-1
Ucoz presentation-1
 
Formuleren
FormulerenFormuleren
Formuleren
 
Asuhan keperawatan klien tn
Asuhan keperawatan klien tnAsuhan keperawatan klien tn
Asuhan keperawatan klien tn
 
Pengertian kalimat efektif
Pengertian kalimat efektifPengertian kalimat efektif
Pengertian kalimat efektif
 
U coz.kz.2.2
U coz.kz.2.2U coz.kz.2.2
U coz.kz.2.2
 
Optimizing Search Engines using Clickthrough Data
Optimizing Search Engines using Clickthrough DataOptimizing Search Engines using Clickthrough Data
Optimizing Search Engines using Clickthrough Data
 
Stichting leerkracht
Stichting leerkrachtStichting leerkracht
Stichting leerkracht
 
Debatteren
DebatterenDebatteren
Debatteren
 
Toddlers programme
Toddlers programmeToddlers programme
Toddlers programme
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...
 
Kesihatan pergigian warga emas
Kesihatan pergigian warga emasKesihatan pergigian warga emas
Kesihatan pergigian warga emas
 
HTTP 완벽 가이드 9~10장
HTTP 완벽 가이드 9~10장HTTP 완벽 가이드 9~10장
HTTP 완벽 가이드 9~10장
 

【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood with Hierarchical Prior

  • 1. Doing Bayesian Data Analysis 輪読会 Chapter 9 Gunosy Inc. 吉田宏司 2013/08/24
  • 2. 9章 Bernoulli Likelihood with Hierarchical Prior • 目次 – 9.1 A Single Coin from a Single Mint – 9.2 Multiple Coins from a Single Mint – 9.3 Multiple Coins from Multiple Mints – 9.4 Summary – 9.5 R Code – 9.6 Exercises – (mint = 造幣局) 2013/08/24
  • 3. 8章の内容と9章の内容 • 8章では、独立な2個のパラメータを推定する問 題について考えた – Ex) コインの表裏の確率に関するパラメータは、コイ ン間で影響し合わない • 9章では、従属な2個以上のパラメータを推定す る問題について考える – Ex) あるコインの表裏の確率に関するパラメータは、 コイン工場のパラメータを通して、別のコインの表 裏の確率に関するパラメータに影響を与える 2013/08/24
  • 4. パラメータとハイパーパラメータ • 2種類のパラメータ – パラメータ : データに直接的に影響を与えるパラメー タ • Ex) コインのパラメータ – ハイパーパラメータ:別のパラメータに影響をあた えることで、間接的にデータに影響を与えるパラ メータ • Ex) コイン工場のパラメータ 2013/08/24
  • 5. ハイパーパラメータの利点 • パラメータ間の従属関係を考えることの2つの利 点 – 1. 同時事後確率を考えるときに、モデルの構造を変 更しないで良い – 2. 従属関係は、その事後分布から、比較的効率的な モテカルロサンプリングをモチベートする 2013/08/24
  • 6. 9.1 A SINGLE COIN FROM A SINGLE MINT • コインが1個の場合の尤度と事前確認を復習する • コインの表裏の確率は、ベルヌーイ分布を用い て、以下の式で表せる p ( y | θ ) = bern ( y | θ ) = θy ( 1 – θ ) 1- y ( 表 : y = 1、裏 : y = 0 ) ( θ : コインの表が出る確率に関するパラメータ ) 2013/08/24
  • 7. パラメータの独立性 • 試行(コイン投げ)ごとに、表裏が出るパラメータ は独立と仮定した • N 回の試行中、 z 回表が出る同じ確率は、以下の式 で表せる p ( y1, y1, …, | θ1, θ2, …, ) = Π p ( yi |θi ) = θz ( 1 - θ )N-z – N = 1 の場合は、前ページの以下の式と同じ p ( y | θ ) = bern ( y | θ ) = θy ( 1 – θ ) 1- y 2013/08/24
  • 8. パラメータ θ の事前確率 • パラメータ θ の事前確率 p(θ) について考える • コイン投げの例では、 p(θ) として、ベータ分布を仮 定していた • ベータ分布 beta ( θ | a, b ) = θa-1 ( 1 - θ )b-1 / B(a, b) – a, bは、ベータ分布のパラメータ、B(*, *) はベータ関数 – 平均 μ 、サンプルサイズ Z を用いて、a, bは以下のように 表せる a = μ K b = (1-μ) K 2013/08/24
  • 9. パラメータ θ の事前確率 • サンプルサイズ K は、confidenceに影響を与える • ここでは、K は定数だと考え、事前分布は以下 の式で表す p( θ | μ) = beta ( θ | μK, ( 1–μ)K ) 2013/08/24
  • 10. hierachical models • μ を定数ではなく、0 ~ 1の値をとる確率変数と 考えるhierachical modelsの領域に入っていく… – μ を定数ではなく、0 ~ 1の値をとる確率変数と考える → コイン工場のコイン作りに対する信念の不確かさを 表す p ( μ ) = beta( μ | Aμ, Bμ ) (Aμ, Bμは定数) Ex) 大きいμ → 表が出やすいコイン作りばかりする工 場 小さいμ → 裏が出やすいコイン作りばかりする工 場2013/08/24
  • 11. hierachical models • 変数間の関係を表したhierachial modelsの図 – i 番目のコイン投げの表裏 yi は、パラ メータ θ のベルヌーイ分布から生成さ れる – θ は、パラメータ a, b のベータ分布か ら生成される – a, b は、それぞれ μK, (1-μ)K に等しい – μ は、パラメータ Aμ, Bμ のベータ分布 から生成される 2013/08/24
  • 12. hierachical modelsへのベイズルールの適用 • ベイズルールを適用する p ( θ, μ | y ) = p ( y | θ, μ ) p ( θ, μ ) / p ( y ) = p ( y | θ ) p ( θ | μ ) p (μ) / p ( y ) 2013/08/24
  • 13. 9.1.1 Posterior via Grid Approximation • 事後分布をGrid Approximationする – θ と μ の値域は、[0, 1]で有限なので、Grid Approximationはtractableで、グラフも簡単に作れる 2013/08/24
  • 14. Posterior via Grid Approximation 事前分布 • 事前分布の図 – p ( μ ) = beta( μ | 2, 2 ) – p( θ | μ ) = beta( θ | μ100, (1-μ)100) 2013/08/24
  • 15. Posterior via Grid Approximation事前分布 • μ は、0.5付近をとる確率が大きいが、uncertaintyは大き い(右上の図) • θ は、μ と同じくらいの値を取りやすい(真ん中上と右 下の図) 2013/08/24
  • 16. Posterior via Grid Approximation尤度 • 尤度の図 – データ D : 表 9 回、裏 3 回 – 尤度 : p ( D | θ ) = θ9 ( 1 – θ )3 2013/08/24
  • 17. Posterior via Grid Approximation事後確率 • 事後確率の図 2013/08/24
  • 18. Posterior via Grid Approximation 事後確率 • 事後確率 = 尤度 × 事前確率 = × 2013/08/24
  • 19. certainty の大きな μ の場合の事前分布 • μ の certainty を0.5周辺で大きくする – p ( μ ) = beta( μ | 20, 20 ) – p ( θ | μ ) = beta( θ | μ6, (1-μ)6 ) 2013/08/24
  • 20. certainty の大きな μ の場合の尤度 • さっきと同じデータ – データ D : 表 9 回、裏 3 回 – 尤度 : p ( D | θ ) = θ9 ( 1 – θ )3 2013/08/24
  • 21. certainty の大きな μ の場合の事後分布 • 事後確率の図 – μ は、certainty高かったので、あまり変わらず、θ だ けとんがる 2013/08/24
  • 22. certainty の大きな μ の場合の事後分布 • 事後確率 = 尤度 × 事前確率 = × 2013/08/24
  • 23. 9.2 MULTIPLE COINS FROM A SINGLE MINT • 9.1 – コインは1個で、複数回の試行でパラメータ θ は同じ ものだった • 9.2 – コインは複数個で、それぞれ異なるパラメータ θj を 持つ – コインは複数個あるけど、同じmint(工場)で作られ てるとする – 同じmintで作られてるので、パラメータ μ は複数個の コインで同一とする – コインは独立に作られてるので、θjはμに関して条件 付き独立とする 2013/08/24
  • 24. 9.2 MULTIPLE COINS FROM A SINGLE MINT 9.1では θ, yi → 9.2では θj, yij 2013/08/24
  • 25. 9.1.2 Posterior via Grid Approximation • 9.1.1の内容を、コインが2個(θ1, θ2)の場合で 行う 2013/08/24
  • 26. Posterior via Grid Approximation 事前確率 • 事前確率 2013/08/24
  • 27. Posterior via Grid Approximation 尤度 • 尤度 – データ D1 : 表 3 回、裏 13 回 – データ D2 : 表 4 回、裏 1 回 – 尤度 : p ( D1 | θ1 ) = θ1 3 ( 1 – θ1 )13 – 尤度 : p ( D1 | θ2 ) = θ2 4 ( 1 – θ2 )1 2013/08/24
  • 28. Posterior via Grid Approximation 事後確率 • 事後確率 – データ数の大きかった 1 の方がデータの平均値に事後 確率も集まりやすい 2013/08/24
  • 29. Posterior via Grid Approximation 事前確率 μ と θ の依存関係が強い場合 • 事前確率 – μ と θ の依存関係が強い場合 2013/08/24
  • 30. Posterior via Grid Approximation 事前確率 μ と θ の依存関係が強い場合 • 尤度、データはさっきと同じ – データ D1 : 表 3 回、裏 13 回 – データ D2 : 表 4 回、裏 1 回 – 尤度 : p ( D1 | θ1 ) = θ1 3 ( 1 – θ1 )13 – 尤度 : p ( D1 | θ2 ) = θ2 4 ( 1 – θ2 )1 2013/08/24
  • 31. Posterior via Grid Approximation 事後確率 μ と θ の依存関係が強い場合 • 事後確率 – さっきよりも θ2 が θ1 の方によってる – μ と θ の依存関係が強いので、μを通して、データの 影響が別のパラメータθへの影響も強くなる 2013/08/24
  • 32. 9.2.2 Posterior via Monte Carlo Sampling • モデルをより現実的なものにするために、パラ メータ K も導入する – サンプルサイズKは、9.2.1まで定数だった – K が大 → θj は μ に近くなりやすい – K が小 → θj は μ からはなれて広がりやすい – 実際には、 K の値を事前に知ることはできず、「異 なるコインの試行結果が似かよってたら、K は大きい だろう」、「異なるコインの試行結果があんまり似 てなかったら、K は小さいだろう」みたいにという証 拠になる 2013/08/24
  • 33. 9.2.2 Posterior via Monte Carlo Sampling • パラメータ K (図中ではκ) は、定数ではなくて、事前 分布から生じる(ここでは ガンマ分布を使用) • パラメータは全部で J + 2 個 – θ1 〜 θJ, μ, κ 2013/08/24
  • 34. ガンマ分布 – s: shape parameter, 分布のな だらかさを表す – r: rate parameter, (=1/scale) – m: s / r – sd: √s / r 2013/08/24
  • 37. κ の事前分布にガンマ分布を用いた場合 • コイン3個の試行で、3個とも似たような結果だった場合 • コイン工場のパラメータ μ の推定の確かさは高い • κ の平均値が大きくなる 2013/08/24
  • 38. κ の事前分布にガンマ分布を用いた場合 2013/08/24 • コイン3個の試行で、3個ともバラバラな結果だった場合 • コイン工場のパラメータ μ の推定の確かさは低い • κ の平均値は小さくなる
  • 39. 9.2.3 Outliers and Shrinkage of Individual Estimates • 多くのコインが似たような結果を出すと、κ は 大きくなり、θ と μ の依存関係も強くなる – 異なるコインの θ が同じような分布になる 2013/08/24
  • 40. Outliers and Shrinkage • コイン5個投げて、1個変なコインがいた (Outliers) – κ が小さい時は、θ5 は実際の分布に近づくが、κ が大 きい時は、他のコインの θ の分布に近づく (Shrinkage) 2013/08/24
  • 41. 9.2.5 Number of Coins and Flips per Coin • データ増やすと、よりcertainにモデル推定が可 能になる • データの増やし方 – コインごとの投げ数を増やす – コインの数を増やす • ハイパーパラメータの推定が目的の場合はこっち • 個々のコインのバイアスではなくて、コイン工場のパラメー タを推定したい時とか 2013/08/24
  • 42. 9.3 MULTIPLE COINS FROM MULTIPLE MINTS • コイン工場に関するパラメータ μ, κ が工場ごと にことなる場合 • 工場ごとのパラメータが独立な場合と従属な場 合の2つを考える 2013/08/24
  • 43. 9.3.1 Independent Mints • μc, κc は、コイン毎に異なるが、同じガンマ分布 から生成される μ, κ が同じの場合 μc, κc がバラバラの場合 2013/08/24
  • 44. 9.3.2 Dependent Mints • μc, κc が、コイン毎に異なり、 異なるガンマ分布から生成さ れる – ガンマ分布のパラメータsc, rcは、 平均 μγ, 標準偏差 σγ で表される – μγ と σγ は一様分布から生じる 2013/08/24