みどりぼん読書会10章  
階層ベイズモデル 
-GLMMのベイズモデル化-(後半) 
@tetsuroito 
2014/09/30  @dwango 
2014年9月30日火曜日
自己紹介 
名前:伊藤 徹郎(@tetsuroito) 
近況:恵比寿のお店を開拓中 
マイブーム:クッキング 
冬が待ち遠しい今日この頃 
2014年9月30日火曜日
マイルストーン 
イマココ! 
だいぶ終盤に差し掛かりました 
2014年9月30日火曜日
前半でやったこと 
GLMMを階層ベイズモデル化 
階層ベイズモデルのMCMCサンプリング 
階層ベイズモデルの事後分布推定と予測 
2014年9月30日火曜日
後半のお品書き 
10.4 ベイズモデルで使う様々な事前分布 
10.5 個体差+場所差の階層ベイズモデル 
10.6 まとめと参考文献 
2014年9月30日火曜日
ベイズ統計モデルの設計で重要なこと 
よく使われる3種類の事前分布 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
ベイズ統計モデルの設計で重要なこと 
→事前分布の選択 
よく使われる3種類の事前分布 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
ベイズ統計モデルの設計で重要なこと 
→事前分布の選択 
よく使われる3種類の事前分布 
1,主観的な事前分布2,無情報事前分布3,階層事前分布 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
1,主観的な事前分布 
個体差  の事前分布として使うならば‥ 
「私はこうなってると思う!」で決定する 
主観的な事前分布を使う場合 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
1,主観的な事前分布 
個体差  の事前分布として使うならば‥ 
「私はこうなってると思う!」で決定する 
→でも、この本では使いません 
主観的な事前分布を使う場合 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
1,主観的な事前分布 
個体差  の事前分布として使うならば‥ 
「私はこうなってると思う!」で決定する 
→でも、この本では使いません 
主観的な事前分布を使う場合 
連続値の観測値xに関する測定時の誤測定が大きい場合 
→スペックなどで測定ばらつきを主観で決定 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
2,無情報事前分布 
事前分布が事後分布に影響を与えないようにしたい場合に用いる 
久保先生の談話 
「データの読み上げみたいなもの」「統計モデリングじゃない」 
4章の4.2節に登場したフルモデルみたいの (懐かしいですね) 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
2,無情報事前分布 
事前分布が事後分布に影響を与えないようにしたい場合に用いる 
久保先生の談話 
「データの読み上げみたいなもの」「統計モデリングじゃない」 
4章の4.2節に登場したフルモデルみたいの (懐かしいですね) 
→これも、メインでは使いません 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
そういえば‥ 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
そういえば‥ 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
そういえば‥ 
こんな主張ありました 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
3,階層事前分布 
→10.3の例題ではこちらを使用 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
3,階層事前分布 
→10.3の例題ではこちらを使用 
個体差  の事前分布p( |s)を階層事前分布 
平均=0,標準偏差sの正規分布 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
3,階層事前分布 
→10.3の例題ではこちらを使用 
個体差  の事前分布p( |s)を階層事前分布 
平均=0,標準偏差sの正規分布 
正規分布sの事前分布は無情報事前分布を設定 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
3,階層事前分布 
→10.3の例題ではこちらを使用 
個体差  の事前分布p( |s)を階層事前分布 
平均=0,標準偏差sの正規分布 
正規分布sの事前分布は無情報事前分布を設定 
→階層構造はこれより深くはならない 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
事前分布に何を選択すればよいの? 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
事前分布に何を選択すればよいの? 
→パラメータがデータ全体のどの範囲を説明しているか? 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
事前分布に何を選択すればよいの? 
→パラメータがデータ全体のどの範囲を説明しているか? 
データ全体を大域的に説明する少数パラメータ 
データの一部を説明する局所的パラメータ 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
10.3の例題のコードをおさらい 
model 
10.4 ベイズモデルで使う様々な事前分布 
{" 
for(i in 1:N){ 
" " Y[i] ~ dbin(q[i],8)" #二項分布 
" " logit(q[i]) <- beta + r[i]" #生存確率 
" } 
" beta ~ dnorm(0,1.0E-4)" #無情報事前分布 
" for(i in 1:N){ 
" " r[i] ~ dnorm(0,tau)" #階層事前分布 
" } 
" tau <- 1/(s * s)" #tauは分散の逆数 
" s ~ dunif(0,1.0E+4)"#無情報事前分布 
} 
2014年9月30日火曜日
10.3の例題で言えば‥ 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
10.3の例題で言えば‥ 
切片β→データ全体を説明する大域パラメータ 
100個の個体差[ ]→局所的パラメータ 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
10.3の例題で言えば‥ 
切片β→データ全体を説明する大域パラメータ 
100個の個体差[ ]→局所的パラメータ 
→階層事前分布を設定するのは後者ということになる 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
階層ベイズモデル 
多数の局所的パラメータを制御するため、  
階層事前分布を設定 
この階層事前分布を少数の大域的パラメータ 
で支配する 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
not only個体差 but also場所差 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
not only個体差 but also場所差 
植木鉢が10個あり、[A,‥,E](白):無処理 
         [F,‥,J](グレイ):施肥処理 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
not only個体差 but also場所差 
植木鉢が10個あり、[A,‥,E](白):無処理 
         [F,‥,J](グレイ):施肥処理 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
過分散や個体差、植木鉢差が存在している 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
過分散や個体差、植木鉢差が存在している 
→データだけ見ていても、この植木鉢差の理由は不明 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
過分散や個体差、植木鉢差が存在している 
→データだけ見ていても、この植木鉢差の理由は不明 
このデータ構造の場合‥ 
 疑似反復なので、個体差と植木鉢差を同時に 
 扱う必要性があります(7.5章を参照) 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
GLMM化したポアソン回帰で扱える問題 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
GLMM化したポアソン回帰で扱える問題 
個体iの種子数 のばらつきを平均 のポアソン分布 
で表現 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
GLMM化したポアソン回帰で扱える問題 
個体iの種子数 のばらつきを平均 のポアソン分布 
で表現 
10.5個体差+場所差の階層ベイズモデル 
平均種子数 
2014年9月30日火曜日
GLMM化したポアソン回帰で扱える問題 
個体iの種子数 のばらつきを平均 のポアソン分布 
で表現 
(無情報事前分布) 
10.5個体差+場所差の階層ベイズモデル 
平均種子数 
切片 
施肥処理の有無の係数 
(無情報事前分布) 
2014年9月30日火曜日
GLMM化したポアソン回帰で扱える問題 
個体iの種子数 のばらつきを平均 のポアソン分布 
で表現 
個体iの効果 
(階層事前分布) 
10.5個体差+場所差の階層ベイズモデル 
平均種子数 
切片 
施肥処理の有無の係数 
植木鉢jの効果 
(無情報事前分布) 
(無情報事前分布) 
(階層事前分布) 
2014年9月30日火曜日
GLMM化したポアソン回帰で扱える問題 
個体iの種子数 のばらつきを平均 のポアソン分布 
で表現 
個体iの効果 
(階層事前分布) 
(階層事前分布) のばらつき 
10.5個体差+場所差の階層ベイズモデル 
平均種子数 
切片 
施肥処理の有無の係数 
植木鉢jの効果 
(無情報事前分布) 
(無情報事前分布) 
(0~10^4の一様分布) 
2014年9月30日火曜日
個体差+植木鉢差の階層ベイズモデル概要 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
WinBUGSを使って推定 
model 
{ 
! for (i in 1:N.sample) { 
! ! Y[i] ~ dpois(lambda[i]) 
! ! log(lambda[i]) <- beta1 + beta2 * F[i] + r[i] + rp[Pot[i]] 
! } 
! beta1 ~ dnorm(0, 1.0E-4) 
! beta2 ~ dnorm(0, 1.0E-4) 
! for (i in 1:N.sample) { 
! ! r[i] ~ dnorm(0, tau[1]) 
! } 
! for (j in 1:N.pot) { 
! ! rp[j] ~ dnorm(0, tau[2]) 
! } 
! for (k in 1:N.tau) { 
! ! tau[k] <- 1.0 / (s[k] * s[k]) 
! ! s[k] ~ dunif(0, 1.0E+4) 
! } 
} 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
だが、しかし‥ 
WinBUGSでry)‥ 
とある10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
RのMCMCglmm()でもできそう 
http://hosho.ees.hokudai.ac.jp/~kubo/ce/McmcGlmm.html#toc2 
stanでもできそう 
http://ito-hi.blog.so-net.ne.jp/2012-09-04 
※詳細はWEBでチェック! 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
stanで推定された結果を拝借 
ちゃんとパラメータ推定できている 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
10.6まとめと参考文献 
2014年9月30日火曜日
GLMMをベイズモデル化→階層ベイズモデル 
10.6まとめと参考文献 
2014年9月30日火曜日
GLMMをベイズモデル化→階層ベイズモデル 
階層ベイズは事前分布となる確率分布の 
 パラメータにも事前分布が指定されている 
10.6まとめと参考文献 
2014年9月30日火曜日
GLMMをベイズモデル化→階層ベイズモデル 
階層ベイズは事前分布となる確率分布の 
 パラメータにも事前分布が指定されている 
主観を排し、無情報、階層事前分布を使う! 
10.6まとめと参考文献 
2014年9月30日火曜日
GLMMをベイズモデル化→階層ベイズモデル 
階層ベイズは事前分布となる確率分布の 
 パラメータにも事前分布が指定されている 
主観を排し、無情報、階層事前分布を使う! 
複雑な構造の統計モデリングでは、階層ベイズ 
モデルとMCMCサンプリングによるパラメータ 
推定の組み合わせで対処する 
10.6まとめと参考文献 
2014年9月30日火曜日
注意点 
統計モデルと推定方法の区別に注意! 
10.6まとめと参考文献 
2014年9月30日火曜日
注意点 
統計モデルと推定方法の区別に注意! 
統計モデル:階層ベイズモデル 
推定方法 :MCMCサンプリング 
10.6まとめと参考文献 
2014年9月30日火曜日
おまけ 
先日のjulia tokyoでMCMCの発表があった 
2014年9月30日火曜日
ご清聴ありがとうございました! 
2014年9月30日火曜日

20140930 みどりぼん10章後半 階層ベイズモデル -GLMMのベイズモデル化-(後半)