MCMCで研究報告
徳岡 大
広島大学大学院教育学研究科
mtokuoka37@hiroshima-u.ac.jp
Slideshare↓
http://www.slideshare.net/masarutokuoka
1	
2014.06.08
ベイズ推定による多変量解析入門
@広島大学総合科学研究科
自己紹介
•  徳岡大です。
•  研究室的な専門は発達心理学,自分でやっている
専門は動機づけです。
•  統計解析に詳しくなりたい,そんな年頃のD3です。
•  いくつか統計の資料をSlideshareとDARMホーム
ページにアップしています。
•  http://www.slideshare.net/masarutokuoka
•  今日何度も広告されている本の
潜在曲線モデルの章を書いてます
2
従来の分析とMCMCの対応表
3	
  いつもの分析 MCMC 	
推定値,
基礎統計量
回帰係数,相関係数
など
回帰係数,相関係数など
の中央値 or 平均値	
  標準誤差 標準偏差
 
95%CI(信頼区間:
confidence interval) 
95%CI(信用区間:
credible interval),
95%HDI
(Highest Destiny
Interval)
適合度指標 CFI, R2
事後予測p値
  AIC BIC, ベイズファクター
信頼区間と信用区間
•  95%信頼区間
– サンプリングを繰り返す
と,95%の確率でその区
間内に真値(≒推定値)
を含む。
•  95%信用区間
– 上位2.5%∼下位2.5%の
範囲こと。得られた推定
値は95%の確率でその区
間内にある。分布の形を
知るのに役立つ。
4	
こんな感じの図を
用いた報告もあり
報告例
5
今日の重回帰分析の例でなら
•  X1はY1に正の影響を及ぼすことが示された
(b = 0.68, 95%信用区間[0.60, 0.77])。
6
論文本体で報告
事例:
  Regarding the clinical process–mechanism–outcome
linkages examined in the SEM, EB results for the regression
parameters in the structural portion of the SEM (see Figure
4) suggest a positive effect of the following sets of therapist
interventions on change in family functioning: (a)
proportion of individually focused general interventions (BE
(7,9) = 17.49, 95% credible interval [6.41, 28.29])
7	
Ozechowski, T. J. (2014). Empirical bayes MCMC estimation for modeling treatment processes,
mechanisms of change, and clinical outcome in small sample. Journal of Consulting and
Clinical Psychology, Doi: 10.1037/a0035889
追加資料の表で報告
8	
Median P2.5 P97.5
AL(1) 57.62 44.68 71.73
AL(2) –32.95 –47.05 –18.26
AL(3) 9.79 8.36 11.2
AL(4) –1.58 –2.97 –0.13
PS(1,1) 225.2 30.49 838
PS(2,2) 912.2 108.9 3229
–32.86
9.8
–1.57
280.1
1102.8
Model and
parameter
EB posterior mean and percentiles
Mean
Latent growth model for adolescent MRJ use and DLQ
57.7
Ozechowski, T. J. (2014). Empirical bayes MCMC estimation for modeling treatment processes,
mechanisms of change, and clinical outcome in small sample. Journal of Consulting and
Clinical Psychology, Doi: 10.1037/a0035889
MCMCと従来の分析を対応させる
•  モデルの適合度指標
– MCMCではCFIやRMSEAといった適合度が算出
できないので,事後予測p値,BICなどの指標を
用いる
– 事後予測p値:データとモデルの適合度。0.0∼
1.0の範囲を取り,0.5に近いほど当てはまりが
良い
– BIC:モデル比較の時に用いる指標。小さい方が
あてはまりがよい
– ベイズファクター:帰無仮説と対立仮説のどち
らが確からしいかp値に頼らずに検討可能。
9
ベイズファクターを用いるなら
•  Jefferys (1961)の基準
10	
ベイズファクター 解釈
30 ∼ 100 帰無仮説をとても強く支持
10 ∼ 30 帰無仮説を強く支持
3 ∼ 10 帰無仮説を十分に支持
1 ∼ 3 帰無仮説を事例的に支持
1 どちらも支持できない
1/3 ∼ 1 対立仮説を事例的に支持
1/10 ∼ 1/3 対立仮説を十分に支持
1/30 ∼ 1/10 対立仮説を強く支持
1/100 ∼ 1/30 対立仮説をとても強く支持
ベイズファクター用いるなら
•  事例
11	
Wagenmakers, E. J., Wetzels, R., Borsboom, D., & Maas, H. (2011). Why psychologists must
change the way they analyze their data: The case of psi: Comment on Bem (2011). Journal of
Personality and Social Psychology, 100, 426-432.
従来の分析にはないがMCMCするなら報告
•  どのような条件でMCMCを実施し,データを得た
か
– バーンイン期間がどれくらいか
– シミュレーション数
– 採用したデータの間隔
– 複数のMCMCを走らせた場合はいくつか
走らせたか
•  MCMCが収束しているかどうか
– (R hat):鎖内分散と鎖間分散の割合。1.0に近づ
いていく。1.1を超えた場合,MCMCの反復によ
り収束が改善する可能性あり
12
今日の重回帰分析での例なら
•  自己相関の指標であるDependance factorの値が0.99
から1.06の範囲にあり,いずれも5を下回っているた
め, Rafrery and Lewisの収束診断に基づき(Raftery
& Lewis, 1992)MCMCは収束していると判断した。
13	
Raftery, A. E. & Lewis, S. (1992). How Many Iterations in the Gibbs Sampler? In J.M. Bernardo,
J. Berger, A. P. Dawid & A. F. M. Smith (Eds.), In Bayesian Statistics 4 (pp. 763-773).
Oxford: Oxford University Press.
MCMCするなら報告しときたいもの
事例:MCMCの実施における設定
  One hundred thousand simulated draws from the
posterior were obtained for each parameter. The simulated
draws were preceded by 2,000 “burn in” draws, which were
discarded from the analysis. To reduce temporal
autocorrelation among the draws, the MCMC chain was
thinned by including only every 20th draw, yielding 5,000
simulated posterior observations.
14	
Ozechowski, T. J. (2014). Empirical bayes MCMC estimation for modeling treatment processes,
mechanisms of change, and clinical outcome in small sample. Journal of Consulting and
Clinical Psychology, Doi: 10.1037/a0035889
MCMCするなら報告しときたいもの
事例:MCMC収束のエビデンス
  Finally, values of Rˆ equaled 1.0 for all parameters,
indicating convergence across the seven chains initiated
from disparate starting values (i.e., the separate chains
arrived at the same destination from different starting
points). By all indications, it appeared that the MCMC
algorithm achieved convergence for all SEM parameters,
meaning that the simulated posterior values were drawn
from the true posterior for each parameter.
15	
Ozechowski, T. J. (2014). Empirical bayes MCMC estimation for modeling treatment processes,
mechanisms of change, and clinical outcome in small sample. Journal of Consulting and
Clinical Psychology, Doi: 10.1037/a0035889
ベイズ主義の論文を報告したいなら
•  代表的なものとしては・・・
•  Introduction
– ベイズを用いるモチベーション
•  Method
– 推定する事後分布のモデルとパラメタ
– 事前分布の適切性
•  Discussion
– 事後分布の解釈
16
ベイズ主義的な論文報告の詳細
•  Kruschke, J. K. (2011). Doing bayesian data analysis: A
tutorial with R and BUGS. Burlington, MA: Academic
Press/Elsevier
17
ベイズ主義的な論文報告の詳細
•  このまとめはslideshareにアップしました。
•  http://www.slideshare.net/masarutokuoka/140610-35612411
•  後日加筆修正しますが気になる人は確認を!
18
LET’S BAYES!
19

MCMCで研究報告