大森ゼミ新歓11. 第一章 ベイズ統計の誕生
ベイズのアイディアはこうです
・ X を観測した後の p の確率(事後確率)は
P( p | X )と書き、 P( p ) P( X | p )
に比例する。
・ P(p) は情報 X を得る前の p に対する信念 ( 事
前確率 ) であり、それと p を所与とした X の
発生確率 ( 尤度 ) である P(X|p) の積を考えれば
いい。
・事前確率とは p に関する情報を得る前の信念
であり、事後確率とは情報を得た後の信念で
ある。
25. 第三章 MCMC 革命
しかし 20 世紀も終わりにさしかかる 1990 年に不遇の
時代を過ごしたベイズ主義に再び脚光が当たる事件
が発生します。
ゲルファンドとスミスによるマルコフ連鎖モンテカル
ロ法( MCMC )です。 Markov Chain Monte Carlo
略して MCMC です。
これを用いることで容易に同時確率分布の積分が行え
るようになり、誤解を恐れずに言えば、どんな難し
い問題でもベイズで解けるようになりました。
26. 第三章 MCMC 革命
MCMC の基本的なアイディアは、「事後分布を
解析的に求めるのではなく、まず事後分布か
らのランダムサンプリングをして、それで事
後分布を近似する」というものです。これは
モンテカルロ法の一種です。
なぜこんなに遠回りなことをするのでしょう
か。一つには事後分布が解析的に求まらない
ということがありますが、最大の理由はラン
ダムサンプルの集計によって高次元の積分計
算が簡単に代替できるということがありま
す。これをモンテカルロ積分といいます。
27. 第三章 MCMC 革命
事後分布における高次元積分の問題のイメージ
はこんな感じです。
仮に 10 変数の推定を解いていたとして、 10 変
数の同時事後分布がわかったとしましょう。
密度関数は 10 次元空間上です。しかし残念な
がら 10 次元上の関数について人間は特徴をつ
かむことができません。
なので、 1 変数や 2 変数について集計する必要
があります、つまりある変数に対しての周辺
分布を求めるために、残りの 8 変数や 9 変数
に対して積分する必要があります。
31. 第三章 MCMC 革命
当然こんなことは 20 世紀のベイズ統計学者も織
り込み済みだった筈ですが、実は同時事後分
布からのサンプリングというのは実際には難
しいことが多いのです。
それを可能にするのがもう一つのキーワードで
あるマルコフ連鎖です。
普通サンプリングは独立に行われるというイ
メージですが、 MCMC の場合には前のサンプ
ルに次のサンプルを従属させます。
36. 第三章 MCMC 革命
MCMC や S などシミュレーションに基づいた
MC
手法には必ずモンテカルロエラーと呼ばれる
誤差が伴いますが、十分な回数の試行を行う
ことでなくなったとみなすことができます
(かつ、普通のサンプルと違って、時間の許
す限りたくさんのサンプルを自由に得ること
ができます)。
皮肉なことに、 MCMC や S によるサンプリン
MC
グは、頻度主義統計がもっともよく当てはま
る問題であり、実際にサンプルの収束の判定
やサンプリングスキームの正当化に頻度主義
理論がよく使われています。
48. おまけ(興味のある人のために)
主要なパッケージ一覧 (2014 年現
在)
・ MCMC 専用のパッケージ
WinBugs(もっとも普及している汎用 MCMC パッケージ)
JAGS S版の WinBugs)
(OS
S (最新の MCMC 専用パッケージ)
tan
・ R のパッケージ
MCMCpack(R でもっとも有名なベイズ推定 )
pom p(PMCMC による状態空間モデル推定 )
bayesm
・その他
Dynare(Matlab 上での DS
GEのベイズ推定 )
LibBi(MPI ・ GPGPU 対応の、 PMCMC ・ S
MC2 を用いた状態空間モデルのベイズ推定 )