BUGSを使うメリット
2013.9.29
@berobero11
BUGSって何?
Bayesian inference Using Gibbs Sampling
Rにそっくりな構文で統計モデリングできます
☺• ドメイン知識がフル活用できる
• 書くコードが少なくてすむ
• 結果がRからとても使いやすい
• パラメータの同時分布が得られる
1
2
3
4
• ドメイン知識がフル活用できる
• 書くコードが少なくてすむ
• 結果がRからとても使いやすい
• パラメータの同時分布が得られる
1
2
3
4
ドメイン知識 ≒ 業界内の経験則
例 ユーザーの行動
例 トピックモデル
統計数理研究所H24年度公開講座「確率的トピックモデル」石黒先生の資料より
ドメイン知識を使うことによる当然の帰結
結果が解釈しやすい
検定・クラスタリング・PCA・MDS…
これらで十分ですか?
機械学習の結果を解釈して
実務にフィードバックできてますか?
• ドメイン知識がフル活用できる
• 書くコードが少なくてすむ
• 結果がRからとても使いやすい
• パラメータの同時分布が得られる
1
2
3
4
出席する/しない が性別で変わるか?
線形クラス分類のベイズ版
• ドメイン知識がフル活用できる
• 書くコードが少なくてすむ
• 結果がRからとても使いやすい
• パラメータの同時分布が得られる
1
2
3
4
MCMCサンプルのベクトル!
• ドメイン知識がフル活用できる
• 書くコードが少なくてすむ
• 結果がRからとても使いやすい
• パラメータの同時分布が得られる
1
2
3
4
𝑝 パラメータ1, パラメータ2, … が求まる
パラメータを消去したりすることで
任意の分布が求められる
欲しいところのMCMCサンプルを
取ってくるだけの簡単なお仕事
実際上は
おまけ
☹• 時間がかかる
– 計算が1日のオーダーになることもしばしば
• モデルの書き方が分かりにくい
– Rだってはじめは分かりにくかったでしょ?
• エラーメッセージが意味不明で殺意がわく
– OpenBUGS・WinBUGS ⇒ JAGS・Stanへ!
あなたに合うライブラリは?
データ数は
10万行以上?
CAR model
(空間統計モデ
ルの一種)
使いたい?
行列の演算を
いっぱい使う?
yes
Noyes
WinBUGS
安定と先進的、
どちらかと言えば
安定が好き?
yes
Noyes
JAGS
Stan
参考文献
• 久保 拓弥
「データ解析のための統計モデリング入門
一般化線形モデル・階層ベイズモデル・MCMC」
• Taeko Becque, 丹後俊郎
「ベイジアン統計解析の実際」
• David Lunn et al.
「The BUGS Book」
Web上の情報
• 久保先生のホームページの一部
– http://hosho.ees.hokudai.ac.jp/~kubo/ce/BayesianMcmc.html
• RとWinBUGS
– http://d.hatena.ne.jp/lindley/
• Small Data Scientist Memorandum
– http://heartruptcy.blog.fc2.com/
• Taglibro de H
– http://ito-hi.blog.so-net.ne.jp/archive/c75233-1
• BOD [R]緑本メモ
– http://d.hatena.ne.jp/dichika/20120522/1337681689
• @dichikaさんのTokyo.R第23回の発表資料から
– http://www.slideshare.net/dichika/tokyor23

BUGSを使うメリット