NagoyaStat #12 で使用した資料です(公開に当たって当日ホワイトボードに書いた内容等を補完したものになります)。
「StanとRでベイズ統計モデリング」の第9章前半になります。
第9章のテーマは行列やベクトルを使った演算の高速化です。
---
The title of textbook is "Bayesian statistical modeling with Stan and R", and that of Chapter 9 in textbook is "advanced grammar" in English.
NagoyaStat #12 で使用した資料です(公開に当たって当日ホワイトボードに書いた内容等を補完したものになります)。
「StanとRでベイズ統計モデリング」の第9章前半になります。
第9章のテーマは行列やベクトルを使った演算の高速化です。
---
The title of textbook is "Bayesian statistical modeling with Stan and R", and that of Chapter 9 in textbook is "advanced grammar" in English.
* Satoshi Hara and Kohei Hayashi. Making Tree Ensembles Interpretable: A Bayesian Model Selection Approach. AISTATS'18 (to appear).
arXiv ver.: https://arxiv.org/abs/1606.09066#
* GitHub
https://github.com/sato9hara/defragTrees
Data-Intensive Text Processing with MapReduce ch6.1Sho Shimauchi
This document is written about "Data-Intensive Text Processing with MapReduce" Chapter 6.1.
Chapter 6 describes how to design Expectation Maximization with MapReduce algorithm.
Section 6.1 focus to Expectation Maximization algorithm itself, and so there are no description about MapReduce.
11. データからモデルを推定する
• データが与えられたときのパラメータθの推定
をどうするか?
– 最尤推定は?
n
arg Max log p( xi ; )
ˆ
i 1
n
arg Max log m ( xi ; )
i 1
⇒logの中に∑があるので、陽に解析できない。
12. じゃあ、どうやって推定する?
• しかし、最尤推定を行いたい。
• →パラメータxとモデルを表すラベルmの対、( xi , mi )
が明らかになっていれば計算できる
(証明は教科書で)
n
arg Max log p( xi , mi ; )
ˆ
n
arg Max log p( xi ; )
ˆ
i 1
i 1
ラベルを与える
n
arg Max log m ( xi , mi ; )
n
arg Max log m ( xi ; )
i 1
i 1
⇒どのように、 xi , mi )を与えるか?
(
13. EMアルゴリズム
• EMアルゴリズム・・・反復によって欠損データの最尤推定を
行う方法
• 混合分布の場合、所与のデータが属するラベルが欠損して
いると考える。
通常のデータ行列 EMアルゴリズムで扱うデータ行列
欠けたデータ
x11 x1 p x11 x1 p m1
X X
x x x x m
n1 np n1 np n