SlideShare a Scribd company logo
1 of 11
Download to read offline
PRML10.1~10.4まとめ
大域的変分推論法
@sesenosannko
目次
変分法とは
変分近似法の概要
大域的変分推論法の概要
大域的変分推論法の利点
目次
変分法
関数⋯入力した値xに対してy(x)を返す
汎関数⋯入力した関数y(x)に対してF[y]を返す(関数の関数)
↓
微分⋯ xの微小変化に対する関数y(x)の変化
変分⋯ y(x)の微小変化に対する汎関数F[y]の変化
変分近似法は近似だが、変分法自体は近似ではない
変分法とは
変分法を用いて何を近似するのか
変分法⇒汎関数を最大化することができる
(簡単には求められない)確率分布を
単純な確率分布の組合せで近似したい
⇑
何かを最大化する組み合わせの確率分布の組合せを求める
⇑
変分法!!
変文近似法の概要
変分近似法の種類
変分推論法(変分ベイズ法)
大域的変分推論法
全ての確率分布についての事後分布の近似
局所的変分推論法
モデルの各変数(または変数群)の関数の近似
EP法
考え方が異なる変分近似法(ここでは説明は省略する)
変文近似法の概要
大域的変分推論法で扱うモデル
潜在変数Zを持つモデルを対象とする
(このモデルではパラメータも潜在変数Zに含めます)
観測データXに対して潜在変数Zの事後確率p(Z∣X)が知りたい
事後確率p(Z∣X)が簡単には求まらないとする
例:
混合ガウス分布(Z ⋯平均μ・分散Σ・潜在変数Z)
ベイズ線形回帰(Z ⋯パラメータw・超パラメータα)
大域的変分推論法の概要
事後分布はどうすれば求まる?
任意の確率分布q(Z)に対して以下が成り立つ
lnp(X) = L(q) + KL(p∣∣q)
ただし
L(q) = q(Z)ln dZ
KL(p∣∣q) = − q(Z)ln dZ
大域的変分推論法の概要
∫ { q(Z)
p(X,Z)
}
∫ { q(Z)
p(Z∣X)
}
事後分布はどうすれば求まる?
ここでlnp(X)が一定であるため
L(q)の最大化⟺ KL(p∣∣q)の最小化
⇒ q(Z)が任意であればq(z) = p(Z∣X)
(KL(p∣∣q)の形式より)
大域的変分推論法の概要
事後分布はどうすれば求まる?
p(Z∣X)は厳密には求められない(仮定)
↓
q(Z)を単純な確率分布の組み合わせなどで近似
↓
L(q)の最大化するq(Z)はp(Z∣X)の近似となる
汎関数L(q)の最大化⇐変分法!!!
大域的変分推論法の概要
大域的変分推論法の利点
EMアルゴリズムについて(最尤推定とベイズ推定の違い)
モデルの複雑さに自動的にペナルティを与える
混合ガウス分布などの要素が縮退することがない
適切な混合要素数を決定できる
ベイズ線形回帰について(超パラメータの点推定との比較)
完全なベイズモデルになる(超パラメータに関する積分)
大域的変分推論法の利点
まとめ
変分法を用いた確率分布の近似が変分推論法
大域的変分推論法では汎関数L(q)の最大化を経由して
事後確率p(Z∣X)を求める
変分近似法によりベイズ推定を適用できる対象の幅が広がる
まとめ

More Related Content

Viewers also liked

Viewers also liked (20)

U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
 
“Why Should I Trust You?” Explaining the Predictions of Any Classifierの紹介
“Why Should I Trust You?” Explaining the Predictions of Any Classifierの紹介“Why Should I Trust You?” Explaining the Predictions of Any Classifierの紹介
“Why Should I Trust You?” Explaining the Predictions of Any Classifierの紹介
 
AI班ハードウェア領域
AI班ハードウェア領域AI班ハードウェア領域
AI班ハードウェア領域
 
Unsupervised Image-to-Image Translation Networksの紹介
Unsupervised Image-to-Image Translation Networksの紹介Unsupervised Image-to-Image Translation Networksの紹介
Unsupervised Image-to-Image Translation Networksの紹介
 
Phonetic Posteriorgrams for Many-to-One Voice Conversion without Parallel Dat...
Phonetic Posteriorgrams for Many-to-One Voice Conversion without Parallel Dat...Phonetic Posteriorgrams for Many-to-One Voice Conversion without Parallel Dat...
Phonetic Posteriorgrams for Many-to-One Voice Conversion without Parallel Dat...
 
Random forest の解説
Random forest の解説Random forest の解説
Random forest の解説
 
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
 
ハミルトニアンモンテカルロ法についての説明
ハミルトニアンモンテカルロ法についての説明ハミルトニアンモンテカルロ法についての説明
ハミルトニアンモンテカルロ法についての説明
 
Tutorial of topological_data_analysis_part_1(basic)
Tutorial of topological_data_analysis_part_1(basic)Tutorial of topological_data_analysis_part_1(basic)
Tutorial of topological_data_analysis_part_1(basic)
 
Topological data analysis
Topological data analysisTopological data analysis
Topological data analysis
 
Duchenne
DuchenneDuchenne
Duchenne
 
Ggge6533 pengajaran strategi_pembelajaran_bahasa
Ggge6533 pengajaran strategi_pembelajaran_bahasaGgge6533 pengajaran strategi_pembelajaran_bahasa
Ggge6533 pengajaran strategi_pembelajaran_bahasa
 
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
 
Clase activ. 8
Clase activ. 8Clase activ. 8
Clase activ. 8
 
Fibrosis quistica, Ehler Danlos, Osteogenesis Imperfecta
Fibrosis quistica, Ehler Danlos, Osteogenesis ImperfectaFibrosis quistica, Ehler Danlos, Osteogenesis Imperfecta
Fibrosis quistica, Ehler Danlos, Osteogenesis Imperfecta
 
약속해 합창 반주 악보
약속해   합창 반주 악보약속해   합창 반주 악보
약속해 합창 반주 악보
 
Diseñando secuencias didacticas 2
Diseñando secuencias didacticas 2Diseñando secuencias didacticas 2
Diseñando secuencias didacticas 2
 
Probabiliad y Estadistica
Probabiliad y Estadistica Probabiliad y Estadistica
Probabiliad y Estadistica
 
Is the end near
Is the end nearIs the end near
Is the end near
 
クラシックな機械学習の入門  9. モデル推定
クラシックな機械学習の入門  9. モデル推定クラシックな機械学習の入門  9. モデル推定
クラシックな機械学習の入門  9. モデル推定
 

More from KCS Keio Computer Society

More from KCS Keio Computer Society (20)

Large scale gan training for high fidelity natural
Large scale gan training for high fidelity naturalLarge scale gan training for high fidelity natural
Large scale gan training for high fidelity natural
 
Imagenet trained cnns-are_biased_towards
Imagenet trained cnns-are_biased_towardsImagenet trained cnns-are_biased_towards
Imagenet trained cnns-are_biased_towards
 
機械学習ゼミ: Area attenttion
機械学習ゼミ: Area attenttion機械学習ゼミ: Area attenttion
機械学習ゼミ: Area attenttion
 
機械学習ゼミ 2018/10/17
機械学習ゼミ 2018/10/17機械学習ゼミ 2018/10/17
機械学習ゼミ 2018/10/17
 
機械学習ゼミ2018 06 15
機械学習ゼミ2018 06 15機械学習ゼミ2018 06 15
機械学習ゼミ2018 06 15
 
Control by deep learning
Control by deep learningControl by deep learning
Control by deep learning
 
深層学習 第6章
深層学習 第6章深層学習 第6章
深層学習 第6章
 
Vector-Based navigation using grid-like representations in artificial agents
 Vector-Based navigation using grid-like representations in artificial agents Vector-Based navigation using grid-like representations in artificial agents
Vector-Based navigation using grid-like representations in artificial agents
 
文章生成の未解決問題
文章生成の未解決問題文章生成の未解決問題
文章生成の未解決問題
 
Word2vec alpha
Word2vec alphaWord2vec alpha
Word2vec alpha
 
テンソル代数
テンソル代数テンソル代数
テンソル代数
 
Hindsight experience replay
Hindsight experience replayHindsight experience replay
Hindsight experience replay
 
Kml 輪読514
Kml 輪読514Kml 輪読514
Kml 輪読514
 
ゼロから作るDeepLearning 5章 輪読
ゼロから作るDeepLearning 5章 輪読ゼロから作るDeepLearning 5章 輪読
ゼロから作るDeepLearning 5章 輪読
 
ELBO型VAEのダメなところ
ELBO型VAEのダメなところELBO型VAEのダメなところ
ELBO型VAEのダメなところ
 
ゼロから作るDeepLearning 2~3章 輪読
ゼロから作るDeepLearning 2~3章 輪読ゼロから作るDeepLearning 2~3章 輪読
ゼロから作るDeepLearning 2~3章 輪読
 
ゼロから作るDeepLearning 4章 輪読
ゼロから作るDeepLearning 4章 輪読ゼロから作るDeepLearning 4章 輪読
ゼロから作るDeepLearning 4章 輪読
 
Soft Actor Critic 解説
Soft Actor Critic 解説Soft Actor Critic 解説
Soft Actor Critic 解説
 
ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読
 
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
 

PRML10.1〜10.4 大域的変分推論法の紹介