21. Variational Inference
对数边缘概率分布有如下分解式:
其中:
ln ( ) ( ) ( )p x L q KL q p P
( , )
( ) ( )ln
( )
( | )
( ) ( )ln
( )
p X Z
L q q Z dZ
q Z
p Z X
KL q p q Z
q Z
P
固定值
极小化 等价于极大化( )KL q pP ( )L q
22. Variational Inference
( ) ln ( , ) ln
ln ( , ) ln
ln ( , ) ln
ln ( , ) ln
i i
ii
j i i j i i
ii j i
j i i j k i
ii j k
j i i j i i i i i
ii j
L q q p X Z q dZ
q p X Z q dZ dZ q q dZ
q p X Z q dZ dZ q q dZ
q p X Z q dZ dZ q q q dZ dZ
23. Variational Inference
( ) ln ( , ) ln
1
ln ( , ) ln
ln ( , ) ln
ln ( , ) ln
j i i j i i i i i
ii j
j i i j i i i
ii j i i
j i i j i i i
ii j
j i i j j j j
i j
L q q p X Z q dZ dZ q q dZ q dZ
q p X Z q dZ dZ q q dZ
q dZ
q p X Z q dZ dZ q q dZ
q p X Z q dZ dZ q q dZ const
24. Variational Inference
• 定义新的分布:
• 其中:
ln ( , ) [ln ( , )]j
i j
p X Z E p X Z const
%
归一化
[ln ( , )] ln ( , ) i i
i j
i j
E p X Z p X Z q dZ
25. Variational Inference
• 则泛函
• 结合约束 ,根据泛函求条件极值的必要条件有:
( ) ln ( , ) ln
( , )
ln
( , ( , ))
j j j j j j
j
j j
j
j j
L q q p X Z dZ q q dZ const
p X Z
q dZ const
q
KL q p X Z const
%
%
%
ln 1j j jq q dZ
. { ( , ( , )) ( ln 1)} 0j j i j j j
i
i KL q p X Z q q dZ
q
%
若q(Z)划分为M个分解式,则上式有M个等式
当且仅当 和 相等时,取得最小值jq ( , )jp X Z%
28. 例子
• 使用前述最优解形式计算:
2
2
*
1 1
2
1 2 11 1 1 12 2 2
2
1 11 1 1 11 1 12 2 2
ln ( ) [ln ( )]
1
[ ( ) ( ) ( )]
2
1
( [ ] )
2
z
z
q z E p z const
E z z z z const
z z z E z const
和 无关的项都放到const里1z
29. 例子
• 配方法得到
• 其中
• 同理
* 1
1 1 1 1 11( ) ( | , )q z N z m
1
1 1 11 12 2 2( [ ] )m E z
* 1
2 2 2 2 22( ) ( | , )q z N z m
1
2 2 22 21 1 1( [ ] )m E z
2 2[ ]E z m
1 1[ ]E z m
30. Reference
• The normal distribution, Patrick Breheny.
• Variational Bayes, http://www.blog.huajh7.com/variational-bayes/, Junhao Hua.
• PMLR, chapter 10, Approximate Inference, Christopher M. Bishop.
• PMLR读书会第十章 Approximate Inference, 戴玮.
• Completing the square, http://t.cn/RLJtqNS, Richard D. Morey.