数学预备知识
• Gamma function
•Distribution
• Gamma Distribution
• Binomial Distribution
• Multinomial Distribution
• Beta Distribution
• Dirichlet Distribution
• MCMC
• Gibbs Sampling
6.
Gamma function Ahistory profile of the gamma function by Philip J. Davis
问题:如何找到一个函数经过阶乘数列的所有点?
Gamma function
1
1 23
lim ( 1)
(1 )(2 ) ( )
( 1)( 2) ( 1)
lim1 2 3
(1 )(2 ) ( 1)( 2) ( )
( 1)
lim !
( 1)( 2) ( )
1
lim !
!
n
m
n
m
n
m
n
m
k
m
m
n n m n
n n m m
n
n n m m m m n
m
n
m m m n
m
n
m k
n
L
L
L
L
L L
L
• 上面的式子可以整理如下:
Gamma function
• 受Wallis计算半圆曲线面积的启发Euler考虑如下定积分:
•一步分部积分:
1
0
( , ) (1 )e n
J e n x x dx
1
1
0
1
1 1 1
0 0
1
1 1
0
1
( , ) (1 )
1
1
(1 ) | (1 )
1
(1 )
1
( +1, -1)
1
n e
n e e n
e n
J e n x dx
e
x x x d x
e
n
x x dx
e
n
J e n
e
12.
Gamma function
• 迭代上式可得:
1
0
1
1
/
0
12 n
( , )
( 1)( 2) ( 1)
1 2 n
(1 )
( 1)( 2) ( 1)
:
1 2 n
(1 )
( 1) ( 1 )( 2 ) ( ( 1) )
e n
n
f e n
J e n
e e e n
x x dx
e e e n
fsubstitute for e
g
g
x x dx
f n g f g e g e n g
L
L
L
L
L
L
13.
Gamma function
• 似乎令f=1,g=0就可以得到右侧上面的n!,但是:
•继续将x替换为 :
1
0
1 1
( 1) (1 )
0
n
n n
f n g x dx x
g
g
f g
x
1
1
1 0
( 1)
(1 )
( 1) 1
( )
( )
g f g n
n
ng f g
n
f n g g
dx x
g f g
f n g x
dx
f g g f g
14.
Gamma function
• 再次令f=1,g=0
• 对于 ,当z趋近于0时,由洛必达法则,上下同时求导:
• 替换 u
t e
0
! n u
n u e du
0
(1 )
0
n
n
x
dx
(1 )z
x z
0
1
0
(1 ) 0 ln
! ( log )n
x x
n t dt
Beta-Binomial Conjugate Distribution
•对比问题一求解的概率函数为:
• 做了m次贝努利实验,计数比p小的事件和比p大的事件
• 给定实验结果后,p的后验分布变为:
( | , 1)Beta p k n k
1 2( | , 1 )Beta p k m n k m
Beta-Binomial Conjugate Distribution
•例子:
• Bayesian公式
投掷一枚硬币,Theta概率为正面,1-Theta概率为反面,投掷5次3次为正面,估计Theta?
( | ) ( )
( | )
( )
p X p
p X
p X
不再是一个固定的值,而是服从一
个概率分布,比如Beta分布二项分布
5 3 2
2( | ) (1 )p X C
边缘分布
1
0
( ) ( | ) ( )p X p X p d
Dirichlet Distribution
• 问题三求解:
12 1 2
1 2 1 2
1 1 1 1 2
1 2 3
1 2
1 1 1 2
1 2 3
1 2 1 2
2 11
( )
1 11 1
!
( )
( 1)!( 1)!( )!
k k n k k
k k n k k
n n kn n
x x x x
k k
n
x x x x
k k n k k
36.
Dirichlet Distribution
• 概率密度函数:
•令 ,则密度函数可写为:
• 三维形式的Dirichlet分布,记为:
1 1 2 2 3 1 2, , 1k k n k k
1 2 3 1 2 3,Dir x x x ( , | , , )
Dirichlet-Multinomial Conjugate Distribution
•根据条件1、2可知: 在 中分别成了第
大的数
• 则后验概率为:
1 2,p p 1 2 1 2, , , , , ,n mX X X Y Y YL L
1 1 2 2,k m k m
1 1 2 2 1 2 3, 1Dir p k m k m n k k m
r
( | , )
39.
Dirichlet-Multinomial Conjugate Distribution
•直观的:
1. 猜测参数 ,先验分布为:
2. 经过试验获取结果
3. 后验分布为:
1 2 3( , , )p p p p
r
( | )Dir p k
rr
1 2 3( , , )m m m m
r
( | )Dir p k m
rr r
Dirichlet Distribution为Multinomial Distribution的Conjugate Prior
40.
MC (Monte Carlo)
•许多科学问题需要计算积分:
• 将其变为某随机变量的期望
• 则积分可以化为采样 的样本然后累加:
( )
b
a
I f x dx
1 1
( )1
( )
( )
n n
i
i
i ii
f x b a
I f x
n g x n
( )g x( 为密度函数)
( )
( )
( )
b
a
f x
I g x dx
g x
( )g x
MCMC (Markov ChainMonte Carlo)
• 通过建立一个平稳分布为 的马氏链来得到 的样本
1. 在观测样本上选一个合适的马尔科夫链,使其转移核为
合适的含义是 是其相应的平稳分布(满足细致平稳分布条件)
2. 由观测样本上的某一点 出发,用1中的马尔科夫链产生序列
3. 对某个m和足够大的n,任一函数f(x)的期望估计如下:
( )x ( )x
(*|*)p
( )x
(0)
X (0) ( )
, n
X XL
( )
1
1ˆ ( )
n
t
t m
E f f X
n m