tail-to-tail 型
c
a b
•このグラフに対応する同時分布は以下の式で表される
p(a, b, c) = p(a|c)p(b|c)p(c)
• どの変数も観測されていないとすると、a と b が独立かどうかは両
辺を c に関して周辺化すれば調べられる
p(a, b) =
c
p(a|c)p(b|c)p(c)
• この式は一般には積 p(a)p(b) には分解できないので、
a / b | ∅
38 / 59
39.
tail-to-tail 型
c
a b
•一方、変数 c で条件付けてみると、
p(a, b|c) =
p(a, b, c)
p(c)
= p(a|c)p(b|c)
これより、条件付き独立性
a b | c
が導出された
39 / 59
40.
head-to-tail 型
a cb
p(a, b, c) = p(a)p(c|a)p(b|c)
• まず、c に関して周辺化することにより a と b の独立性を調べる
p(a, b) = p(a)
c
p(c|a)p(b|c) = p(a)p(b|a)
この式は一般に p(a)p(b) の形に因数分解できないため、前の例と同
様に
a / b|∅
が言える
40 / 59
41.
head-to-tail 型
a cb
• 次に、ノード c で条件付けると
p(a, b|c) =
p(a, b, c)
p(c)
=
p(a)p(c|a)p(b|c)
p(c)
=
p(c, a)p(b|c)
p(c)
= p(a|c)p(b|c)
が得られ、この場合にも条件付き独立性
a b|c
が導かれる
41 / 59
42.
head-to-head 型
c
a b
•最後に、第 3 の例について考える
p(a, b, c) = p(a)p(b)p(c|a, b)
c に関して周辺化すると、
p(a, b) =
c
p(a)p(b)p(c|a, b)
p(a)p(b)
を得る。よって先の 2 例とは異なり、どの変数も観測されていない
とき a と b とが独立であることがわかる。この結果を a b|∅ と書く
42 / 59
43.
head-to-head 型
c
a b
•次に、c で条件付けられたときは、
p(a, b|c) =
p(a, b, c)
p(c)
=
p(a)p(b)p(c|a, b)
p(c)
これは一般に積 p(a|c)p(b|c) の形に因数分解できないため、a / b | c
である
• このように、第 3 の例は先の 2 例とは反対の振る舞いをする
43 / 59
有向分離
• グラフの有向分離
• A,B,C それぞれを重複しない任意のノード集合とする
• 条件付き独立性 A B | C を調べたい
• A に属する任意のノードから B に属する任意のノードへの全ての可
能な経路を考える必要がある
49 / 59
50.
経路の遮断
• 以下の条件のうちいずれかを満たすノードを含む経路は遮断されて
いると言う
..1 集合C に含まれるノードであって、経路に含まれる矢印がそこで
head-to-tail あるいは tail-to-tail である
..2 経路に含まれる矢印がそのノードで head-to-head であり、自身ある
いはそのすべての子孫のいずれも集合 C に含まれない
• すべての経路が遮断されていれば、A は C によって B から有向分離
されていると言い、グラフの全変数上の同時分布は A B | C を満
たす
50 / 59
51.
例 1
f
e b
a
c
•遮断する条件
..1 集合 C に含まれるノードであって、経路に含まれる矢印がそこで
head-to-tail あるいは tail-to-tail である
..2 経路に含まれる矢印がそのノードで head-to-head であり、自身ある
いはそのすべての子孫のいずれも集合 C に含まれない
• a から b への経路はノード f によって遮断されない
• f は tail-to-tail
• e によっても遮断されない
• head-to-head だが子孫 c が観測されている
• 以上より、条件付き独立性 a b | c はこのグラフからは導けない
51 / 59
52.
例 2
f
e b
a
c
•a から b への経路はノード f によって遮断される
• ノード f は tail-to-tail であり、かつ観測されている
• 条件付き独立性 a b | f が成立
52 / 59
53.
独立同分布データの場合
µ
x1 xN
• 1変量ガウス分布の平均事後分布を得る問題
p(µ, x) = p(x|µ)p(µ)
• µ を条件付け変数と見なすと、任意の xi から xj i への経路が
tail-to-tail の観測済みノード µ によって遮断される
• µ が与えられた下で、観測値 D = (x1, ..., xN) は独立
p(D|µ) =
N
n=1
p(xn|µ)
53 / 59