Chap08 1 12

第8章グラフィカルモデル山下正行 Twitter: @ruto5 PRML勉強会第10回　2010/1/9

目次８　グラフィカルモデル ,[object Object]

8.1.1 例：多項式曲線フィッティング

8.1.2 生成モデル朱鷺の杜によれば確率変数をノードとし、確率変数間に統計的な依存関係を有向辺で表したグラフを考える。このグラフに基づいて、複数の確率変数の結合確率や条件付確率を扱うモデル

8章　グラフィカルモデル加法定理乗法定理これまでの確率論で成り立っていたどんな複雑なモデルでも定式化して解くことができる確率的グラフィカルモデル解析に使うと　とても便利確率分布の図式的な表現特徴１：確率モデル構造の視覚化する方法を提供、新モデル設計方針の決定支援２：グラフ構造から条件付き独立性などのモデル性質に関する知見を得る３：精巧なモデルで推論や学習を実行するのにグラフ上の操作として表現数学的な表現も兼ねている

グラフリンク（辺、弧）ノード（頂点）グラフ：リンクによって接続されたノードの集まり確率的グラフィカルモデル：確率変数：変数間の確率的関係確率的グラフィカルモデルでのグラフ「全確率変数上の同時分布が、一部の変数のみに依存する因子の積としてどのように分解可能か」を表現する

有向／無向グラフベイジアンネットワーク（別名　有向グラフィカルモデル）マルコフ確率場（別名　無向グラフィカルモデル） ,[object Object],確率変数間の因果関係を表現するのに便利 ,[object Object],確率変数間の緩い束縛関係を表現するのに便利 ,[object Object],8.4.3で説明推論問題を解く際　有/無向グラフを因子グラフに変換すると便利グラフィカルモデルの特徴パターン認識や機械学習に応用する場合に重要となる側面に焦点を当てる

一般的な議論に関する資料１．Whittaker, J. (1990) Graphical Models in Applied Multivariate Statistics. Wiley. ２．Lauritzen, S.L. (1996) Graphical Models. Oxford University Press ３．Jensen, F. V. (1996). An Introduction to Bayesian Networks. UCL Press ４．Castillo, E., J. M. Gutierrez, and A. S. Hadi (1997). Expert Systems and 　　　　　　　　　　　　　　 Probabilistic Network Modes. Springer. ５．Jordan, M. I. (1999). Learning in Graphical Models. MIT Press. ６．Cowell, R. G., A. P. Dawid, S. L. Lauritzen, and D. J. Spiegelhalter (1999). Probabilistic Networks and Expert Systems. Springer ７．Jordan, M. I. (2007) An Introduction to Probabilistic Graphical Models. In preparatioA １２４ 5 ６

８．１　ベイジアンネットワーク広い確率分布のクラスをグラフで記述できる有向グラフを用いて確率分布を記述することの利点 3変数a,b,c上の任意の同時分布 p(a,b,c)を考える確率の乗法定理 p(X,Y) = p(Y | X)p(X) (1.11)を用いる第2因子も(1.11)を適用 aとｂの関係 a b aはbの親ノードｂはaの子ノード Fig.8.1

全結合図8.1の例を拡張して、K変数の同時分布p(x1,...,xK)の場合を考える確率の乗法定理を繰り返し適用 Kの値を決めれば同時分布はK個のノードを持つ有向グラフとして表現される全てのノードの組に対してリンクを持つ全結合条件付き確率への分解や全結合グラフ表現は、任意の同時分布に対して適用可能グラフはリンクが存在しないことをもって分布のクラスの性質に関する情報を表現する

全結合でないグラフグラフに対応する同時確率分布を条件付分布の積で表す表し方１つの条件付分布を１つのノードに対応させる各条件付分布は対応するノードの親だけに条件付けられるようにする Fig.8.2

有向グラフと変数分布間の関係グラフによって定義される同時分布グラフ上で親に対応する変数によって条件付けられた各ノード変数上の条件付分布の積によって与えられる K個のノードを持つグラフに対応する同時分布 xkの親ノード集合 X={x1,...,xK} 与えられた有向グラフィカルモデルに対応する同時分布の分解特性を表現している各ノードが１つの変数に対応するだけでなく、変数集合やベクトル値変数にも対応可能

演習８．１（基本）1/2 問変数を１つずつ周辺化することによって、有向グラフの同時分布の表現(8.5) が正しく規格化されていることを示せ。ただし、個々の条件付分布は正しく規格化されていると仮定する。グラフのノードに番号が割り振られていると仮定した場合 x1が根ノードになる。大きい番号のノードは、小さい番号のノードへ矢印はつかないそれぞれの条件付分布によって正しく規格化されると仮定した場合他の変数のいずれもxKに依存しないので xKからスタートしてノードの逆順に残すことができる。

演習８．１（基本）2/2 この処理をK-2回繰り返して、以下の式の左が得られる

有向非循環グラフ（DAG） directed acyclic graph あるノードから出発して矢印に従って進んだ後、また初めのノードに戻ってくるような閉じた閉路有向閉路有向非循環グラフ有向閉路を持たない＝大きい番号を持つノードから小さい番号を持つノードへのリンクが存在しないようにノードを順序付けられる

演習８．２（基本）問有向グラフにおいて、すべてのノードについて、自分より小さい番号を持つノードに向かうリンクが存在しないようにノードを順序付けることができるなら、有向閉路は存在しないことを示せグラフのノードがノードから小さい番号のノードまで行く辺がない順番のようなものである有向グラフについて考察する。また、次にノードの部分集合がグラフの有向閉路であるならば、この有向閉路に属するのは同じ番号である性質を満たさなければならない。エッジの向きに閉路を横断するならば、始めのノードで終わらなければならないので、ノード順は単調増加することができない。次の閉路は有向閉路であるはずがない

８．１．１多項式曲線フィッティング確率分布を記述するために有向グラフを利用する方法例：ベイズ多項式回帰モデルモデルの確率変数多項式係数ベクトル：ｗ観測データ：t=(t1,....,tN)T

確率変数だけに注目すると同時分布は事前分布p(w)とN個の条件付分布p(tn|w)(n=1,...,N)の積で与えられるプレートによるコンパクトな表現 ②プレート ③ノード数 ①代表ノード Fig.8.3

プレートによるコンパクトな表現入力データｘ=(x1,...,xN)T ノイズの分散　 σ2 分布の精度パラメータ（ハイパーパラメータ） α モデルのパラメータも陽に書いた方が便利な場合もあるグラフ表現でも描くことができるグラフ表現を描く際の慣例確率変数：塗りつぶさない円決定的パラメータ：塗りつぶされた小さい円確率変数 Fig.8.5

観測変数機械学習やパターン認識問題にグラフィカルモデルを適用する場合確率変数のいくつかを特定の観測値に対応させる例：多項式曲線フィッティングの場合　学習データ{tn} 観測変数は対応するノードに影付けする観測されていない潜在変数（隠れ変数）観測変数確率モデルで重要な役割を果たす Fig.8.6 9章と12章で詳しく説明

事後分布１．２．５節　曲線フィッティング再訪より｛tn}の値を観測すると、多項式係数wの事後分布を求めることができるベイズの定理が適用されている ※決定的パラメータは省略

予測分布多項式フィッティングの最終目的：新しい入力値に対する予測を行うこと問：新しい入力値が、与えられた時、対応する観測データで条件付けられたの確率分布を求めたいグラフィカルモデルで表すと Fig.8.7

確率の加法定理よりモデルパラメータｗを積分消去すると求めるべきの予測分布が得られるが求まるｔに含まれる確率変数は学習データ集合の観測値に暗に固定されている計算詳細は、3章で議論した

８．１．２　生成モデル与えられた確率分布に対して、それに従うサンプルを発生させたい場合が多いサンプリング法については11章で説明グラフィカルモデルと特に関係の深い伝承サンプリング法についてに従って因数分解されるK変数上の同時分布p(x1,...,xK)を考える親ノード変数の番号付け全てのノードはその親ノードよりも大きい番号を持つよう順序付けられている子ノード

目的：同時分布に従うサンプルを発生させること番号の最も小さいノードから順にサンプルを発生させていけば良い１．分布p(x1)に従うサンプルを発生させる p(x1) 2.各ノードを番号順に進む p(x2) p(x1) 3.n番目のノードでは条件付分布p(xn|pan)に従うサンプルを発生させる p(xn) p(x2) p(x1) p(x3) 値は、サンプリングされた値を用いる親変数　pan

一部の変数上のサンプルを得る一部の変数集合上の周辺分布に従うサンプルを得たい場合 p(x4) p(x1) p(x2) p(x3) 同時分布p(x1,x2,x3,x4)に従うサンプル p(x1) p(x2) 同時分布p(x1,x2)に従うサンプル分布p(x2,x4)に従うサンプル他の値は捨てる p(x2,x4) =p(x1) p(x2|x1) p(x1) p(x2|x1) p(x3|x2)p(x4|x3) 確率モデルの実際のアプリケーションでは潜在変数の重要な役割 x4 x1 x2 x3 観測変数上の複雑な形の分布をより単純な条件付き分布から作られたモデルを使って表現することにある末端ノードに対応する大きい番号が割り振られた変数小さい変数が振られたノード観測値潜在変数観測データを発生する過程を表現している

例　物体認識問題目的：観測データ（物体の像）から物体の種類を推論する問題観測像が１つ与えられたとき、すべての可能な位置、向きに関して隠れ変数を積分消去することで物体の種類に関する事後分布を求める隠れ変数像：観測データ点 Fig.8.8

生成モデル図８．８は観測データが生成される因果過程を表現している生成モデル多項式回帰モデルは生成モデルではない理由・入力変数ｘに関する確率分布を与えられていない・人工的なデータ点を生成できない少し複雑になるが適切な事前分布p(x)を導入することで多項式回帰モデルを生成モデルにすることが可能複雑な同時分布を単純な要素から構成するためだけに導入してもOK 伝承サンプリングを生成モデルに適用観測データの生成過程を模倣して観測データと全く同じ確率分布に従う「架空」のデータを発生実用上、そのモデルによって表現される確率分布の形を理解する上で有効 Pearl,J. (1988). Probabilistic Reasoning in Intelligent Systems. Morgan Kaufmann

Chap08 1 12

Recommended

Recommended

More Related Content

What's hot

What's hot (17)

Viewers also liked

Viewers also liked (9)

Recently uploaded

Recently uploaded (9)

Chap08 1 12