Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
ノンパラメトリックベイズ
4章 クラスタリング
担当 fluct中野智文
4.1 k平均アルゴリズム
• K個のクラスにデータ点
を分類
• 各クラスの代表点:
• の距離を定
義して代表点が近いクラス
へ分類
http://aidiary.hatenablog.com/entry/20120813/13448538...
• がクラス に属する:
•zは隠れ変数、潜在変数とよばれる
•K-平均アルゴリズムは、各クラス内の平均とそれが
属するデータ点との距離が最小となる
を求める。すなわち
※著作権保護のため画質が悪くなっています。
アルゴリズム4.1
4.2 混合ガウスモデルのギブスサンプリングによ
るクラスタリング
?
成り立てば1, でなければ0
Ziに連動して平均が変化
対数化したガウス分布
•最適化問題は、
となる
※著作権保護のため画質が悪くなっています。
•アルゴリズム4.1(3)(i)を次のように書き換えられる
よって、次の最大化問題と考えることが出来る
K個のガウス分布 にもとづき、
•データごとに最も尤度が高いクラスを選択→
• から平均を最尤推定している→
分布に基づいたランダムに
4.2.1分散固定の場合
•データ は
と生成されると仮定する
標準ガウス分布 一様分布
生成したいパラメータ
データ
テンポラリな
パラメータ
事前分布
(正則化)
•だから、
ベイズの定理
分母は固定だから消え
る
グラフィカルモデルよ
り関係のある部分の
み残す
これが知りたかった?
正規化
結合確率に比例
グラフィカルモデルよ
り関係のある部分の
み残す
ここで
•条件部の依存関係
•よって、
正規分布だから正規
化は必要ない?
アルゴリズム4.2
4.2.2 分散も確率変数とする場合
•データ は
と生成されると仮定する
Zipf's の法則的な
何かとか
「正規分布の分散の
事前分布」と1章の時
のメモ
再掲
結合確率
条件付き分布は
正規化
ここで
τが共通でない
とうまくいかな
いという
ここで
積分消去すれば
アルゴリズム4.3
4.3 混合ガウスモデルの周辺化ギブスサンプリン
グによるクラスタリング
周辺化
逐次的に
結合分布
グラフィカルモデルより、
となります。ただし
は条件付き独立とはいかない。
下記(3章で説明があった)より、
よって結合確率
条件付き分布
なぜそうなったのか
積分記号?
ノンパラメト
リックベイズ
はここを拡張
(4.31)?
ノンパラメト
リックベイズ
はここを拡張
アルゴリズム4.4
ノンパラメトリックベイズ4章クラスタリング
ノンパラメトリックベイズ4章クラスタリング
ノンパラメトリックベイズ4章クラスタリング
ノンパラメトリックベイズ4章クラスタリング
ノンパラメトリックベイズ4章クラスタリング
ノンパラメトリックベイズ4章クラスタリング
ノンパラメトリックベイズ4章クラスタリング
ノンパラメトリックベイズ4章クラスタリング
ノンパラメトリックベイズ4章クラスタリング
ノンパラメトリックベイズ4章クラスタリング
ノンパラメトリックベイズ4章クラスタリング
Upcoming SlideShare
Loading in …5
×

ノンパラメトリックベイズ4章クラスタリング

1,141 views

Published on

MLP(機械学習プロフェッショナルシリーズ)の勉強会の資料です。

Published in: Data & Analytics
  • Be the first to comment

ノンパラメトリックベイズ4章クラスタリング

  1. 1. ノンパラメトリックベイズ 4章 クラスタリング 担当 fluct中野智文
  2. 2. 4.1 k平均アルゴリズム • K個のクラスにデータ点 を分類 • 各クラスの代表点: • の距離を定 義して代表点が近いクラス へ分類 http://aidiary.hatenablog.com/entry/20120813/1344853878
  3. 3. • がクラス に属する: •zは隠れ変数、潜在変数とよばれる
  4. 4. •K-平均アルゴリズムは、各クラス内の平均とそれが 属するデータ点との距離が最小となる を求める。すなわち ※著作権保護のため画質が悪くなっています。
  5. 5. アルゴリズム4.1
  6. 6. 4.2 混合ガウスモデルのギブスサンプリングによ るクラスタリング ? 成り立てば1, でなければ0 Ziに連動して平均が変化 対数化したガウス分布
  7. 7. •最適化問題は、 となる ※著作権保護のため画質が悪くなっています。
  8. 8. •アルゴリズム4.1(3)(i)を次のように書き換えられる よって、次の最大化問題と考えることが出来る
  9. 9. K個のガウス分布 にもとづき、 •データごとに最も尤度が高いクラスを選択→ • から平均を最尤推定している→
  10. 10. 分布に基づいたランダムに
  11. 11. 4.2.1分散固定の場合 •データ は と生成されると仮定する 標準ガウス分布 一様分布
  12. 12. 生成したいパラメータ データ テンポラリな パラメータ 事前分布 (正則化)
  13. 13. •だから、 ベイズの定理 分母は固定だから消え る グラフィカルモデルよ り関係のある部分の み残す これが知りたかった?
  14. 14. 正規化
  15. 15. 結合確率に比例 グラフィカルモデルよ り関係のある部分の み残す
  16. 16. ここで
  17. 17. •条件部の依存関係 •よって、 正規分布だから正規 化は必要ない?
  18. 18. アルゴリズム4.2
  19. 19. 4.2.2 分散も確率変数とする場合 •データ は と生成されると仮定する Zipf's の法則的な 何かとか 「正規分布の分散の 事前分布」と1章の時 のメモ
  20. 20. 再掲
  21. 21. 結合確率
  22. 22. 条件付き分布は
  23. 23. 正規化
  24. 24. ここで τが共通でない とうまくいかな いという
  25. 25. ここで
  26. 26. 積分消去すれば
  27. 27. アルゴリズム4.3
  28. 28. 4.3 混合ガウスモデルの周辺化ギブスサンプリン グによるクラスタリング
  29. 29. 周辺化
  30. 30. 逐次的に
  31. 31. 結合分布 グラフィカルモデルより、 となります。ただし は条件付き独立とはいかない。
  32. 32. 下記(3章で説明があった)より、
  33. 33. よって結合確率
  34. 34. 条件付き分布
  35. 35. なぜそうなったのか
  36. 36. 積分記号? ノンパラメト リックベイズ はここを拡張
  37. 37. (4.31)? ノンパラメト リックベイズ はここを拡張
  38. 38. アルゴリズム4.4

×