More Related Content
Similar to Tokyo r#10 Rによるデータサイエンス 第五章:クラスター分析 (20)
Tokyo r#10 Rによるデータサイエンス 第五章:クラスター分析
- 15. 以下繰り返し… クラスタ C(3) と C(4) が併合され,クラスタ C(3,4) が作られる C(1,2) C(3) C(4) C(5) 2.06 3.20 2.69 C(5) 2.00 3.61 C(4) 2.61 C(3) C(4) C(3) C(1 ,2 )
- 16. 以下繰り返し… クラスタ C(3,4) と C(5) が併合され,クラスタ C(3,4,5) が作られる C(1,2) C(5) C(3,4) 2.63 3.09 C(5) 3.11 C(3,4) C(3,4) C(1 ,2 )
- 17. 以下繰り返し… クラスタ C(1,2) と C(3,4,5) が併合され,クラスタ C(1,2,3,4,5) が作られる C(1,2) C(5) C(3,4) 3.10 C(3,4,5) C(1 , 2)
- 33. EMアルゴリズム 不完全データ x どのクラスタ で発生したか がわからない 隠れ変数: c ( どのクラスタで発生したか)を付与 完全データ: y=(x,c) x の分布の最適化問題を y の分布の最適化問題の 繰り返しに帰着させるアルゴリズム EM アルゴリズム
- 34. EMアルゴリズムの流れ θ :固定 c : 尤度最大 E-step θ :尤度最大 c : 固定 M-step c を推定! θ を推定! パラメータ θ と隠れ変数 c を交互に推定 -> 収束したときのパラメータを採用!