12. 最近の研究
• D. Arthurらの研究
重心の初期値を慎重に決定する方法, 𝑘-means++を提案.
(参考文献:D. Arthur , S. Vassilvitskii , k -means++: the advantages of careful seeding)
クラスタリング結果は安定するが,初期値を決定する際に
繰り替えし計算が必要で,余計な計算コストがかかる.
この論文では,目的関数の差をとることで初期値の決定が
不要なアルゴリズムを提案する.
2018/6/11 張研 12
17. アルゴリズム
この論文で提案する新たなアルゴリズム.
2018/6/11 張研 17
1: Input: matrix 𝑋 𝑑×𝑛 = 𝒙1, 𝒙2, … , 𝒙 𝑛
2: Output: 𝑆1, … , 𝑆𝑟
3: Assign 𝒙1, 𝒙2, … , 𝒙 𝑛 with a random cluaster label
4: Calclate 𝒅1, … , 𝒅 𝑘
5: while not convergence do
6: for each 𝒙1, 𝒙2, … , 𝒙 𝑛 (in random order) do
7: Seek 𝑆 𝑣 that maximizes ∆𝐼∗
𝒙𝑖
8: if ∆𝐼∗ 𝒙𝑖 > 0 then
9: Move 𝒙𝑖 from current cluster to 𝑆 𝑣
10: end if
11: end for
12: end while