2. 5.4 Divisive global clustering
Divisive global clustering→要はトップダウン・再帰的(二)分割
5.4.1 Cut頂点集合Vの分割S,S^c
5.4.2 Maximum flowmaximum-flow に基づくクラスタリング
5.4.3 Spectral methodグラフのスペクトル理論
5.4.4. Betweennessグラフの幾何構造を利用した枝の重み付け
5.4.5 Voltage and potential電子回路解析手法を転用したクラスタリング
5.4.6 Markov chain and random walksMarkov連鎖のイテレーションとspectrsalclustering
5.4.7 Other divisive methodsその他
各サブセクション内の文献は、綺麗にクラスタリングされていない(笑)
各サブセクションは、かなりの分量。これまでやってきた話の1セクショ ンぐらいの文量
2
3. 5.4 Divisive global clustering
今回とりあげるのは5.4.2 Maximum flow
minimum cut が高速なのでFlow networkの容量自体を変数として扱 いましょうという話。
結局最小コンダクタンスカットいいからminimum-cutつかっていい 見積与えたいよねという話がほとんど。
取り上げる論文はサブセクションの殆どを割いて書いている
G. W. Flake, R. E. Tarjan, and K. Tsioutsiouliklis, Internet Math. 1, 385 (2004).
balanced minimum cut とGomory-Hu (minimum-cut) tree を組み合わせ た手法。
3
4. s-t minimum-cut
各枝に、流量(flow)とその最大量である容量(capacity)が割り振られた、湧 点(source(s))から沈点(sink(t))への流れを考える、ネットワークフロー 問題を考える。
最大流最小カット定理(Elias-Feinstein-Shannon とFord-Fulkerson 1956)
L. R. Ford and D. R. Fulkerson, Can. J. Math. 8, 399 (1956) DOI: 10.4153/CJM-1956-045-5
P. Elias, A. Feinstein, and C. Shannon, IEEE Trans. Inf. Theory 2, 117 (1956) DOI: 10.1109/TIT.1956.1056816
“ボトルネック”がsからtへの最大流量を決めている
sからtへの最大流は、頂点集合をsを含む集合とtを含む集合に二分割(cut)し た際の境界にある枝の容量の総和(cut capacity)の最小値に等しい。
4
5. balanced minimum cut
問題意識:
クラスタリング(インタネット上のコミュニティの検出)をしたい。
コミュニティ:内部が密で境界が疎な頂点集合
類似した条件はNP困難かNP完全。
minimum-cut は境界が疎なところを検出するのでうまく使えない か?
→ unbalanced cut, trivial cut の問題
→ 仮想的な頂点を入れてそれっぽい手法にした。
[1] G. W. Flake, S. Lawrence, C. L. Giles, and F. M. Coetzee, Computer (Long. Beach. Calif). 35, 66 (2002).
[2] G. W. Flake, S. Lawrence, and C. L. Giles, in Knowl. Discov. Data Min. (ACM Press, New York, New York, USA, 2000), pp. 150?160. 5
11. 論文本題
G. W. Flake, R. E. Tarjan, and K. Tsioutsiouliklis, Internet Math. 1, 385 (2004).
論文中、色々と書いてあるけど、主な主張は以下の3点
•グラフをk個のウェブコミュニティ*にする問題はNP困難
* sのウェブコミュニティ
•重みαで全ての頂点と連結したartificial sink tを加えたグラフのsの ウェブコミュニティSに対して、以下が成り立つ c푆,푆c 푆c≤훼≤ c푃,푄 min푃,푄
•훼1≥⋯≥훼max⇒푆1⊆푆2⊆⋯⊆푆max
11