SlideShare a Scribd company logo
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Subspace Clustering
Using Log-determinant Rank
Approximation (KDD2015勉強会)
1
高橋 諒
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
自己紹介
2
名前: 高橋 諒
出身: 福井県(大学から大阪)
現在社会人1年目
大学での研究: 心理統計と行動統計
よろしくお願いいたしますm(._.)m
TwitterID: @RyoZ_AXL
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
どんな内容?
読んだ論文: Subspace Clustering Using Log-determinant
Rank Approximation
著者: Chong Peng, Zhao Kang, Huiqing Li, and Qiang Cheng
内容:
 ・高次元データを低階数近似してクラスタリング
 ・低階数近似でlog det functionを利用
 ・ALMで最適化
3
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Introduction
Subspace Clusteringの仮定
高次元データはいくつかの低次元部分空間によって構成
ある部分空間に属する点はその空間に属する他の個体点の
重み付き線形和で表すことができる→self-expressiveness
有名な手法: LRR
LRSC
SSC
4
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Related Works
Low Rank Representation (LRR)
A … d×n given data matrix
Aがcleanな場合、A=AXを満たす低階数行列Xを求める
( ||・||*はnuclear normで特異値の和 )
この解はX=VrV’r (ただしA = UrΣrV’r)
5
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Related Works
Aがcleanでない場合、次の最適化問題を解く
データがきれいにk個の部分空間に分けることができる場合には
6
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Related Works
Sparse Subspace Clustering (SSC)
・Sは大きな誤差(outlier)を補正する疎行列
・Eは残差行列
・diag(X)=0の制約はtrivialな解を避けるため
得られたXを用いてW=|X|+|X’|で
類似度行列を作りスペクトラルクラスタリング
7
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Proposed method
Log-determinant Function
nuclear normは大きな特異値が存在する場合にrankの
近似精度が悪くなる
σiが0のときはlog-det function F(X)への寄与は0
σiが0より大きいとき,
8
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Proposed method
データ行列Aについて次の仮定を置く
・Bは未知のcleanなデータ行列でB = BXを満たす
・Sは誤差を示す疎行列→outlierへの対応
・Eはガウシアンノイズ
この仮定のもとで目的関数は
9
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Proposed method
B = BXの等式制約を緩和する
Augmented Lagrangian Multipliersを用いて,各パラメータに対
して,逐次更新をする→Y = I - Xとして,ALMの形に書き換える
10
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Proposed method
11
ランクを小さく outlier補正 最小二乗誤差基準
||B-BX||2
(self expressiveness) ALM
ハイパーパラメータ: α, β, γ
推定するパラメータ: X, S, B, Y, Λ, ρ
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Optimization
whole ALM Algorithm
0. input α, β, γ, µ, A
1. initialize S0, Y0, Λ0, ρ0, and k=0
2.Update X
3.Update B
4.Update S
5.Update Y
6.Update Λ and ρ
7.repeat 2-6 until convergence or k = kmax
肝となるのはXの更新のみ!!
12
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Optimization
Update B
Update S
論文中ではl=1とl=2,1の場合を紹介。l=1のときは
13
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Optimization
Update Y
Update Λ and ρ
14
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Optimization
Update X
このとき、log-det functionはunitarily invariant
σiに対して微分可能
15
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Optimization
Moreau-Yoshida proximity operator
最適なXは次で求められる
16
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Optimization
17
証明)
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Optimization
σi
Dが0より大きいとき、
少なくともひとつは(0,σi
D)に含まれる解を持つ
σi
Dが0のときは、解は0となる
18
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Optimization
whole ALM Algorithm
0. input α, β, γ, µ, A
1. initialize S0, Y0, Λ0, ρ0, and k=0
2.Update X
3.Update B
4.Update S
5.Update Y
6.Update Λ and ρ
7.repeat 2-6 until convergence or k = kmax
19
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Subspace Clustering
上の最小化問題から得られたX*を用いてクラスタリング
正規化
φが大きすぎるとクラスタ間分離度は上がるが、クラスタ内分
散も大きくなる
20
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Experiments
21
・Face image clusteringへの応用 (Extended Yale B data)
38人 64パターンの画像を48 42ピクセルにしてベクトル化
(1-10, 11-20, 21-30, 31-38)
n {2,3,5,8,10} n {2,3,5,8}
クラスター数をおさえるため
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Experiments
22
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Experiments
23
α、β、γの値による誤分類率の変化
SCLA1 SCLA2,1
All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd
Summary
・基本的にはLRRの考え方と同じ
・nuclear normは単純に特異値を足しただけなので、
 階数近似としては微妙→log-det function使おう!
・ハイパーパラメータ多いし、データによっては分類精度がか
 なり変わる (Experimentsの部分がちょっと怪しい)
・Clustering and Dimension reductionの最近の流れをつか
 むには良い内容だと思う
24

More Related Content

Similar to KDD 2015勉強会_高橋

Pycon reject banditアルゴリズムを用いた自動abテスト
Pycon reject banditアルゴリズムを用いた自動abテストPycon reject banditアルゴリズムを用いた自動abテスト
Pycon reject banditアルゴリズムを用いた自動abテスト
Shoichi Taguchi
 
Pydata_リクルートにおけるbanditアルゴリズム_実装前までのプロセス
Pydata_リクルートにおけるbanditアルゴリズム_実装前までのプロセスPydata_リクルートにおけるbanditアルゴリズム_実装前までのプロセス
Pydata_リクルートにおけるbanditアルゴリズム_実装前までのプロセス
Shoichi Taguchi
 
Redshift Spectrumを使ってみた話
Redshift Spectrumを使ってみた話Redshift Spectrumを使ってみた話
Redshift Spectrumを使ってみた話
Yoshiki Kouno
 
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17Yuya Unno
 
Spring “BigData”
Spring “BigData”Spring “BigData”
Spring “BigData”
Recruit Technologies
 
スパースモデリング入門
スパースモデリング入門スパースモデリング入門
スパースモデリング入門
Hideo Terada
 
Jupyter NotebookとChainerで楽々Deep Learning
Jupyter NotebookとChainerで楽々Deep LearningJupyter NotebookとChainerで楽々Deep Learning
Jupyter NotebookとChainerで楽々Deep Learning
Jun-ya Norimatsu
 
07. artisocレシピブック ポテンシャル法を高速化しよう
07. artisocレシピブック ポテンシャル法を高速化しよう07. artisocレシピブック ポテンシャル法を高速化しよう
07. artisocレシピブック ポテンシャル法を高速化しよう
Masaki Tamada
 
リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例
Tetsutaro Watanabe
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
Recruit Technologies
 
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Recruit Technologies
 
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9Yuya Unno
 
JSONBはPostgreSQL9.5でいかに改善されたのか
JSONBはPostgreSQL9.5でいかに改善されたのかJSONBはPostgreSQL9.5でいかに改善されたのか
JSONBはPostgreSQL9.5でいかに改善されたのか
NTT DATA OSS Professional Services
 
B34 Extremely Tuned Hadoop Cluster by Daisuke Hirama
B34 Extremely Tuned Hadoop Cluster by  Daisuke HiramaB34 Extremely Tuned Hadoop Cluster by  Daisuke Hirama
B34 Extremely Tuned Hadoop Cluster by Daisuke HiramaInsight Technology, Inc.
 
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
Recruit Technologies
 
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
Yasuyuki Sugai
 
Elastic ML Introduction
Elastic ML IntroductionElastic ML Introduction
Elastic ML Introduction
Hiroshi Yoshioka
 
Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜
Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜
Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜
Mao Yamaguchi
 
PostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめPostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめ
Ohyama Masanori
 

Similar to KDD 2015勉強会_高橋 (20)

Pycon reject banditアルゴリズムを用いた自動abテスト
Pycon reject banditアルゴリズムを用いた自動abテストPycon reject banditアルゴリズムを用いた自動abテスト
Pycon reject banditアルゴリズムを用いた自動abテスト
 
Pydata_リクルートにおけるbanditアルゴリズム_実装前までのプロセス
Pydata_リクルートにおけるbanditアルゴリズム_実装前までのプロセスPydata_リクルートにおけるbanditアルゴリズム_実装前までのプロセス
Pydata_リクルートにおけるbanditアルゴリズム_実装前までのプロセス
 
Redshift Spectrumを使ってみた話
Redshift Spectrumを使ってみた話Redshift Spectrumを使ってみた話
Redshift Spectrumを使ってみた話
 
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
 
Spring “BigData”
Spring “BigData”Spring “BigData”
Spring “BigData”
 
スパースモデリング入門
スパースモデリング入門スパースモデリング入門
スパースモデリング入門
 
Jupyter NotebookとChainerで楽々Deep Learning
Jupyter NotebookとChainerで楽々Deep LearningJupyter NotebookとChainerで楽々Deep Learning
Jupyter NotebookとChainerで楽々Deep Learning
 
07. artisocレシピブック ポテンシャル法を高速化しよう
07. artisocレシピブック ポテンシャル法を高速化しよう07. artisocレシピブック ポテンシャル法を高速化しよう
07. artisocレシピブック ポテンシャル法を高速化しよう
 
リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
 
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
 
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
 
JSONBはPostgreSQL9.5でいかに改善されたのか
JSONBはPostgreSQL9.5でいかに改善されたのかJSONBはPostgreSQL9.5でいかに改善されたのか
JSONBはPostgreSQL9.5でいかに改善されたのか
 
B34 Extremely Tuned Hadoop Cluster by Daisuke Hirama
B34 Extremely Tuned Hadoop Cluster by  Daisuke HiramaB34 Extremely Tuned Hadoop Cluster by  Daisuke Hirama
B34 Extremely Tuned Hadoop Cluster by Daisuke Hirama
 
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
 
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
 
Elastic ML Introduction
Elastic ML IntroductionElastic ML Introduction
Elastic ML Introduction
 
Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜
Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜
Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜
 
PostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめPostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめ
 
CMSI計算科学技術特論B(10) 大規模MD並列化の技術1
CMSI計算科学技術特論B(10) 大規模MD並列化の技術1CMSI計算科学技術特論B(10) 大規模MD並列化の技術1
CMSI計算科学技術特論B(10) 大規模MD並列化の技術1
 

KDD 2015勉強会_高橋

  • 1. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Subspace Clustering Using Log-determinant Rank Approximation (KDD2015勉強会) 1 高橋 諒
  • 2. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd 自己紹介 2 名前: 高橋 諒 出身: 福井県(大学から大阪) 現在社会人1年目 大学での研究: 心理統計と行動統計 よろしくお願いいたしますm(._.)m TwitterID: @RyoZ_AXL
  • 3. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd どんな内容? 読んだ論文: Subspace Clustering Using Log-determinant Rank Approximation 著者: Chong Peng, Zhao Kang, Huiqing Li, and Qiang Cheng 内容:  ・高次元データを低階数近似してクラスタリング  ・低階数近似でlog det functionを利用  ・ALMで最適化 3
  • 4. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Introduction Subspace Clusteringの仮定 高次元データはいくつかの低次元部分空間によって構成 ある部分空間に属する点はその空間に属する他の個体点の 重み付き線形和で表すことができる→self-expressiveness 有名な手法: LRR LRSC SSC 4
  • 5. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Related Works Low Rank Representation (LRR) A … d×n given data matrix Aがcleanな場合、A=AXを満たす低階数行列Xを求める ( ||・||*はnuclear normで特異値の和 ) この解はX=VrV’r (ただしA = UrΣrV’r) 5
  • 6. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Related Works Aがcleanでない場合、次の最適化問題を解く データがきれいにk個の部分空間に分けることができる場合には 6
  • 7. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Related Works Sparse Subspace Clustering (SSC) ・Sは大きな誤差(outlier)を補正する疎行列 ・Eは残差行列 ・diag(X)=0の制約はtrivialな解を避けるため 得られたXを用いてW=|X|+|X’|で 類似度行列を作りスペクトラルクラスタリング 7
  • 8. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Proposed method Log-determinant Function nuclear normは大きな特異値が存在する場合にrankの 近似精度が悪くなる σiが0のときはlog-det function F(X)への寄与は0 σiが0より大きいとき, 8
  • 9. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Proposed method データ行列Aについて次の仮定を置く ・Bは未知のcleanなデータ行列でB = BXを満たす ・Sは誤差を示す疎行列→outlierへの対応 ・Eはガウシアンノイズ この仮定のもとで目的関数は 9
  • 10. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Proposed method B = BXの等式制約を緩和する Augmented Lagrangian Multipliersを用いて,各パラメータに対 して,逐次更新をする→Y = I - Xとして,ALMの形に書き換える 10
  • 11. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Proposed method 11 ランクを小さく outlier補正 最小二乗誤差基準 ||B-BX||2 (self expressiveness) ALM ハイパーパラメータ: α, β, γ 推定するパラメータ: X, S, B, Y, Λ, ρ
  • 12. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Optimization whole ALM Algorithm 0. input α, β, γ, µ, A 1. initialize S0, Y0, Λ0, ρ0, and k=0 2.Update X 3.Update B 4.Update S 5.Update Y 6.Update Λ and ρ 7.repeat 2-6 until convergence or k = kmax 肝となるのはXの更新のみ!! 12
  • 13. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Optimization Update B Update S 論文中ではl=1とl=2,1の場合を紹介。l=1のときは 13
  • 14. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Optimization Update Y Update Λ and ρ 14
  • 15. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Optimization Update X このとき、log-det functionはunitarily invariant σiに対して微分可能 15
  • 16. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Optimization Moreau-Yoshida proximity operator 最適なXは次で求められる 16
  • 17. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Optimization 17 証明)
  • 18. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Optimization σi Dが0より大きいとき、 少なくともひとつは(0,σi D)に含まれる解を持つ σi Dが0のときは、解は0となる 18
  • 19. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Optimization whole ALM Algorithm 0. input α, β, γ, µ, A 1. initialize S0, Y0, Λ0, ρ0, and k=0 2.Update X 3.Update B 4.Update S 5.Update Y 6.Update Λ and ρ 7.repeat 2-6 until convergence or k = kmax 19
  • 20. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Subspace Clustering 上の最小化問題から得られたX*を用いてクラスタリング 正規化 φが大きすぎるとクラスタ間分離度は上がるが、クラスタ内分 散も大きくなる 20
  • 21. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Experiments 21 ・Face image clusteringへの応用 (Extended Yale B data) 38人 64パターンの画像を48 42ピクセルにしてベクトル化 (1-10, 11-20, 21-30, 31-38) n {2,3,5,8,10} n {2,3,5,8} クラスター数をおさえるため
  • 22. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Experiments 22
  • 23. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Experiments 23 α、β、γの値による誤分類率の変化 SCLA1 SCLA2,1
  • 24. All Right Reserved. Copyright. (c) Recruit Technologies Co., Ltd Summary ・基本的にはLRRの考え方と同じ ・nuclear normは単純に特異値を足しただけなので、  階数近似としては微妙→log-det function使おう! ・ハイパーパラメータ多いし、データによっては分類精度がか  なり変わる (Experimentsの部分がちょっと怪しい) ・Clustering and Dimension reductionの最近の流れをつか  むには良い内容だと思う 24