Scaling up Machine Learning Algorithms for Classificationsmatsus
This document discusses methods for scaling up machine learning algorithms to massive datasets. It presents the Dual Cached Loops method which runs disk input/output (I/O) and computation simultaneously to avoid bottlenecks. This outperforms existing methods on large, sparse datasets. The document also discusses ongoing work on distributed asynchronous optimization across multiple machines to further improve scaling. The goal is methods that can optimize machine learning models on datasets too large to fit in memory.
Scaling up Machine Learning Algorithms for Classificationsmatsus
This document discusses methods for scaling up machine learning algorithms to massive datasets. It presents the Dual Cached Loops method which runs disk input/output (I/O) and computation simultaneously to avoid bottlenecks. This outperforms existing methods on large, sparse datasets. The document also discusses ongoing work on distributed asynchronous optimization across multiple machines to further improve scaling. The goal is methods that can optimize machine learning models on datasets too large to fit in memory.
Spectral divide-and-conquer algorithms for eigenvalue problems and the SVDyuji_nakatsukasa
The document discusses communication-minimizing algorithms for the symmetric eigendecomposition and singular value decomposition (SVD). Standard algorithms for these problems are expensive in terms of communication cost when reducing matrices to tridiagonal/bidiagonal form. The goal is to design QR-based algorithms that avoid this reduction, thereby minimizing communication. Randomized algorithms provide an alternative approach for approximating the SVD with lower communication cost.
5. Rayleigh-Ritzの技法
],,,[ 21 mm vvvV K=1. 正規直交基底を生成
2. 固有値問題 を解くyyAVV mm θ=
T
0≈− yVyAV mm θ( なら の固有対が得られてる)A
をRitz値, をRitzベクトルと呼ぶθ yVm
Ritz
5/21
yy
yAVVy
xx
Axx mm
yvvx mm
m
T
TT
R
T
T
),,span(
maxmax
1
×
∈∈
⇔
K
yAVVy mm
y
TT
1
max
=
に対するラグランジュ未定乗数法より
0
T
=− yyAVV mm θ
名前の由来は Ritz 法から?
6. 射影法に属するアルゴリズム
Lanczos 法 [Lanczos, 1950]
大きい方からいくつかの固有値を求める際に有力
べき乗法の拡張
非対称用のArnoldi法,Bi-Lanczos法に拡張される
Jacobi-Davidson 法 [Sleijpen, van der Vorst,1996]
6/21
Jacobi-Davidson 法 [Sleijpen, van der Vorst,1996]
ある点の近傍の固有値を求める際に有力
シフト付き逆反復法の拡張(Davidson法の変種)
非対称用にも用いられる
Z. Bai, J. Demmel, J. Dongarra, A. Ruhe, H. van der Vorst: Templates for the
Solution of Algebraic Eigenvalue Problems: A Practical Guide, SIAM, 2000.
参考文献参考文献参考文献参考文献
7. べき乗法
nn Axx =+1
0x初期ベクトル を設定
反復計算
7/21
mλλλ >>> L21固有値 とおく(重複しないと仮定)
))/()/(( 12122111
222111
m
n
mm
nn
mm
n
m
nnn
ucucuc
ucucucxA
λλλλλ
λλλ
+++=
+++=
L
L
mmucucucx +++= L2211
絶対値最大の固有値に収束
:固有ベクトルで展開
12. リスタート付き Lanczos 法(一般) 12/21
],,,[ 21 mm vvvV K=2. 正規直交基底を生成
3. 固有値問題 を解く(大きい方から 対)yyAVV mm θ=
T
0≈− yVyAV mm θ( なら の固有対が得られてる)A
大きい方から 個の固有値を求める場合
1. 初期ベクトル からKrylov部分空間を生成x
k
k
0≈− yVyAV mm θ( なら の固有対が得られてる)A
mm AVV
T
特徴: は三重対角行列
Krylov部分空間の性質
計算量の小さい実装が可能(Lanczos算法)
4. 精度が不十分なら以下の更新後2へ
kkmk CyyVvv ],,[:],,[ 11 KK =
MATLABのeigsのデフォルトは 6,20 == km
kC( は適切な直交行列)
13. リスタート付き Lanczos 法(一般) 13/21
],,,[ 21 mm vvvV K=2. 正規直交基底を生成
3. 固有値問題 を解く(大きい方から 対)yyAVV mm θ=
T
0≈− yVyAV mm θ( なら の固有対が得られてる)A
大きい方から 個の固有値を求める場合
1. 初期ベクトル からKrylov部分空間を生成x
k
k
0≈− yVyAV mm θ( なら の固有対が得られてる)A
4. 精度が不十分なら以下の更新後2へ
kkmk CyyVvv ],,[:],,[ 11 KK = kC( は適切な直交行列)
収束定理 [Sorensen, 1992]
一定の条件下で, 個のRitz値が固有値 に,
Karushの証明とは方針が少し違う
k
kλλ >>L1
kuu ,,1 K
k
本のRitzベクトルが固有ベクトル に収束する
14. 射影法に属するアルゴリズム(再)
Lanczos 法 [Lanczos, 1950]
大きい方からいくつかの固有値を求める際に有力
べき乗法の拡張
非対称用のArnoldi法,Bi-Lanczos法に拡張される
Jacobi-Davidson 法 [Sleijpen, van der Vorst,1996]
14/21
Jacobi-Davidson 法 [Sleijpen, van der Vorst,1996]
ある点の近傍の固有値を求める際に有力
シフト付き逆反復法の拡張(Davidson法の変種)
非対称用にも用いられる
Z. Bai, J. Demmel, J. Dongarra, A. Ruhe, H. van der Vorst: Templates for the
Solution of Algebraic Eigenvalue Problems: A Practical Guide, SIAM, 2000.
参考文献参考文献参考文献参考文献
20. リスタート付き Jacobi-Davidson 法 20/21
基底を増やしすぎると を解くのが大変→リスタートyyAVV mm θ=
T
],,,[ 21 mm vvvV K=
2. 固有値問題 を解くyyAVV mm θ=
T
1. 初期ベクトル からJacobi-Davidson法で正規直交基底を生成x
yyAVV mm θ=
0≈− yVyAV mm θ( なら の固有対が得られてる)A
3. 精度が不十分なら として 1へyVx m=:
収束速度は3次(Rayleigh商反復法と同じ)
21. まとめ
対称固有値問題に対する射影法を説明した
Lanczos 法 [Lanczos, 1950]
大きい方からいくつかの固有値を求める際に有力
べき乗法の拡張
非対称用のArnoldi法,Bi-Lanczos法に拡張される
Jacobi-Davidson 法 [Sleijpen, van der Vorst,1996]
21/21
Jacobi-Davidson 法 [Sleijpen, van der Vorst,1996]
ある点の近傍の固有値を求める際に有力
シフト付き逆反復法の拡張(Davidson法の変種)
非対称用にも用いられる
Z. Bai, J. Demmel, J. Dongarra, A. Ruhe, H. van der Vorst: Templates for the
Solution of Algebraic Eigenvalue Problems: A Practical Guide, SIAM, 2000.
参考文献参考文献参考文献参考文献