1. A Near-linear Time Approximation
for Angle-based Outlier Detection
in High-dimensional Data [KDD’12]
by N. Pham & R. Pagh Univ. of Copenhagen
発表者:数理情報学専攻 修士2年 山田直敬
1
2. 発表の流れ
1. Outlier Detection in High-dimensional data
- 高次元では次元の呪いによる性能悪化が発生する
2. Angle-based Outlier Detection (ABOD)
- 距離や密度による手法よりも高次元でロバストな手法
3. A Near Linear Time Approximation for ABOD
- ABODの計算量は O(dn3). 近似でこれを大幅に高速化
本論文のcontribution
2
22. ABODの近似
ri
・|Lp||Rp| は超平面を跨ぐ回数
b
a
p
・ t 回の平均をとることでより精度が高まる.
・ F1(p) はMOA1(p)の不偏推定量
・しかも分散も小さいことが示されている. (Chernoff bound)
・L,Rはsortで得る. F1 を求める計算量はO(t n (d+log n) ) 22
29. References [年代順]
1. H.P. Kriegel, M.Schubert, & A. Zimek. Angle-based
outlier detection in high-dimensional data. In KDD
2008.
1. H.P. Kriegel, M. Schubert, & A. Zimek. Outlier
detection techniques. In tutorial at KDD 2010.
1. N. Pham & R. Pagh. A Near-linear Time
Approximation Algorithm for Angle-based Outlier
Detection in High-dimensional Data. In KDD 2012.
29