異常検知と変化検知　7章方向データの異常検知

異常検知と変化検知
7章方向データの
異常検知
担当株式会社VOYAGE GROUP 中野智文
2015/11/04 機械学習プロフェッショナルシリーズ輪読会

補足スライド：方向データ
• 自然言語処理のよくありそうなパターン
• 文書の語彙をbag of wordsにして
• それを更にTF-IDFで重み付け
• それらさらに重み合計１に正規化
• 次元圧縮行列（これがミソ）を使って、ベクトル化
• ベクトル化されたものを距離１で正規化
• これを使って分類や最近傍法を行う

補足スライド：方向データ
１で正規化されているので
１で正規化されているので
正規化されていれば（方向データは）cosでも距離でも同じ意味となる
cos類似度の場合：
ユークリッド距離の場合：

球体の上の正規分布？

フォンミーゼス・フィッシャー分布
平均方向集中度
第一種変形ベッセル関数
(7.1)
(7.2)

フォンミーゼス・フィッシャー分布
(疑問1) 一周(3.14)したら0にもどるはず… πが最小値なのでは?
(疑問2) 確率密度分布は全部合計したら、１になるはず。しかしそ
のようには見えない…

7.2 平均方向の最尤推定
ただし (7.3)

最尤推定
を制約にラグランジュの未定乗数法にて

ただし
(7.4)
これを解くと、

より
を使って
最後に
その解き方

方向データの異常度とその確率分布
(7.5)
(1) 最尤推定量の確率分布
(2) の確率分布が必要。

置換積分デルタ関数の基本性質(2.20) ↑ より
sinθ
cosθ
式(2.19) ※おそらく誤植なので勝手に修正しています

定期式(2.10)より、自由度M-1、スケール因子1/(2κ)のカイ二乗分布
a<<1 より次のように近似

定理7.1 (方向データの異常度の確率分布)
のとき、κが十分大きければ、近似的に
(7.6)

7.4 積率法にいよるカイ二乗分布の当てはめ
• カイ二乗分布に従うことは分かったが、パラメータは分からない。
• 積率法（モーメント法）による当てはめ

これから
(7.8) (7.9)
(7.7)

7.5 補足：フォンミーゼスフィッシャー分布の
性質
あまりこの章が興味なさそうなので、省略

異常検知と変化検知　7章方向データの異常検知

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

More from 智文中野

More from 智文中野 (9)