Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

異常検知と変化検知 7章方向データの異常検知

2,169 views

Published on

機械学習プロフェッショナルシリーズ輪読会

Published in: Data & Analytics
  • Be the first to comment

異常検知と変化検知 7章方向データの異常検知

  1. 1. 異常検知と変化検知 7章 方向データの 異常検知 担当 株式会社VOYAGE GROUP 中野智文 2015/11/04 機械学習プロフェッショナルシリーズ輪読会
  2. 2. 扱うデータ 距離が1
  3. 3. 補足スライド:方向データ • 自然言語処理のよくありそうなパターン • 文書の語彙をbag of wordsにして • それを更にTF-IDFで重み付け • それらさらに重み合計1に正規化 • 次元圧縮行列(これがミソ)を使って、ベクトル化 • ベクトル化されたものを距離1で正規化 • これを使って分類や最近傍法を行う
  4. 4. 補足スライド:方向データ 1で正規化されているので 1で正規化されているので 正規化されていれば(方向データは)cosでも距離でも同じ意味となる cos類似度の場合: ユークリッド距離の場合:
  5. 5. 球体の上の正規分布?
  6. 6. フォンミーゼス・フィッシャー分布 平均方向 集中度 第一種変形ベッセル関数 (7.1) (7.2)
  7. 7. フォンミーゼス・フィッシャー分布 (疑問1) 一周(3.14)したら0にもどるはず… πが最小値なのでは? (疑問2) 確率密度分布は全部合計したら、1になるはず。しかしそ のようには見えない…
  8. 8. 7.2 平均方向の最尤推定 ただし (7.3)
  9. 9. 最尤推定 を制約にラグランジュの未定乗数法にて
  10. 10. ただし (7.4) これを解くと、
  11. 11. より を使って 最後に その解き方
  12. 12. 方向データの異常度とその確率分布 (7.5) (1) 最尤推定量 の確率分布 (2) の確率分布が必要。
  13. 13. (1) を とみなす。
  14. 14. 置換積分 デルタ関数の基本性質(2.20) ↑ より sinθ cosθ 式(2.19) ※おそらく誤植なので勝手に修正しています
  15. 15. 定期式(2.10)より、自由度M-1、スケール因子1/(2κ)のカイ二乗分布 a<<1 より次のように近似
  16. 16. 定理7.1 (方向データの異常度の確率分布) のとき、κが十分大きければ、近似的に (7.6)
  17. 17. 7.4 積率法にいよるカイ二乗分布の当てはめ • カイ二乗分布に従うことは分かったが、パラメータは分からない。 • 積率法(モーメント法)による当てはめ
  18. 18. これから (7.8) (7.9) (7.7)
  19. 19. 7.5 補足:フォンミーゼスフィッシャー分布の 性質 あまりこの章が興味なさそうなので、省略

×