More Related Content
Similar to 時系列分析による異常検知入門
Similar to 時系列分析による異常検知入門 (13)
More from Yohei Sato (20)
時系列分析による異常検知入門
- 2. AGENDA
●
自己紹介
●
異常検知とは
● 3つの異常検知
●
変化点検出
●
グラフ時系列の異常検知
●
最後に
- 3. AGENDA
●
自己紹介
●
異常検知とは
● 3つの異常検知
●
変化点検出
●
グラフ時系列の異常検知
●
最後に
- 4. 自己紹介
● 名前 : 里 洋平
● ID : yokkuns
● 職業 : データマイニングエンジニア
- 5. Tokyo.Rを主催しています
是非、ご参加ください!
http://groups.google.com/group/r-study-tokyo
- 8. 本日の内容
●
グラフ時系列の異常検知
●
固有空間におけるコンピュータシステムの障害検知
– http://bit.ly/l9tV8D
● Web系システムからの特徴抽出とオンライン障害検知手法
– http://bit.ly/iYML8J
- 9. AGENDA
●
自己紹介
●
異常検知とは
● 3つの異常検知
●
変化点検出
●
グラフ時系列の異常検知
●
最後に
- 21. マーケティングでの活用例
新しい流行の兆しを検出する
口コミ 消費行動 アンケート
いつもと違った異常を検知
新しい流行に気付き、新商品の開発へ
- 23. AGENDA
●
自己紹介
●
異常検知とは
● 3つの異常検知
●
変化点検出
●
グラフ時系列の異常検知
●
最後に
- 24. 3つの異常検知
基本的な異常検知
機能 入力対象 確率モデル 検出対象 応用
- 25. 3つの異常検知
基本的な異常検知
機能 入力対象 確率モデル 検出対象 応用
はずれ値検出 多次元ベクトル 独立モデル 外れ値 不正検出
侵入検知
故障検知
- 26. 3つの異常検知
基本的な異常検知
機能 入力対象 確率モデル 検出対象 応用
はずれ値検出 多次元ベクトル 独立モデル 外れ値 不正検出
侵入検知
故障検知
変化点検出 多次元時系列 時系列モデ 時系列上の 攻撃検出
ル 急激な変化 ワーム検出
バースト的異常 障害予兆検出
- 27. 3つの異常検知
基本的な異常検知
機能 入力対象 確率モデル 検出対象 応用
はずれ値検出 多次元ベクトル 独立モデル 外れ値 不正検出
侵入検知
故障検知
変化点検出 多次元時系列 時系列モデ 時系列上の 攻撃検出
ル 急激な変化 ワーム検出
バースト的異常 障害予兆検出
異常行動検出 セッション 行動モデル 異常セッション なりすまし検出
時系列 異常行動パター 障害予兆検出
ン 不審行動検出
- 28. 3つの異常検知
基本的な異常検知
機能 入力対象 確率モデル 検出対象 応用
はずれ値検出 多次元ベクトル 独立モデル 外れ値 不正検出
侵入検知
故障検知
変化点検出 多次元時系列 時系列モデ 時系列上の 攻撃検出
ル 急激な変化 ワーム検出
バースト的異常 障害予兆検出
異常行動検出 セッション 行動モデル 異常セッション なりすまし検出
時系列 異常行動パター 障害予兆検出
ン 不審行動検出
- 29. 3つの異常検知
基本的な異常検知
機能 入力対象 確率モデル 検出対象 応用
はずれ値検出 多次元ベクトル 独立モデル 外れ値 不正検出
侵入検知
故障検知
変化点検出 多次元時系列 時系列モデ 時系列上の 攻撃検出
ル 急激な変化 ワーム検出
バースト的異常 障害予兆検出
異常行動検出 セッション 行動モデル 異常セッション なりすまし検出
時系列 異常行動パター 障害予兆検出
ン 不審行動検出
本日のテーマは、変化点検出
- 30. AGENDA
●
自己紹介
●
異常検知とは
● 3つの異常検知
●
変化点検出
●
グラフ時系列の異常検知
●
最後に
- 36. 統計的検定に基づく変化点検出
リアルタイムで検出できない
●
全ての候補点に対して検定を行うため時間がかかる
●
セキュリティ監視や障害監視に使えない
- 37. 統計的検定に基づく変化点検出
リアルタイムで検出できない
●
全ての候補点に対して検定を行うため時間がかかる
●
セキュリティ監視や障害監視に使えない
計算効率が高くオンライン処理に向いた変化点検出が必要
- 39. 変化点検出エンジンChange Finder
2段階学習により本質的な変動を捉える
入力 Xt
第1段階学習 第2段階学習
データ時系列モデルの スコア時系列モデルの
忘却学習 スコアの平滑化 忘却学習
スコアリング スコアリング
- 40. Change Finderの基本原理
● Step1 : 第1段階学習
時系列データの確率モデルを用意し、
データ時系列モデルの オンライン忘却学習アルゴリズムで学習
忘却学習
対数損失 :
スコアリング
ヘリンジャースコア :
- 42. Change Finderの基本原理
● Step3 : 第2段階学習
時系列データの確率モデルを用意し、
スコア時系列モデルの オンライン忘却学習アルゴリズムで学習
忘却学習
Given : T'
対数損失 :
スコアリング
ヘリンジャースコア :
- 43. Change Finderのポイント
ノイズを除去し、本質的な変動のみを捉える
●
第1段階学習では時系列中の外れ値を検出
●
外れ値スコアを平滑化→ノイズに反応した外れ値を除去
●
第2段階学習によって本質的な変動のみを検出
- 44. 変化点検出の応用例
攻撃検知1 : MS.Blast
第1次検知 第2次検知
(発生) (爆発的増加)
変化点スコア
アクセスドロップ数
- 45. AGENDA
●
自己紹介
●
異常検知とは
● 3つの異常検知
●
変化点検出
●
グラフ時系列の異常検知
●
最後に
- 46. ネットワーク構造の異常を検出したい
●
ネットワークの大域的な構造の変化
●
局所的な異常箇所の特定
●
ソーシャルネットワークの中のコミュニティ構造の変化
●
物理ネットワークのおける障害検出
- 50. Webシステムの障害検知
処理能力の設計値よりも
低い値でシステムダウンの可能性がある
DB
それぞれのサーバ単体ではなく
ネットワークとしての異常を検出したい
- 52. グラフ時系列を圧縮する
活動度ベクトルを計算する
t t-n t-2 t-1 t
t-1 第1固有ベクトル
●
ノルムが1になるように
D
●
t-2 規格化
•••
- 53. 異常度スコアの計算
活動度ベクトルとの相違度を見る
現時点で計算された
活動度ベクトル
1時点前に計算された
活動度ベクトル
θ
- 54. 実験例 : Webシステムの障害検知
●
システム構成
● 冗長構成のWebシステム
●
サービスが二つ動いている
●
実験
● 片方のサーバのDBコールを止める。
– 動作は不調だがプロセスは生きている状態にする
DB
- 58. AGENDA
●
自己紹介
●
異常検知とは
● 3つの異常検知
●
変化点検出
●
グラフ時系列の異常検知
●
最後に
- 59. 最後に
Tokyo.Rの
発表者を募集しています!