密度比推定による
時系列データの異常検知
@LT会
2018/4/13
IoT/AIソリューション事業部 長谷川哲也
自己紹介
1
■ 名前:長谷川哲也
■ 所属:IoT/AIソリューション事業部
■ 経歴など
学生時代:数値計算
入社後:ほぼ機械学習関連のお仕事
商品のレコメンド、画像の自動分類
異常検知、自然言語処理など
なんかいろいろやっています
目次
1. ナイーブな密度比の計算による異常検知
2. 密度比推定による異常検知のアイデア
3. 密度比推定による異常検知の実験結果
2
時系列データの異常検知
3
異常な箇所時系列データの例
異常が発生した場合に自動でそれを検知したい
ナイーブな密度比の計算による異常検知
4
time
︙ ︙
確率密度を推定
観測値
と が似ている
と が似ていない
ナイーブな密度比の計算による異常検知
5
 推定した2つの確率密度 と を比較
2つの部分波形の傾向が同じ
特に変化は起きていない
2つの波形の傾向が異なる
何か変化(異常)が起きている
 2つの確率密度の違い(異常度)は次式で計算
 は を
満たす凸関数
ナイーブな密度比の計算による異常検知
6
この値が大きいほど
確率密度が
大きく異なる
確率密度の比を
計算に使う
ナイーブな密度比の計算による異常検知
7
tim
e
観測値
tim
e
異常度
窓をずらしていき、異常度を順次計算
ナイーブな密度比の計算の問題点
8
 ナイーブな密度比計算の問題点
と を推定するとどちらにも誤差が含まれ、
それらの比 は非常に大きい誤差になりうる
と の推定
密度比推定のアイデア
9
と を別々に推定せず、
を直接推定する
 密度比推定では前述の問題を次のようにして解決
 これは次のVapnikの原理に基づいている
ある問題を解くときに、それよりも一般的な問題を
途中段階で解くべきではない
の推定
密度比推定の実験
10
 実験に用いる波形は次の人工データ
1. 1次元の平均が変化する波形
2. 2次元の共分散が変化する波形
 異常度の計算で用いる非負の関数 は次のようにしている
11
平均が変化する波形
異常度
波形
変化点
12
2つの波形の共分散が
変化する波形
変化点
異常度
波形2
波形1
まとめ
13
 今回は密度比推定を用いた時系列データの異常検知について
概要と実験結果を示しました
 ただし本来は異常度に対してしきい値を決めておいて
それを超えたら異常と判定するような仕組みにします
 この話に興味がありましたらお声がけください

密度比推定による時系列データの異常検知