Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

RUTILEA社内勉強会第7回 「LSTMを用いた異常検知」

73 views

Published on

RUTILEA社内で定期的に行っている勉強会の第7回です.
第7回のテーマは”LSTMを用いた異常検知”です.

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

RUTILEA社内勉強会第7回 「LSTMを用いた異常検知」

  1. 1. 1 LSTMを用いた異常値検知 KIM YONGMIN 2020/02/14
  2. 2. 目次 • LSTMの紹介 • RNNの構造 • LSTMの構造 • 異常値検知 • 心電図の異常値検知 • マハラノビス距離 • MCD(Minimum Covariance Determinant) 2
  3. 3. RNNの構造 3 • RNNはhidden layerが方向性を持ちエッジにつながる循環構造を持つ人工的なニューラル ネットワークである. • 音声,文字など逐次的なデータに向いている. • 種類 • One to many: 写真の説明(写真から単語へ) • Many to one: 感情分析(単語から感情指標へ) • Many to many: 翻訳(単語から単語へ)
  4. 4. 4 RNNの基本構造 <RNNの内部構造> <RNNの例>
  5. 5. LSTMの構造 5 • RNNはcell間距離が遠くなると,誤差逆伝播が進むことに従って,勾配が減り性能が低下 するVanishing gradient problemがある. • その問題を解決するために提案されたのがLSTM
  6. 6. LSTMの構造 6 Forget gate: 𝑓𝑡は過去を忘れるためのゲート Input gate: 𝑖 𝑡 ⊙ 𝑔𝑡は現在の情報を記憶する ためのゲート
  7. 7. 異常値検知 7 • LSTMから過去のデータから次のデータを予測するモデルを作り,訓練データのパータン を学習させることができる. • その予測値とデータの誤差を計算することで学習データ(正常のデータ)との相違の指標 として使うことができる.
  8. 8. 異常値検知 8 心電図の異常値検知 • 正常の部分を訓練データを10個のデータから3個のデータ予測するモデルに合わせデータ前処 理しLSMTモデルを学習する. • LSTMモデルの予測値と実際のデータとの誤差分布を求める. • その分布から確率分布上の距離であるマハラノビス距離を求め,データの値がどのぐらい分布 から離れているか(異常値の程度)を数値化する. • マハラノビス距離が正規分布に従うとすると,その二乗がカイ二乗分布に従うので,カイ二乗 分布の検定を行い,異常値を検出する.
  9. 9. 異常値検知 • マハラノビス距離 確率分布上の距離であり, 平均と標準偏差の何倍離れているかを表す指標 →確率分布上,どのぐらい起きにくいか 9
  10. 10. 異常値検知 10 LSTMを用いた心電図の異常値検値
  11. 11. MCD(Minimum Covariance Determinant) • マハラノビス距離を求めるには共分散行列が必要 • 共分散行列は異常値によわい→異常値による変動が大きい • その問題を解決するために提案されたものがMCD • 定義 与えられたデータから共分散の行列式を最小とするhコのデータを取り出せ, それを用いて共分散を求める. MCDに用いられるデータの個数hは(𝑛 + 𝑝 + 1)/2 ≤ ℎ ≤ 𝑛を用いる. 11 https://wis.kuleuven.be/stat/robust/papers/2010/wire-mcd.pdf

×