異常音検知に対する深層学習適用事例

⼾⽥智基
名古屋⼤学情報基盤センター
2022年11⽉18⽇
異常⾳検知に対する
深層学習適⽤事例

本講演の内容
本講演では，異常⾳検知の代表的な枠組みを概説すると
ともに，深層学習に基づく異常⾳検知⼿法として我々の
研究事例をいくつか紹介します．また，国際チャレンジ
DCASEの異常⾳検知タスクにおける性能評価結果に
ついても簡単に紹介します．
講演内容
正常動作中
異常発⽣！

異常⾳検知とは？
http://dcase.community/challenge2022/より

異常⾳検知は何に使える？
• ⾒守り・監視システムへの応⽤！
• 機械の動作⾳からの異常状態の検出
• 故障や不具合の検出など
• 街中の収録⾳からの異常事態の検出
• 叫び声や銃声の検出など
• ⾳を⽤いるがゆえに・・・
• 遮蔽物に頑健！
• 収録デバイス（マイク）が安価！
• 昼夜問わず利⽤可能！
• 映像との併⽤も可能！
異常⾳検知：1

異常⾳検知にトライ！
• 機械の動作⾳から異常が発⽣しているかどうか分かりますか？
異常⾳検知：2
異常！異常！異常！
正常正常正常

異常⾳検知の枠組み
• 想定される条件
• 基本的に正常⾳データのみ⼊⼿可能
• 異常⾳データは⼊⼿困難
• 主なアプローチ
• 対象機器（or 対象とする⾳環境）に対する異常⾳検知システムの構築
• 機械学習の活⽤
対象機器の
正常⾳データ
学習処理
異常⾳検知
システム
対象機器の⾳データ
推論処理正常⾳ or 異常⾳
異常⾳検知：3

機械学習に基づく代表的なアプローチ
• ⽣成的アプローチ：Inlier Modeling (IM)
• 対象機器の正常⾳データを⽤いてその特徴をモデル化
• モデルのマッチング尺度を⽤い，外れ値として異常⾳データを検出
• 識別的アプローチ：Outlier Exposure (OE) [Hendrycks+ 2019]
• 対象機器以外の正常⾳データを疑似異常⾳データとして利⽤
• 正常⾳データと疑似異常⾳データを識別するモデルを学習
対象機器の
正常⾳データ
学習処理
正常⾳データ
確率分布
異常⾳検知：4
対象機器の
正常⾳データ
学習処理識別境界
対象機器以外の
正常⾳データ
＋
[Kawaguchi+ 2021]

IM（⽣成的アプローチ）の例
• ⾃⼰符号化器の再構成誤差に基づく異常⾳検知 [Koizumi+ 2020]
• 学習処理
• 正常⾳データに対する再構成誤差最⼩化
• 推論処理
• 再構成誤差が⼩ → ⼊⼒⾳は学習データと類似 → 正常⾳
• 再構成誤差が⼤ → ⼊⼒⾳は学習データと相違 → 異常⾳
エンコーダ
ネットワーク
ボトルネック特徴量
デコーダ
ネットワーク
⼊⼒⾳響特徴量再構成⾳響特徴量
再構成誤差の計算
異常⾳検知：5

OE（識別的アプローチ）の例
• 正常⾳クラス識別器の事後確率に基づく異常⾳検知 [Primus+ 2020]
• 学習処理
• 正常⾳データと疑似異常⾳データを⽤いた正常⾳クラス識別器の学習
• 推論処理
• 正常⾳クラス事後確率が⼤ → 正常⾳
• 正常⾳クラス事後確率が⼩ → 異常⾳
識別的特徴抽出
ネットワーク
正常⾳の⾳響特徴量
疑似異常⾳の⾳響特徴量
識別的
特徴量
識別層
正常⾳
クラス
異常⾳
クラス
もしくは
もしくは
異常⾳検知：6

IMとOEの特徴
IM（⽣成的アプローチ） OE（識別的アプローチ）
確率分布の学習
＝難易度の⾼い問題
識別境界の学習
＝⽐較的難易度の低い問題
正常⾳データのみが必要正常データに加えて
疑似異常⾳データが必要
⽐較的安定した傾向ばらつきが⼤きい傾向
異常⾳データを⼊⼿できた
場合は容易にそれを活⽤可能
学習データ
異常⾳検知性能
学習時の問題設定
異常⾳検知：7

IMとOEを組み合わせるアプローチ
• 並列型
• IMの結果とOEの結果をアンサンブル [Giri+ 2020]
• 直列型
• OEで抽出された識別的特徴量に対してIMを適⽤ [Morita+ 2021]
IM異常⾳検知
OE異常⾳検知
検知結果
検知結果検知結果
…異常⾳検知検知結果
統合
OEによる
特徴量抽出
IM異常⾳検知検知結果
⼊⼒⾳響特徴量
⼊⼒⾳響特徴量
異常⾳検知：8
識別的特徴量

性能評価指標：TPR，FPR，ROC曲線
• True-Positive-Rate (TPR)
• 異常⾳を正しく異常と判定した割合
• TPR = TP / (TP+FN)
• False-Positive-Rate (FPR)
• 正常⾳を誤って異常と判定した割合
• FPR = FP / (FP+TN)
• ROC曲線 (Receiver Operating Characteristic)
• 検出閾値を変化させてTPRと
FPRをプロット
0 1
1
異常と判定正常と判定
異常⾳ TP FN
正常⾳ FP TN
TPR
FPR
異常スコア
正常⾳
異常⾳
異常スコアに対する検出閾値
によってTPRとFPRは変化
TPR=1.0
FPR=1.0
TPR=0.9
FPR=0.5
TPR=0.5
FPR=0.0
検出閾値
異常
正常
異常⾳検知：9

性能評価指標：AUCとpAUC
• AUC (Area Under the Curve)
• ROC曲線の下側の⾯積
0 1
1
TPR
FPR
• pAUC
• FPRが確率p以下の領域での
ROC曲線の下側の⾯積
0 1
1
TPR
FPR
p (e.g., 0.1)
AUCが⼤きいほど
異常検知性能が⾼い！
正常⾳を頻繁に異常⾳と誤検出する
システムは信⽤し難い
→ FPRがp以下の領域で⾯積計算
pAUCが⼤きいほど誤検出を減らした
設定において異常検知性能が⾼い！
異常⾳検知：10

その他の性能評価指標：再現率，適合率，F値
• 再現率 (Recall) ＝TPR
• 異常⾳を正しく異常と判定した割合
• Recall = TP / (TP+FN)
• 適合率 (Precision)
• 異常と判定した中で正しかった割合
• Precision = TP / (TP+FP)
• F値
• 再現率と適合率の調和平均
• F値 =
再現率適合率
= 2
再現率・適合率
再現率適合率
異常と判定正常と判定
異常⾳ TP FN
正常⾳ FP TN
異常⾳検知：11
異常⾳が⽣じている区間の検出
• セグメントベース：
短時間区間単位(e.g., 10 ms)でF値計算
• イベントベース：
各異常⾳区間単位でF値計算
F値が⼤きいほど異常区間の
検出性能が⾼い！

深層学習に基づく異常⾳検知
（※我々の研究事例を中⼼に）

機械の動作⾳を対象とした異常⾳検知
• 機械動作状態のモニタリング
• 動作⾳から異常（故障や不具合など）が⽣じているかを検知
• 国際チャレンジDCASEにてタスクとして採⽤
• 2020年：機械動作状態モニタリング [Koizumi+ 2020]
• 2021年：ドメインシフト下での機械動作状態モニタリング [Kawaguchi+ 2021]
• 2022年：ドメインシフトに頑健な機械動作状態モニタリング [Dohi+ 2022]
• OEベースの深層学習の適⽤事例を紹介
• 異常⾳検知に適した識別的特徴量空間の学習
• 少量の異常⾳データを活⽤した検知性能改善
• 直列型によるIM併⽤の効果
深層OE事例：1

距離学習基準を導⼊したOEベース異常⾳検知
• 正常⾳データと疑似異常⾳データを識別する特徴抽出において，
従来の識別学習基準に加えて，距離学習基準も利⽤
• 識別学習基準：特徴空間の線形分離性能を最⼤化
• 距離学習基準：クラス内分散を最⼩化しつつクラス間分散を最⼤化
対象機器の
正常⾳データ
対象機器以外の
正常⾳データ
特徴抽出ネットワーク
距離学習基準
識別学習基準
[Kuroyanagi+ 2021a]
特徴量
正常⾳データ
疑似異常⾳データ
異常⾳データ(未観測)
⾼次元特徴空間
深層OE事例：2

識別基準と距離基準を⽤いたマルチタスク学習
• 特徴量𝒛 𝑓 𝒙 |𝜽 を抽出する深層ネットワーク𝑓 · |𝜽 を学習
• 学習データ
• ⼊⼒⾳響データ𝒙 とクラスラベル𝑦 ∈ 1, 1
• ロス関数：
• 識別基準ℒ ：⼆値交差エントロピー
• 距離基準ℒ
• 正常⾳データ重⼼𝒄 と疑似異常⾳データ重⼼𝒄 を利⽤
• 特徴量から各重⼼への距離を利⽤
ℒ ∝ 𝒛 𝒄 𝒛 𝒄
ℒ ∝ 𝑦 ln 𝜎 𝒛 1 𝑦 ln 1 𝜎 𝒛
𝜎 ⋅ ：シグモイド関数
ℒ ℒ 𝜔 ℒ
正常⾳データ・・・・ 𝒄 に近づける 𝒄 からは遠ざける
疑似異常⾳データ・・ 𝒄 からは遠ざける 𝒄 に近づける
深層OE事例：3
[Kuroyanagi+ 2021a]

実験的評価結果の例
• DCASE2020 Task 2 [Koizumi+ 2020]の学習データセットを利⽤
• 機械種別：fan, pump, slider, valve, ToyCar, ToyConveyor
• 機器ID：各種機械毎に3~4種類（違う種類のfanなど）
• 各機械の個々の機器IDごとに異常⾳検知システムを構築
• 正常データ：対象機械の対象機器IDの⾳データ
• 疑似異常データ：それ以外（対象機械の別機器ID＋別機械の全機器ID）
• AUCによる性能評価
識別基準〇〇〇
正常⾳重⼼〇〇〇〇
異常⾳重⼼〇〇
深層OE事例：4
[Kuroyanagi+ 2021a]

少量の異常⾳データを⽤いた性能改善
• OEの利点：異常⾳データの利⽤が容易
• システム運⽤を通して異常⾳が⽣じたら，それを利⽤して再学習
することでシステム性能の改善が可能
追加学習に使⽤した異常データの量
識別学習
基準
距離学習基準
正常⾳重⼼異常⾳重⼼
使⽤
使⽤
使⽤使⽤
使⽤使⽤
使⽤使⽤使⽤
AUC
深層OE事例：5
[Kuroyanagi+ 2021a]

識別的特徴学習の改良
• 機械種別の識別と機器IDの識別を切り分けて実施
• 機械種別識別：全ての⾳データに対して実施
• 対象とする機械種別は正常データ：原点から遠ざける
• 対象外の機械種別は疑似異常データ：原点に近づける
• 機器ID識別：対象機械種別の⾳データに対してのみ実施
• 各機器IDごとに⼆値分類を実施
• One-vs-Rest識別器を機器IDの数だけ⽤意
対象外機械
の正常⾳
対象機械の
正常⾳
機械種別
識別
識別的
特徴抽出
ネット
機器ID
識別
深層OE事例：6
[Kuroyanagi+ 2022b]

⼆種類の⼆値分類に基づくマルチタスク学習
• 対象機器毎に特徴量𝒛 を抽出する深層ネットワークを学習
• 異なる機器IDに対して共通の識別的特徴量を抽出
• ラベル
• 機械種別ラベル𝑡 ∈ 1, 1 と機器ID結合ラベル𝑦 , ∈ 1, 1
• ロス関数
• 機械種別識別ロスℒ ：全ての⾳データに対して計算
• 機器ID識別ロスℒ ：対象機械種別の⾳データに対してのみ計算
ℒ ∝ 𝑡 ln 𝑔 𝒛 1 𝑡 ln 1 𝑔 𝒛
対象外の機械は原点に近づける
対象機械は原点から遠ざける
ℒ ∝ 𝑡 𝑦 , ln 𝜎 𝒛 1 𝑦 , ln 1 𝜎 𝒛
,
ℒ ℒ 𝑤 ℒ
深層OE事例：7
[Kuroyanagi+ 2022b]

OE+IM直列型の導⼊
• OEで抽出された識別的特徴量の確率密度分布をIMでモデル化
対象外機械
の正常⾳
対象機械の
正常⾳
機械種別
識別
識別的
特徴抽出
ネット
機器ID
識別
識別的特徴量
１．OEによる識別的特徴抽出ネットワークの学習
2．対象機械の対象機器IDの
正常⾳から識別的特徴量を抽出
3．IMによる対象機械&
機器ID依存⽣成モデル学習
確率密度関数
深層OE事例：8
[Kuroyanagi+ 2022b]

• DCASE2021 Task 2 [Kawaguchi+ 2021]の学習データセットを利⽤
• 機械種別：fan, pump, slider, valve, ToyCar, ToyConveyor
• 機器ID：各種機械毎に6種類
• 各機械種別の個々の機器IDごとに異常⾳検知システムを構築
• 識別的特徴抽出ネットワークは各機械種別にて共有
• AUCとpAUC（p=0.1）の調和平均による性能評価
• 複数モデルを⽤意することなく直列型で⾼い性能を達成
深層OE事例：9
[Kuroyanagi+ 2022b]

駅構内における異常⾳検知
• 駅構内の⼈混みの中での異常⾳検知
• ガラスの割れる⾳や叫び声を異常⾳として検知
• IMベースの深層学習の適⽤事例を紹介
• 深層波形⽣成モデルを利⽤することで時間構造（位相情報）も
考慮した異常⾳検知を実現
• 異常⾳が発⽣している区間も検出
• ⽇時や時間帯に応じた⾳環境変化への対応
深層IM事例：1

WaveNetを⽤いたIMベース異常⾳検知：学習
• 正常⾳の時間波形𝒙 𝑥 , 𝑥 , … , 𝑥 の同時確率分布𝑝 𝒙 を⾃⼰回帰
モデルで学習
𝑝 𝑥 |𝑥 , … , 𝑥 , 𝒉
深層波形⽣成
ネットワーク
正常⾳データ
時間波形 𝒙
𝑥
𝑥
⼊⼒層
𝑥
第1隠れ層
𝑥
𝑥
𝑥
𝑥
第2隠れ層
Dilation幅 1
Dilation幅 2
𝑥
第3隠れ層
Dilation幅 4
WaveNet [van den Oord+ 2016]
• 拡張畳み込みによる⾃⼰回帰モデリング
⾳響特徴量
系列 𝒉
特徴抽出
𝑝 𝒙 𝒉 𝑝 𝑥 𝑥 , … , 𝑥 , 𝒉
• ⾼次マルコフ過程の導⼊して
条件付き確率分布をモデル化
• ⾳響特徴量系列𝒉による条件付け
𝑝 𝒙 𝒉
深層IM事例：2
[Hayashi+ 2018]

WaveNetを⽤いたIMベース異常⾳検知：推論
• 異常スコアとして，⼊⼒⾳の時間波形に対する条件付き確率分布
𝑝 𝑥 𝑥 , … , 𝑥 , 𝒉 のエントロピーを利⽤
波形振幅量⼦化クラスID 波形振幅量⼦化クラスID
条件付き確率
条件付き確率
正常⾳に対する例異常⾳に対する例
モデリング精度⾼
＝エントロピー⼩
モデリング精度低
＝エントロピー⼤
時間 [s]
検出結果
エントロピー
エントロピー時系列に対する
後処理により異常区間を検出
深層IM事例：3
[Hayashi+ 2018]

⾳環境埋め込みによるコンテキスト情報の活⽤
• 想定タスク：駅構内における⼈混みの中での異常⾳検知
• 曜⽇・時間帯に応じて⾳環境は⼤きく変化
• ⾳環境埋め込みを併⽤してコンテキスト適応型WaveNetを学習
コンテキスト適応型
WaveNet
正常⾳データ
時間波形 𝒙
⾳響特徴量系列 𝒉
特徴抽出
𝑝 𝒙 𝒉, 𝒆
⾳環境埋め込み𝒆
iVector抽出器
話者認識の埋め込み表現
iVector [Dehak+ 2011]を適⽤
⾳響特徴量系列の
全域的な特徴を抽出
深層IM事例：4
[Komatsu+ 2019]

• 地下鉄で収録した環境⾳データに対し，ガラスが割れる⾳や叫び声
などを異常⾳として重畳して作成した模擬データを使⽤
ガラスが割れる⾳⾜⾳
周波数
[Hz]
エントロピー
検出結果
時間 [s]
セグメント
ベースF値[%]
AE 68.21
AR-LSTM 64.26
BLSTM AE 67.67
WaveNet 77.76
WaveNet+iVector 79.33
• WaveNetにより時間構造（位相情報）
も利⽤した異常検知が可能！
• iVectorを併⽤することで性能改善！
深層IM事例：5
[Komatsu+ 2019]

国際チャレンジDCASEの
異常⾳検知タスクにおける結果

DCASE2021異常⾳検知タスク
• ドメインシフトが⽣じる状況下における機械の動作⾳を対象とした
異常⾳検知（推論時のドメインは既知）
• 例．回転数：学習データは約300回／分，評価データは100回／分
• 各機械種別の各機器IDにおける学習データ
• 元のドメイン：1,000クリップ＋⽬標ドメイン：3クリップ
学習⽤
元の
ドメイン
⽬標
ドメイン
検証⽤
正常
正常
正常
異常
正常
異常
元の
ドメイン
⽬標
ドメイン
正常
正常
元の
ドメイン
⽬標
ドメイン
学習⽤評価⽤
DCASE：1
[Kawaguchi+ 2021]

名⼤＋HDLシステム
• 並列型異常⾳検知：複数システムのアンサンブルを実施
• OE：識別基準と距離基準によるマルチタスク学習
• IM：Conformer⾃⼰符号化器+機器ID回帰
• 様々な学習条件で各種システムを構築して利⽤
• ドメインシフト対応は特になし
• チャレンジ結果
• OEとIMの組み合わせは効果的
[Kuroyanagi+ 2021b]
1 5 10
チーム順位
15 20
0.5
AUCとpAUCの調和平均
名⼤+HDLチーム
0.6
0.7
25
DCASE：2
トップシステム [Lopez+ 2021]
• 様々なシステムのアンサンブル

DCASE2022タスク説明
• ドメインシフトが⽣じる状況下における機械の動作⾳を対象とした
異常⾳検知（推論時のドメインは未知）
• 各機械種別の各機器IDにおける学習データ
• 元のドメイン：900クリップ＋⽬標ドメイン：10クリップ
学習⽤
元の
ドメイン
⽬標
ドメイン
検証⽤
正常
正常
正常
異常
正常
異常
元の
ドメイン
⽬標
ドメイン
正常
正常
学習⽤評価⽤
DCASE：3
[Dohi+ 2022]

名⼤システム
• 直列型異常⾳検知
• OE：⼆種の⼆値分類によるマルチタスク学習で識別的特徴量抽出
• IM：パラメトリック・ノンパラメトリック⽣成モデルをチューニング
• ドメイン特化アプローチ
• ドメイン依存IMの結果をドメイン分類器の事後確率で重み付け
• チャレンジ結果
1 5
AUCとpAUCの調和平均
チーム順位
名⼤
0.7
0.6
0.5
0.4
10 15 20 25 30
DCASE：4
[Kuroyanagi+ 2022a]
トップシステム [Zeng+ 2022]
• データ観測に基づく前処理を導⼊

ドメインシフト対応の効果
• ドメイン特化アプローチの効果⼤
• 評価データには元ドメインと⽬標ドメインしか含まれないことに注意
• 未知ドメインに対する性能は不明
ドメイン特化
アプローチ
ドメイン汎化
アプローチ
ドメインシフト
未対応
DCASE：5
[Dohi+ 2022]

まとめ
まとめ
• 異常⾳検知の代表的な枠組みの概説
• IM（⽣成的アプローチ）とOE（識別的アプローチ）
• 深層学習に基づく研究事例の紹介
• OE：距離学習の導⼊による識別的特徴量空間の設計
• IM：深層波形⽣成モデルの適⽤
• 国際チャレンジDCASEの異常⾳検知タスク
• IMとOEの組み合わせが効果的
• ドメイン特化型アプローチが効果的
⾒守り・監視システムなどへの応⽤が期待
異常⾳検知に対する深層学習適⽤事例の紹介

本講演で紹介した研究内容は，主に以下の研究グループメンバーが
中⼼となって取り組んだ研究成果となります．
• 畔栁伊吹⽒（名古屋⼤学情報学研究科博⼠前期課程）
• 林知樹博⼠（株式会社Human Dataware Lab.）
謝辞

[Dehak+ 2011] N. Dehak, P. J. Kenny, R. Dehak, P. Dumouchel, P. Ouellet, “Front-end factor analysis for
speaker verification,” IEEE Trans. Audio, Speech, Lang. Process., Vol. 19, No. 4, pp. 788‒798, 2011.
[Dohi+ 2022] K. Dohi, K. Imoto, N. Harada, D. Niizumi, Y. Koizumi, T. Nishida, H. Purohit, T. Endo, M.
Yamamoto, Y. Kawaguchi, “Description and discussion on DCASE 2022 challenge task 2: unsupervised
anomalous sound detection for machine condition monitoring applying domain generalization techniques,”
Proc. DCASE 2020 Workshop, 5 pages, 2020.
[Giri+ 2020] R. Giri, S. V. Tenneti, F. Cheng, K. Helwani, U. Isik, A. Krishnaswamy, “Self-supervised
classification for detecting anomalous sounds,” Proc. DCASE 2020 Workshop, pp. 46‒50, 2020.
[Hayashi+ 2018] T. Hayashi, T. Komatsu, R. Kondo, T. Toda, K. Takeda, “Anomalous sound event detection
based on WaveNet,” Proc. EUSIPCO, pp. 2508-2512, 2018.
[Hendrycks+ 2019] D. Hendrycks, M. Mazeika, T.G. Dietterich, “Deep anomaly detection with outlier
exposure,” Proc. ICLR, 18 pages, 2019.
[Kawaguchi+ 2021] Y. Kawaguchi, K. Imoto, Y. Koizumi, N. Harada, D. Niizumi, K. Dohi, R. Tanabe, H.
Purohit, T. Endo, “Description and discussion on DCASE 2021 challenge task 2: unsupervised anomalous
sound detection for machine condition monitoring under domain shifted conditions,” Proc. DCASE 2021
Workshop, pp. 186-190, 2021.
[Koizumi+ 2020] Y. Koizumi, Y. Kawaguchi, K. Imoto, T. Nakamura, Y. Nikaido, R. Tanabe, H. Purohit, K.
Suefusa, T. Endo, M. Yasuda, N. Harada, “Description and discussion on DCASE2020 challenge task2:
unsupervised anomalous sound detection for machine condition monitoring,” Proc. DCASE 2020 Workshop,
pp. 81-85, 2020.
[Komatsu+ 2019] T. Komatsu, T. Hayashi, R. Kondo, T. Toda, K. Takeda, “Scene-dependent anomalous
acoustic-event detection based on conditional WaveNet and i-Vector,” Proc. IEEE ICASSP, pp. 870-874, 2019.
[Kuroyanagi+ 2021a] I. Kuroyanagi, T. Hayashi, K. Takeda, T. Toda, “Anomalous sound detection using a
binary classification model and class centroids,” Proc. EUSIPCO, pp. 1995-1999, Aug. 2021.
参考⽂献
参考⽂献：1

[Kuroyanagi+ 2021b] I. Kuroyanagi, T. Hayashi, Y. Adachi, T. Yoshimura, K. Takeda, T. Toda, “An ensemble
approach to anomalous sound detection based on conformer-based autoencoder and binary classifier
incorporated with metric learning,” Proc. DCASE 2021 Workshop, pp. 110-114, 2021.
[Kuroyanagi+ 2022a] I. Kuroyanagi, T. Hayashi, K. Takeda, T. Toda, “Two-stage anomalous sound detection
systems using domain generalization and specialization techniques,” Tech. Rep., DCASE 2022 Task 2, 5
pages, 2022.
[Kuroyanagi+ 2022b] I. Kuroyanagi, T. Hayashi, K. Takeda, T. Toda, “Improvement of serial approach to
anomalous sound detection by incorporating two binary cross-entropies for outlier exposure,” Proc. EUSIPCO,
pp. 294-298, 2022.
[Lopez+ 2021] J.A. Lopez, G. Stemmer, P. Lopez-Meyer, P.S. Singh, J.A. del Hoyo Ontiveros, H.A. Courdourier,
“Ensemble of complementary anomaly detectors under domain shifted conditions,” Proc. DCASE 2021
Workshop, pp. 11-15, 2021.
[Morita+ 2021] K. Morita, T. Yano, and K. Tran, “Anomalous sound detection using CNN-based features by
self supervised learning,” Tech. Rep. DCASE2021 Challenge, 3 pages, 2021.
[Primus+ 2020] P. Primus, V. Haunschmid, P. Praher, G. Widmer, “Anomalous sound detection as a simple
binary classification problem with careful selection of proxy outlier examples,” Proc. DCASE 2020 Workshop,
pp. 170‒174, 2020.
[van den Oord+ 2016] A. van den Oord, S. Dieleman, H. Zen, K. Simonyan, O. Vinyals, A. Graves, N.
Kalchbrenner, A. W. Senior, K. Kavukcuoglu, “WaveNet: a generative model for raw audio,” arXiv preprint,
arXiv:1609.03499, 15 pages, 2016.
[Zeng+ 2022] Y. Zeng, H. Liu, L. Xue, Y. Zhou, L. Gan, “Robust anomaly sound detection framework for
machine condition monitoring,” Tech. Rep. DCASE2022 Challenge, 3 pages, 2022.
参考⽂献
参考⽂献：2

異常音検知に対する深層学習適用事例

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to 異常音検知に対する深層学習適用事例

Similar to 異常音検知に対する深層学習適用事例 (20)

More from NU_I_TODALAB

More from NU_I_TODALAB (20)

異常音検知に対する深層学習適用事例