SlideShare a Scribd company logo
1 of 39
⼾⽥ 智基
名古屋⼤学 情報基盤センター
2022年11⽉18⽇
異常⾳検知に対する
深層学習適⽤事例
本講演の内容
本講演では,異常⾳検知の代表的な枠組みを概説すると
ともに,深層学習に基づく異常⾳検知⼿法として我々の
研究事例をいくつか紹介します.また,国際チャレンジ
DCASEの異常⾳検知タスクにおける性能評価結果に
ついても簡単に紹介します.
講演内容
正常動作中
異常発⽣!
異常⾳検知とは?
http://dcase.community/challenge2022/より
異常⾳検知は何に使える?
• ⾒守り・監視システムへの応⽤!
• 機械の動作⾳からの異常状態の検出
• 故障や不具合の検出など
• 街中の収録⾳からの異常事態の検出
• 叫び声や銃声の検出など
• ⾳を⽤いるがゆえに・・・
• 遮蔽物に頑健!
• 収録デバイス(マイク)が安価!
• 昼夜問わず利⽤可能!
• 映像との併⽤も可能!
異常⾳検知:1
異常⾳検知にトライ!
• 機械の動作⾳から異常が発⽣しているかどうか分かりますか?
異常⾳検知:2
異常! 異常! 異常!
正常 正常 正常
異常⾳検知の枠組み
• 想定される条件
• 基本的に正常⾳データのみ⼊⼿可能
• 異常⾳データは⼊⼿困難
• 主なアプローチ
• 対象機器(or 対象とする⾳環境)に対する異常⾳検知システムの構築
• 機械学習の活⽤
対象機器の
正常⾳データ
学習処理
異常⾳検知
システム
対象機器の⾳データ
推論処理 正常⾳ or 異常⾳
異常⾳検知:3
機械学習に基づく代表的なアプローチ
• ⽣成的アプローチ:Inlier Modeling (IM)
• 対象機器の正常⾳データを⽤いてその特徴をモデル化
• モデルのマッチング尺度を⽤い,外れ値として異常⾳データを検出
• 識別的アプローチ:Outlier Exposure (OE) [Hendrycks+ 2019]
• 対象機器以外の正常⾳データを疑似異常⾳データとして利⽤
• 正常⾳データと疑似異常⾳データを識別するモデルを学習
対象機器の
正常⾳データ
学習処理
正常⾳データ
確率分布
異常⾳検知:4
対象機器の
正常⾳データ
学習処理 識別境界
対象機器以外の
正常⾳データ
+
[Kawaguchi+ 2021]
IM(⽣成的アプローチ)の例
• ⾃⼰符号化器の再構成誤差に基づく異常⾳検知 [Koizumi+ 2020]
• 学習処理
• 正常⾳データに対する再構成誤差最⼩化
• 推論処理
• 再構成誤差が⼩ → ⼊⼒⾳は学習データと類似 → 正常⾳
• 再構成誤差が⼤ → ⼊⼒⾳は学習データと相違 → 異常⾳
エンコーダ
ネットワーク
ボトルネック特徴量
デコーダ
ネットワーク
⼊⼒⾳響特徴量 再構成⾳響特徴量
再構成誤差の計算
異常⾳検知:5
OE(識別的アプローチ)の例
• 正常⾳クラス識別器の事後確率に基づく異常⾳検知 [Primus+ 2020]
• 学習処理
• 正常⾳データと疑似異常⾳データを⽤いた正常⾳クラス識別器の学習
• 推論処理
• 正常⾳クラス事後確率が⼤ → 正常⾳
• 正常⾳クラス事後確率が⼩ → 異常⾳
識別的特徴抽出
ネットワーク
正常⾳の⾳響特徴量
疑似異常⾳の⾳響特徴量
識別的
特徴量
識別層
正常⾳
クラス
異常⾳
クラス
もしくは
もしくは
異常⾳検知:6
IMとOEの特徴
IM(⽣成的アプローチ) OE(識別的アプローチ)
確率分布の学習
=難易度の⾼い問題
識別境界の学習
=⽐較的難易度の低い問題
正常⾳データのみが必要 正常データに加えて
疑似異常⾳データが必要
⽐較的安定した傾向 ばらつきが⼤きい傾向
異常⾳データを⼊⼿できた
場合は容易にそれを活⽤可能
学習データ
異常⾳検知性能
学習時の問題設定
異常⾳検知:7
IMとOEを組み合わせるアプローチ
• 並列型
• IMの結果とOEの結果をアンサンブル [Giri+ 2020]
• 直列型
• OEで抽出された識別的特徴量に対してIMを適⽤ [Morita+ 2021]
IM異常⾳検知
OE異常⾳検知
検知結果
検知結果 検知結果
…異常⾳検知 検知結果
統合
OEによる
特徴量抽出
IM異常⾳検知 検知結果
⼊⼒⾳響特徴量
⼊⼒⾳響特徴量
異常⾳検知:8
識別的特徴量
性能評価指標:TPR,FPR,ROC曲線
• True-Positive-Rate (TPR)
• 異常⾳を正しく異常と判定した割合
• TPR = TP / (TP+FN)
• False-Positive-Rate (FPR)
• 正常⾳を誤って異常と判定した割合
• FPR = FP / (FP+TN)
• ROC曲線 (Receiver Operating Characteristic)
• 検出閾値を変化させてTPRと
FPRをプロット
0 1
1
異常と判定 正常と判定
異常⾳ TP FN
正常⾳ FP TN
TPR
FPR
異常スコア
正常⾳
異常⾳
異常スコアに対する検出閾値
によってTPRとFPRは変化
TPR=1.0
FPR=1.0
TPR=0.9
FPR=0.5
TPR=0.5
FPR=0.0
検出閾値
異常
正常
異常⾳検知:9
性能評価指標:AUCとpAUC
• AUC (Area Under the Curve)
• ROC曲線の下側の⾯積
0 1
1
TPR
FPR
• pAUC
• FPRが確率p以下の領域での
ROC曲線の下側の⾯積
0 1
1
TPR
FPR
p (e.g., 0.1)
AUCが⼤きいほど
異常検知性能が⾼い!
正常⾳を頻繁に異常⾳と誤検出する
システムは信⽤し難い
→ FPRがp以下の領域で⾯積計算
pAUCが⼤きいほど誤検出を減らした
設定において異常検知性能が⾼い!
異常⾳検知:10
その他の性能評価指標:再現率,適合率,F値
• 再現率 (Recall) =TPR
• 異常⾳を正しく異常と判定した割合
• Recall = TP / (TP+FN)
• 適合率 (Precision)
• 異常と判定した中で正しかった割合
• Precision = TP / (TP+FP)
• F値
• 再現率と適合率の調和平均
• F値 =
再現率 適合率
= 2
再現率・適合率
再現率 適合率
異常と判定 正常と判定
異常⾳ TP FN
正常⾳ FP TN
異常⾳検知:11
異常⾳が⽣じている区間の検出
• セグメントベース:
短時間区間単位(e.g., 10 ms)でF値計算
• イベントベース:
各異常⾳区間単位でF値計算
F値が⼤きいほど異常区間の
検出性能が⾼い!
深層学習に基づく異常⾳検知
(※我々の研究事例を中⼼に)
機械の動作⾳を対象とした異常⾳検知
• 機械動作状態のモニタリング
• 動作⾳から異常(故障や不具合など)が⽣じているかを検知
• 国際チャレンジDCASEにてタスクとして採⽤
• 2020年:機械動作状態モニタリング [Koizumi+ 2020]
• 2021年:ドメインシフト下での機械動作状態モニタリング [Kawaguchi+ 2021]
• 2022年:ドメインシフトに頑健な機械動作状態モニタリング [Dohi+ 2022]
• OEベースの深層学習の適⽤事例を紹介
• 異常⾳検知に適した識別的特徴量空間の学習
• 少量の異常⾳データを活⽤した検知性能改善
• 直列型によるIM併⽤の効果
深層OE事例:1
距離学習基準を導⼊したOEベース異常⾳検知
• 正常⾳データと疑似異常⾳データを識別する特徴抽出において,
従来の識別学習基準に加えて,距離学習基準も利⽤
• 識別学習基準:特徴空間の線形分離性能を最⼤化
• 距離学習基準:クラス内分散を最⼩化しつつクラス間分散を最⼤化
対象機器の
正常⾳データ
対象機器以外の
正常⾳データ
特徴抽出ネットワーク
距離学習基準
識別学習基準
[Kuroyanagi+ 2021a]
特徴量
正常⾳データ
疑似異常⾳データ
異常⾳データ(未観測)
⾼次元特徴空間
深層OE事例:2
識別基準と距離基準を⽤いたマルチタスク学習
• 特徴量𝒛 𝑓 𝒙 |𝜽 を抽出する深層ネットワーク𝑓 · |𝜽 を学習
• 学習データ
• ⼊⼒⾳響データ𝒙 とクラスラベル𝑦 ∈ 1, 1
• ロス関数:
• 識別基準ℒ :⼆値交差エントロピー
• 距離基準ℒ
• 正常⾳データ重⼼𝒄 と疑似異常⾳データ重⼼𝒄 を利⽤
• 特徴量から各重⼼への距離を利⽤
ℒ ∝ 𝒛 𝒄 𝒛 𝒄
ℒ ∝ 𝑦 ln 𝜎 𝒛 1 𝑦 ln 1 𝜎 𝒛
𝜎 ⋅ :シグモイド関数
ℒ ℒ 𝜔 ℒ
正常⾳データ・・・・ 𝒄 に近づける 𝒄 からは遠ざける
疑似異常⾳データ・・ 𝒄 からは遠ざける 𝒄 に近づける
深層OE事例:3
[Kuroyanagi+ 2021a]
実験的評価結果の例
• DCASE2020 Task 2 [Koizumi+ 2020]の学習データセットを利⽤
• 機械種別:fan, pump, slider, valve, ToyCar, ToyConveyor
• 機器ID:各種機械毎に3~4種類(違う種類のfanなど)
• 各機械の個々の機器IDごとに異常⾳検知システムを構築
• 正常データ:対象機械の対象機器IDの⾳データ
• 疑似異常データ:それ以外(対象機械の別機器ID+別機械の全機器ID)
• AUCによる性能評価
識別基準 〇 〇 〇
正常⾳重⼼ 〇 〇 〇 〇
異常⾳重⼼ 〇 〇
深層OE事例:4
[Kuroyanagi+ 2021a]
少量の異常⾳データを⽤いた性能改善
• OEの利点:異常⾳データの利⽤が容易
• システム運⽤を通して異常⾳が⽣じたら,それを利⽤して再学習
することでシステム性能の改善が可能
追加学習に使⽤した異常データの量
識別学習
基準
距離学習基準
正常⾳重⼼ 異常⾳重⼼
使⽤
使⽤
使⽤ 使⽤
使⽤ 使⽤
使⽤ 使⽤ 使⽤
AUC
深層OE事例:5
[Kuroyanagi+ 2021a]
識別的特徴学習の改良
• 機械種別の識別と機器IDの識別を切り分けて実施
• 機械種別識別:全ての⾳データに対して実施
• 対象とする機械種別は正常データ:原点から遠ざける
• 対象外の機械種別は疑似異常データ:原点に近づける
• 機器ID識別:対象機械種別の⾳データに対してのみ実施
• 各機器IDごとに⼆値分類を実施
• One-vs-Rest識別器を機器IDの数だけ⽤意
対象外機械
の正常⾳
対象機械の
正常⾳
機械種別
識別
識別的
特徴抽出
ネット
機器ID
識別
深層OE事例:6
[Kuroyanagi+ 2022b]
⼆種類の⼆値分類に基づくマルチタスク学習
• 対象機器毎に特徴量𝒛 を抽出する深層ネットワークを学習
• 異なる機器IDに対して共通の識別的特徴量を抽出
• ラベル
• 機械種別ラベル𝑡 ∈ 1, 1 と機器ID結合ラベル𝑦 , ∈ 1, 1
• ロス関数
• 機械種別識別ロスℒ :全ての⾳データに対して計算
• 機器ID識別ロスℒ :対象機械種別の⾳データに対してのみ計算
ℒ ∝ 𝑡 ln 𝑔 𝒛 1 𝑡 ln 1 𝑔 𝒛
対象外の機械は原点に近づける
対象機械は原点から遠ざける
ℒ ∝ 𝑡 𝑦 , ln 𝜎 𝒛 1 𝑦 , ln 1 𝜎 𝒛
,
ℒ ℒ 𝑤 ℒ
深層OE事例:7
[Kuroyanagi+ 2022b]
OE+IM直列型の導⼊
• OEで抽出された識別的特徴量の確率密度分布をIMでモデル化
対象外機械
の正常⾳
対象機械の
正常⾳
機械種別
識別
識別的
特徴抽出
ネット
機器ID
識別
識別的特徴量
1.OEによる識別的特徴抽出ネットワークの学習
2.対象機械の対象機器IDの
正常⾳から識別的特徴量を抽出
3.IMによる対象機械&
機器ID依存⽣成モデル学習
確率密度関数
深層OE事例:8
[Kuroyanagi+ 2022b]
実験的評価結果の例
• DCASE2021 Task 2 [Kawaguchi+ 2021]の学習データセットを利⽤
• 機械種別:fan, pump, slider, valve, ToyCar, ToyConveyor
• 機器ID:各種機械毎に6種類
• 各機械種別の個々の機器IDごとに異常⾳検知システムを構築
• 識別的特徴抽出ネットワークは各機械種別にて共有
• AUCとpAUC(p=0.1)の調和平均による性能評価
• 複数モデルを⽤意することなく直列型で⾼い性能を達成
深層OE事例:9
[Kuroyanagi+ 2022b]
駅構内における異常⾳検知
• 駅構内の⼈混みの中での異常⾳検知
• ガラスの割れる⾳や叫び声を異常⾳として検知
• IMベースの深層学習の適⽤事例を紹介
• 深層波形⽣成モデルを利⽤することで時間構造(位相情報)も
考慮した 異常⾳検知を実現
• 異常⾳が発⽣している区間も検出
• ⽇時や時間帯に応じた⾳環境変化への対応
深層IM事例:1
WaveNetを⽤いたIMベース異常⾳検知:学習
• 正常⾳の時間波形𝒙 𝑥 , 𝑥 , … , 𝑥 の同時確率分布𝑝 𝒙 を⾃⼰回帰
モデルで学習
𝑝 𝑥 |𝑥 , … , 𝑥 , 𝒉
深層波形⽣成
ネットワーク
正常⾳データ
時間波形 𝒙
𝑥
𝑥
⼊⼒層
𝑥
第1隠れ層
𝑥
𝑥
𝑥
𝑥
第2隠れ層
Dilation幅 1
Dilation幅 2
𝑥
第3隠れ層
Dilation幅 4
WaveNet [van den Oord+ 2016]
• 拡張畳み込みによる⾃⼰回帰モデリング
⾳響特徴量
系列 𝒉
特徴抽出
𝑝 𝒙 𝒉 𝑝 𝑥 𝑥 , … , 𝑥 , 𝒉
• ⾼次マルコフ過程の導⼊して
条件付き確率分布をモデル化
• ⾳響特徴量系列𝒉による条件付け
𝑝 𝒙 𝒉
深層IM事例:2
[Hayashi+ 2018]
WaveNetを⽤いたIMベース異常⾳検知:推論
• 異常スコアとして,⼊⼒⾳の時間波形に対する条件付き確率分布
𝑝 𝑥 𝑥 , … , 𝑥 , 𝒉 のエントロピーを利⽤
波形振幅量⼦化クラスID 波形振幅量⼦化クラスID
条件付き確率
条件付き確率
正常⾳に対する例 異常⾳に対する例
モデリング精度⾼
=エントロピー⼩
モデリング精度低
=エントロピー⼤
時間 [s]
検出結果
エントロピー
エントロピー時系列に対する
後処理により異常区間を検出
深層IM事例:3
[Hayashi+ 2018]
⾳環境埋め込みによるコンテキスト情報の活⽤
• 想定タスク:駅構内における⼈混みの中での異常⾳検知
• 曜⽇・時間帯に応じて⾳環境は⼤きく変化
• ⾳環境埋め込みを併⽤してコンテキスト適応型WaveNetを学習
コンテキスト適応型
WaveNet
正常⾳データ
時間波形 𝒙
⾳響特徴量系列 𝒉
特徴抽出
𝑝 𝒙 𝒉, 𝒆
⾳環境埋め込み𝒆
iVector抽出器
話者認識の埋め込み表現
iVector [Dehak+ 2011]を適⽤
⾳響特徴量系列の
全域的な特徴を抽出
深層IM事例:4
[Komatsu+ 2019]
実験的評価結果の例
• 地下鉄で収録した環境⾳データに対し,ガラスが割れる⾳や叫び声
などを異常⾳として重畳して作成した模擬データを使⽤
ガラスが割れる⾳ ⾜⾳
周波数
[Hz]
エントロピー
検出結果
時間 [s]
セグメント
ベースF値[%]
AE 68.21
AR-LSTM 64.26
BLSTM AE 67.67
WaveNet 77.76
WaveNet+iVector 79.33
• WaveNetにより時間構造(位相情報)
も利⽤した異常検知が可能!
• iVectorを併⽤することで性能改善!
深層IM事例:5
[Komatsu+ 2019]
国際チャレンジDCASEの
異常⾳検知タスクにおける結果
DCASE2021異常⾳検知タスク
• ドメインシフトが⽣じる状況下における機械の動作⾳を対象とした
異常⾳検知(推論時のドメインは既知)
• 例.回転数:学習データは約300回/分,評価データは100回/分
• 各機械種別の各機器IDにおける学習データ
• 元のドメイン:1,000クリップ+⽬標ドメイン:3クリップ
学習⽤
元の
ドメイン
⽬標
ドメイン
検証⽤
正常
正常
正常
異常
正常
異常
元の
ドメイン
⽬標
ドメイン
正常
正常
元の
ドメイン
⽬標
ドメイン
学習⽤ 評価⽤
DCASE:1
[Kawaguchi+ 2021]
名⼤+HDLシステム
• 並列型異常⾳検知:複数システムのアンサンブルを実施
• OE:識別基準と距離基準によるマルチタスク学習
• IM:Conformer⾃⼰符号化器+機器ID回帰
• 様々な学習条件で各種システムを構築して利⽤
• ドメインシフト対応は特になし
• チャレンジ結果
• OEとIMの組み合わせは効果的
[Kuroyanagi+ 2021b]
1 5 10
チーム順位
15 20
0.5
AUCとpAUCの調和平均
名⼤+HDLチーム
0.6
0.7
25
DCASE:2
トップシステム [Lopez+ 2021]
• 様々なシステムのアンサンブル
DCASE2022タスク説明
• ドメインシフトが⽣じる状況下における機械の動作⾳を対象とした
異常⾳検知(推論時のドメインは未知)
• 各機械種別の各機器IDにおける学習データ
• 元のドメイン:900クリップ+⽬標ドメイン:10クリップ
学習⽤
元の
ドメイン
⽬標
ドメイン
検証⽤
正常
正常
正常
異常
正常
異常
元の
ドメイン
⽬標
ドメイン
正常
正常
学習⽤ 評価⽤
DCASE:3
[Dohi+ 2022]
名⼤システム
• 直列型異常⾳検知
• OE:⼆種の⼆値分類によるマルチタスク学習で識別的特徴量抽出
• IM:パラメトリック・ノンパラメトリック⽣成モデルをチューニング
• ドメイン特化アプローチ
• ドメイン依存IMの結果をドメイン分類器の事後確率で重み付け
• チャレンジ結果
1 5
AUCとpAUCの調和平均
チーム順位
名⼤
0.7
0.6
0.5
0.4
10 15 20 25 30
DCASE:4
[Kuroyanagi+ 2022a]
トップシステム [Zeng+ 2022]
• データ観測に基づく前処理を導⼊
ドメインシフト対応の効果
• ドメイン特化アプローチの効果⼤
• 評価データには元ドメインと⽬標ドメインしか含まれないことに注意
• 未知ドメインに対する性能は不明
ドメイン特化
アプローチ
ドメイン汎化
アプローチ
ドメインシフト
未対応
DCASE:5
[Dohi+ 2022]
まとめ
まとめ
• 異常⾳検知の代表的な枠組みの概説
• IM(⽣成的アプローチ)とOE(識別的アプローチ)
• 深層学習に基づく研究事例の紹介
• OE:距離学習の導⼊による識別的特徴量空間の設計
• IM:深層波形⽣成モデルの適⽤
• 国際チャレンジDCASEの異常⾳検知タスク
• IMとOEの組み合わせが効果的
• ドメイン特化型アプローチが効果的
⾒守り・監視システムなどへの応⽤が期待
異常⾳検知に対する深層学習適⽤事例の紹介
本講演で紹介した研究内容は,主に以下の研究グループメンバーが
中⼼となって取り組んだ研究成果となります.
• 畔栁 伊吹 ⽒(名古屋⼤学 情報学研究科 博⼠前期課程)
• 林 知樹 博⼠(株式会社Human Dataware Lab.)
謝辞
[Dehak+ 2011] N. Dehak, P. J. Kenny, R. Dehak, P. Dumouchel, P. Ouellet, “Front-end factor analysis for
speaker verification,” IEEE Trans. Audio, Speech, Lang. Process., Vol. 19, No. 4, pp. 788‒798, 2011.
[Dohi+ 2022] K. Dohi, K. Imoto, N. Harada, D. Niizumi, Y. Koizumi, T. Nishida, H. Purohit, T. Endo, M.
Yamamoto, Y. Kawaguchi, “Description and discussion on DCASE 2022 challenge task 2: unsupervised
anomalous sound detection for machine condition monitoring applying domain generalization techniques,”
Proc. DCASE 2020 Workshop, 5 pages, 2020.
[Giri+ 2020] R. Giri, S. V. Tenneti, F. Cheng, K. Helwani, U. Isik, A. Krishnaswamy, “Self-supervised
classification for detecting anomalous sounds,” Proc. DCASE 2020 Workshop, pp. 46‒50, 2020.
[Hayashi+ 2018] T. Hayashi, T. Komatsu, R. Kondo, T. Toda, K. Takeda, “Anomalous sound event detection
based on WaveNet,” Proc. EUSIPCO, pp. 2508-2512, 2018.
[Hendrycks+ 2019] D. Hendrycks, M. Mazeika, T.G. Dietterich, “Deep anomaly detection with outlier
exposure,” Proc. ICLR, 18 pages, 2019.
[Kawaguchi+ 2021] Y. Kawaguchi, K. Imoto, Y. Koizumi, N. Harada, D. Niizumi, K. Dohi, R. Tanabe, H.
Purohit, T. Endo, “Description and discussion on DCASE 2021 challenge task 2: unsupervised anomalous
sound detection for machine condition monitoring under domain shifted conditions,” Proc. DCASE 2021
Workshop, pp. 186-190, 2021.
[Koizumi+ 2020] Y. Koizumi, Y. Kawaguchi, K. Imoto, T. Nakamura, Y. Nikaido, R. Tanabe, H. Purohit, K.
Suefusa, T. Endo, M. Yasuda, N. Harada, “Description and discussion on DCASE2020 challenge task2:
unsupervised anomalous sound detection for machine condition monitoring,” Proc. DCASE 2020 Workshop,
pp. 81-85, 2020.
[Komatsu+ 2019] T. Komatsu, T. Hayashi, R. Kondo, T. Toda, K. Takeda, “Scene-dependent anomalous
acoustic-event detection based on conditional WaveNet and i-Vector,” Proc. IEEE ICASSP, pp. 870-874, 2019.
[Kuroyanagi+ 2021a] I. Kuroyanagi, T. Hayashi, K. Takeda, T. Toda, “Anomalous sound detection using a
binary classification model and class centroids,” Proc. EUSIPCO, pp. 1995-1999, Aug. 2021.
参考⽂献
参考⽂献:1
[Kuroyanagi+ 2021b] I. Kuroyanagi, T. Hayashi, Y. Adachi, T. Yoshimura, K. Takeda, T. Toda, “An ensemble
approach to anomalous sound detection based on conformer-based autoencoder and binary classifier
incorporated with metric learning,” Proc. DCASE 2021 Workshop, pp. 110-114, 2021.
[Kuroyanagi+ 2022a] I. Kuroyanagi, T. Hayashi, K. Takeda, T. Toda, “Two-stage anomalous sound detection
systems using domain generalization and specialization techniques,” Tech. Rep., DCASE 2022 Task 2, 5
pages, 2022.
[Kuroyanagi+ 2022b] I. Kuroyanagi, T. Hayashi, K. Takeda, T. Toda, “Improvement of serial approach to
anomalous sound detection by incorporating two binary cross-entropies for outlier exposure,” Proc. EUSIPCO,
pp. 294-298, 2022.
[Lopez+ 2021] J.A. Lopez, G. Stemmer, P. Lopez-Meyer, P.S. Singh, J.A. del Hoyo Ontiveros, H.A. Courdourier,
“Ensemble of complementary anomaly detectors under domain shifted conditions,” Proc. DCASE 2021
Workshop, pp. 11-15, 2021.
[Morita+ 2021] K. Morita, T. Yano, and K. Tran, “Anomalous sound detection using CNN-based features by
self supervised learning,” Tech. Rep. DCASE2021 Challenge, 3 pages, 2021.
[Primus+ 2020] P. Primus, V. Haunschmid, P. Praher, G. Widmer, “Anomalous sound detection as a simple
binary classification problem with careful selection of proxy outlier examples,” Proc. DCASE 2020 Workshop,
pp. 170‒174, 2020.
[van den Oord+ 2016] A. van den Oord, S. Dieleman, H. Zen, K. Simonyan, O. Vinyals, A. Graves, N.
Kalchbrenner, A. W. Senior, K. Kavukcuoglu, “WaveNet: a generative model for raw audio,” arXiv preprint,
arXiv:1609.03499, 15 pages, 2016.
[Zeng+ 2022] Y. Zeng, H. Liu, L. Xue, Y. Zhou, L. Gan, “Robust anomaly sound detection framework for
machine condition monitoring,” Tech. Rep. DCASE2022 Challenge, 3 pages, 2022.
参考⽂献
参考⽂献:2

More Related Content

What's hot

WaveNetが音声合成研究に与える影響
WaveNetが音声合成研究に与える影響WaveNetが音声合成研究に与える影響
WaveNetが音声合成研究に与える影響NU_I_TODALAB
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習cvpaper. challenge
 
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...Deep Learning JP
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向Motokawa Tetsuya
 
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...Hideki Tsunashima
 
SHAP値の考え方を理解する(木構造編)
SHAP値の考え方を理解する(木構造編)SHAP値の考え方を理解する(木構造編)
SHAP値の考え方を理解する(木構造編)Kazuyuki Wakasugi
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!TransformerArithmer Inc.
 
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~Yui Sudo
 
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer近年のHierarchical Vision Transformer
近年のHierarchical Vision TransformerYusuke Uchida
 
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)Shota Imai
 
機械学習の未解決課題
機械学習の未解決課題機械学習の未解決課題
機械学習の未解決課題Hiroyuki Masuda
 
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習SSII
 
異常音検知の実用化に向けて
異常音検知の実用化に向けて異常音検知の実用化に向けて
異常音検知の実用化に向けてRyohei Yamaguchi
 
音響信号に対する異常音検知技術と応用
音響信号に対する異常音検知技術と応用音響信号に対する異常音検知技術と応用
音響信号に対する異常音検知技術と応用Yuma Koizumi
 
ドメイン適応の原理と応用
ドメイン適応の原理と応用ドメイン適応の原理と応用
ドメイン適応の原理と応用Yoshitaka Ushiku
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII
 
環境音の特徴を活用した音響イベント検出・シーン分類
環境音の特徴を活用した音響イベント検出・シーン分類環境音の特徴を活用した音響イベント検出・シーン分類
環境音の特徴を活用した音響イベント検出・シーン分類Keisuke Imoto
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門Shuyo Nakatani
 
機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明Satoshi Hara
 
大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック
大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック 大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック
大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック 西岡 賢一郎
 

What's hot (20)

WaveNetが音声合成研究に与える影響
WaveNetが音声合成研究に与える影響WaveNetが音声合成研究に与える影響
WaveNetが音声合成研究に与える影響
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
 
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向
 
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
 
SHAP値の考え方を理解する(木構造編)
SHAP値の考え方を理解する(木構造編)SHAP値の考え方を理解する(木構造編)
SHAP値の考え方を理解する(木構造編)
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!Transformer
 
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
 
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
 
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
 
機械学習の未解決課題
機械学習の未解決課題機械学習の未解決課題
機械学習の未解決課題
 
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
 
異常音検知の実用化に向けて
異常音検知の実用化に向けて異常音検知の実用化に向けて
異常音検知の実用化に向けて
 
音響信号に対する異常音検知技術と応用
音響信号に対する異常音検知技術と応用音響信号に対する異常音検知技術と応用
音響信号に対する異常音検知技術と応用
 
ドメイン適応の原理と応用
ドメイン適応の原理と応用ドメイン適応の原理と応用
ドメイン適応の原理と応用
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 
環境音の特徴を活用した音響イベント検出・シーン分類
環境音の特徴を活用した音響イベント検出・シーン分類環境音の特徴を活用した音響イベント検出・シーン分類
環境音の特徴を活用した音響イベント検出・シーン分類
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門
 
機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明
 
大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック
大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック 大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック
大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック
 

Similar to 異常音検知に対する深層学習適用事例

「解説資料」VideoMix: Rethinking Data Augmentation for Video Classification
「解説資料」VideoMix: Rethinking Data Augmentation for  Video Classification「解説資料」VideoMix: Rethinking Data Augmentation for  Video Classification
「解説資料」VideoMix: Rethinking Data Augmentation for Video ClassificationTakumi Ohkuma
 
「事実にもとづく管理」によるソフトウェア品質の改善 ー ヒンシツ大学 Evening Talk #04
「事実にもとづく管理」によるソフトウェア品質の改善 ー ヒンシツ大学 Evening Talk #04「事実にもとづく管理」によるソフトウェア品質の改善 ー ヒンシツ大学 Evening Talk #04
「事実にもとづく管理」によるソフトウェア品質の改善 ー ヒンシツ大学 Evening Talk #04Makoto Nonaka
 
「最強」のチームを「造る」技術基盤 ディレクターズ・カット
「最強」のチームを「造る」技術基盤 ディレクターズ・カット「最強」のチームを「造る」技術基盤 ディレクターズ・カット
「最強」のチームを「造る」技術基盤 ディレクターズ・カットRakuten Group, Inc.
 
機械学習エンジニアリング・品質保証 (ESS2018招待講演 鷲崎弘宜)
機械学習エンジニアリング・品質保証 (ESS2018招待講演 鷲崎弘宜)機械学習エンジニアリング・品質保証 (ESS2018招待講演 鷲崎弘宜)
機械学習エンジニアリング・品質保証 (ESS2018招待講演 鷲崎弘宜)Hironori Washizaki
 
ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"
ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"
ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"SIGSTJ
 
ロボット介護機器設計支援ツール、中坊嘉宏(産総研)
ロボット介護機器設計支援ツール、中坊嘉宏(産総研)ロボット介護機器設計支援ツール、中坊嘉宏(産総研)
ロボット介護機器設計支援ツール、中坊嘉宏(産総研)robotcare
 
Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善Hironori Washizaki
 
SQuaRE に基づくソフトウェア品質評価枠組みと品質実態調査
SQuaRE に基づくソフトウェア品質評価枠組みと品質実態調査SQuaRE に基づくソフトウェア品質評価枠組みと品質実態調査
SQuaRE に基づくソフトウェア品質評価枠組みと品質実態調査Hironori Washizaki
 
SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査
SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査
SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査Hironori Washizaki
 
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation 「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation Takumi Ohkuma
 
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDeep Learning JP
 
探求の道 Lead Clearly
探求の道 Lead Clearly探求の道 Lead Clearly
探求の道 Lead ClearlyYutaka KATAYAMA
 
Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~nlab_utokyo
 
CVPRプレゼン動画100本サーベイ
CVPRプレゼン動画100本サーベイCVPRプレゼン動画100本サーベイ
CVPRプレゼン動画100本サーベイYuki Yamashita
 
JaSST'16 Tokyo モバイルセッション
JaSST'16 Tokyo モバイルセッションJaSST'16 Tokyo モバイルセッション
JaSST'16 Tokyo モバイルセッションmirer
 
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計Hironori Washizaki
 
CODE BLUE 2014 : サイバーエスピオナージを抑制するためにデバイスを無効化する ハイパーバイザー "DeviceDisEnabler" by...
CODE BLUE 2014 : サイバーエスピオナージを抑制するためにデバイスを無効化する ハイパーバイザー "DeviceDisEnabler" by...CODE BLUE 2014 : サイバーエスピオナージを抑制するためにデバイスを無効化する ハイパーバイザー "DeviceDisEnabler" by...
CODE BLUE 2014 : サイバーエスピオナージを抑制するためにデバイスを無効化する ハイパーバイザー "DeviceDisEnabler" by...CODE BLUE
 
ソフトウェア品質実態調査報告「測定評価と分析を通じたソフトウェア製品品質の実態定量化および総合的品質評価枠組みの確立」
ソフトウェア品質実態調査報告「測定評価と分析を通じたソフトウェア製品品質の実態定量化および総合的品質評価枠組みの確立」ソフトウェア品質実態調査報告「測定評価と分析を通じたソフトウェア製品品質の実態定量化および総合的品質評価枠組みの確立」
ソフトウェア品質実態調査報告「測定評価と分析を通じたソフトウェア製品品質の実態定量化および総合的品質評価枠組みの確立」Hironori Washizaki
 
TERAS Conference
TERAS ConferenceTERAS Conference
TERAS ConferenceKeiju Anada
 

Similar to 異常音検知に対する深層学習適用事例 (20)

「解説資料」VideoMix: Rethinking Data Augmentation for Video Classification
「解説資料」VideoMix: Rethinking Data Augmentation for  Video Classification「解説資料」VideoMix: Rethinking Data Augmentation for  Video Classification
「解説資料」VideoMix: Rethinking Data Augmentation for Video Classification
 
「事実にもとづく管理」によるソフトウェア品質の改善 ー ヒンシツ大学 Evening Talk #04
「事実にもとづく管理」によるソフトウェア品質の改善 ー ヒンシツ大学 Evening Talk #04「事実にもとづく管理」によるソフトウェア品質の改善 ー ヒンシツ大学 Evening Talk #04
「事実にもとづく管理」によるソフトウェア品質の改善 ー ヒンシツ大学 Evening Talk #04
 
20150414seminar
20150414seminar20150414seminar
20150414seminar
 
「最強」のチームを「造る」技術基盤 ディレクターズ・カット
「最強」のチームを「造る」技術基盤 ディレクターズ・カット「最強」のチームを「造る」技術基盤 ディレクターズ・カット
「最強」のチームを「造る」技術基盤 ディレクターズ・カット
 
機械学習エンジニアリング・品質保証 (ESS2018招待講演 鷲崎弘宜)
機械学習エンジニアリング・品質保証 (ESS2018招待講演 鷲崎弘宜)機械学習エンジニアリング・品質保証 (ESS2018招待講演 鷲崎弘宜)
機械学習エンジニアリング・品質保証 (ESS2018招待講演 鷲崎弘宜)
 
ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"
ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"
ICST 2015 まるわかりDay! "Test Selection and Prioritization Track"
 
ロボット介護機器設計支援ツール、中坊嘉宏(産総研)
ロボット介護機器設計支援ツール、中坊嘉宏(産総研)ロボット介護機器設計支援ツール、中坊嘉宏(産総研)
ロボット介護機器設計支援ツール、中坊嘉宏(産総研)
 
Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善
 
SQuaRE に基づくソフトウェア品質評価枠組みと品質実態調査
SQuaRE に基づくソフトウェア品質評価枠組みと品質実態調査SQuaRE に基づくソフトウェア品質評価枠組みと品質実態調査
SQuaRE に基づくソフトウェア品質評価枠組みと品質実態調査
 
SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査
SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査
SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査
 
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation 「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
探求の道 Lead Clearly
探求の道 Lead Clearly探求の道 Lead Clearly
探求の道 Lead Clearly
 
Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~
 
CVPRプレゼン動画100本サーベイ
CVPRプレゼン動画100本サーベイCVPRプレゼン動画100本サーベイ
CVPRプレゼン動画100本サーベイ
 
JaSST'16 Tokyo モバイルセッション
JaSST'16 Tokyo モバイルセッションJaSST'16 Tokyo モバイルセッション
JaSST'16 Tokyo モバイルセッション
 
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
 
CODE BLUE 2014 : サイバーエスピオナージを抑制するためにデバイスを無効化する ハイパーバイザー "DeviceDisEnabler" by...
CODE BLUE 2014 : サイバーエスピオナージを抑制するためにデバイスを無効化する ハイパーバイザー "DeviceDisEnabler" by...CODE BLUE 2014 : サイバーエスピオナージを抑制するためにデバイスを無効化する ハイパーバイザー "DeviceDisEnabler" by...
CODE BLUE 2014 : サイバーエスピオナージを抑制するためにデバイスを無効化する ハイパーバイザー "DeviceDisEnabler" by...
 
ソフトウェア品質実態調査報告「測定評価と分析を通じたソフトウェア製品品質の実態定量化および総合的品質評価枠組みの確立」
ソフトウェア品質実態調査報告「測定評価と分析を通じたソフトウェア製品品質の実態定量化および総合的品質評価枠組みの確立」ソフトウェア品質実態調査報告「測定評価と分析を通じたソフトウェア製品品質の実態定量化および総合的品質評価枠組みの確立」
ソフトウェア品質実態調査報告「測定評価と分析を通じたソフトウェア製品品質の実態定量化および総合的品質評価枠組みの確立」
 
TERAS Conference
TERAS ConferenceTERAS Conference
TERAS Conference
 

More from NU_I_TODALAB

深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術NU_I_TODALAB
 
信号の独立性に基づく多チャンネル音源分離
信号の独立性に基づく多チャンネル音源分離信号の独立性に基づく多チャンネル音源分離
信号の独立性に基づく多チャンネル音源分離NU_I_TODALAB
 
The VoiceMOS Challenge 2022
The VoiceMOS Challenge 2022The VoiceMOS Challenge 2022
The VoiceMOS Challenge 2022NU_I_TODALAB
 
敵対的学習による統合型ソースフィルタネットワーク
敵対的学習による統合型ソースフィルタネットワーク敵対的学習による統合型ソースフィルタネットワーク
敵対的学習による統合型ソースフィルタネットワークNU_I_TODALAB
 
Investigation of Text-to-Speech based Synthetic Parallel Data for Sequence-to...
Investigation of Text-to-Speech based Synthetic Parallel Data for Sequence-to...Investigation of Text-to-Speech based Synthetic Parallel Data for Sequence-to...
Investigation of Text-to-Speech based Synthetic Parallel Data for Sequence-to...NU_I_TODALAB
 
Interactive voice conversion for augmented speech production
Interactive voice conversion for augmented speech productionInteractive voice conversion for augmented speech production
Interactive voice conversion for augmented speech productionNU_I_TODALAB
 
CREST「共生インタラクション」共創型音メディア機能拡張プロジェクト
CREST「共生インタラクション」共創型音メディア機能拡張プロジェクトCREST「共生インタラクション」共創型音メディア機能拡張プロジェクト
CREST「共生インタラクション」共創型音メディア機能拡張プロジェクトNU_I_TODALAB
 
Recent progress on voice conversion: What is next?
Recent progress on voice conversion: What is next?Recent progress on voice conversion: What is next?
Recent progress on voice conversion: What is next?NU_I_TODALAB
 
Weakly-Supervised Sound Event Detection with Self-Attention
Weakly-Supervised Sound Event Detection with Self-AttentionWeakly-Supervised Sound Event Detection with Self-Attention
Weakly-Supervised Sound Event Detection with Self-AttentionNU_I_TODALAB
 
Statistical voice conversion with direct waveform modeling
Statistical voice conversion with direct waveform modelingStatistical voice conversion with direct waveform modeling
Statistical voice conversion with direct waveform modelingNU_I_TODALAB
 
音素事後確率を利用した表現学習に基づく発話感情認識
音素事後確率を利用した表現学習に基づく発話感情認識音素事後確率を利用した表現学習に基づく発話感情認識
音素事後確率を利用した表現学習に基づく発話感情認識NU_I_TODALAB
 
楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法
楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法
楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法NU_I_TODALAB
 
End-to-End音声認識ためのMulti-Head Decoderネットワーク
End-to-End音声認識ためのMulti-Head DecoderネットワークEnd-to-End音声認識ためのMulti-Head Decoderネットワーク
End-to-End音声認識ためのMulti-Head DecoderネットワークNU_I_TODALAB
 
空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調/抑圧法
空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調/抑圧法空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調/抑圧法
空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調/抑圧法NU_I_TODALAB
 
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元NU_I_TODALAB
 
Hands on Voice Conversion
Hands on Voice ConversionHands on Voice Conversion
Hands on Voice ConversionNU_I_TODALAB
 
Advanced Voice Conversion
Advanced Voice ConversionAdvanced Voice Conversion
Advanced Voice ConversionNU_I_TODALAB
 
Deep Neural Networkに基づく日常生活行動認識における適応手法
Deep Neural Networkに基づく日常生活行動認識における適応手法Deep Neural Networkに基づく日常生活行動認識における適応手法
Deep Neural Networkに基づく日常生活行動認識における適応手法NU_I_TODALAB
 
CTCに基づく音響イベントからの擬音語表現への変換
CTCに基づく音響イベントからの擬音語表現への変換CTCに基づく音響イベントからの擬音語表現への変換
CTCに基づく音響イベントからの擬音語表現への変換NU_I_TODALAB
 
Missing Component Restoration for Masked Speech Signals based on Time-Domain ...
Missing Component Restoration for Masked Speech Signals based on Time-Domain ...Missing Component Restoration for Masked Speech Signals based on Time-Domain ...
Missing Component Restoration for Masked Speech Signals based on Time-Domain ...NU_I_TODALAB
 

More from NU_I_TODALAB (20)

深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術
 
信号の独立性に基づく多チャンネル音源分離
信号の独立性に基づく多チャンネル音源分離信号の独立性に基づく多チャンネル音源分離
信号の独立性に基づく多チャンネル音源分離
 
The VoiceMOS Challenge 2022
The VoiceMOS Challenge 2022The VoiceMOS Challenge 2022
The VoiceMOS Challenge 2022
 
敵対的学習による統合型ソースフィルタネットワーク
敵対的学習による統合型ソースフィルタネットワーク敵対的学習による統合型ソースフィルタネットワーク
敵対的学習による統合型ソースフィルタネットワーク
 
Investigation of Text-to-Speech based Synthetic Parallel Data for Sequence-to...
Investigation of Text-to-Speech based Synthetic Parallel Data for Sequence-to...Investigation of Text-to-Speech based Synthetic Parallel Data for Sequence-to...
Investigation of Text-to-Speech based Synthetic Parallel Data for Sequence-to...
 
Interactive voice conversion for augmented speech production
Interactive voice conversion for augmented speech productionInteractive voice conversion for augmented speech production
Interactive voice conversion for augmented speech production
 
CREST「共生インタラクション」共創型音メディア機能拡張プロジェクト
CREST「共生インタラクション」共創型音メディア機能拡張プロジェクトCREST「共生インタラクション」共創型音メディア機能拡張プロジェクト
CREST「共生インタラクション」共創型音メディア機能拡張プロジェクト
 
Recent progress on voice conversion: What is next?
Recent progress on voice conversion: What is next?Recent progress on voice conversion: What is next?
Recent progress on voice conversion: What is next?
 
Weakly-Supervised Sound Event Detection with Self-Attention
Weakly-Supervised Sound Event Detection with Self-AttentionWeakly-Supervised Sound Event Detection with Self-Attention
Weakly-Supervised Sound Event Detection with Self-Attention
 
Statistical voice conversion with direct waveform modeling
Statistical voice conversion with direct waveform modelingStatistical voice conversion with direct waveform modeling
Statistical voice conversion with direct waveform modeling
 
音素事後確率を利用した表現学習に基づく発話感情認識
音素事後確率を利用した表現学習に基づく発話感情認識音素事後確率を利用した表現学習に基づく発話感情認識
音素事後確率を利用した表現学習に基づく発話感情認識
 
楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法
楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法
楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法
 
End-to-End音声認識ためのMulti-Head Decoderネットワーク
End-to-End音声認識ためのMulti-Head DecoderネットワークEnd-to-End音声認識ためのMulti-Head Decoderネットワーク
End-to-End音声認識ためのMulti-Head Decoderネットワーク
 
空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調/抑圧法
空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調/抑圧法空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調/抑圧法
空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調/抑圧法
 
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
 
Hands on Voice Conversion
Hands on Voice ConversionHands on Voice Conversion
Hands on Voice Conversion
 
Advanced Voice Conversion
Advanced Voice ConversionAdvanced Voice Conversion
Advanced Voice Conversion
 
Deep Neural Networkに基づく日常生活行動認識における適応手法
Deep Neural Networkに基づく日常生活行動認識における適応手法Deep Neural Networkに基づく日常生活行動認識における適応手法
Deep Neural Networkに基づく日常生活行動認識における適応手法
 
CTCに基づく音響イベントからの擬音語表現への変換
CTCに基づく音響イベントからの擬音語表現への変換CTCに基づく音響イベントからの擬音語表現への変換
CTCに基づく音響イベントからの擬音語表現への変換
 
Missing Component Restoration for Masked Speech Signals based on Time-Domain ...
Missing Component Restoration for Masked Speech Signals based on Time-Domain ...Missing Component Restoration for Masked Speech Signals based on Time-Domain ...
Missing Component Restoration for Masked Speech Signals based on Time-Domain ...
 

異常音検知に対する深層学習適用事例