SlideShare a Scribd company logo
1 of 26
Download to read offline
異常音検知の実用化に向けて
Tokyo BISH Bash #07
2022.7.6 
Hmcomm 株式会社
山口凌平 1
contents
- 自己紹介
- 研究的側面の異常音検知
- 異常音検知の研究的位置づけ
- 異常音検知の歴史
- ビジネス的側面の異常音検知
- 異常音検知のビジネス的位置づけ
- 異常音検知の応用シーン
- ビジネス応用における課題
- FAST-D による異常音検知
- FAST-Dの構成システム
- FAST-Dデモ
2
contents
- 自己紹介
- 研究的側面の異常音検知
- 異常音検知の研究的位置づけ
- 異常音検知の歴史
- ビジネス的側面の異常音検知
- 異常音検知のビジネス的位置づけ
- 異常音検知の応用シーン
- ビジネス応用における課題
- FAST-D による異常音検知
- FAST-Dの構成システム
- FAST-Dデモ
3
自己紹介
山 口 凌 平
お仕事
- 異常音検知の研究開発
 工場パイプライン,設備機器,設備機械室
- 異常音検知プラットフォームの開発
SNS
- Twitter : @6111Ryo
最近やっていること
- SaaSビジネスについて
- ワインの勉強
趣味
- 料理:お店の味を再現することが生きがいです
- テニス:中級レベルになったばかりです
AWS Certified Machine Learning Speciality
4
contents
- 自己紹介
- 研究的側面の異常音検知
- 異常音検知の研究的位置づけ
- 異常音検知の歴史
- ビジネス的側面の異常音検知
- 異常音検知のビジネス的位置づけ
- 異常音検知の応用シーン
- ビジネス応用における課題
- FAST-D による異常音検知
- FAST-Dの構成システム
- FAST-Dデモ
5
異常音検知の研究的位置づけ
環境音の特徴を活用した音響イベント検出・シーン分類 (井本桂右) より
環境音分析の中の異常音検知
6
異常音検知の歴史
Anomalous Sound Detection with Machine Learning: A Systematic Review より
・2019年から論文の数も増加
・論文著者の数は日本人が多い
異常音検知の研究はごく最近盛り上がり始めている
共通データセット ・ コンペ
音響シーン分析の研究の中でもまだまだ未熟でこれからの分野
ToyADMOS / MIMⅡ DCASE task 2
7
※発表者個人的な意見です
異常音検知のモデルの推移
AE Series
CNN Series
Deep AE
VAE
LSTM-AE
CNN-AE
Conv-LSTM-AE
DenseNet
MobileNet
ResNet-50
2014 2015 2016 2017 2018 2019 2020 2021
最近は転移学習を使いスペクトログラムを
画像のように扱うことが多い
スペクトログラムを
使用したAE
One-Class SVM
GMM
Anomalous Sound Detection with Machine Learning: A Systematic Review より
8
contents
- 自己紹介
- 研究的側面の異常音検知
- 異常音検知の研究的位置づけ
- 異常音検知の歴史
- ビジネス的側面の異常音検知
- 異常音検知のビジネス的位置づけ
- 異常音検知の応用シーン
- ビジネス応用における課題
- FAST-D による異常音検知
- FAST-Dの構成システム
- FAST-Dデモ
9
異常音検知のビジネス的位置づけ
マイク
カメラ
センサー
・・・・  画像異常検知
・・・・  振動異常検知
・・・・  異常音検知
異常検知の中の異常音検知
10
異常音検知のビジネス的位置づけ
音 画像
振動
(センサー)
対象範囲 内部の異常 表面の異常 内部の異常
環境ノイズの
影響
大
対象とは異なる方向からの情報も
収集する
中
対象とする機器のみの情報を
取得できる.
照明の影響を受ける
小
対象とする機器の情報を直接
取得できる
データの
直感的理解
◯
ヒトが聞いて判断できる
ヒトによって異なる
◎
ヒトが見て判断できる
ヒトによらないことが多い
△
ヒトが五感で判断が困難
設置の容易さ
◯
非接触で設置可能
△
非接触で設置可能
画角の調整 有
△
接触で設置
専用の穴を空ける必要性有
11
異常音検知の応用シーン
12
異常音検知の応用シーン
解決したい
社会的課題
対象音 豚の咳
くしゃみ
ヒトの心音
イヌの心音
生活音
空調機械
鉄道の線路
製造製品
応用シーン
熟練者・後継者 不足
遠隔点検・監視
スマートファクトリー
Condition Based Maintenance
スマートホーム スマート農業
遠隔医療
道路
設備機器
製造機器 13
異常音検知の応用シーンとデータの関係
異常データ量:多い
(比較的多い)
異常データ量:少ない
(殆ど無し)
正常データの多様性:低い
正常データの多様性:高い
14
異常音検知の応用シーンと手法
異常データ量:多い
(比較的多い)
異常データ量:少ない
(殆ど無し)
正常データの多様性:低い
正常データの多様性:高い
教師なし異常音検知
少量データを利用した音響イベント検出
DCASE task4, task5
DCASE task2
15
ビジネスにおける異常音検知の課題
そもそもデータが蓄えられていない
異常音が無いため評価ができない
異常検知の精度
異常音検知の XAI
16
ビジネスにおける異常音検知の課題
ビジネスにおける異常音検知はスモールデータ
データセットの構築・収集が難しい
→ ほとんどデータとして蓄えられていない
→ ディープラーニングで解決することが難しい( DCACE task2のテクニックは使いづらい)
→ 音響の物理的特性やデータの発生を仮定した特徴量設計なども必要となる
そもそもデータが蓄えられていない
17
ビジネスにおける異常音検知の課題
異常音が無いため評価ができない
擬似的に異常音を作成して評価に利用する
→ いくつかの異常音サンプルと正常音サンプルを使用して疑似異常音を作成し,
  現場の方に視聴してもらい尤もらしい異常データを作成する
→ ユーザーやクライアントと一緒にこういった異常を検知できますよと
  検知対象音に対するの認識を合わせておく必要がある
正常 異常1 異常2 異常3
18
ビジネスにおける異常音検知の課題
実現場での精度は AUC=0.99 でも不十分のときもある
→ 大事なのは FPR を 0 にした上で 実用的に十分な TPR がいくらかなのかを決めること
  プロジェクト初期の段階でユーザーと認識を合わせておく
→ post process による処理
異常検知の精度
ある区間の 50% がしきい値を超えると異常
誤報が発生 誤報を抑制
19
ビジネスにおける異常音検知の課題
異常音検知の XAI
異常/正常の判定結果の理由の説明
→ ユーザーやクライアントによっては 〇〇の違いがあるから異常
  と判定されるといった原因箇所などを示す必要がある
→ 異常箇所の可視化や異常判定音声の再生機能などが必要になる
正常時の異常スコア
異常時の異常スコア
20
contents
- 自己紹介
- 研究的側面の異常音検知
- 異常音検知の研究的位置づけ
- 異常音検知の歴史
- ビジネス的側面の異常音検知
- 異常音検知のビジネス的位置づけ
- 異常音検知の応用シーン
- ビジネス応用における課題
- FAST-D による異常音検知
- FAST-Dの構成システム
- FAST-Dデモ
21
FAST-Dの対象シーン
異常データ量:多い
(比較的多い)
異常データ量:少ない
(殆ど無し)
正常データの多様性:低い
正常データの多様性:高い
22
FAST-D
常設マイクで集音

(24時間365日)

AIで判定

(エッジ端末から結果をクラウドへ)

状況のモニタリングと通知

(クラウドにアクセスして確認)

異常

機械室内の熱源機、空調機、排気ファン、吸気ファン等が発する音をAIで分析して、

 故障時の早期対応、部品交換時期の見極めや、予防保守に活かせるサービスです。

サービス概要
 建物機械室内の機器稼働音をモニタリングして、

故障+故障予兆を検知できるクラウドサービス

現場の端末でAI推論を実施し、その結果をクラウドで管理できるサービスです。
結果は、PCブラウザにて閲覧 23
FAST-D システム構成
24
FAST-Dを使った異常音検知 DEMO
25
当日は DEMO を実演
おわりに
音に関わるみなさん!!
いっしょに異常音検知を盛り上げましょう 🎉
&
Hmcommもよろしくおねがいします 󰚍
thanks :)
● 異常音検知の研究について
○ ここ数年で研究が発達
○ まだまだ未解決な問題も多い(ドメインシフト,環境ノイズ対策,
etc)
○ 日本頑張っている
● 異常音検知のビジネスについて
○ 機械の音だけでなくヘルスケア業界の応用もある
○ 熟練者・後継者不足が社会的課題として大きい
○ データが無いため評価の方法を工夫する必要がある
● FAST-Dについて
○ 誰でも使いやすいシンプルな異常音検知サービス
26

More Related Content

What's hot

【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習cvpaper. challenge
 
深層学習と音響信号処理
深層学習と音響信号処理深層学習と音響信号処理
深層学習と音響信号処理Yuma Koizumi
 
マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向Koichiro Mori
 
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)Shota Imai
 
動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセットToru Tamaki
 
ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方BrainPad Inc.
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門Kawamoto_Kazuhiko
 
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs 【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs Deep Learning JP
 
【DL輪読会】Segment Anything
【DL輪読会】Segment Anything【DL輪読会】Segment Anything
【DL輪読会】Segment AnythingDeep Learning JP
 
分散学習のあれこれ~データパラレルからモデルパラレルまで~
分散学習のあれこれ~データパラレルからモデルパラレルまで~分散学習のあれこれ~データパラレルからモデルパラレルまで~
分散学習のあれこれ~データパラレルからモデルパラレルまで~Hideki Tsunashima
 
距離学習を導入した二値分類モデルによる異常音検知
距離学習を導入した二値分類モデルによる異常音検知距離学習を導入した二値分類モデルによる異常音検知
距離学習を導入した二値分類モデルによる異常音検知NU_I_TODALAB
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門Takuji Tahara
 
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)Shota Imai
 
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法Deep Learning JP
 
環境音の特徴を活用した音響イベント検出・シーン分類
環境音の特徴を活用した音響イベント検出・シーン分類環境音の特徴を活用した音響イベント検出・シーン分類
環境音の特徴を活用した音響イベント検出・シーン分類Keisuke Imoto
 
Noisy Labels と戦う深層学習
Noisy Labels と戦う深層学習Noisy Labels と戦う深層学習
Noisy Labels と戦う深層学習Plot Hong
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類Shintaro Fukushima
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向Motokawa Tetsuya
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!TransformerArithmer Inc.
 

What's hot (20)

Data-Centric AIの紹介
Data-Centric AIの紹介Data-Centric AIの紹介
Data-Centric AIの紹介
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
 
深層学習と音響信号処理
深層学習と音響信号処理深層学習と音響信号処理
深層学習と音響信号処理
 
マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向
 
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
 
動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット
 
ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
 
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs 【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
 
【DL輪読会】Segment Anything
【DL輪読会】Segment Anything【DL輪読会】Segment Anything
【DL輪読会】Segment Anything
 
分散学習のあれこれ~データパラレルからモデルパラレルまで~
分散学習のあれこれ~データパラレルからモデルパラレルまで~分散学習のあれこれ~データパラレルからモデルパラレルまで~
分散学習のあれこれ~データパラレルからモデルパラレルまで~
 
距離学習を導入した二値分類モデルによる異常音検知
距離学習を導入した二値分類モデルによる異常音検知距離学習を導入した二値分類モデルによる異常音検知
距離学習を導入した二値分類モデルによる異常音検知
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門
 
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
 
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法
 
環境音の特徴を活用した音響イベント検出・シーン分類
環境音の特徴を活用した音響イベント検出・シーン分類環境音の特徴を活用した音響イベント検出・シーン分類
環境音の特徴を活用した音響イベント検出・シーン分類
 
Noisy Labels と戦う深層学習
Noisy Labels と戦う深層学習Noisy Labels と戦う深層学習
Noisy Labels と戦う深層学習
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!Transformer
 

異常音検知の実用化に向けて