SlideShare a Scribd company logo
USVSEG
齧歯超音波発声の検出手法
橘 亮輔
Tachibana RO, Kanno K, Okabe S, Kobayasi KI, Okanoya K (2020)
USVSEG: A robust method for segmentation of ultrasonic vocalizations in rodents.
PLOS ONE 15(2) e0228907
論文:
文脈①:小鳥の歌解析(本職)
• 音区間自動切り出し、教師あり識別
• 線型サポートベクタマシン
• 532次元の音響特徴量空間
• 教師60秒分(~400個)だけで、
1日分のデータ(~3万個)の分類。
2Tachibana et al. (2014) PLoS ONE
label ‘A’
other
識別
境界
マージン
Linear SVM
文脈②:齧歯USV研究への接近
• 他の動物の音声解析技術
• 生物学・心理学・動物行動学の人たちが結構困っている
• ノイズと声の分離
• 声の音響特徴量
• 主にネズミ(マウス・ラット・他)、次にマーモセット
• ASDモデルのコミュニケーション
• 母子間コミュニケーション
• 友人のマウス研究者にたいする技術協力
• 流し録音から音声個所を切り出し+特徴量計算
• 録音環境・機材からみなおし
• ネズミの超音波発声 (ultrasonic vocalization: USV) への興味
• 齧歯の音声はだいたい超音波 (20~100 kHz)
• 求愛行動中の音声系列にはなんらかのパターンがある
• 齧歯USVは非学習性だが、発達による変化はあるかも
• 小鳥の歌との類似性?
3
目的
USVをいっぱい録音して測定の信頼度を上げたい
しかしこれまでは、
• ノイズに埋もれがち
• 手作業で切り出すのは大変
そこで、
• ノイズを低減しながら、USVの発声区間をきっちり
取り出してくるプログラムが欲しい
なお、個人的なこだわりとして
• 音響的に解釈可能な方法がいいなあ
(“AI”とかじゃなくて…)
4
敵を知る①:マウスUSV
• 成体の求愛時・仔マウスの体温低下時
• 40-100 kHz
5Time (s)
A_140513Aco59_2Home1
10 11 12 13 14 15 16 17 18 19 20
0
20
40
60
80
100
120
13.8 14 14.2 14.4 14.6 14.8 15 15.2 15.4 15.6
0
20
40
60
80
100
120
Frequency(kHz)Frequency(kHz)
敵を知る②:ラットUSV
• 嬉しいとき(40-60 kHz)
6
• 嫌なとき(20-25 kHz)
29.1 29.2 29.3 29.4 29.5 29.6 29.7 29.8 29.9 30.0 30.1
0
20
40
60
80
100
120
29 30 31 32 33
0
20
40
60
80
100
120
Frequency(kHz)
Time (s) Time (s)
25 26 27 28 29 30 31 32 33 34
0
20
40
60
80
100
120
Frequency(kHz)
Time (s)
敵を知る③:USVと背景雑音
• ノイズのスペクトルは大体broad
• ケージひっかき音、床敷きガサガサ
• USVは周波数的にすごく局所的
7
Frequency
Amplitude
USV
noise
戦略
• 要求
• サンプリングレート:250 kHz
• 時間ステップ:0.5 ms
• 時間窓:2 ms
• 周波数解像度:500 Hzくらい(50 kHzに対して1%)
→ FFTサイズ:512
• 方針
• USV成分(周期的・局所的)を目立たせるような処理をする
• なんらかの方法で閾値設定し、これを超えたものをUSVとする
• 背景ノイズを「平坦」にすることで、閾値の定義をシンプルにする
8
Frequency
Amplitude
USV
noise
Frequency
Amplitude
USV
noise
平坦化
閾値
時間窓をどうするか
• 普通の窓だとスペクトル
ピークがいっぱい生じる
• サイドローブと背景雑音
の干渉?
• 移動平均すると信号の
ピークが減る
9
20 40 60 80 100
-40
-30
-20
-10
0
20 40 60 80 100
-40
-30
-20
-10
0
20 40 60 80 100
-40
-30
-20
-10
0
20 40 60 80 100
-40
-30
-20
-10
0
20 40 60 80 100
-40
-30
-20
-10
0
20 40 60 80 100
-40
-30
-20
-10
0
SNR
6 dB
0 dB
-3 dB
Frequency (kHz)
Hann窓でのスペクトル 6点移動平均
Frequency (kHz)
55 kHz正弦波+白色雑音
Hann窓
time
せや、窓いっぱいつこたろ
• 直交する窓をいっぱい使う
• 多重窓 multitaper method
• 個々の窓をかけてはFFTし、
振幅スペクトルを合算する
→スペクトルのバタつき減る
• 窓系列はエネルギが特定の幅に
集中するよう設計
• 「離散扁長回転楕円体系列
(DPSS)」「Slepian系列」
• 窓の数だけFFTするので遅い
• 窓の数だけピークが太くなる
10
①
②
③
④
⑤
⑥ time
多重窓はいいぞ
• ピークは太くなるが、見つけやすい
11
20 40 60 80 100
-40
-30
-20
-10
0
20 40 60 80 100
-40
-30
-20
-10
0
20 40 60 80 100
-40
-30
-20
-10
0
20 40 60 80 100
-40
-30
-20
-10
0
20 40 60 80 100
-40
-30
-20
-10
0
20 40 60 80 100
-40
-30
-20
-10
0
SNR
6 dB
0 dB
-3 dB
Frequency (kHz) Frequency (kHz)
55 kHz正弦波
+白色雑音
多重窓Hann窓
さらに、平坦化
• 背景ノイズの概形を推定して差っ引くことで平らにする
• 周波数方向:
• 各時刻のスペクトルについて、ケプストラムの低次成分を差分
(high-pass liftering)
• 時間方向:
• スペクトルの中央値を差分
12
提案法の全体像
13
閾値どうする?
• 平坦化スペクトログラムの振幅分布をみると…
• 背景雑音が正規分布(の対数) っぽい。このSDを基準に閾値を決定。
• 背景ノイズレベルに応じて実際の閾値(dB値)が変わる。
14
やってみた
• aa
15
比較してみた
• 多重窓 vs 単一窓(Hann窓)
• 平坦化 vs 白色化(長時間スペクトル差分)
• 平坦化がよい。SNが悪いときに多重窓がより良い。
(正解データ作成のため共著者らが人力で切り出しまくった努力の結晶である!)
16
おわりに
• 齧歯USVの医学生物学研究は広がりがある。
計測解析に音響知識がいるので結構大変かも。
• まず切り出しが大変、次に分類が大変
• 小鳥研究者はずっとそれらと戦ってきたのだ
• 分類を他に任せて、切り出すだけの方法を作った
• USV用の解析プログラムは色々提案されているが(VoICE, MUPET,
DeepSqueak等) 、切り出しに焦点を絞ったのがポイント
• 多重窓はなかなか使える子、平坦化は視覚的によい
• ホントはピーク周波数推定などに色々アイディアを盛り込んだ
が、それはまたいつか・・・
• 数学をもっと分かってればやりたいことは色々あるが
(ピーク推定に導関数を使うとか、複素多重窓を使うとか)
17
https://doi.org/10.1371/journal.pone.0228907
https://sites.google.com/view/vocalcommuj/resource
論文アクセス:
使用法サイト:

More Related Content

What's hot

異常音検知に対する深層学習適用事例
異常音検知に対する深層学習適用事例異常音検知に対する深層学習適用事例
異常音検知に対する深層学習適用事例
NU_I_TODALAB
 
心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する
Hiroshi Shimizu
 
機械学習におけるオンライン確率的最適化の理論
機械学習におけるオンライン確率的最適化の理論機械学習におけるオンライン確率的最適化の理論
機械学習におけるオンライン確率的最適化の理論
Taiji Suzuki
 
心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ
Hiroshi Shimizu
 
階層ベイズと自由エネルギー
階層ベイズと自由エネルギー階層ベイズと自由エネルギー
階層ベイズと自由エネルギー
Hiroshi Shimizu
 
Numpy scipyで独立成分分析
Numpy scipyで独立成分分析Numpy scipyで独立成分分析
Numpy scipyで独立成分分析Shintaro Fukushima
 
【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers
【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers
【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers
Deep Learning JP
 
2 7.一般化線形混合モデル
2 7.一般化線形混合モデル2 7.一般化線形混合モデル
2 7.一般化線形混合モデル
logics-of-blue
 
ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-Koichiro Gibo
 
クラシックな機械学習の入門 6. 最適化と学習アルゴリズム
クラシックな機械学習の入門  6. 最適化と学習アルゴリズムクラシックな機械学習の入門  6. 最適化と学習アルゴリズム
クラシックな機械学習の入門 6. 最適化と学習アルゴリズム
Hiroshi Nakagawa
 
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
Yui Sudo
 
PRML輪読#1
PRML輪読#1PRML輪読#1
PRML輪読#1
matsuolab
 
CV分野におけるサーベイ方法
CV分野におけるサーベイ方法CV分野におけるサーベイ方法
CV分野におけるサーベイ方法
Hirokatsu Kataoka
 
分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門
Koichiro Gibo
 
Stanでガウス過程
Stanでガウス過程Stanでガウス過程
Stanでガウス過程
Hiroshi Shimizu
 
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
Daichi Kitamura
 
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
Daichi Kitamura
 
1 6.変数選択とAIC
1 6.変数選択とAIC1 6.変数選択とAIC
1 6.変数選択とAIC
logics-of-blue
 
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
Yoshitake Takebayashi
 

What's hot (20)

異常音検知に対する深層学習適用事例
異常音検知に対する深層学習適用事例異常音検知に対する深層学習適用事例
異常音検知に対する深層学習適用事例
 
心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する
 
機械学習におけるオンライン確率的最適化の理論
機械学習におけるオンライン確率的最適化の理論機械学習におけるオンライン確率的最適化の理論
機械学習におけるオンライン確率的最適化の理論
 
心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ
 
階層ベイズと自由エネルギー
階層ベイズと自由エネルギー階層ベイズと自由エネルギー
階層ベイズと自由エネルギー
 
Numpy scipyで独立成分分析
Numpy scipyで独立成分分析Numpy scipyで独立成分分析
Numpy scipyで独立成分分析
 
【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers
【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers
【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers
 
2 7.一般化線形混合モデル
2 7.一般化線形混合モデル2 7.一般化線形混合モデル
2 7.一般化線形混合モデル
 
ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-
 
クラシックな機械学習の入門 6. 最適化と学習アルゴリズム
クラシックな機械学習の入門  6. 最適化と学習アルゴリズムクラシックな機械学習の入門  6. 最適化と学習アルゴリズム
クラシックな機械学習の入門 6. 最適化と学習アルゴリズム
 
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
 
第2回DARM勉強会
第2回DARM勉強会第2回DARM勉強会
第2回DARM勉強会
 
PRML輪読#1
PRML輪読#1PRML輪読#1
PRML輪読#1
 
CV分野におけるサーベイ方法
CV分野におけるサーベイ方法CV分野におけるサーベイ方法
CV分野におけるサーベイ方法
 
分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門
 
Stanでガウス過程
Stanでガウス過程Stanでガウス過程
Stanでガウス過程
 
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
 
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
 
1 6.変数選択とAIC
1 6.変数選択とAIC1 6.変数選択とAIC
1 6.変数選択とAIC
 
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
 

USVSEG:齧歯超音波発声の検出手法