11. 実験条件
• DNNの学習条件
• 評価音源(SiSEC2011)
10
Song ID Song name Signal length [s]
1 dev1__bearlin-roads 14.0
2 dev2__another_dreamer-the_ones_we_love 25.0
3 dev2__fort_minor-remember_the_name 24.0
4 dev2_ultimate_nz_tour 18.0
データセット
SiSEC2016データベースのドラム (Dr.) 及び
ボーカル (Vo.) 音源100曲 (16 kHz)
FFT窓長/シフト長 128 ms/64 ms
境界周波数 4 kHz(ナイキスト周波数の半分)
エポック数/ミニバッチ数 1000/128
最適化法 Adam (学習率η=0.001)
12. 実験1:結果
• 各評価音源に対するSAR値の比較
• 混合信号の高周波帯域をDNNに入力する提案フレーム
ワークの妥当性を確認
11
Song ID 混合信号を入力しないDNN 混合信号を入力するDNN
1
Dr. : 21.1 dB Dr. : 28.0 dB
Vo. : 21.8 dB Vo. : 31.5 dB
2
Dr. : 22.0 dB Dr. : 21.8 dB
Vo. : 12.7 dB Vo. : 19.6 dB
3
Dr. : 15.0 dB Dr. : 20.4 dB
Vo. : 11.2 dB Vo. : 18.5 dB
4
Dr. : 11.0 dB Dr. : 18.2 dB
Vo. : 10.4 dB Vo. : 15.3 dB