[DL輪読会]An Iterative Framework for Self-supervised Deep Speaker Representation Learning
1. 1
DEEP LEARNING JP
[DL Papers]
http://deeplearning.jp/
An Iterative Framework for Self-supervised Deep
Speaker Representation Learning
Hiroshi Sekiguchi, Morikawa Lab
2. 書誌情報
• “An Iterative Framework for Self-supervised Deep Speaker
Representation Learning ”
Danwei Cai!, Weiqing Wang!, Ming Li!†
!Department of Electrical and Computer Engineering, Duke University, Durham, USA
†Data Science Research Center, Duke Kunshan University, Kunshan, China
2021 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP 2021) , pp.6728-6732
https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9414713
• 概要
– 話者認識(Speaker Recognition)の分野で、①Contrastive learning+clustering
+purifying+擬似ラベルベースspeaker classficationを用いて、② 上記を繰
り返し学習することで、従来のContrastive learningよりも、よい話者表現が
得られた。
– この表現を、話者認識の一応用である話者照合(Speaker Verification)タス
クで適用したところ、話者認証性能が、単純なContrastive learningよりも向
上した。
• 動機:複数音声分離に話者同定の技術を組み込むことで音声分離
の向上を検討 2