基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)

基底変形型教師あり NMF による
実楽器信号分離
奈良先端科学技術大学院大学
北村大地猿渡洋鹿野清宏
ヤマハ株式会社
近藤多伸高橋祐
Signal separation for real instruments based on
supervised NMF with basis deformation

研究背景
• 複数の楽器が多重に混合された音楽信号の
中から，特定の楽器音を分離・抽出する技術
は，一般に多重音解析と呼ばれる
• ユーザの好み応じて各楽器音を編集する新
しい音楽の楽しみ方や，音楽信号の自動採
譜等に応用できる重要な技術
2

• 多重音解析に用いられる技術の一つとして，
非負値行列因子分解がある [Lee, 1999]
• 効率的な反復アルゴリズムが提案され，画像
処理，音響信号処理等様々な分野に応用さ
れる
研究背景
3

Time [sec]
Frequency[Hz]
Nonnegative Matrix Factorization (NMF)
4
…
…
…
…
頻出スペクトル
各スペクトルの
タイミングと音量

Time [sec]
Frequency[Hz]
Nonnegative Matrix Factorization (NMF)
5
…
…
…
…
アクティベーション行列
スペクトル基底行列

• 分離する楽器の教師音を用いる手法
学習プロセス
罰則条件付き教師あり NMF [八木, 2010]
6
目的の楽器の教師音を
用いて学習した基底
分離プロセス教師基底を固定してを構成

• 分離する楽器の教師音を用いる手法
学習プロセス
7
目的の楽器の教師音を
用いて学習した基底
分離プロセス教師基底を固定してを構成
から再構成した
スペクトログラムが分離結果

• 教師基底とその他の基底が互いに無相
関となる罰則条件を与える
8
に教師基底と同じスペクトル
パターンが現れた場合，から
得られる抽出音に欠損が生じる
Ex.

実楽器音を対象とした NMF の信号分離
• 本研究では，実楽器の混合信号から目的の
楽器音を分離する
• 従来手法では，混合信号中の目的楽器音と
教師音の音色に差があると分離精度が著しく
劣化する
9
信号分解
実楽器の混合信号
教師音
分離音

• 本研究では，実楽器の混合信号から目的の
楽器音を分離する
• 従来手法では，混合信号中の目的楽器音と
教師音の音色に差があると分離精度が著しく
劣化する
10
信号分解
実楽器の混合信号
教師音
分離音音色に差があると
分離精度が低下

• 同じ種類の楽器であっても，音色は楽器の個
体差や演奏者などに強く依存
• 事前に入手可能な教師音を分離対象音に適
応させる新たな分解手法が必要
11
事前入手可能な教師音
分離対象音

• 次のような分解を提案する
• 教師基底の変形項として，共通のアクティ
ベーションを持つスペクトル基底を導入
• 教師基底を変形して目的音に合わせる
基底変形型教師あり NMF
12
を
分離結果とする
目的音のスペクトル
教師音のスペクトル
Amplitude
Frequency
減算
加算

• 基底は加算と減算に対応した変形項
• は以下の制約下で正負値を持つ
• は教師基底に対する減算の許容範囲
13
減算
の場合 30%まで
減算可能

• 基底は，教師基底と同じアクティベー
ションを持つため，分離目的音と同じタイミ
ングで生じる別の楽器のスペクトルが現れる
恐れがある
14
ととが
全て別の基底
目的音
非目的音

• 基底は，教師基底と同じアクティベー
ションを持つため，分離目的音と同じタイミ
ングで生じる別の楽器のスペクトルが現れる
恐れがある
15
同じタイミングで生じる別の楽器
が，基底に現れる恐れがある
ととが
全て別の基底
目的音
非目的音

• 目的関数
基底変形型教師あり NMF 目的関数
16

• 通常の NMF の更新式導出と同様に補助関
数法を用いる
• 目的関数の上限を与える補助関数を以
下のように定義
• とはそれぞれ対数項と罰則項の
上限，は定数
基底変形型教師あり NMF 更新式導出
17

• 補助関数を最小化することで，間接的に
目的関数を最小化
• 基底の更新式を導出するためにを
で偏微分しとおくと以下の式を得る
18

• 補助関数を最小化することで，間接的に
目的関数を最小化
• 基底の更新式を導出するためにを
で偏微分しとおくと以下の式を得る
19
正負の値を持つ

基底変形型教師あり NMF 更新式
20
基底行列更新式 (一般化 KL divergence 規準)

21
基底行列更新式 (一般化 KL divergence 規準)

22
アクティベーション行列更新式
(一般化 KL divergence 規準)

基底変形型教師あり NMF 実験条件
23
入力信号実録の Fl. と Cl. の 2 楽器の等パワー混合信号
教師信号
Fl. と Cl.の MIDI 音
入力信号の音域をカバーする範囲において
半音階で2オクターブ上昇する信号
STFT
窓関数：矩形 → ハニング
窓長： 92.9 msec, シフト長: 46.4 msec
教師基底数 100
その他基底数 50
変形許容範囲 0.3
更新回数学習プロセス：500, 分離プロセス：400
各行列の初期値乱数
各罰則項の重み実験的に調整した値
分離精度評価値 SDR, SIR, SAR (10回試行の平均値)

客観的評価尺度
• 分離した推定信号が次式で表現できると仮
定する
24
SDR ：分離した目的音の品質
SIR ：分離した目的音と非目的音との分離度合
SAR ：一連の信号処理によって生じた歪みの少なさ
高いほうが
良い分離

• 実験結果の比較
• Fl. の分離では，全ての評価値が向上
• Cl. の分離では，SDR と SAR が向上したが，
SIR は低下
• 提案手法の分離信号はより実音に近い
基底変形型教師あり NMF 分離実験
25
入力信号
分離
目的音
従来手法提案手法
SDR SIR SAR SDR SIR SAR
Flute 5.3 13.4 6.2 7.6 16.4 8.4
Clarinet 7.2 21.1 7.4 8.9 16.9 9.9
SDR ：分離した目的音の品質
SIR ：分離した目的音と非目的音との分離度合
SAR ：一連の信号処理によって生じた歪みの少なさ

基底変形型教師あり NMF 分離実験
26
Fl. と Cl. の混合信号 Fl. のみの真の信号
従来法の Fl. 抽出信号提案法のFl. 抽出信号

• 教師音を用いた実楽器音の音源分離手法と
して，基底変形型教師あり NMF を提案
• 提案法は従来法より優れた分離を実現し，よ
り実音に近い自然な分離音が得られる
• 様々な実楽器に適応して分離精度を比較
• 罰則項の重みパラメータの最適値推定方法
の検討
• マルチチャネル信号分解への応用
まとめと今後
27

基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (12)

Similar to 基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)

Similar to 基底変形型教師ありNMFによる実楽器信号分離 (in Japanese) (6)

More from Daichi Kitamura

More from Daichi Kitamura (9)

基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)

Editor's Notes