More Related Content
PPTX
半教師あり非負値行列因子分解における音源分離性能向上のための効果的な基底学習法 PPTX
基底変形型教師ありNMFによる実楽器信号分離 (in Japanese) PPTX
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank... PPTX
非負値行列分解の確率的生成モデルと多チャネル音源分離への応用 (Generative model in nonnegative matrix facto... PPTX
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep... PPTX
非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法 PPTX
コサイン類似度罰則条件付き半教師あり非負値行列因子分解と音源分離への応用 PPTX
独立低ランク行列分析に基づくブラインド音源分離(Blind source separation based on independent low-rank... What's hot
PPTX
Music signal separation using supervised nonnegative matrix factorization wit... PPTX
コサイン類似度罰則条件付き非負値行列因子分解に基づく音楽音源分離 PPTX
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou... PPTX
スペクトログラム無矛盾性に基づく独立低ランク行列分析 PPTX
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia... PPTX
スペクトログラム無矛盾性を用いた独立低ランク行列分析の実験的評価 PPTX
統計的独立性と低ランク行列分解理論に基づくブラインド音源分離 –独立低ランク行列分析– Blind source separation based on... PDF
フィラーを含む自発音声合成モデルの品質低下原因の調査と一貫性保証による改善 PPTX
音源分離における音響モデリング(Acoustic modeling in audio source separation) PPTX
調波打撃音分離の時間周波数マスクを用いた線形ブラインド音源分離 PPTX
音楽信号処理における基本周波数推定を応用した心拍信号解析 PDF
PDF
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析 PPTX
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s... PDF
PDF
[DL輪読会]Discriminative Learning for Monaural Speech Separation Using Deep Embe... PPTX
ICASSP2017読み会(関東編)・AASP_L3(北村担当分) PPTX
PDF
PPTX
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~ Similar to 直交化及び距離最大化則条件を用いた教師あり非負値行列因子分解による音楽信号分離
PPTX
PDF
PDF
PPTX
PPTX
PDF
PPTX
深層学習に基づく周波数帯域補間手法による音源分離処理の高速化 PPTX
時間微分スペクトログラムに基づくブラインド音源分離 PPTX
Divergence optimization based on trade-off between separation and extrapolati... PPTX
Optimal divergence diversity for superresolution-based nonnegative matrix fac... PPTX
深層学習に基づく音響帯域拡張による音源分離処理の高速化 PPTX
Efficient multichannel nonnegative matrix factorization with rank-1 spatial m... PPTX
深層学習に基づく間引きインジケータ付き周波数帯域補間手法による音源分離処理の高速化 PPTX
Discriminative SNMF EA201603 PPTX
Study on optimal divergence for superresolution-based supervised nonnegative ... PDF
Divergence optimization based on trade-off between separation and extrapolati... PPTX
Evaluation of separation accuracy for various real instruments based on super... PPTX
スペクトログラム無矛盾性を用いた独立低ランク行列分析の実験的評価 PDF
More from 奈良先端大 情報科学研究科
PPTX
9. マイコンと機械学習を使って行動認識システムを作ろう PPTX
18. 計測に基づいた写実的なコンピュータグラフィクスの生成法 PPTX
16. マイコンと機械学習を使って行動認識システムを作ろう PPTX
PPTX
15. テレイグジスタンスシステムを制作してみよう PPTX
11.実装の脆弱性を利用して強力な暗号を解読してみよう! PPTX
PPTX
14. ビデオシースルーHMDで視覚拡張の世界を体感しよう PPTX
PPTX
PPTX
PPTX
20. 友好的関係を構築する人と対話ロボットのコミュニケーション技術開発 PPTX
マイコンと機械学習を使って行動認識システムを作ろう PPTX
20. 地理ビッグデータ利活用: リスク予測型自動避難誘導,地理的リスク分析 PPTX
14. モバイルエージェントによる並列分散学習システムの構築 PPTX
PPTX
21. 人の動作・行動センシングに基づく拡張現実感システムの開発 PPTX
PPTX
21.Raspberry Piを用いたIoTアプリの開発 PPTX
Recently uploaded
PDF
エンジニアが選ぶべきAIエディタ & Antigravity 活用例@ウェビナー「触ってみてどうだった?Google Antigravity 既存IDEと... PDF
Machine Tests Benchmark Suite. Explain github.com/alexziskind1/machine_tests #2 PDF
Machine Tests Benchmark Suite. Explain github.com/alexziskind1/machine_tests #1 PDF
流行りに乗っかるClaris FileMaker 〜AI関連機能の紹介〜 by 合同会社イボルブ PDF
20251210_MultiDevinForEnterprise on Devin 1st Anniv Meetup PPTX
楽々ナレッジベース「楽ナレ」3種比較 - Dify / AWS S3 Vector / Google File Search Tool 直交化及び距離最大化則条件を用いた教師あり非負値行列因子分解による音楽信号分離
- 1.
Music Signal SeparationUsing Supervised
Nonnegative Matrix Factorization with Orthogonality
and Maximum-divergence Penalties
直交化及び距離最大化則条件を用いた
教師あり非負値行列因子分解による音楽信号分離
北村大地, 猿渡洋, 八木浩介, 鹿野清宏
(奈良先端科学技術大学院大学)
高橋祐, 近藤多伸
(ヤマハ株式会社)
- 2.
発表の流れ
• 研究背景
• 従来手法
–非負値行列因子分解
– 教師あり非負値行列因子分解
– 従来手法の問題点
• 提案手法
– 罰則条件付き教師あり非負値行列因子分解
• 基底直交化罰則条件
• 基底間距離最大化罰則条件
• 評価実験
– 2音源混合信号
– 4音源混合信号
• まとめ
2
- 3.
発表の流れ
• 研究背景
• 従来手法
–非負値行列因子分解
– 教師あり非負値行列因子分解
– 従来手法の問題点
• 提案手法
– 罰則条件付き教師あり非負値行列因子分解
• 基底直交化罰則条件
• 基底間距離最大化罰則条件
• 評価実験
– 2音源混合信号
– 4音源混合信号
• まとめ
3
- 4.
- 5.
発表の流れ
• 研究背景
• 従来手法
–非負値行列因子分解
– 教師あり非負値行列因子分解
– 従来手法の問題点
• 提案手法
– 罰則条件付き教師あり非負値行列因子分解
• 基底直交化罰則条件
• 基底間距離最大化罰則条件
• 評価実験
– 2音源混合信号
– 4音源混合信号
• まとめ
5
- 6.
従来手法: 非負値行列因子分解
[Lee, etal., 2012]
• 非負値行列因子分解 (nonnegative matrix factorization: NMF)
Amplitude
Frequency
Frequency
– スパース分解表現による特徴量抽出手法
Amplitude
Time
観測行列
(スペクトログラム)
Time
パーツ,基底
アクティベーション行列
(時間的なゲイン変化)
基底行列
(頻出スペクトルパターン)
Ω: 周波数ビン数
𝑇: 時間フレーム数
𝐾: 基底数
• 分解された基底を音源毎に選別する教師無しNMFは非常に困難
6
- 7.
従来手法: 教師ありNMF (SNMF)[Smaragdis, et al., 2007]
• 分離したい目的音の教師 (サンプル) 音を事前に学習
– 学習プロセスで教師スペクトル基底 (dictionary) を作成
– 分離プロセスで目的音
と,非目的音
に分離
学習プロセス
音階情報等
分離目的音の教師音
教師音から作成した教師スペクトル基底
最適化
分離プロセス
混合音
固定
目的音
非目的音
7
- 8.
従来手法の問題点
• SNMFにおける基底共有問題
– 教師基底とその他の基底 の間には特に制約が無い
– 目的音のスペクトルがその他の基底 に現れる可能性がある
その他の基底
に教師と同じスペクトルが現れた場合
本来の目的信号
推定目的音
– 推定した目的音には欠損が生じる
– コスト関数が混合信号 と
れているため
推定非目的音
の距離のみで定義さ
8
- 9.
- 10.
- 11.
- 12.
発表の流れ
• 研究背景
• 従来手法
–非負値行列因子分解
– 教師あり非負値行列因子分解
– 従来手法の問題点
• 提案手法
– 罰則条件付き教師あり非負値行列因子分解
• 基底直交化罰則条件
• 基底間距離最大化罰則条件
• 評価実験
– 2音源混合信号
– 4音源混合信号
• まとめ
12
- 13.
- 14.
- 15.
- 16.
基底直交化罰則条件
• 教師基底 とその他の基底
くなるを求める
– 類似した基底が現れると
の内積ができるだけ小さ
は大きな値になる
• 基底は全て周波数方向の総和が1になる制限を与える
– NMFにおけるスケールの任意性を無くすため
• コスト関数に付与する際に重み係数
通常のNMFは
スケールが任意
を与える
16
- 17.
- 18.
- 19.
- 20.
- 21.
- 22.
- 23.
- 24.
発表の流れ
• 研究背景
• 従来手法
–非負値行列因子分解
– 教師あり非負値行列因子分解
– 従来手法の問題点
• 提案手法
– 罰則条件付き教師あり非負値行列因子分解
• 基底直交化罰則条件
• 基底間距離最大化罰則条件
• 評価実験
– 2音源混合信号
– 4音源混合信号
• まとめ
24
- 25.
実験条件
• MIDI信号で作成したモノラル音源
• Clarinet,Oboe, Piano, Celloの4種類
• 2音源混合と4音源混合の信号で評価
– 2音源は全12パターン,4音源は全4パターンの平均評価値を算出
• 教師音は分離目的音の音域をカバーする同じMIDIの音階情報
教師用
音源信号
目的音源の音域をカバーする2オクターブの24音階
25
- 26.
- 27.
実験結果: 2音源混合
• 全12パターンの平均評価値を算出
16
16
14
14
8従来
SNMF
6
16
14
12
12
10
PSNMF
PSNMF (距離最大化)
(直交化)
10
SDR [dB]
SDR [dB]
10
PSNMF PSNMF
(直交化) (距離最大化)
SDR [dB]
12
PSNMF PSNMF
(直交化) (距離最大化)
8
6
従来
SNMF
従来
8 SNMF
6
4
4
2
2
2
0
0
0
0
• 全ての
1
2
4
0
1
2
0
1
2
において従来手法から大きく改善された
– 基底共有問題を防ぐことができたため
– 直交化罰則と距離最大化罰則に大きな差はない
27
- 28.
実験結果: 4音源混合
• 全4パターンの平均評価値を算出
14
14
12
12
従来
8SNMF
14
PSNMF
PSNMF (距離最大化)
(直交化)
10
従来
8 SNMF
12
SDR [dB]
6
10
SDR [dB]
SDR [dB]
PSNMF PSNMF
10 (直交化) (距離最大化)
従来
8 SNMF
PSNMF PSNMF
(直交化) (距離最大化)
6
6
4
4
4
2
2
2
0
0
0
0
1
2
0
1
2
0
1
2
• 2音源混合と同様に大きく改善された
28
- 29.
- 30.
- 31.