Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
SaruwatariLabUTokyo
134,912 views
Ea2015 7for ss
Invited talk in EA Kenkyukai on July 2015
Engineering
◦
Read more
1
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 47
2
/ 47
Most read
3
/ 47
4
/ 47
Most read
5
/ 47
6
/ 47
7
/ 47
8
/ 47
Most read
9
/ 47
10
/ 47
11
/ 47
12
/ 47
13
/ 47
14
/ 47
15
/ 47
16
/ 47
17
/ 47
18
/ 47
19
/ 47
20
/ 47
21
/ 47
22
/ 47
23
/ 47
24
/ 47
25
/ 47
26
/ 47
27
/ 47
28
/ 47
29
/ 47
30
/ 47
31
/ 47
32
/ 47
33
/ 47
34
/ 47
35
/ 47
36
/ 47
37
/ 47
38
/ 47
39
/ 47
40
/ 47
41
/ 47
42
/ 47
43
/ 47
44
/ 47
45
/ 47
46
/ 47
47
/ 47
More Related Content
PPTX
ILRMA 20170227 danwakai
by
SaruwatariLabUTokyo
PDF
Kameoka2017 ieice03
by
kame_hirokazu
PPTX
Blind source separation based on independent low-rank matrix analysis and its...
by
Daichi Kitamura
PDF
Asj2017 3invited
by
SaruwatariLabUTokyo
PDF
独立深層学習行列分析に基づく多チャネル音源分離(Multichannel audio source separation based on indepen...
by
Daichi Kitamura
PPTX
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...
by
Daichi Kitamura
PDF
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
by
Naoya Takahashi
PPTX
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
by
Daichi Kitamura
ILRMA 20170227 danwakai
by
SaruwatariLabUTokyo
Kameoka2017 ieice03
by
kame_hirokazu
Blind source separation based on independent low-rank matrix analysis and its...
by
Daichi Kitamura
Asj2017 3invited
by
SaruwatariLabUTokyo
独立深層学習行列分析に基づく多チャネル音源分離(Multichannel audio source separation based on indepen...
by
Daichi Kitamura
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...
by
Daichi Kitamura
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
by
Naoya Takahashi
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
by
Daichi Kitamura
What's hot
PDF
深層生成モデルに基づく音声合成技術
by
NU_I_TODALAB
PDF
近接分離最適化によるブラインド⾳源分離(Blind source separation via proximal splitting algorithm)
by
Daichi Kitamura
PDF
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
by
NU_I_TODALAB
PPTX
音源分離における音響モデリング(Acoustic modeling in audio source separation)
by
Daichi Kitamura
PPTX
独立低ランク行列分析に基づくブラインド音源分離(Blind source separation based on independent low-rank...
by
Daichi Kitamura
PPTX
独立低ランク行列分析に基づく音源分離とその発展
by
Kitamura Laboratory
PPTX
ランク1空間近似を用いたBSSにおける音源及び空間モデルの考察 Study on Source and Spatial Models for BSS wi...
by
Daichi Kitamura
PPTX
非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法
by
Daichi Kitamura
PDF
ICASSP 2019での音響信号処理分野の世界動向
by
Yuma Koizumi
PDF
高次アンビソニックスのための マイクロホンアレイ設計の研究
by
horieyuto
PPTX
半教師あり非負値行列因子分解における音源分離性能向上のための効果的な基底学習法
by
Daichi Kitamura
PPTX
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
by
Daichi Kitamura
PDF
実環境音響信号処理における収音技術
by
Yuma Koizumi
PDF
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析
by
Shinnosuke Takamichi
PPTX
音楽信号処理における基本周波数推定を応用した心拍信号解析
by
Kitamura Laboratory
PPTX
調波打撃音分離の時間周波数マスクを用いた線形ブラインド音源分離
by
Kitamura Laboratory
PPTX
スペクトログラム無矛盾性を用いた独立低ランク行列分析の実験的評価
by
Daichi Kitamura
PPTX
コサイン類似度罰則条件付き半教師あり非負値行列因子分解と音源分離への応用
by
Kitamura Laboratory
PPTX
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
by
Daichi Kitamura
PPTX
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
by
Yui Sudo
深層生成モデルに基づく音声合成技術
by
NU_I_TODALAB
近接分離最適化によるブラインド⾳源分離(Blind source separation via proximal splitting algorithm)
by
Daichi Kitamura
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
by
NU_I_TODALAB
音源分離における音響モデリング(Acoustic modeling in audio source separation)
by
Daichi Kitamura
独立低ランク行列分析に基づくブラインド音源分離(Blind source separation based on independent low-rank...
by
Daichi Kitamura
独立低ランク行列分析に基づく音源分離とその発展
by
Kitamura Laboratory
ランク1空間近似を用いたBSSにおける音源及び空間モデルの考察 Study on Source and Spatial Models for BSS wi...
by
Daichi Kitamura
非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法
by
Daichi Kitamura
ICASSP 2019での音響信号処理分野の世界動向
by
Yuma Koizumi
高次アンビソニックスのための マイクロホンアレイ設計の研究
by
horieyuto
半教師あり非負値行列因子分解における音源分離性能向上のための効果的な基底学習法
by
Daichi Kitamura
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
by
Daichi Kitamura
実環境音響信号処理における収音技術
by
Yuma Koizumi
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析
by
Shinnosuke Takamichi
音楽信号処理における基本周波数推定を応用した心拍信号解析
by
Kitamura Laboratory
調波打撃音分離の時間周波数マスクを用いた線形ブラインド音源分離
by
Kitamura Laboratory
スペクトログラム無矛盾性を用いた独立低ランク行列分析の実験的評価
by
Daichi Kitamura
コサイン類似度罰則条件付き半教師あり非負値行列因子分解と音源分離への応用
by
Kitamura Laboratory
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
by
Daichi Kitamura
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
by
Yui Sudo
Viewers also liked
PDF
Dsp2015for ss
by
SaruwatariLabUTokyo
PDF
Moment matching networkを用いた音声パラメータのランダム生成の検討
by
Shinnosuke Takamichi
PDF
HMMに基づく日本人英語音声合成における中学生徒の英語音声を用いた評価
by
Shinnosuke Takamichi
PPTX
Koyama ASA ASJ joint meeting 2016
by
SaruwatariLabUTokyo
PDF
数値解析と物理学
by
すずしめ
PDF
Ica2016 312 saruwatari
by
SaruwatariLabUTokyo
PPTX
Hybrid NMF APSIPA2014 invited
by
SaruwatariLabUTokyo
PPTX
Koyama AES Conference SFC 2016
by
SaruwatariLabUTokyo
PDF
Apsipa2016for ss
by
SaruwatariLabUTokyo
PDF
Asj2017 3 bileveloptnmf
by
SaruwatariLabUTokyo
PPTX
Discriminative SNMF EA201603
by
SaruwatariLabUTokyo
PDF
Slp201702
by
Yuki Saito
Dsp2015for ss
by
SaruwatariLabUTokyo
Moment matching networkを用いた音声パラメータのランダム生成の検討
by
Shinnosuke Takamichi
HMMに基づく日本人英語音声合成における中学生徒の英語音声を用いた評価
by
Shinnosuke Takamichi
Koyama ASA ASJ joint meeting 2016
by
SaruwatariLabUTokyo
数値解析と物理学
by
すずしめ
Ica2016 312 saruwatari
by
SaruwatariLabUTokyo
Hybrid NMF APSIPA2014 invited
by
SaruwatariLabUTokyo
Koyama AES Conference SFC 2016
by
SaruwatariLabUTokyo
Apsipa2016for ss
by
SaruwatariLabUTokyo
Asj2017 3 bileveloptnmf
by
SaruwatariLabUTokyo
Discriminative SNMF EA201603
by
SaruwatariLabUTokyo
Slp201702
by
Yuki Saito
Similar to Ea2015 7for ss
PDF
Neural text-to-speech and voice conversion
by
Yuki Saito
PDF
音情報処理における特徴表現
by
NU_I_TODALAB
PPTX
非負値行列分解の確率的生成モデルと多チャネル音源分離への応用 (Generative model in nonnegative matrix facto...
by
Daichi Kitamura
PPTX
非負値行列因子分解を用いた被り音の抑圧
by
Kitamura Laboratory
PPTX
Music signal separation using supervised nonnegative matrix factorization wit...
by
Daichi Kitamura
PPTX
時間微分スペクトログラムに基づくブラインド音源分離
by
Kitamura Laboratory
PPTX
[DL輪読会]Monaural Audio Source Separationusing Variational Autoencoders
by
Deep Learning JP
PDF
複素ラプラス分布に基づく非負値行列因子分解
by
Hiroki_Tanji
PPTX
周波数双方向再帰に基づく深層パーミュテーション解決法
by
Kitamura Laboratory
PDF
バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張
by
奈良先端大 情報科学研究科
PPTX
多重解像度時間周波数表現に基づく独立低ランク行列分析,
by
Kitamura Laboratory
PPTX
Divergence optimization based on trade-off between separation and extrapolati...
by
Daichi Kitamura
PDF
Kameoka2016 miru08
by
kame_hirokazu
PDF
Kameoka2012 talk07 1
by
kame_hirokazu
PDF
招待講演(鶴岡)
by
nozomuhamada
PDF
バイノーラル信号音源分離における両耳事前分布モデルの考察
by
奈良先端大 情報科学研究科
PDF
Ieice中国地区
by
nozomuhamada
PPTX
Study on optimal divergence for superresolution-based supervised nonnegative ...
by
Daichi Kitamura
PPTX
Evaluation of separation accuracy for various real instruments based on super...
by
Daichi Kitamura
PDF
機械学習を用いた最近の聴覚研究(日本音響学会サマーセミナー講演資料)
by
Takuya Koumura
Neural text-to-speech and voice conversion
by
Yuki Saito
音情報処理における特徴表現
by
NU_I_TODALAB
非負値行列分解の確率的生成モデルと多チャネル音源分離への応用 (Generative model in nonnegative matrix facto...
by
Daichi Kitamura
非負値行列因子分解を用いた被り音の抑圧
by
Kitamura Laboratory
Music signal separation using supervised nonnegative matrix factorization wit...
by
Daichi Kitamura
時間微分スペクトログラムに基づくブラインド音源分離
by
Kitamura Laboratory
[DL輪読会]Monaural Audio Source Separationusing Variational Autoencoders
by
Deep Learning JP
複素ラプラス分布に基づく非負値行列因子分解
by
Hiroki_Tanji
周波数双方向再帰に基づく深層パーミュテーション解決法
by
Kitamura Laboratory
バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張
by
奈良先端大 情報科学研究科
多重解像度時間周波数表現に基づく独立低ランク行列分析,
by
Kitamura Laboratory
Divergence optimization based on trade-off between separation and extrapolati...
by
Daichi Kitamura
Kameoka2016 miru08
by
kame_hirokazu
Kameoka2012 talk07 1
by
kame_hirokazu
招待講演(鶴岡)
by
nozomuhamada
バイノーラル信号音源分離における両耳事前分布モデルの考察
by
奈良先端大 情報科学研究科
Ieice中国地区
by
nozomuhamada
Study on optimal divergence for superresolution-based supervised nonnegative ...
by
Daichi Kitamura
Evaluation of separation accuracy for various real instruments based on super...
by
Daichi Kitamura
機械学習を用いた最近の聴覚研究(日本音響学会サマーセミナー講演資料)
by
Takuya Koumura
Ea2015 7for ss
1.
統計的バイノーラル信号表現と その音源分離への応用 東京大学・大学院情報理工学系研究科 猿渡 洋 (2015年7月) 電気音響研究会・招待講演
2.
発表の流れ 研究背景と目的 従来手法 非負値行列因子分解を用いた音源分離手法 一般化MMSE-STSA推定器を用いた音源分離手法
提案手法 時系列事前分布モデルとスペクトル基底の同時適応を行う音 源分離 評価実験 まとめと今後の課題 2
3.
発表の流れ 研究背景と目的 従来手法 非負値行列因子分解を用いた音源分離手法 一般化MMSE-STSA推定器を用いた音源分離手法
提案手法 時系列事前分布モデルとスペクトル基底の同時適応を行う音 源分離 評価実験 まとめと今後の課題 3
4.
研究背景:バイノーラル音楽音源分離 マルチチャネル信号は多くの信号処理技術に応用される マイクロフォンアレイによる録音信号 (アレイ信号処理) 一般的なステレオ音楽信号
(音楽信号処理) ダミーヘッドによる両耳録音信号 バイノーラル信号の音源分離では以下の問題が生じる 抽出対象音の定位を保持しつつ音源分離を行わねばならない 未知の頭部伝達関数 (HRTF)による変形に対しても高精度に 分離を行わねばならない 4 本研究の対象 (バイノーラル信号) しかし… 定位を保持し,未知のHRTFに対応し頑健かつ高精度に動 作するバイノーラル音源分離手法は未だ確立されていない
5.
発表の流れ 研究背景と目的 従来手法 非負値行列因子分解を用いた音源分離手法 一般化MMSE-STSA推定器を用いた音源分離手法
提案手法 時系列事前分布モデルとスペクトル基底の同時適応を行う音 源分離 評価実験 まとめと今後の課題 5
6.
混合信号のモデル 信号の定義 :観測信号 :伝達関数 : 妨害音信号 :目的音信号 これ以降,各信号における下付き文字 は それぞれ左耳と右耳での信号を表すとする :
周波数インデックス : 時間フレームインデックス 8
7.
従来手法: NMFを用いた音源分離 Nonnegative
Matrix Factorization (NMF) [Lee, et al., 2001] スパース分解表現による特徴量抽出手法 非負値行列を2つの非負値行列の積で近似表現する 所望の基底を用いてスペクトログラムを再構成することで音源 分離を行うことができる 7 Amplitude Amplitude 観測行列 (スペクトログラム) 基底行列 (頻出スペクトルパターン) アクティベーション行列 (時間的なゲイン変化) Time 𝑓 : 周波数ビン数 τ : 時間フレーム数 k: 基底数 Time Frequency Frequency
8.
従来手法: 基底変形型教師ありNMF 基底変形型教師ありNMF
(Deformation SNMF) [Kitamura, et al., 2013] 分離したい目的音源のサンプル音を事前学習する 事前学習した教師基底を観測音信号に適応させ分離を行う 学習プロセス 教師音から作成した教師スペクトル基底 分離目的音の教師音 (音階等) わずかに異なる 分離プロセス 最適化 分離プロセス 最適化 教師基底に対する変形項
9.
従来手法: 一般化MMSE-STSA推定器 [Breithaupt, et
al., 2008] 目的音事前分布がカイ分布だと仮定するminimum mean-square error short-time spectral amplitude (MMSE-STSA) ベイズ推定 9 r = 1は目的音波形がガウス分布、r <1は優ガウス分布に従う : 信号 xのp.d.f.: 形状母数: ガンマ関数 観測音中の目的音カイ分布
10.
目的音振幅スペクトルの誤差が最小となるように推定 10 推定目的音 : 推定目的音
: ゲイン関数 : 合流型超幾何関数 : 事前SNR : 事後SNR : 形状母数: ガンマ関数 : 忘却係数 : 妨害音のパワースペクトル 従来手法: 一般化MMSE-STSA推定器 [Breithaupt, et al., 2008] : 振幅圧縮パラメータ
11.
• 観測音中の目的音を最もよく表す形状母数の値は未知 • 非定常な妨害音に対応できない •
カイ分布を用いた時系列データモデリングによって,時間 方向の影響(残響など)に適応して分離可能. • 加法型の変形方法では,適切な変形を行うことが難しい • 基底の変形と音源分離を同時に行うため,最適化が困難 従来手法の利点と欠点 11 Deformation SNMF • 教師基底の変形によって,周波数特性の変化に適応して 分離可能. 一般化MMSE-STSA推定法
12.
発表の流れ 研究背景と目的 従来手法 非負値行列因子分解を用いた音源分離手法 一般化MMSE-STSA推定器を用いた音源分離手法
提案手法 時系列事前分布モデルとスペクトル基底の同時適応を行う音 源分離 まとめと今後の課題 12
13.
Frequency AmplitudeAmplitude Frequency 時変な変形 (フレーム外変動) Amplitude Frequency 時不変な変形 (周波数変形) 13 未知のHRTFによる信号の変形 Amplitude Time Amplitude Time Amplitude Time 波形信号 時間周波数 信号 : Time
window
14.
Frequency AmplitudeAmplitude Frequency 時変な変形 (フレーム外変動) Amplitude Frequency 時不変な変形 (周波数変形) 14 未知のHRTFによる信号の変形 Amplitude Time Amplitude Time Amplitude Time 波形信号 時間周波数 信号 : Time
window Deformation SNMFにより対応 一般化MMSE- STSA推定器により 対応
15.
カイ分布における時系列モデリングの問題点 観測音中の目的音を最もよく表す形状母数の値は未知. Deformation
SNMFの基底変形における問題点 目的音に対応した精度のよい基底変形を行うことが困難. 提案手法における各問題点の解決方法 15 提案手法における問題点と解決方法 より良い基底変形の枠組みを導入する 時系列モデリング 基底変形 観測データからブラインドに形状母数を推定する
16.
16 STFT Non-target signal estimation by
SNMF Generalized MMSE-STSA estimator Equi binaural spectral gain calculation Target prior estimation ISTFT Supervised basis training Supervised basis update Spectral weight training, true false 提案手法の概要 Target prior estimation Basis deformation 提案手法のブロック図 一般化MMSE-STSA推定器により目的音を抽出. 時変,時不変変形への適応を反復して行う.
17.
統計的バイノーラルモデルの自動 適応に基づく両耳音楽信号分離
18.
目的音振幅スペクトルの誤差が最小となるように推定 18 推定目的音 : 推定目的音
: ゲイン関数 : 合流型超幾何関数 : 事前SNR : 事後SNR : 形状母数: ガンマ関数 : 忘却係数 : 妨害音のパワースペクトル 一般化MMSE-STSA推定器 : 振幅圧縮パラメータ
19.
目的音振幅スペクトルの誤差が最小となるように推定 19 推定目的音 : 推定目的音
: ゲイン関数 : 合流型超幾何関数 : 事前SNR : 事後SNR : 形状母数: ガンマ関数 : 忘却係数 : 妨害音のパワースペクトル 一般化MMSE-STSA推定器 : 振幅圧縮パラメータ 未知 未知
20.
目的音振幅スペクトルの誤差が最小となるように推定 20 推定目的音 : 推定目的音
: ゲイン関数 : 合流型超幾何関数 : 事前SNR : 事後SNR : 形状母数: ガンマ関数 : 忘却係数 : 妨害音のパワースペクトル 一般化MMSE-STSA推定器 : 振幅圧縮パラメータ SNMFにより推定
21.
形状母数とカートシス 21 目的音振幅スペクトルの4次統計量(カートシス)を求め ることで形状母数が推定可能→でも目的音は未知!? カイ分布 の形状母数rとカートシスの関係 : m次モーメント :
カイ分布の確率密度 関数(p.d.f.) : カートシス
22.
加法信号のm次モーメント算出における問題 22 観測音 目的音 妨害音 未知
既知既知 波形 逆畳み込みは困難→何か別の方法は無いか? 畳み込み 未知 既知既知 p.d.f.
23.
• キュムラント km(x):対数特性関数の級数展開 特徴 •
特性関数 モーメント・キュムラント変換 [1/4] (m次モーメント) (m次キュムラント) キュムラントの加法性 モーメントの乗法性 キュムラント・モーメント変換を駆使すれば様々な 混合確率過程の統計量分解も可能
24.
モーメント・キュムラント変換 [2/4] • キュムラントからのモーメントの導出 :
を分割するパターン :分割された各ブロック :ブロックのサイズ : の分割数(ブロック数) – Faà di Bruno’s formula
25.
モーメント・キュムラント変換 [3/4] m =
3 の場合 1 2 3 1 2 3 1 3 2 2 3 1 1 2 3 + + ++
26.
• モーメントからのキュムラントの導出 モーメント・キュムラント変換 [4/4]
27.
目的音振幅スペクトルのカートシス推定 目的音振幅スペクトルカートシス(複素数ドメイン)
28.
実部と虚部でi.i.d.を仮定すると次の式が成り立つ 振幅スペクトルドメインへの変換 28 : 観測音の振幅スペクトル :
SNMFによって得られる 妨害音の振幅スペクトル
29.
目的音のカートシス推定 [Murota, et
al., ICASSP2014] 29 目的音振幅スペクトルカートシス • 観測音とSNMFの推定値のみから解析的に目的音 のカートシスが計算可能 • 観測音中に埋もれている目的音を表す形状母数は、 可観測なデータのみから閉形式にて推定可能 • これを両耳個別に適用すれば、左右における時系列 の統計的な違いを表現できるのではないか? : 観測音の振幅スペクトル : SNMFによって得られる妨害音 の振幅スペクトル
30.
事前分布に着目したバイノーラル信号モデル 30 左耳 右耳 NR(f,t) NL (f,t) SL (f,t) SR(f,t) s(f,t) hL(f) hR(f) (a)
従来のバイノーラル 決定論的信号モデル hR (f) hL (f) HRTF (b) 事前分布に着目した統計的信号モデル 未知 SL (f,t)=hL(f)s(f,t) SR (f,t)=hR(f)s(f,t) 左耳: 右耳: SL (f,t)+NL(f,t) SR(f,t)+NR(f,t) 左右形状母数 のみを決める 問題に帰着
31.
音像定位に関する問題 個別の統計モデルを用いた一般化MMSE-STSA推定器 両耳のゲインは個別に計算されたものを用いて良いのか? 統計的な手法に基づいているので,推定値(ゲイン関数)に揺 らぎが生じる. 両耳信号推定における音像定位改善 左右の耳で共通のゲインを用いることで定位問題を改善する. 31 両耳間のゲインが同期していないグリッドがあるので, 定位感に劣化が生じる(音像のふらつき等).
32.
エラー関数 両耳共通ゲインの導出方針 32 : 共通化ゲイン 上記のエラー関数を最小化する を求める(事前分布の元で) :
振幅圧縮パラメータ 直接 を求めるのは困難なため2段階の最適化に分ける 1. 各チャネル毎に最適化(事前分布を意識した最適化) 2. 上記の結果を用いて を近似最適化(事前分布は無視)
33.
1. 各チャネルごとの最適化 • 各チャネル個別のスペクトルゲインを補助変数として導入すると, エラー関数は次のように書くことができる。 33 エラー関数の展開
34.
1. 各チャネルごとの最適化 • 各チャネル個別のスペクトルゲインを補助変数として導入すると, エラー関数は次のように書くことができる。 34 エラー関数の展開
35.
1. 各チャネルごとの最適化 • 各チャネル個別のスペクトルゲインを補助変数として導入すると, エラー関数は次のように書くことができる。 35 エラー関数の展開 ≒0 ≒0
36.
近似エラー関数の定式化 2. 共通ゲインの導出 36 上式メインコスト部は 単純な最小二乗問題 なので、右式の根で 最小値をとる 両耳それぞれに おける事前分布 に基づいて最適化
37.
両耳共通ゲイン LチャネルにおけるMMSE最適スペクトルゲイン RチャネルにおけるMMSE最適スペクトルゲイン (これら2個のゲインは,一般化MMSE-STSA推定器によって計算されたもの) 2.共通ゲインの導出(続き)
38.
スペクトル基底の反復変形に基づく 教師信号ミスマッチ問題解決
39.
問題点 加法型の変形では,時不変の変形を表すことが難しい. 基底の変形と音源分離を同時に行うため,最適化が困難. 提案手法における基底変形の方針 変形を時不変なスペクトル重み(積)の形で表す 基底変形と音源分離を別のステップに分けて行う 一般化MMSE-STSA推定により得られた推定目的音に近づく よう変形を行う
→ 本処理とSNMF+MMSE-STSAの繰り返し Deformation SNMFにおける問題点 26 教師スペクトル基底 変形項(正負値) 及び を最適化 Deformation SNMFの分解モデル
40.
発表の流れ 研究背景と目的 従来手法 非負値行列因子分解を用いた音源分離手法 一般化MMSE-STSA推定器を用いた音源分離手法
提案手法 時系列事前分布モデルとスペクトル基底の同時適応を行う音 源分離 評価実験 まとめと今後の課題 40
41.
実験条件(教師と観測音がミスマッチ) 41 楽器音 (MIDI) Ob.,
Cl., Vc., Pf. 観測音(MIDI) Obとその他1種類を選び等パワーで混合したもの 目的音 Ob. 教師音 (MIDI) 2 オクターブ上昇する目的楽器 24 音(伝達特性は異なる) 基底数 k 目的音: 100 妨害音 50 反復回数 学習時: 500 分離時: 400 サンプリング周波数 44100 忘却係数 α 0.97 サブバンド分割数 M 128 評価値 SDR: 分離度合いと人工歪みの少なさを含む総合的な分 離音源の品質 0° 90°−90° 15° 観測音の音源配置: 前方15度刻み.目的音と妨害音は 同じ方向に配置
42.
評価実験: 既存手法との比較 実験目的 目的音の事前分布を推定することによる効果を確認する 反復して基底を変形させることによる効果を確認する
比較手法 42 手法名 ポストフィルタ 妨害音推定 事前分布推定 NMFの反復 Equi-gain WF ウィーナフィルタ Deformatin SNMF しない しない Equi-gain MMSE- STSA MMSE-STSA estimator Deformatin SNMF しない しない Gain-min MMSE- STSA MMSE-STSA estimator Deformatin SNMF しない しない Equi-gain GMMSE- STSA 一般化MMSE- STSA estimator Deformatin SNMF する しない Proposed method 一般化MMSE- STSA estimator 反復型 Deformation SNMF する する
43.
実験結果(目的音: Ob.) スレッショルドパラメータ:
0.8, 反復数: 4 43
44.
実験結果(目的音: Ob.) スレッショルドパラメータ:
0.8, 反復数: 4 44 事前分布を推定する 事前分布を推定しない
45.
実験結果(目的音: Ob.) スレッショルドパラメータ:
0.8, 反復数: 4 45 反復あり 反復なし
46.
主観評価結果 ゲイン共通化を行う場合と行わない場合の差をXAB試 験により比較 46
47.
まとめと今後の課題 バイノーラル信号を対象として定位を保持し,未知のHRTFに対し て頑健かつ高精度に目的音源を分離する新しい手法を提案した 観測音中の目的音に適応し分離を行う手法を提案した 従来手法より高い分離精度を実現した
解析フレーム長を超える伝達関数を扱うことが可能となった 新たな基底変形手法を,様々な問題に応用することが出来る 伝達関数による変形以外も吸収できるような枠組みを導入する. 47 まとめ 今後の課題 [2015年・日本音響学会秋季研究発表会にて報告予定]
Download