More Related Content
More from 奈良先端大 情報科学研究科 (20)
変調スペクトルを考慮したHMM音声合成
- 2. 発表概要
問題: HMM音声合成 [Zen et al., 2009.] の音質劣化
– HMMの平滑化処理により発生
– 平滑化の影響を定量的に表現する特徴量とは?
平滑化を表現する特徴量とは?:
– パラメータ系列の分散 (GV: Global Variance) [Toda et al., 2007.]
– 系列の変調スペクトル (MS: Modulation Spectrum)を本発表で導入
提案法: 変調スペクトルを補償するポストフィルタ
– 生成パラメータ系列に対して、事前学習したフィルタを適用
HMM音声合成およびGVと比較して、合成音声の音質を改善
2/15
- 3. HMM音声合成の枠組み
[Zen et al., 2009.]
自然音声のパラメータ系列
freq
Time
HMM学習
HMM
パラメータ
生成
freq
Time
合成音声のパラメータ系列
ある次元のパラメータ系列を見てみると・・・?
3/15
- 5. 変調スペクトル(MS: Modulation Spectrum)
離散フーリエ変換 &
対数振幅の計算
変調スペクトル
(MS)
変調スペクトルを、パラメータ系列の対数振幅スペクトルと定義
– 系列の周波数変動を表現するパラメータ
– 先行研究における有効性
• 音声知覚におけるスペクトルキュー [Rob et al., 1993.]
• HMMによる音声認識技術の精度向上 [Sriram et al., 2009.]
– 本研究では、系列毎に変調スペクトルを計算
5/15
- 9. MS of d-th parameter
sequence Sd(m)
学習部: MSの確率密度関数を推定
“Natural speech”のMSの
確率密度関数 N sd m d( Nm) , d( Nm)
,
,
“HMM”のMSの
確率密度関数
(
(
N sd m dGm) , dGm)
,
,
Modulation frequency m
自然/合成音声のパラメータ系列のMSを正規分布でモデル化
9/15
- 10. MS of d-th parameter
sequence Sd(m)
生成部: 生成パラメータのMSを線形変換
フィルタ後のMS
(
(
N sd m d Nm) , d Nm)
,
,
変換
“HMM”のMS
(
(
N sd m dGm) , dGm)
,
,
Modulation frequency m
(
d Nm)
(G )
( N)
,
s 'd m 1 k sd m k
s m d ,m d ,m
(
dGm) d
,
フィルタ後のMS
フィルタ強度係数 “HMM”のMS
10/15
- 12. 実験条件
評価:
– 適切なフィルタ強度係数の決定 (客観評価)
– 音質改善効果の確認 (主観評価)
手法:
–
–
–
–
“HMM”: HMM音声合成 [Zen et al., 2009.]
“HMM+MS”: “HMM”に提案法を適用
“HMM+GV”: GVを考慮 [Toda et al., 2007.]
“HMM+GV+MS”: “HMM+GV”に提案法を適用
実験条件
学習データ
ATR音素バランス文450文、女性
テストデータ
同53文
スペクトルパラメータ
0~24次のメルケプストラム (提案法を適用)
音源パラメータ
対数F0、5周波数帯域の非周期成分
MSのFFT長
4096 (全データの系列の長さを超える値) 12/15
- 14. Preference score for speech quality
主観評価:音質改善効果
7人に対するプリファレンステストを実施
1
0.8
0.6
0.4
0.2
0
HMM
HMM+MS
HMM+GV
HMM+GV+MS
提案法による音質改善を確認
14/15
- 15. まとめ
目的
– HMM音声合成による合成音声の音質改善
変調スペクトル(MS)を考慮した提案法
– 合成音声のMSは、自然音声のMSと比較して大きく劣化
– MSを補償するポストフィルタを提案
評価結果
– 従来法と比較して音質改善を確認
今後の予定
– HMM尤度・GV尤度・MS尤度を考慮したパラメータ生成法
15/15