Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Yy

61 views

Published on

重回帰分析を用いた頭部伝達関数の補間に関する研究

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

Yy

  1. 1. 重回帰分析を用いた頭部伝達関数の 補間に関する研究 所属 人工知能第一研究室 発表者 17E3023 山中 雄太 会場 指導教員 古家 賢一 教授 発表日 2月6日
  2. 2. 目次 •研究背景・目的 •HRTFについて •従来研究 •課題とアプローチ •提案法 •まとめ •今後の課題 1
  3. 3. 研究背景 • 近年、スマートフォンやゲーム端末,動画再生プラットフォームの 普及により全天球動画、VRを気軽に視聴できる環境が整っている 2 視覚に臨場感は感じられるが、 音声の臨場感については、重きを置かれていない 頭部伝達関数(HRTF)を用いた音響技術が必要 例) 視界
  4. 4. ヘッドホンを用いた音場再現(HRTF) HRTF(頭部伝達関数):頭部、外耳における複雑な反射、 回折の特性を含んでいる伝達関数 HRTFを切り替えることで定位を保つことが可能 3 実際の環境 測定 左耳のHRTF 右耳のHRTF 録音した信号 音を再現した場合
  5. 5. HRTFの問題点 •測定方法 無響室でスピーカアレイの中心に人を座らせ一つ一つ 鳴らす -時間、コスト、身体的疲労が膨大に掛かる -角度間隔が大きくなり不連続 4 東北大通研(仙台市) スピーカ
  6. 6. 目的 •HRTFは個人性を伴うため各人のすべての方向のHRTF を測定するのは困難 5 •少ないHRTFから未知のHRTFを推定し本来のHRTFの 精度に近づける
  7. 7. 従来研究(1) • 水平面上の頭部伝達関数の補間 西野 隆典,(日本音響学会1998年) 線形2点補間 • 高臨場感音響のためのラグランジュ多項式を用いた 頭部伝達関数補間 山中 雄太(大分大学大学院,電子情報通信学会九州支部2017) 6 角度による推定 :測定されたHRTF :補間で求めるHRTF 𝜃𝑖−2 𝜃𝑖−1 𝜃 𝜃𝑖+1 𝜃𝑖+2 度
  8. 8. 線形2点補間 •水平面上の頭部伝達関数の補間 -西野 隆典,(日本音響学会1998年) •HRTFの測定に関する問題点についてHRTFを補間に よって推定できないか - 線形2点補間 7
  9. 9. ラグランジュ多項式を用いた補間 8 𝐻 𝑓𝑘 = 𝜃−𝜃2 𝜃−𝜃3 𝜃−𝜃4 𝜃1−𝜃2 𝜃1−𝜃3 𝜃1−𝜃4 |𝐻1 𝑓𝑘 | + 𝜃−𝜃1 𝜃−𝜃3 𝜃−𝜃4 𝜃2−𝜃1 𝜃2−𝜃3 𝜃2−𝜃4 |𝐻2 𝑓𝑘 | + 𝜃 − 𝜃1 𝜃 − 𝜃2 𝜃 − 𝜃4 𝜃3 − 𝜃1 𝜃3 − 𝜃2 𝜃3 − 𝜃4 |𝐻3 𝑓𝑘 | + 𝜃 − 𝜃1 𝜃 − 𝜃2 𝜃 − 𝜃3 𝜃4 − 𝜃1 𝜃4 − 𝜃2 𝜃4 − 𝜃3 |𝐻4 𝑓𝑘 | ある物理量を測定しn+1個の値が得られたときに (𝜃1,|𝐻1 𝑓𝑘 |),(𝜃2,|𝐻2 𝑓𝑘 |),⋯, (𝜃 𝑛+1,|𝐻 𝑛+1 𝑓𝑘 |)を通る多項式で 近似する方法 𝐻 𝑓𝑘 : 求めたい角度のHRTF振幅応答 |𝐻𝑖 𝑓𝑘 |:測定されたHRTFの振幅応答 𝜃: 求めたい角度 𝜃1, 𝜃2, 𝜃3, 𝜃4:測定されている角度
  10. 10. 従来研究(2) • 重回帰分析に基づく頭部伝達関数の推定 西野 隆典(名古屋大学2001年) 9 身体的特徴による推定 被験者 HRTF 身体的特徴 A ○ ○ B ○ ○ C × ○ D ○ ○ E ○ ○
  11. 11. 重回帰分析(1) 10 重回帰分析 HRTF推定 ・HRTFは頭部や耳介の形状に起因 ・9個の身体的特徴量とHRTFとの関係をもとに、 重回帰分析を用いてHRTFを推定
  12. 12. 身体的特徴量 • 9個の身体的特徴量を計測 1.耳介(縦) 2.耳介(横) 3.耳甲介腔(縦) 4.耳甲介腔(横) 5.頭部・耳介距離 6.両耳間距離 7.頭囲(前) 8.頭囲(後) 9.頭囲(縦) HRTFと身体的特徴量を 対応づけるために重回帰分析を用いる 11
  13. 13. 重回帰モデル 𝜔 𝜃,𝑘 𝑛 = 𝛽0𝑛 + 𝑙=1 𝐿 𝛽𝑙𝑛 𝑥𝑙𝑘 +𝜀 𝑛 2個以上の説明変数から一つの目的変数を 推定するための回帰分析 𝜔 𝜃,𝑘 𝑛 :求めたいHRTFの対数振幅応答 𝑥𝑙𝑘 :身体的特徴量 𝛽𝑙𝑛 : 回帰係数 𝜀 𝑛 : 誤差 12
  14. 14. 課題 • 従来法 -音源の近い方向の精度は良いが遠い方向の精度は悪い 13 音源が近い場合 測定 音源が遠い場合 測定 補間精度が悪い補間精度が良い
  15. 15. アプローチ 14 • 身体的特徴と角度情報(両隣のHRTF)をあわせて重回帰分析を行いHRTF を補間 • 説明変数に角度情報(両隣のHRTF)を加えることで影響が少ない 説明変数に対する重回帰係数の値が小さくなり精度が向上するのでは? 前提条件 提案法 重回帰分析 補間 学習データ 〇 〇 × 身体的特徴 〇 〇 × 本人のHRTF △ × △ •HRTFの情報は角度と身体的特徴に起因する
  16. 16. 提案モデル 𝜔 𝜃,𝑘[𝑛]:求めたいHRTFの主成分重み 𝑥𝑙𝑘:身体的特徴量 𝛽𝑙𝑛, 𝛽𝑖𝑛:回帰係数 15 • 隣のHRTFと身体的特徴を一緒に回帰させるモデル 𝜔𝑖𝑘[𝑛]:求めたいHRTFの隣の情報 𝜔 𝜃,𝑘 𝑛 = 𝛽0𝑛 + 𝑙=1 𝐿 𝛽𝑙𝑛 𝑥𝑙𝑘 + 𝑖=𝜃− 𝛼 2 𝜃+ 𝛼 2 𝛽𝑖𝑛 𝜔𝑖𝑘 𝑛
  17. 17. 重回帰分析計算方法(1) 16 𝜔 𝜃,𝑘 𝑛 = 𝛽0𝑛 + 𝑙=1 𝐿 𝛽𝑙𝑛 𝑥𝑙𝑘 + 𝜀 𝑛 𝐸 = 𝑚=1 𝑀 𝜀 𝑛 2 = 𝑚=1 𝑀 (𝜔 𝜃,𝑚 𝑛 − 𝛽0𝑛 − 𝑙=1 𝐿 𝛽𝑙𝑛 𝑥𝑙𝑘 − 𝑖=𝜃− 𝛼 2 𝜃+ 𝛼 2 𝛽𝑖𝑛 𝜔𝑖𝑘 𝑛 )2 とおいて各重回帰係数で偏微分を行う 𝜕E 𝜕𝛽𝑙𝑛 = 0 ⋮ ⋮ 𝑥𝑙𝑚 𝑥1𝑚 𝑥𝑙𝑚 1 𝑥1𝑚 𝑥1𝑚 𝑥1 2 𝑚 ⋱ ⋮ ⋯ 𝑥𝑙 2 𝑚 ⋯ 𝑥𝑙𝑚 ⋯ 𝑥1𝑚 𝑥𝑙𝑚 𝛽𝑙𝑛:重回帰係数 𝜀 𝑛 :誤差 𝜀 𝑛を最小2乗誤差により最小化する 𝜔 𝜃,𝑘 𝑛 :主成分重み × 𝑏0𝑛 𝑏1𝑛 ⋮ 𝑏𝑙𝑛 = 𝜔 𝜃,𝑚[𝑛] 𝜔 𝜃,𝑚[𝑛]𝑥1𝑚 ⋮ 𝜔 𝜃,𝑚[𝑛]𝑥𝑙𝑚
  18. 18. 重回帰分析計算方法(2) 17 𝑋 = 𝑊 = (𝜔 𝜃,1[𝑛], 𝜔 𝜃,2[𝑛] … 𝜔 𝜃,𝑀[𝑛]) 𝑇 𝐵 = (𝛽0𝑛, 𝛽1𝑛, … 𝛽𝑙𝑛, ) 𝑇 とおくと 𝑋 𝑇 𝑋 B = 𝑋 𝑇 𝑊 のようにおける両辺に𝑋 𝑇 𝑋の逆行列をかけると最終的に B = 𝑋 𝑇 𝑋 −1 𝑋 𝑇 𝑊 となり角度ごとに回帰係数を求めることができる 𝑋 𝛽0𝑛 𝛽1𝑛 ⋮ 𝛽𝑙𝑛 = 𝜔 𝜃,𝑚[𝑛] 𝜔 𝜃,𝑚[𝑛]𝑥1𝑚 ⋮ 𝜔 𝜃,𝑚[𝑛]𝑥𝑙𝑚 1 𝑥11 1 𝑥12 ⋯ ⋯ 𝜔 𝜃−1,1[𝑛] 𝜔 𝜃+1,1[𝑛] ⋯ ⋯ 𝜔 𝜃−1,2[𝑛] 𝜔 𝜃+1,2[𝑛] ⋮ ⋮ 1 𝑥1𝑀 ⋯ ⋯ ⋮ ⋮ ⋯ ⋯ 𝜔 𝜃−1,𝑀[𝑛] 𝜔 𝜃+1,𝑀[𝑛]
  19. 19. HRTFの振幅応答の合成 18 𝜔 𝜃,𝑘 𝑛 = 𝛽0𝑛 + 𝑙=1 𝐿 𝛽𝑙𝑛 𝑥𝑙𝑘 + 𝑖=𝜃− 𝛼 2 𝜃+ 𝛼 2 𝛽𝑖𝑛 𝜔𝑖𝑘 𝑛 𝐻 𝜃 𝑓𝑖 = 𝐶 ∗ 𝜔 𝜃,𝑘 𝑛 𝐶:主成分行列 B:回帰係数 𝐻 𝜃 𝑓𝑖 :求めたいHRTFの対数振幅 𝐵 = (𝛽0𝑛, 𝛽1𝑛, … 𝛽𝑙𝑛, ) 𝑇
  20. 20. 身体的特徴の検討 19 寄与率:どの身体的特徴がHRTFに影響を及ぼしているかの値 身体的特 徴 寄与率 両耳間距離 68% 頭囲(前) 14% 頭囲(後) 12% 3種類で寄与率が94 % であることから残りの6 種類はHRTF の構成 にあまり影響していないと考えられる 身体的特徴 9種類 3種類 2種類 1種類 平均SD 1.794(dB) 1.720(dB) 1.711(dB) 1.708(dB)
  21. 21. 客観評価実験 •提案法と従来法の補間精度について比較 -補間精度が提案モデルで良くなるか 20 SD値を比較 SD値(Spectrum Distortion) -値が小さいほど補間精度が高い 𝑆𝐷 = 1 𝑁 𝑘=1 𝑁 (20𝑙𝑜𝑔 |𝐻(𝑓 𝑘)| | 𝐻 (𝑓 𝑘)| )2 [dB] | 𝐻 (𝑓𝑘)|:補間したHRTFの振幅応答 |𝐻 𝑓𝑘 |:測定したHRTFの振幅応答
  22. 22. 実験の流れ 21 70名分のHRTFのデータと身体的特徴 を使用し、重回帰モデルを作成 80名分のHRTFのデータを10名ずつ8グループ作成 回帰係数𝛽𝑙を求め る テストデータ10名分の身体的特徴と 求めた回帰係数𝛽𝑙を合成し、10名分の 測定したHRTFと比較評価 学習データ70名 テストデータ 10名
  23. 23. 実験条件 22 提案法1 提案法2 重回帰分析 線形補間 ラグラン ジュ補間 名古屋大学 HRTF データ ベース 学習データ 70名 テストデー タ10名 学習データ 70名 テストデー タ10名 学習データ 70名 テストデー タ10名 テスト データ10 名 テスト データ10 名 説明変数 身体的特徴 1種+両隣 のHRTF2点 身体的特徴 1種+両隣 のHRTF4点 身体的特徴 1種 なし なし サンプリン グ周波数 48kHz 48kHz 48kHz 48kHz 48kHz 評価帯域 1kHz~ 8kHz 1kHz~ 8kHz 1kHz~ 8kHz 1kHz~ 8kHz 1kHz~ 8kHz
  24. 24. 実験結果 23 0 1 2 3 4 5 6 SD(dB) 角度 右耳HRTFのSD平均 提案法2 ラグランジュ 線形 提案法1 重回帰分析
  25. 25. 考察 •提案法の全体平均SDが悪い原因 24 •重回帰分析で他人のHRTFの影響が反映されてしまう •70度~90度が提案法が良くなった要因 •重回帰分析で学習したため -両耳間距離の学習データとテストデータの幅が最大59[mm]
  26. 26. まとめ • HRTFとこれまでの研究 -HRTFは角度情報と身体的特徴に起因する -課題として音源から遠いHRTFの精度が悪い • 重回帰分析に両隣のHRTF情報を追加したモデルを提案 -身体的特徴の削減 • 補間精度比較実験 -音源が遠い方向の70度~90度では提案法が約0.1~0.2dB程度 良くなった 25
  27. 27. 今後の課題 • 全体の補間精度についてあまり改善が見られなかった • データベースから無作為に選んだデータで補間したため 精度向上しなかった 26 • 両耳間距離でHRTFデータベースを分けて作成し学習させる

×