Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
ニューラルネットワーク
による音声の分類
Yamaguchi
動機(1) ハイキュー!!
• 2012年から少年ジャンプで連載中
• 二期までアニメ化(三期は2016年春)
• 山口忠君は一日で一番多く口にする単語が
「ツッキー!」(公式)
• 山口君マジ母性
動機(2) かわいすぎ
動機(3)
山口の「ツッキー!」は心臓に悪い
なんとかして動画中の「ツッキー!」に斎藤壮馬受け
ボイスをかぶせることができないだろうか
(C++には音声ライブラリがない・・・?自作ライブラ
リ? むずかしい、できないよ!)
まずは「ツッキー!」...
・・・ということでデータの用意
「ツッキー!」 サンプル17個 テストデータ1個
ダミーとして
Free! ドラマCD 7個 1個
ハイキュー!! 7個 1個
真夏の夜の淫夢第一章 4個 1個
最大振幅を合わせた0.3秒のmp3を16kHzでサ...
MFCC(メル周波数ケプストラム)の簡単
なおさらい
• 音声信号→フーリエ変換→絶対値→対数→フーリエ変換
→ケプストラム
• ケプストラムの低次成分に人の周波数知覚特性を考慮した重み付
けをした特徴量が、MFCC
分類!わーい!
• こんなプログラムを書きましたコピペしました。
ドキドキの結果
最後に
• 実行するたびに結果が変わることがある 初期値ランダムだもんね
• ブラックボックス気持ち悪い!
• 動画に挿入できる日はいつになるやら
Special Thanks
• Cookies氏
• Kivantium氏
And 聞いてくれたみなさま!
Upcoming SlideShare
Loading in …5
×

ニューラルネットワークによる音声の分類

896 views

Published on

  • Login to see the comments

  • Be the first to like this

ニューラルネットワークによる音声の分類

  1. 1. ニューラルネットワーク による音声の分類 Yamaguchi
  2. 2. 動機(1) ハイキュー!! • 2012年から少年ジャンプで連載中 • 二期までアニメ化(三期は2016年春) • 山口忠君は一日で一番多く口にする単語が 「ツッキー!」(公式) • 山口君マジ母性
  3. 3. 動機(2) かわいすぎ
  4. 4. 動機(3) 山口の「ツッキー!」は心臓に悪い なんとかして動画中の「ツッキー!」に斎藤壮馬受け ボイスをかぶせることができないだろうか (C++には音声ライブラリがない・・・?自作ライブラ リ? むずかしい、できないよ!) まずは「ツッキー!」を分類するプログラムを作 ろう!
  5. 5. ・・・ということでデータの用意 「ツッキー!」 サンプル17個 テストデータ1個 ダミーとして Free! ドラマCD 7個 1個 ハイキュー!! 7個 1個 真夏の夜の淫夢第一章 4個 1個 最大振幅を合わせた0.3秒のmp3を16kHzでサンプリング →48000サンプルを切り出して160サンプルごとにMFCC
  6. 6. MFCC(メル周波数ケプストラム)の簡単 なおさらい • 音声信号→フーリエ変換→絶対値→対数→フーリエ変換 →ケプストラム • ケプストラムの低次成分に人の周波数知覚特性を考慮した重み付 けをした特徴量が、MFCC
  7. 7. 分類!わーい! • こんなプログラムを書きましたコピペしました。
  8. 8. ドキドキの結果
  9. 9. 最後に • 実行するたびに結果が変わることがある 初期値ランダムだもんね • ブラックボックス気持ち悪い! • 動画に挿入できる日はいつになるやら
  10. 10. Special Thanks • Cookies氏 • Kivantium氏 And 聞いてくれたみなさま!

×