Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

音声認識技術の最新状況とあるべき未来

1,004 views

Published on

2017年11月20日 #品テク meetup Vol.09
登壇資料

Published in: Technology
  • Be the first to comment

音声認識技術の最新状況とあるべき未来

  1. 1. 品テク meetup Vol.09 音声認識技術の最新状況 とあるべき未来 2017年11月20日 品テクmeetup Vol.09 株式会社ホロラボ 初音 玲
  2. 2. 品テク meetup Vol.09 自己紹介 初音 玲 仕事略歴 • 音声認識を使った文字化/自動翻訳システムやってます。 Community活動 • Microsoft MVP (2008/04~2018/06) • Oracle ACE (2008/04~ :日本で2人目) • TMCNテクニカルエバンジェリスト • HoloMagitians 会社作りました • 株式会社ホロラボ共同出資者 2
  3. 3. 品テク meetup Vol.09 アジェンダ 音声認識の最新状況:2x2x3 AIスピーカーのあるべき姿 まとめ 3
  4. 4. 品テク meetup Vol.09 音声認識の最新状況:2x2x3 4
  5. 5. 品テク meetup Vol.09 音声認識とは 音声を対応する文字に置換するパターンマッチ 音声というアナログから文字というデジタルへのAD変換 キーポイントは「音声」という波形 • 一人ひとり違う • 年齢や性別によっても違い • それでは人はなぜ音声から文章を書き起こせるのか • 「あ」の音の理解と発話訓練 5
  6. 6. 品テク meetup Vol.09 音声認識の最新状況:2x2x3 6 音声認識の最新状況:2x2x3
  7. 7. 品テク meetup Vol.09 2学習モデルx2x3 非ディープラーニング ディープラーニング(DNN) 7 2009年、ヒルトンらによって、 ニューラルネットワークを3週間 ほど学習させることで実用的な音 声認識ができることを立証された ディープラーニングとは? ニューラルネットワークを多層的にすることで、 コンピューター自らがデータに含まれる潜在的 な特徴をとらえ、より正確で効率的な判断を実 現させる技術や手法
  8. 8. 品テク meetup Vol.09 音声認識の最新状況:2x2x3 8 音声認識の最新状況:2x2x3
  9. 9. 品テク meetup Vol.09 2x2モデルx3 音響モデル 言語モデル 9
  10. 10. 品テク meetup Vol.09 2x2モデルx3 音響モデル 10
  11. 11. 品テク meetup Vol.09 2x2モデルx3 言語モデル 11 品川 で から 食事 勉強 会 品テ ク 新幹 線 10.567% 5.032% 24.129% 71.192%
  12. 12. 品テク meetup Vol.09 音響モデルと言語モデルの使い方 12 1. 発話を音素に分解 (音響モデル) 2. 発音辞書で音素の並びを推定 まだ、複数の音素候補がある し 60% ひ 40% 3. 単語の並びを判断 (言語モデル) 複数の音素候補から絞り込む 「美しい」のうしろは しまわり 40% ひまわり 70% 美しいひまわりが咲いている
  13. 13. 品テク meetup Vol.09 音声認識の最新状況:2x2x3 13 音声認識の最新状況:2x2x3
  14. 14. 品テク meetup Vol.09 2x2x3モード Interactive Conversation Dictation 1 モード 対話モード 会話モード 口述筆記モード 2 用途 アプリへの命令入力 人と人の会話用 文字起こし 3 発話先 アプリ 人 聴講者 4 認識途中経過 必要なのは最終認識結果 発話中がわかるように途中経過の表示が必要 14
  15. 15. 品テク meetup Vol.09 2x2x3モード Interactive Conversation Dictation 1 モード 対話モード 会話モード 口述筆記モード 2 用途 アプリへの命令入力 人と人の会話用 文字起こし 3 発話先 アプリ 人 聴講者 4 認識途中経過 必要なのは最終認識結果 発話中がわかるように途中経過の表示が必要 15 AIスピーカー demo
  16. 16. 品テク meetup Vol.09 これから登場する技術 16
  17. 17. 品テク meetup Vol.09 MFT (ミッシングフィチャー理論) これから登場する技術(1) 17
  18. 18. 品テク meetup Vol.09 音源分離 これから登場する技術(2) 18
  19. 19. 品テク meetup Vol.09 話者特定 これから登場する技術(3) 19
  20. 20. 品テク meetup Vol.09 AIスピーカーのあるべき姿 20
  21. 21. 品テク meetup Vol.09 AIスピーカーのAIとは? 音声認識のこと? それとも会話Botのこと? 21
  22. 22. 品テク meetup Vol.09 AIスピーカーのAIってなんだろう 話しかければ偉くなる • 教師データになるの? • 音素のカテゴライズの線引きが変更されるの? 好みが反映される? • 検索順位や検索カテゴライズの絞り込み? • それってgoogle検索エンジンと同じじゃ 22
  23. 23. 品テク meetup Vol.09 ぼくらの欲しいAIがこんなはずはない もっと、こちらのことをわかってほしい • いつもの!に答えてほしい • 先回りしてほしい もっと、こちらが興味をもてるようになってほしい • もっと無駄な反応をしてほしい • 同じキーワードで同じ答えではなくボクだけの答えがほしい 23
  24. 24. 品テク meetup Vol.09 ぼくらの欲しいAIがこんなはずはない ぼくらの生活がかわるんじゃない 24
  25. 25. 品テク meetup Vol.09 AIスピーカーがこんなに可愛いわけがない AIスピーカーとの生活が そのAIスピーカーを変えてほしい 25
  26. 26. 品テク meetup Vol.09 FIN 26

×