Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Japan Robot Week 2014けいはんなロボットフォーラム

1,723 views

Published on

講演スライドです。

Published in: Technology
  • Be the first to comment

Japan Robot Week 2014けいはんなロボットフォーラム

  1. 1. サービスロボットの音声対話技術と クラウドロボティクスの展望 情報通信研究機構主任研究員 RoboCupFederation, Trustee(理事) 杉浦孔明 komei.sugiura@nict.go.jp 2014/10/17
  2. 2. ROSPEEX:ロボット向けクラウド型音声コミュニ ケーションツールキット 2
  3. 3. 背景:ロボット対話の開発において、音声認識や合成が 低コスト化を妨げている •想定するタスク – サービスロボットとのインタラク ション •ロボット開発者が直面する壁 – コストと比較して、音声認識・合成の性能が悪い XIMERA 3 (読み上げ) 声優
  4. 4. デモ 4
  5. 5. サンプルコードを公開しています •JSON形式のコマンドを以下のサーバに送る { “method” : “speak”, "params" : [ "ja", "こんにちは", "*", "audio/x-wav" ]} http://rospeex.ucri.jgn-x.jp/nauth_json/jsServices/VoiceTraSS 合成用JSON ※JavaScript, Python, C++のサンプルコードを公開中 (企業・大学・研究機関・地方自治体などで利用実績多数) 非モノローグ音声合成 検索
  6. 6. クラウド基盤rospeex ロボット対話の壁をクラウド型API公開で解決します •問題は何か – 音声認識:マイク-話者間距離&非push-to-talk – 音声合成:対話用の合成音声を使っていない – 学習コスト:平均的ユーザには高すぎる – 利用コスト:商用版のコストパフォーマンスは疑問 60dBA 70dBA 80dBA • ROSに対応したクラウド基盤 • 非モノローグHMM音声合成 rospeexの特徴
  7. 7. デモ 7
  8. 8. rospeexを用いた4ヶ国語対話 8
  9. 9. rospeexの位置付け ロボットミドルウェアに対応したクラウド型音声認識・合成 •音声対話に特化したクラウドロボティクス基盤 •これまでのユニークユーザ数>5000 クラウドAPI型 (Nuance, NTT docomo, VoiceTextWeb APIなど) 多数 OpenHRI,HARK, PocketSphinx, Festival クラウド型 非クラウド型 ロボットミドル ウェア対応 対応無
  10. 10. 簡単な対話を10行程度で記述可能 •例:「今何時?」に答える対話 音声認識のコールバック関数 日本語を指定してNICTサーバで合成。 ‘google’, ‘en’なども可能
  11. 11. rospeexが提供する機能 音声モジュール 対話処理 (理解・生成等) 音声合成 タスクシナリオ管理 音声出力 音声入力 他モジュールからの入力 (センサ値、認識結果等) 他モジュールへの出力 (アクチュエータ、学習等) ユーザが 用意する機能 rospeexが 提供する機能 音声認識 音声認識・合成 サーバ 雑音抑圧 発話区間検出 音声認識・合成 サーバ 第三者が 提供する機能
  12. 12. HMM軌道生成* 音声合成にも軌道生成にも利用可能な汎用的な手法 国内最大規模の声優掛け合い対話コーパス + 合成波形の特徴ベクトル +1次差分+2次差分の時系列 差分近似係数の行列 HMM軌道生成[Tokuda, 2000] 状態列 訓練済みのHMMパラメータ 理論的上限に近い品質 上限 ベースライン 提案手法 = 12
  13. 13. サービスロボットとクラウドロボティクスに 関する技術動向 13
  14. 14. ロボティクス分野の世界動向: ICT企業の参入 2012/3 Amazonが約650億円でKiva Systemsを買収 2013/12 Googleが約100億円でロボットベンチャー8社を買収 2014/2 Double Roboticsリモートプレゼンスロボットが約30万円で日本発売 2014/5 Intelが10万円のロボットを発売することを発表 2014/6 ソフトバンクがPepperを発売することを発表 2014/6,7 「ロボットを成長戦略の柱に」「2020年に東京ロボット五輪開催」 と首相発言 by ソフトバンクHP by Economist by Double Robotics HP
  15. 15. ロボット向けミドルウェアROSに関する世界動向 •ROS (Robot Operating System) – パッケージ管理、メッセージ通信などを司るミドルウェア – 画像処理、座標変換、SLAMなど2000パッケージ以上がROS に対応 – 国際的なデファクトスタンダードなので、(研究向けに) ライブラリ開発する場合無視できない IROS 2013@ 東京にて 15
  16. 16. クラウドロボティクスに関する技術動向 •クラウドロボティクスの4背景[Kehoe&Goldberg2015] – ビッグデータ・クラウド(Cloud)コンピューティング・ ロボット間知識共有・クラウド(Crowd)ソーシング •これまでと何が違うか – ロボットに転用可能なクラウド技術が身近になった 例:docomo知識Q&A API「富士山の高さは?」 分類 代表事例 リモートブレイン、 ネットワークロボット [Inaba1993], [総務省ネットワーク・ロボット技術に関 する調査研究会報告書2003] クラウドロボティクス [Kuffner(Google)2010] クラウドAPI利用 クラウド型物体認識を用いた物体把持[Kehoe+ 2013] 知識ベース構築 RoboEarth知識ベースによる知識共有[Tenorth+ 2012] 16
  17. 17. クラウドロボティクスAPIのユーザを増やすためにどうするか? 「ロボットでもスマホでも使えるAPI」 VoiceTra(rospeexで参考にした構成) •100万ダウンロードを達成 •IWSLT音声認識ベンチマーキングで2年連続で世界トップ •音声翻訳技術をNICTから民間9社に技術移転 ログの可視化 17
  18. 18. クラウドロボティクスの今後の方向性 •大規模データを用いた研究テーマ – 例:ロボットに特化した対話機能の継続的改良 – 音声認識分野のメインプレーヤは、1000時間(≒100万発話)規模 のコーパスを利用して改良を行っている •ロボティクスデータへの機械学習・データ工学の応用 – 日本ロボット学会学術講演会でセッションを開催:2014年は全 セッションのなかで最大となる
  19. 19. インテリジェントホームロボティクス研究専門委員会のご案内 •2014年8月に日本ロボット学会の研究専門委員会として発足 – 委員長:岡田浩之(玉川大),副委員長:佐野睦夫(大阪工業 大) – 委員の所属:電通大, NICT, NII, 九工大, 日立, 北陽電機, アドイン研 究所, ATR, パナソニック, 金沢工大, アールティ, ウェストユニティ ス, 東京農工大, 富士通, トヨタ自動車 •第1回インテリジェントホームロボティクス研究会 – 日程:2014年12月6日(土),7日(日) – 場所:秋葉原ダイビル インテリジェントホームロボティクス研究会 検索 19
  20. 20. ロボカップにおける サービスロボットのベンチマーキング 20
  21. 21. ロボカップ関連の社会展開 •Quince: ロボカップレスキューから原子炉建屋投入へ •Kiva Systems: amazonが約650億円で買収 – Amazon Picking Challenge(賞金約270万円) •ロボカップでの採用を機にNAO(Aldebaran Robotics)が 普及 – その後ソフトバンクが株式を取得 by Kiva Systems Quince NAO 21
  22. 22. ロボカップ@ホーム 世界大会優勝(2008, 2010),準優勝(2009, 2012):玉川大、電通大と共同 22
  23. 23. ロボカップ@ホームの概要 •生活支援ロボットの競技会として世界最大* – ロボカップのリーグのひとつ – 中心課題:移動マニピュレーション・ヒューマンロボットインタラク ション – 7個の規定タスクと3つのデモタスクにより評価される •参加チーム – 約15か国の大学・研究機関から200人以上の参加者 – 6~10人程度のチームが多い *同様の競技会として、 Mobile Manipulation ChallengeやSemantic Robot Visionがある 23
  24. 24. 世界大会は20チーム前後で推移しており、日本大会は増加 傾向にある ※2014年世界大会はブラジルへの輸送問題のため出場数が減少 0 5 10 15 20 25 30 2006 2007 2008 2009 2010 2011 2012 2013 2014 世界大会参加チーム数 日本大会参加チーム数
  25. 25. 25
  26. 26. タスクの難しさ •モバイルマニピュレーション – 未知環境における地図作成・移動 – 観客(移動障害物)の存在 – 実際の店舗の利用 – 日用品の物体認識・把持 •ヒューマンロボットインタラクション – 高騒音環境(Leq=75dB) – 頑健な対話処理 – ジェスチャ認識 26
  27. 27. 規定タスク(2014年) Stage Task name Abstract 場所 1 Robo-Zoo 並んだ展示ブースでロボットにパフォーマンスを行わせ、観客に 投票させる フィールド Basic Functionalities 個別機能の検査(Pick & Place, 障害物回避, 人発見&音声認識) フィールド Follow Me 人混みやエレベータの中で未知ユーザを追従する 外部 Emergency situation 「高齢の居住者が具合が悪くなった」という設定で、マップや状 況をまとめて通報情報を作成 フィールド 2 Cocktail Party ロボットを呼んでいる3人を見つけて注文を聞き、飲み物を取り に行く フィールド EnduringGeneral PurposeService Robot 複文の指示の解釈、曖昧な指示を明確化(例:「何の飲み物を 持ってきますか」)し,指示を実行する フィールド Restaurant 未知環境(実際の店舗)で棚から3個のオブジェクトを持ってく る 外部 Demo Challenge 「スマートホームの中のスマートロボット」に関する自由デモ フィールド 決勝 Final 自由に選んだテーマに沿ったデモ フィールド
  28. 28. 標準タスクの中で最も難しいタスク: Enduring General Purpose Service Robots NimbRo (ボン大学) 28
  29. 29. ロボカップの今後 •「2050年に人型ロボットでワールドカップチャンピオ ンに勝つ」ことを目標 •実問題への展開(レスキューロボット、ホームロボッ ト、工場ロジスティクス) •2017年世界大会の誘致に向け、名古屋市が立候補 – 1997年第1回世界大会(名古屋)から20年後の節目 by テレビ愛知 by 名古屋市役所 29
  30. 30. まとめ 30
  31. 31. まとめ •rospeex: クラウド型音声コミュニケーションツールキット •サービスロボットとクラウドロボティクスに関する技術動向 •ロボカップ@ホーム:サービスロボットのベンチマーキング ソフトウェアを公開中 rospeex 検索 31

×