Recommended
PDF
PDF
PDF
PDF
PDF
PDF
Japan Robot Week 2014けいはんなロボットフォーラム
PDF
20151129インテリジェントホームロボティクス研究会
PDF
PDF
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
PDF
PDF
PDF
PDF
PDF
PDF
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
PDF
Jubatusの紹介@第6回さくさくテキストマイニング
PDF
Jubatusにおける大規模分散オンライン機械学習
PDF
PDF
情報抽出入門 〜非構造化データを構造化させる技術〜
PDF
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
PDF
Connecting embedding for knowledge graph entity typing
PDF
第四回 全日本CV勉強会スライド(MOTS: Multi-Object Tracking and Segmentation)
PDF
NIPS2013読み会: Distributed Representations of Words and Phrases and their Compo...
PPTX
PDF
Deep learning for acoustic modeling in parametric speech generation
PDF
segmentation-modelsでざっくり動かすセマンティックセグメンテーション(U-Net)
PDF
Dataset cartography mapping and diagnosing datasets with training dynamics
PDF
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
PDF
ビッグデータで開扉されるイノベーション社会
PDF
人間とのインタラクションにより言葉と行動を学習するロボット, 岩橋直人
More Related Content
PDF
PDF
PDF
PDF
PDF
PDF
Japan Robot Week 2014けいはんなロボットフォーラム
PDF
20151129インテリジェントホームロボティクス研究会
PDF
What's hot
PDF
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
PDF
PDF
PDF
PDF
PDF
PDF
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
PDF
Jubatusの紹介@第6回さくさくテキストマイニング
PDF
Jubatusにおける大規模分散オンライン機械学習
PDF
PDF
情報抽出入門 〜非構造化データを構造化させる技術〜
PDF
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
PDF
Connecting embedding for knowledge graph entity typing
PDF
第四回 全日本CV勉強会スライド(MOTS: Multi-Object Tracking and Segmentation)
PDF
NIPS2013読み会: Distributed Representations of Words and Phrases and their Compo...
PPTX
PDF
Deep learning for acoustic modeling in parametric speech generation
PDF
segmentation-modelsでざっくり動かすセマンティックセグメンテーション(U-Net)
PDF
Dataset cartography mapping and diagnosing datasets with training dynamics
PDF
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Similar to ロボットの音声コミュニケーション技術:言葉や能力の壁を越えるデータ指向知能に向けて
PDF
ビッグデータで開扉されるイノベーション社会
PDF
人間とのインタラクションにより言葉と行動を学習するロボット, 岩橋直人
PDF
記号を用いたコミュニケーションを実現するために何が必要か?― 記号創発ロボティクスの 視点から ―
PDF
PDF
人間とのインタラクションにより言葉と行動を学習するロボット(岩橋 直人)
PDF
PDF
人間との協調を学ぶ人工知能 岩橋直人 Artificial intelligence that learns to cooperate with huma...
PPTX
地域ニーズに沿ったAI活用への挑戦〜株式会社エルブズによる社会性エージェントサービス〜
PDF
PDF
PDF
PDF
PDF
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
PDF
MAごころを、君に - #7 ChatGPT勉強会(2023-03-28)
PPTX
PDF
人工知能技術の現状-今後の見通し-社会へのインパクト-岡夏樹
PPTX
Google’s New AI Is Trying to Talk to Dolphin
PDF
ロボットによる言語獲得とインタラクション ~ロボットの”gaga to water”~(長井隆行)
PDF
PDF
[Whisper論文紹介]Robust Speech Recognition via Large-Scale Weak Supervision
More from Komei Sugiura
PDF
PDF
SuMo-SS: Submodular Optimization Sensor Scattering for Deploying Sensor Netwo...
PDF
Spatio-Temporal Pseudo Relevance Feedback for Large-Scale and Heterogeneous S...
PDF
PDF
New challenge in RoboCup 2017 Nagoya: RoboCup@Home Standard Platform
PDF
20160606劣モジュラ性を利用したドローンによるばらまき型センサ配置
PDF
20160221statistic imitation learning and human-robot communication
PDF
20140513大規模異分野データ横断検索における時空間情報を用いた擬似適合性フィードバック
PDF
20150531Deep Recurrent Neural Networkによる環境モニタリングデータの予測
PDF
階層型評価構造に基づく観光スポット推薦システムの構築と長期実証実験
PDF
Cloud Robotics for Human-Robot Dialogues
PDF
Language acquisition framework for robots: From grounded language acquisition...
PDF
rospeex: a cloud-based speech communication toolkit for ROS
PDF
Introduction to RoboCup@Home
ロボットの音声コミュニケーション技術:言葉や能力の壁を越えるデータ指向知能に向けて 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. rospeexが提供する機能
rospeex core
Dialogue
management
(written by user)
Speech
synthesis
Speech
Output
Speech
recognition
Rospeex cloud TTS
Noise
reduction
Voice activity
detection
Third party’s ASR API
Browser UI
OR
Smarphones On-board mic
Task management
Rospeex cloud ASR
What
time is it? It’s 6 pm.
Third party’s TTS API
Speech synthesis
designed for robots
WER = 7.9% for IWSLT tst2011
(1st Place Winner: IWSLT12, 13, 14)
12. 13. 14. 15. Q. 実ユーザとコミュニケーションを行うロボットにおいて
音声信号処理に何が求められているか?その2
• 前提
– 「スマートスピーカ型」の音声アシスタントや音声対話システム一般と同様に、
音声認識精度、言語理解精度向上は言うまでもなく重要
• ユースケース①:ロボットに向けて発話する場合
– 思想: 実体があればそれに向けて発話することが自然
– 想定状況: ユーザとマイクの距離は最短でも50cm(1.5m程度にしたい)
– ボトルネック: 発話区間検出、耐雑音音声認識
– 特殊事情: マイク移動するなかでの音源方向推定
• ユースケース②:スマホを通してロボットに指示を送る場合
– 思想: 要支援者の平時ユースケースでは手元に端末があると考えて良い
– ボトルネック: 不完全情報や記号接地を含む音声言語理解が重要
• 音声合成
– 対話調の合成音声の需要は大きい
16. 17. 18. 予測軌道をどう求めるか?
模倣学習による記号接地の関連研究
手法 References
制御ベース Dynamic Motion Primitives [Ijspeert 2002]
ニューラルネット
&強化学習
• RNNPB [Sugita 2005, Ogata 2007]
• 深層強化学習[Levine 2015]
確率モデル • ガウス過程 [Lawrence 2004], ガウス回帰[Calinon 2010]
• 隠れマルコフモデル(HMM; Hidden Markov Model)
[Inamura 2004, Niwase 2005]
• 確率最適制御 [松原 2015]
HMMのメリット
• 学習、認識、生成に高速なアルゴリズムが整備
されている
模倣学習 ≒ 動作学習+動作認識+動作生成
19. 20. 21. 22. 23. 24. 25. 26. 規定タスク(2017年)
Stage タスク名 内容
1
Cocktail Party
複数の人物がいる状況で、呼んでいる人物を認識し注文を聞
く
General Purpose
Service Robot (GPSR)
ランダムに生成される文を理解または曖昧性解消し、指示を
実行する
Help-me-carry 買い物袋を認識し、車のトランクから家の中への運搬を行う
Speech and Person
Recognition
音声認識・音源方向推定/人検出を行い、質問に答える
Storing Groceries 棚の中の複数の種類の日用品の種類を認識・整頓する
2
Enhanced
Endurance GPSR
ランダムに生成される文を理解または曖昧性解消し、指示を
実行する。30-45分間の連続動作が必要
Open Challenge 自由に選んだテーマに沿ったデモ
Restaurant
未知環境で地図作成を行い、注文されたものをテーブルに届
ける
Set a table and clean it up
テーブルに食事を運ぶとともに、食器を認識し配置を修正す
る
決勝 Final 自由に選んだテーマに沿ったデモ
27. 28. 29. World Robotics x AI Seminar:ロボカップ併催でロボット
工学x機械学習に関する世界最高峰セミナーを開催します
会期
2017年7月27日(木)10:00~18:00
10:00~14:30 テクニカルツアー、15:00~18:00 セミナー
会場:名古屋市国際展示場
招待講演者
• Prof. Daniel Lee, NIPS 2016 General Chair
• Dr. Joey Durham, Amazon Robotics研究開発マネージャ, Amazon Robotics
Challenge実行委員長
• Prof. Manuela Veloso, カーネギーメロン大学 機械学習部長
• Prof. Peter Stone, Cogitai創設者(ソニー資本参加)
スケジュール 2017年7月27日(木)10:00~18:00
前半テクニカルツアー、後半セミナー
会場 名古屋市国際展示場
招待講演者 • Prof. Daniel Lee, NIPS 2016 General Chair
• Dr. Joey Durham, Amazon Robotics研究開発マネージャ,
Amazon Robotics Challenge実行委員長
• Prof. Manuela Veloso, カーネギーメロン大学 機械学習部長
• Prof. Peter Stone, Cogitai創設者(ソニー資本参加)
ウェブサイト http://robocup-seminar.jp
30. 31. 32. 33. Lessons learned:
研究者がクラウドサービスを作るときに気をつけること
• プラス面
– 学習済みモデル等の知財を公開する必要がない
– ロボット以外もアクセス可能にすれば潜在ユーザ層を大きくできる
– アクティブユーザ数を測れる。⇔オープンソースのダウンロード数は不十分
• マイナス面
– 知名度が高くなると、攻撃やAbuseの対象になる恐れがある
– サーバ監視者にインセンティブを与えにくい
• これからクラウドサービスを作りたい人へ
– 成功をどうやって計測するか?(何年でユーザ何人?)
– ユーザのインセンティブを本気で考えたか?
– 「Google/Microsoft/..が作るかもしれないよ」を気にしすぎないこと
VoiceTra京都観光Navi
34. 35. 36. 37. 37
1. クラウドロボティクス基盤rospeex
2. インテリジェントホームロボティクス
3. 実世界知識を扱う音声対話技術
4. 応用対話システム
謝辞:本研究にサポートをいただきました※50音順
• 研究助成(JSPS科研費、JST CREST、立石財団)
• 共同研究機関(NII、玉川大、電気通信大、東京都立産業技術研究所、
東北大、トヨタ自動車、パナソニック株式会社)
NICTでは、ポスドク研究員を募集しています
生活支援ロボットのための言語・非言語情報に基づく音声言語理解お
よび行動生成(CRESTプロジェクトの一部)