【DL輪読会】Language Conditioned Imitation Learning over Unstructured Data
1.
DEEP LEARNING JP
[DLPapers]
http://deeplearning.jp/
Language Conditioned Imitation Learning over
Unstructured Data
Koki Ishimoto
1
2.
書誌情報
• Title: LanguageConditioned Imitation Learning over Unstructured
Data
• Author: Corey Lynch* and Pierre Sermanet*
• *Robotics at Google
• Conference: Robotics: Science and Systems 2021(Held Virtually: July
12-16, 2021)
• Project page: https://language-play.github.io/
2
研究の概要
• Cover thespace with teleoperational play(Learning from Play)
• テレオペでstate-action logを取る
• Pair play with human language
• 行動を後付けで言語にペアリングする
• Multicontext imitation learning
• 自己教師あり模倣学習により、行動と言語のペアリング数を減らせる(全デー
タ中1%程度)
• Condition on human language at test time
• テスト時に言語指示で複数のスキルを連続実行
• Transfer learning from unlabeled text corpora to robotic manipulation
• ラベル付されてないテキストコーパスからロボットマニピュレーションへの
転移学習
4
Learning to FollowHuman Language
Instructons
• Pairing robot experience with human language
• Hindsight Instruction Pairingを導入
• ロボットセンサデータと関連する言語をペアリングする手法
• Multicontext Imitation Learning
• LangLfP: Following image and Language Goals
9
Knowledge transfer results
•Positive transfer to robotic manipulation
• TransferLangLfPがLangLfPよりも良い性能
を示した
• 大量のテキストに反映された世界の知
識が、言語指示ロボット操作の改善に
活用されたと考えられる
• Following out of distribution “synonym
instructions”
• 同義語の指示に関して、TransferLanngLfP
の方が優位な性能を示した
• 例:「ブロックを拾う」と「レンガを拾
う」などの同じような指示に対する汎化
性の高い対応
22