Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
論文紹介 Grounded Spatial Symbols for Task Planning Based on Experience
1. Grounded Spatial Symbols for Task
Planning Based on Experience
2013 13th IEEE-RAS International Conference on Humanoid Robots (Humanoids).
Kai Welke1, Peter Kaiser1, Alexey Kozlov1, Nils Adermann1,
Tamim Asfour1, Mike Lewis2, Mark Steedman2
1 Institute for Anthropomatics, Karlsruhe Institute of Technology
2 School of Informatics, University of Edinburgh
2014/12/02 発表者:M2谷口 彰
1
4. Contents
4
I. INTRODUCTION AND RELATED WORK
II. THE SYSTEM CONCEPT
III. ACQUIRING SPATIAL KNOWLEDGE FROM
EXPERIENCE
IV. GROUNDED SPATIAL SYMBOLS
V. DISCUSSION
5. I. INTRODUCTION AND RELATED WORK
実世界に適用するための自律的なロボットシステムを構
築することは、多様で異なった研究分野の専門的知識と
アプローチを共に要求する
最大級にチャレンジングな問題
低いレベルのロボット制御と高いレベルのAIの統合により成り
立つ
5
6. I. INTRODUCTION AND RELATED WORK
6
主な課題:2つの表現の違い、ギャップの橋渡し
ロボット制御の連続的な状態空間
多くのAIアプローチで使われる離散的な記号表現
先行研究
表現のギャップを埋めるために、階層的な表現による物体-行動の複
合概念(the concept of object-action complexes (OACs))が提案され
ている[1]
OACは、affordance conceptという単一な表現内で、知覚と行動を組み
合わせる
高いレベルのプランニングを含んだいくつかの階層的なレベルのOAC
の拡張が提案されている[2,3]
アフォーダンス・・・知覚や行為をうながすものとして環境が内包している一種の力。
(Weblio辞書)
7. I. INTRODUCTION AND RELATED WORK
7
本研究では、ヒューマノイドロボットの感覚運動レベルと
高いレベルのプランニングの結合を可能にする、空間的
な領域の表現の抽出にフォーカスを当てる
そのような表現は、PDDL形式[4]の記述により定義した
行動によって視覚化される
PDDL:planning domain definition language
[4] D. McDermott, M. Ghallab, A. Howe, C. Knoblock, A. Ram, M. Veloso, D. Weld, and D. Wilkins, “Pddl.the
planning domain definition language,” New Haven, CT: Yale Center for Computational Vision and Control,
Tech. Rep., 1998.
9. II. THE SYSTEM CONCEPT
9
A. Conceptual assumptions (概念の仮定)
この研究のフォーカスは、経験による空間的な表現の獲得で
ある。
空間的な知識は、自律的なシステムに要求される機能の一
部である
アプローチのアウトラインを明確にするために、システム上の
いくつか事前知識を仮定する
10. II. THE SYSTEM CONCEPT
10
本研究において事前知識は以下のように仮定する
Object knowledge:
物体の豊富な事前知識を仮定する
この知識は、認識と自己位置推定のための、クラスラベルに結びついた
オブジェクトモデルを含む
もっと正確に言えば、一般的に操作可能なキッチンオブジェクトのモデ
ルとクラスラベルを知っている
such as cups, plates, milk, or juice
KIT object model database [21]を利用している
Action knowledge:
使用するロボットはベーシックなアクションを行うことができる
探索フェーズの間、grasp(物をつかむ)、putdown(物を置く)という行動
を行うことができる
さらに、移動する能力は、大きなスケールでの空間的な領域の学習を可
能にするために必要である
[21] A. Kasper, Z. Xue, and R. Dillmann, “The kit object models database: An object model database for
object recognition, localization and manipulation in service robotics,” The International Journal of Robotics
Research, vol. 31, no. 8, pp. 927–934, 2012.
11. II. THE SYSTEM CONCEPT
11
タスクプランニング:タスクを行うための行動計画
タスクプランニングにおいて、計画を遂行するためには、すべ
ての行動と述語の感覚運動の表現を利用可能にする必要が
ある
すべての非場所的な定数、例えば、オブジェクトのクラスラベ
ルなどは、感覚運動レベルで接地される必要がある
場所の表現と記号の表現との組み合わせは、提案アプ
ローチによって学習される
12. II. THE SYSTEM CONCEPT
12
B. System architecture
この研究では、タスクプランニングのための記号接地の問題
を扱うと同時に、ヒューマノイドロボットにおける感覚運動レベ
ルと高いレベルのタスクプランニングの結合による体系的な
手法を提案する。
このために、これらのレベルの結合のためのアーキテクチャ
を開発し実装した
このアーキテクチャの概要図はFig1に示す
感覚運動の表現は、タスクの遂行とプランをモニタリングする
ために使用される
24. III. ACQUIRING SPATIAL KNOWLEDGE
FROM EXPERIENCE
24
Ontological generalization オントロジーの一般化
物体(例:cup)の位置に加えて、概念上のクラス(例:Food)の
の場所は、同様にクエリにできる
(PDDLの述語で使用する要素として使用できる)
親子関係のような単純なクラスのオントロジーを使うことがで
きる
25. III. ACQUIRING SPATIAL KNOWLEDGE
FROM EXPERIENCE
25
4) Common places in the kitchen domain:キッチン領域
上の一般的な場所
学習のアルゴリズムとクラスタリングのアプローチは、the
humanoid robot ARMAR-IIIを使ったキッチンでの実証によっ
て適用された
このシナリオでは、ロボットは、冷蔵庫の中とテーブルの上の
物体を見つけ出し操作する
26. Humanoid robot ARMAR-III ([31], [32])
26
youtube video
http://www.youtube.com/watch?v=SHMSyYLRQPM#t=204
[31] T. Asfour, K. Regenstein, P. Azad, J. Schr¨oder, N. Vahrenkamp, and R. Dillmann, “ARMAR-III: An integrated
humanoid platform for sensory-motor control,” in IEEE International Conference on Humanoid Robots (Humanoids),
2006, pp. 169–175.
[32] T. Asfour, P. Azad, N. Vahrenkamp, K. Regenstein, A. Bierbaum, K. Welke, J. Schr¨oder, and R. Dillmann,
“Toward humanoid manipulation in human-centred environments,” Robotics and Autonomous Systems, vol. 56, no.
1, pp. 54–65, 2008.
27. III. ACQUIRING SPATIAL KNOWLEDGE
FROM EXPERIENCE
Figure 3
4つのARMAR-IIIの実証から得られた空間的な一般化
27
テーブル
冷蔵庫
28. III. ACQUIRING SPATIAL KNOWLEDGE
FROM EXPERIENCE
28
B. Spatial relations from human knowledge
ロボットが自らの経験から学習することに加えて、人間の知識
から空間的な関係の情報を得たい
人間の知識を利用することで、ミルクが冷蔵庫にいつも保存
されていることをロボットに教えることができる
ミルクの位置を含む空間的なクラスタが、冷蔵庫に対応した
特定の確率分布になる
このセクションでは、与えられた物体から有望な場所の集合を
推定する方法を提案する
29. III. ACQUIRING SPATIAL KNOWLEDGE
FROM EXPERIENCE
29
1) Extracting spatial relations from text:テキストから抽
出する空間的な関係
空間的な関係は、空間的な前置詞を使って表現される。
本研究では、テキストコーパス上でマッチングした前置
詞の関係を元とする。
in や onのような前置詞
物体を与えられた場所の条件付き確率を測定することを
目的とする。
• The milk is in the refrigerator
• ミルクは冷蔵庫の中にある
• Take a knife from the drawer.
• ひきだしからナイフをとって
30. III. ACQUIRING SPATIAL KNOWLEDGE
FROM EXPERIENCE
30
:前置詞のcontexts(前後関係)でのobjの発生の頻
度
:obj と locが共起したときの、前置詞の前後関
係の数
条件付き確率P(loc|obj):式(5)で近似
物体が与えられたときの場所の確率
31. III. ACQUIRING SPATIAL KNOWLEDGE
FROM EXPERIENCE
31
コーパスの語彙全体に対して条件付き確率を計算する
のは困難である
プランニングの領域の情報から得られるキッチンに存在
する場所の集合Lを知っている
そのため、制限付きの条件付き確率を定式化する
32. III. ACQUIRING SPATIAL KNOWLEDGE
FROM EXPERIENCE
32
2) The Text Corpus:
本稿では、the Google Books Ngrams Corpus [33]から空間的
な関係を抽出することを提案する。
以下では、Google Corpusと呼ぶ。
このコーパスは、トータルサイズ約3450億の単語と3.5億の英
語の本の表現を含む
33. III. ACQUIRING SPATIAL KNOWLEDGE
FROM EXPERIENCE
33
いくつかの前処理ステップは、文章に適用されている
1) 依存木(dependency trees)で構文解析
2) 構文上のngramの抽出(see Fig. 4)
3) それぞれの構文上のngramの発生の頻度をカウントする
2つの内容語と1つの前置詞を含む構文上のngram
単語は、品詞タグと依存関係のラベルが付けられている
NN - noun, IN - preposition
dobj - direct object, prep - preposition, pobj - prepositional object
34. III. ACQUIRING SPATIAL KNOWLEDGE
FROM EXPERIENCE
34
Google Corpusでは、それぞれの構文上のngramは、異
なる行に保存されている
この論文での関係した情報は、ngramこれ自身と発生の
頻度である
Fig. 4は、以下のような表記で書かれている
35. III. ACQUIRING SPATIAL KNOWLEDGE
FROM EXPERIENCE
35
構文上のngramのパスは、3つのノードからなり、それぞれ次
のような関係のあるフィールドを含んでいる
ノードで表現された単語(例:miik)
The Penn-Treebank part-of-speach tag [34]:単語のタグ付け(例:
NN)
The basic Stanford-dependencies label [35]:ノードの文法的な機能
(例:dobj)
最後の数字は、構文上のngramの発生の頻度である
この例では、 Google Corpus中に160回生じた
36. III. ACQUIRING SPATIAL KNOWLEDGE
FROM EXPERIENCE
36
3) Extracting Relations from the Corpus:
コーパスからの関係の抽出:
物体と場所の間の関係した前置詞を抽出したい
Google Corpusから下記の典型的な行を参照する
以下のパターンにマッチする行を探す
●はワイルドカードを表す
物体(名詞) 前置詞 場所(名詞)
37. III. ACQUIRING SPATIAL KNOWLEDGE
FROM EXPERIENCE
37
4) Evaluation: 評価
Table I
x軸:事前に定義された場所の集合
y軸:物体の集合
式(6)で定義された条件付き確率分布 を計算
この表は、テキストコーパスから前置詞の前後関係を抽出す
る提案手法が、妥当なPLの値を推定することができることを示
す
48. IV. GROUNDED SPATIAL SYMBOLS
48
B. Common sense knowledge for symbol binding
提案アプローチの2番目のステップでは、前のステップで獲得
されたsupport locationsのための記号的な表現を構築するた
めにcommon sense knowledgeを使用する。
例では、探索したat ?x *を元に、 at ?x fridge のためのよい
事前知識を推定する
ここでの主なチャレンジは、感覚運動でも言語の領域でも、場
所fridgeの表現を構築することである
50. V. DISCUSSION
50
A. Contributions
本研究では、タスクプランニングと感覚運動レベルでの空間に適用
できる表現を学習するためのアプローチを提案した
連続的な空間と記号表現を繋げて推定を行うために、2つの経験の
資源を利用した
探索による経験
common sense knowledgeによる経験
この研究は、非常に典型的な方法のアプローチによって開発された。
fridgeの例のような概念は、人間の作った環境中の多くの典型的な
場所に適用できる
common sense knowledgeの適用は、アプローチの実現可能性を見
るための模擬データによって実証された
同じことは、探索を通して集められた実際のデータで行うことができ
る
51. V. DISCUSSION
51
B. Outlook
今回は、特定の場所にある物体を表現するために述語atを使
用した
さらに前置詞を使う(such as in, on, or from )
タスクプランニングでは、場所の上に置くのか中に置くのかの
違いがある(e.g. open the door before putting in).
この問題は、再度、コーパスを使用することによって対処でき
る
52. V. DISCUSSION
52
Table IIを見ると、 冷蔵庫とテーブルに対する正しい前置詞を得ている
common sense knowledgeからこの機能の様子を推定することを可能に
する