More Related Content More from The Whole Brain Architecture Initiative (20) 第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化5. モラベックのパラドックス
¡ プログラム開発が⽐較的容易
¡ 意識的に⾏う作業(⼤⼈の知能)
¡ 数学、⼯学
¡ ゲーム
¡ 知識を⽤いた推論
¡ 進化のスケールで最近獲得された能⼒
¡ プログラム開発が厄介、もしくは著しく困難
¡ 半無意識的に⾏う作業(⼦供の⼈⼯知能)
¡ 歩く、⾛る → 2000年代に著しい進化
¡ 視覚、⾳声の認識 → 2010年代に著しい進化(深層学習)
¡ ⼿、指を⽤いた物体操作 → 2020年代現在でも極めて困難
¡ 数百万年の進化を通して強化された能⼒
5
6. AI(深層学習)のロボット
への応⽤の⽅法
¡ ⼊⼒ → 出⼒の”最適”モデルを学習
¡ 認識
¡ 画像 → 物体の位置と姿勢
¡ 強化学習
¡ 動作と感覚 → 報酬の期待値
¡ 学習モデルの不完全性をベースとする
¡ 世界は開かれている
¡ 予測学習
¡ “実時間”での内外感覚の予測と修正
動作
観測
報酬
6
8. 予測符号化と⾃由エネルギー原理 8
[K. Friston, 2010]
環境 (感覚の⽣成)
感覚予測
(平均, 精度)
感覚⼊⼒ !
− log %('|))
精度重み付
予測誤差
"
+!())
シナプス重み
,-.. ./.-+0
∗
= − log % ' ) + 3"# 4 ) ' ||%())
精度重み付
予測誤差
(Accuracy)
事前信念の
影響
(Complexity)
⾃由エネルギーを最⼩化するためのパラメータ
・w → 学習
・x → 感覚の修正(⾏為の⽣成)
・q(z) → 知覚の修正(仮想知覚の⽣成)
・
!
"!
→ 感覚の精度
・
!
""
→ 事前信念の精度 + ) + /567.
#
*簡略化のため !周辺の負の対数尤度期待値計算は省略
%())
4()|')
事後信念
(予測)
事前信念
(予測)
注意
9. Rao 1999, Tani 2003, Friston 2011, Yamashita 2012 etc.
• 環境とインタラクションを⾏う際の”予測誤差最⼩化”のための⽅策
予測符号化の簡単なイメージ1
実世界
内部モデル
感覚
予測
⾏為
知覚
9
H. Haker et al. 2016.
11. 強化学習との対⽐
¡ 強化学習
¡ ⽬的︓⾃由に設計可能
¡ モデルフリー
¡ 状態と⾏為の組に対する報酬の予測を
⼗分に学習
¡ モデルベース
¡ “世界モデル”を⼗分に学習
¡ “学習済”モデル内でポリシーを更新
¡ 最⼤報酬が期待できる⾏動系列を⽣成
¡ (ランダムな)試⾏錯誤
¡ ⽬的に沿った⾏動の最適化
¡ 予測符号化(能動的推論)
¡ ⽬的︓⾃由エネルギー最⼩化
¡ 状態と⾏為(知覚)の系列(モデル)
を予測学習
¡ 学習は⼗分にはできないことが前提
(開かれた世界)
¡ 期待⾃由エネルギーを最⼩化する仮想
知覚を実時間で能動的に推論(知覚⽣
成=⾏為⽣成)
¡ 弱い事前信念 → 試⾏錯誤
¡ 望ましい知覚を実現する知覚系列が、
事前信念に習慣化される
¡ 最適性は保証されない。
11
16. 注意
¡ ボトムアップ注意
¡ 注意が画像から⽣成される
¡ Saliency(輝度、⾊、⽅向、⽅位)などの特徴
¡ 報酬を最⼤化するマスク、Key, Query, Valueの⽣成
¡ トップダウン注意
¡ 注意が感覚や⾏為などの全知覚から予測される
¡ 知覚や信念の分散学習(予測誤差を分散で割る)
16
17. Multitask learning with an embodied
predictive model
H. Ito, K. Yamamoto, H. Mori, T. Ogata,
Science Robotics(2021 Impact Factor: 23.748), Vol. 7, Issue 65, 2022
17
18. 設計思想
1. 経験の学習(エクスペリエンス・ベースド)
¡ 運動と感覚を区別しない
¡ 「感覚ー>動作」のマップではなく,感覚運動
が⼀体化した”知覚”系列(経験)、内観を学習
2. “Multi-time scale”を扱う再帰結合型RNNの
階層予測構造
¡ 異なったレベル(時定数、次元)の予測
¡ トップダウンとボトムアップのインタラクション
3. “Symbol grounding”,実世界と記号世界
¡ 多義性,世界観の共有,創造性...
Slow Context
S-MTRNN
Sensory
Prediction
Fast Context
Sensory
Inputs
Higher-Level
Network
Lower-Level
Network
Variance
Prediction
Multi-Time scale RNN
[Y. Yamashita, J. Tani, 2008]
18
20. プロトタイプDry-AIREC (2021年10⽉) 20
⾝⻑: 1660mm
全体重量: 約150kg
可搬重量: 最悪姿勢保持: 8kg、最⼤瞬間(肘直⾓時): 20kg
関節トルクセンサxインピーダンス制御(腕部7軸x2、腰部3軸)
ハンド6軸x2(把持⼒センサ)
⼈肌ゲル(腕部、胴体前⾯)
台⾞: 全⽅位オムニホイール