SlideShare a Scribd company logo
1 of 22
Download to read offline
第7回全脳アーキテクチャ
シンポジウム
2022.10.12
予測符号化モデルとしての
深層予測学習とロボット
知能化
尾形哲也
早稲⽥⼤学 理⼯学術院 教授/AIロボット研究所 所⻑
産業技術総合研究所⼈⼯知能研究センター 特定フェロー
WABOT-1
(1973)
WABOT-2
(1984)
Haday-2
(1997)
WABIAN
(1997)
早稲⽥⼤学のロボット研究
WABIAN-II
(2005)
TWENDY-
ONE
(2007)
世界初の
ヒューマノイド
ロボット
2
「脳」ではなく「神経(⾝体)」
¡ “神経班”
¡ 「脳だけを解剖学的な構造の違いで切り取るのではなく、
⾃律神経系、末梢神経系まで含めた⾝体全体で考えないと
意味がない」(加藤⼀郎先⽣より、1993)
¡ ビヘイビアベースドロボティクス、ソフトロボティクス
¡ 「環境ー⾝体」の動的カップリングに着⽬(⾝体の構造)
¡ ⼈間以外のほとんどの⽣物において神経系(脳)の機能は
極めて限定的
¡ 例︓「地⾯ー多⾜機構ー振動⼦」により”歩⾏”が⽣成
¡ そのカップリングの結果としての⾏為のダイナミクスは常
に”刹那的な創発”であり、最適でも汎⽤でもない
加藤⼀郎先⽣
3
発達ロボティクス
×「脳の各機能をロボット(⾝体)が参照する」
◯「⾝体を脳が参照し各機能が分化・創発する(発達)」
×「マルチモーダル情報を学習できる」
◯「⾝体の時空間的制約に拘束されたマルチモーダル情報
しか存在しない(各モーダルは分離できない)」
神経学的変異ー認知プロセスー身体行動それぞれの
レベルの結びつきをシステム的に理解する
4
[浅⽥, 國吉, 2006-]
モラベックのパラドックス
¡ プログラム開発が⽐較的容易
¡ 意識的に⾏う作業(⼤⼈の知能)
¡ 数学、⼯学
¡ ゲーム
¡ 知識を⽤いた推論
¡ 進化のスケールで最近獲得された能⼒
¡ プログラム開発が厄介、もしくは著しく困難
¡ 半無意識的に⾏う作業(⼦供の⼈⼯知能)
¡ 歩く、⾛る → 2000年代に著しい進化
¡ 視覚、⾳声の認識 → 2010年代に著しい進化(深層学習)
¡ ⼿、指を⽤いた物体操作 → 2020年代現在でも極めて困難
¡ 数百万年の進化を通して強化された能⼒
5
AI(深層学習)のロボット
への応⽤の⽅法
¡ ⼊⼒ → 出⼒の”最適”モデルを学習
¡ 認識
¡ 画像 → 物体の位置と姿勢
¡ 強化学習
¡ 動作と感覚 → 報酬の期待値
¡ 学習モデルの不完全性をベースとする
¡ 世界は開かれている
¡ 予測学習
¡ “実時間”での内外感覚の予測と修正
動作
観測
報酬
6
ロボティクス-⾝体性の概念から
「環境ー⾝体ー神経系(脳)」のカップリング
¡ 神経系(脳)の機能は極めて限定的
¡ 深層予測学習 (2013-)
¡ カップリングの中で神経系に深層学習を適⽤
¡ 視覚、触覚などの多次元の感覚と⾝体、環境を
カップリング
7
[K. Noda, H. Arie, Y.
Suga, T. Ogata, 2014]
予測符号化と⾃由エネルギー原理 8
[K. Friston, 2010]
環境 (感覚の⽣成)
感覚予測
(平均, 精度)
感覚⼊⼒ !
− log %('|))
精度重み付
予測誤差
"
+!())
シナプス重み
,-.. ./.-+0
∗
= − log % ' ) + 3"# 4 ) ' ||%())
精度重み付
予測誤差
(Accuracy)
事前信念の
影響
(Complexity)
⾃由エネルギーを最⼩化するためのパラメータ
・w → 学習
・x → 感覚の修正(⾏為の⽣成)
・q(z) → 知覚の修正(仮想知覚の⽣成)
・
!
"!
→ 感覚の精度
・
!
""
→ 事前信念の精度 + ) + /567.
#
*簡略化のため !周辺の負の対数尤度期待値計算は省略
%())
4()|')
事後信念
(予測)
事前信念
(予測)
注意
Rao 1999, Tani 2003, Friston 2011, Yamashita 2012 etc.
• 環境とインタラクションを⾏う際の”予測誤差最⼩化”のための⽅策
予測符号化の簡単なイメージ1
実世界
内部モデル
感覚
予測
⾏為
知覚
9
H. Haker et al. 2016.
“学習”により内部モデルを
変えて予測誤差を最⼩化
予測符号化の簡単なイメージ2
予測誤差最⼩化のための3つの⽅策
“仮想の知覚”を⽣成して
予測誤差を最⼩化
“⾏為の修正”により
予測誤差を最⼩化
機械学習の視点
10
低コスト ⾼コスト
能動的推論の視点
強化学習との対⽐
¡ 強化学習
¡ ⽬的︓⾃由に設計可能
¡ モデルフリー
¡ 状態と⾏為の組に対する報酬の予測を
⼗分に学習
¡ モデルベース
¡ “世界モデル”を⼗分に学習
¡ “学習済”モデル内でポリシーを更新
¡ 最⼤報酬が期待できる⾏動系列を⽣成
¡ (ランダムな)試⾏錯誤
¡ ⽬的に沿った⾏動の最適化
¡ 予測符号化(能動的推論)
¡ ⽬的︓⾃由エネルギー最⼩化
¡ 状態と⾏為(知覚)の系列(モデル)
を予測学習
¡ 学習は⼗分にはできないことが前提
(開かれた世界)
¡ 期待⾃由エネルギーを最⼩化する仮想
知覚を実時間で能動的に推論(知覚⽣
成=⾏為⽣成)
¡ 弱い事前信念 → 試⾏錯誤
¡ 望ましい知覚を実現する知覚系列が、
事前信念に習慣化される
¡ 最適性は保証されない。
11
深層予測学習のフレームワーク
関節⾓度⼊⼒
深層学習
画像
エンコーダ
DCAE
関節⾓度予測
深層学習
画像
デコーダ
DCAE
関節
⾓度
指令値
予測画像
視野画像
⼊⼒
深層予測
学習器
LSTM,
MTRNN
時間ステップ
⼈間の操縦データ(スキル)
の収集(少量データ)
実時間で動作・画像の予測を修正し続ける
学習(世界モデル)
12
仮想の知覚
⾏為の修正
実画像
[P. Yang+, 2016]
「⾝体知」に基づくロボット独⾃の
世界モデルを獲得
p 数⼗回の学習のみ
p “未学習”のタオル,本を⾼速かつ
反復して折り畳み可能
P. Yang+, IEEE RA-L, 2016, ICRA2017 etc.
エクスペリエンス・ベースド・ロボティクス
(尾形提案)
p JST CRDS戦略プロポーザル「第4世代AIの
研究開発」(2020)
p NEDO次世代⼈⼯知能・ロボット中核技術
開発ハンドブック(2020)
深層予測学習のデモンストレーション
折り畳み(タオル配置・種類,本)含︓⼿⾸柔軟関節
Cebit 2017, CEATEC2017,国際ロボット展2017
13
ExaWizards ExaWizards
深層予測学習の企業応⽤例
ハーネス組み
付け(2021)
液体計量(2021)
¡ 粘性の異なる液
体を事前知識な
しで計量
汎⽤モデル
(2017)
¡ タオル畳み
¡ サラダ盛り
付け
粉体計量(2018)
14
ジッパー開け 2021.5 15
[H. Ichiwara+, ICRA2022] [H. Ito+, ICRA2022]
注意
¡ ボトムアップ注意
¡ 注意が画像から⽣成される
¡ Saliency(輝度、⾊、⽅向、⽅位)などの特徴
¡ 報酬を最⼤化するマスク、Key, Query, Valueの⽣成
¡ トップダウン注意
¡ 注意が感覚や⾏為などの全知覚から予測される
¡ 知覚や信念の分散学習(予測誤差を分散で割る)
16
Multitask learning with an embodied
predictive model
H. Ito, K. Yamamoto, H. Mori, T. Ogata,
Science Robotics(2021 Impact Factor: 23.748), Vol. 7, Issue 65, 2022
17
設計思想
1. 経験の学習(エクスペリエンス・ベースド)
¡ 運動と感覚を区別しない
¡ 「感覚ー>動作」のマップではなく,感覚運動
が⼀体化した”知覚”系列(経験)、内観を学習
2. “Multi-time scale”を扱う再帰結合型RNNの
階層予測構造
¡ 異なったレベル(時定数、次元)の予測
¡ トップダウンとボトムアップのインタラクション
3. “Symbol grounding”,実世界と記号世界
¡ 多義性,世界観の共有,創造性...
Slow Context
S-MTRNN
Sensory
Prediction
Fast Context
Sensory
Inputs
Higher-Level
Network
Lower-Level
Network
Variance
Prediction
Multi-Time scale RNN
[Y. Yamashita, J. Tani, 2008]
18
ムーンショット
19
⼀⼈に⼀台⼀⽣寄り添うスマートロボット
“AIREC”
(AI-driven Robot for Embrace and Care)
プロジェクトマネージャー (PM)
菅野 重樹
早稲⽥⼤学
プロトタイプDry-AIREC (2021年10⽉) 20
⾝⻑: 1660mm
全体重量: 約150kg
可搬重量: 最悪姿勢保持: 8kg、最⼤瞬間(肘直⾓時): 20kg
関節トルクセンサxインピーダンス制御(腕部7軸x2、腰部3軸)
ハンド6軸x2(把持⼒センサ)
⼈肌ゲル(腕部、胴体前⾯)
台⾞: 全⽅位オムニホイール
AIとロボットの共進化
AIとロボットが様々な社会ニーズに基づいて共進化
21
ロボティクスの⾰新
柔軟かつ強靭な⾝体を持つロボットが
環境とインタラクションし,知的⾏動
が⾃然に創発される
AIの⾰新
⼈のスキル変換で柔軟なロボットハード
ウェアの機能を,数少ない経験で学習でき
る”深層予測学習”で最⼤限に引き出す
社会受容性の把握
実証実験と社会受容性の
調査により必要かつ適切
な機能を選択
⼈々の共感を得る社会
メッセージの発信
N. Saito, T. Ogata,
H. Mori, S. Funabashi,
and S. Sugano,
IEEE ICRA2021,
Best Paper Award
in Cognitive
Robotics
おわり

More Related Content

What's hot

強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
Shota Imai
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
Kawamoto_Kazuhiko
 

What's hot (20)

Transformer メタサーベイ
Transformer メタサーベイTransformer メタサーベイ
Transformer メタサーベイ
 
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
 
これからの Vision & Language ~ Acadexit した4つの理由
これからの Vision & Language ~ Acadexit した4つの理由これからの Vision & Language ~ Acadexit した4つの理由
これからの Vision & Language ~ Acadexit した4つの理由
 
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
 
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報
 
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
 
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
 
ResNetの仕組み
ResNetの仕組みResNetの仕組み
ResNetの仕組み
 
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery
 
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 
研究効率化Tips Ver.2
研究効率化Tips Ver.2研究効率化Tips Ver.2
研究効率化Tips Ver.2
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
 
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法
 
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
 
Transformerを雰囲気で理解する
Transformerを雰囲気で理解するTransformerを雰囲気で理解する
Transformerを雰囲気で理解する
 
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
 
CV分野におけるサーベイ方法
CV分野におけるサーベイ方法CV分野におけるサーベイ方法
CV分野におけるサーベイ方法
 
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
 
AIのラボからロボティクスへ --- 東大松尾研究室のWRS2020パートナーロボットチャレンジへの挑戦
AIのラボからロボティクスへ --- 東大松尾研究室のWRS2020パートナーロボットチャレンジへの挑戦AIのラボからロボティクスへ --- 東大松尾研究室のWRS2020パートナーロボットチャレンジへの挑戦
AIのラボからロボティクスへ --- 東大松尾研究室のWRS2020パートナーロボットチャレンジへの挑戦
 

More from The Whole Brain Architecture Initiative

More from The Whole Brain Architecture Initiative (20)

第7回WBAシンポジウム:松嶋達也〜自己紹介と論点の提示〜スケーラブルなロボット学習システムに向けて
第7回WBAシンポジウム:松嶋達也〜自己紹介と論点の提示〜スケーラブルなロボット学習システムに向けて第7回WBAシンポジウム:松嶋達也〜自己紹介と論点の提示〜スケーラブルなロボット学習システムに向けて
第7回WBAシンポジウム:松嶋達也〜自己紹介と論点の提示〜スケーラブルなロボット学習システムに向けて
 
第7回WBAシンポジウム:全脳確率的生成モデル(WB-PGM)〜世界モデルと推論に基づく汎用人工知能に向けて
第7回WBAシンポジウム:全脳確率的生成モデル(WB-PGM)〜世界モデルと推論に基づく汎用人工知能に向けて第7回WBAシンポジウム:全脳確率的生成モデル(WB-PGM)〜世界モデルと推論に基づく汎用人工知能に向けて
第7回WBAシンポジウム:全脳確率的生成モデル(WB-PGM)〜世界モデルと推論に基づく汎用人工知能に向けて
 
第7回WBAシンポジウム:基調講演
第7回WBAシンポジウム:基調講演第7回WBAシンポジウム:基調講演
第7回WBAシンポジウム:基調講演
 
第7回WBAシンポジウム:WBAI活動報告
第7回WBAシンポジウム:WBAI活動報告第7回WBAシンポジウム:WBAI活動報告
第7回WBAシンポジウム:WBAI活動報告
 
BriCAプラットフォーム説明会(2022-05)
BriCAプラットフォーム説明会(2022-05)BriCAプラットフォーム説明会(2022-05)
BriCAプラットフォーム説明会(2022-05)
 
第3回WBAレクチャー:BRA評価
第3回WBAレクチャー:BRA評価第3回WBAレクチャー:BRA評価
第3回WBAレクチャー:BRA評価
 
第3回WBAレクチャー:BRAに基づく海馬体の確率的生成モデルの構築
第3回WBAレクチャー:BRAに基づく海馬体の確率的生成モデルの構築第3回WBAレクチャー:BRAに基づく海馬体の確率的生成モデルの構築
第3回WBAレクチャー:BRAに基づく海馬体の確率的生成モデルの構築
 
第3回WBAレクチャー:海馬体周辺におけるBRA駆動開発の進展
第3回WBAレクチャー:海馬体周辺におけるBRA駆動開発の進展第3回WBAレクチャー:海馬体周辺におけるBRA駆動開発の進展
第3回WBAレクチャー:海馬体周辺におけるBRA駆動開発の進展
 
第6回WBAシンポジウム:Humanity X.0 共生創発と情報の身体性
第6回WBAシンポジウム:Humanity X.0 共生創発と情報の身体性第6回WBAシンポジウム:Humanity X.0 共生創発と情報の身体性
第6回WBAシンポジウム:Humanity X.0 共生創発と情報の身体性
 
第6回WBAシンポジウム:人の手のひら AIの手のひら
第6回WBAシンポジウム:人の手のひら AIの手のひら第6回WBAシンポジウム:人の手のひら AIの手のひら
第6回WBAシンポジウム:人の手のひら AIの手のひら
 
第6回WBAシンポジウム:人間は動物を必要とするが、
AIは人間を必要とするか?
第6回WBAシンポジウム:人間は動物を必要とするが、
AIは人間を必要とするか?第6回WBAシンポジウム:人間は動物を必要とするが、
AIは人間を必要とするか?
第6回WBAシンポジウム:人間は動物を必要とするが、
AIは人間を必要とするか?
 
第6回WBAシンポジウム:脳参照アーキテクチャ 駆動開発からの AGI構築ロードマップ
第6回WBAシンポジウム:脳参照アーキテクチャ 駆動開発からの AGI構築ロードマップ第6回WBAシンポジウム:脳参照アーキテクチャ 駆動開発からの AGI構築ロードマップ
第6回WBAシンポジウム:脳参照アーキテクチャ 駆動開発からの AGI構築ロードマップ
 
第6回WBAシンポジウム:WBAI活動報告
第6回WBAシンポジウム:WBAI活動報告第6回WBAシンポジウム:WBAI活動報告
第6回WBAシンポジウム:WBAI活動報告
 
技術進展がもたらす進化戦略の終焉
技術進展がもたらす進化戦略の終焉技術進展がもたらす進化戦略の終焉
技術進展がもたらす進化戦略の終焉
 
The 5th WBA Hackathon Orientation -- Cerenaut Part
The 5th WBA Hackathon Orientation  -- Cerenaut PartThe 5th WBA Hackathon Orientation  -- Cerenaut Part
The 5th WBA Hackathon Orientation -- Cerenaut Part
 
Task Details of the 5th Whole Brain Architecture Hackathon
Task Details of the 5th Whole Brain Architecture HackathonTask Details of the 5th Whole Brain Architecture Hackathon
Task Details of the 5th Whole Brain Architecture Hackathon
 
Introduction to the 5th Whole Brain Architecture Hackathon Orientation
Introduction to the 5th Whole Brain Architecture Hackathon OrientationIntroduction to the 5th Whole Brain Architecture Hackathon Orientation
Introduction to the 5th Whole Brain Architecture Hackathon Orientation
 
WBAレクチャー#1BRAの審査と登録(山川宏)
WBAレクチャー#1BRAの審査と登録(山川宏)WBAレクチャー#1BRAの審査と登録(山川宏)
WBAレクチャー#1BRAの審査と登録(山川宏)
 
WBAレクチャー#1SCID法の実例 (布川絢子)
WBAレクチャー#1SCID法の実例 (布川絢子)WBAレクチャー#1SCID法の実例 (布川絢子)
WBAレクチャー#1SCID法の実例 (布川絢子)
 
WBAレクチャー#1脳機能の体系的理解を目指して(山川宏)
WBAレクチャー#1脳機能の体系的理解を目指して(山川宏)WBAレクチャー#1脳機能の体系的理解を目指して(山川宏)
WBAレクチャー#1脳機能の体系的理解を目指して(山川宏)
 

第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化