WBA勉強会
〜予測する脳と主体性の現象学〜
10⽉23⽇(⾦)
主旨説明 (15分ほど)
• ⾃⼰紹介
• 予測する脳
• 主体性の問題
• 予測できなさ
• なぜ現象学
⾃⼰紹介
• ⼤⽻成征(おおばしげゆき)Twitter: @shigepong
• 学歴
• 1996年4⽉京都⼤学理学部卒
• 1998年4⽉京都⼤学⼤学院 理学研究科
修⼠(地球惑星科学)
• 2001年3⽉ 奈良先端科学技術⼤学院⼤学(NAIST)
修⼠(理学)
• 2002年9⽉ 同 博⼠(⼯学)
• 職歴
• 2003年4⽉奈良先端科学技術⼤学院⼤学 助教
• 2008年4⽉京都⼤学 講師
• 2020年4⽉ミイダスHRサイエンス研究所 シニアリサーチャー
脳とコンピュータ
× 100 億
クロック数
細胞数
シナプス結合数 100 億 × 1万 ?
5GHz 2500 コア
クロック数 1~10 Hz ?
ノード間同期 ← ボトルネック
同期が最⼩限なら効率UP
予測する脳
状態
観測
次の状態
将来の観測
予測
更新
世界
予測する脳
= 状態空間モデルとしての脳
ダイナミクスモデル 観測モデル
内部状態=隠れ変数 xt の確率分布
観測
【脳の予測コーディングモデル】
内部状態や状態空間モデルは
・脳内の神経状態として表象されている
・観測毎の予測誤差を⽤いて、
将来観測の予測がベターになるように更新される
合わせて状態空間モデルと呼ばれる
⾃由エネルギー原理
(free energy principle; FEP)
• ふつうのベイズ推定ならば
• 変分ベイズならば
パラメタ の事前確率 のもとで
内部状態とパラメタの同時事後確率 を求める
⾃由エネルギー = エビデンス変分下界 Evidence Lower Bound; ELBO
を⽬的関数として
を求める
⽬的関数ELBOの便利さ
• 計算が容易
• 事後確率に関するEMアルゴリズム
• 事後確率を表すパラメタに関する勾配法
• AI? ← PyTorch / TF で⾃動微分
• 脳? ← 神経計算
• 拡張が容易
• 階層的な事前分布 ← に関して最適化
• 観測が⾏動依存 ← ⾏動 に関して最適化
能動推論(アクティブインファレンス)
による⾏動決定
⾏動+知覚の統⼀モデル
2020年9⽉ ArXiV
未来を推定?
最適アクションを推定?
最適ポリシーを推定?
相⼿のアクションを推定?
相⼿のスキルをコピー?
← できる
← できる
← できる
← できる
← できる
問題は「世界」の定式化
• 世界には「もの」と「こと」がある
• 世界には「主体」と「客体」がある
• 世界には「わたし」と「それ以外」の境界がある
予測する脳の主体性と現象学
吉⽥ 正俊 (よしだ まさとし)
• 2020年1⽉〜
北海道⼤学
⼈間知・脳・AI研究センター CHAIN 特任准教授
• 2006年4⽉~2019年12⽉
⽣理学研究所 発達⽣理学研究系 助教
http://pooneil.sakura.ne.jp/
⽥⼝ 茂 (たぐち しげる)
• 北海道⼤学 ⽂学研究院 教授
• 同 ⼈間知・脳・AI研究センター センター⻑
差異 神経科学 ⾃⼰意識
意識 ⾃⼰ ⽇本哲学
現象学 媒介 間主観性 ⾃我
脳はどうやって機能(⼼)
を作っているの?
現象はどうやって世界を
作っているの?
どうすれば⼼をもつ機械を作れるの?
現象学
神経科学
WBAI
世界モデル
画像
ダイナミクスモデル 観測モデル
https://free-materials.com/tag/%E4%BA%BA%E6%B7%B7%E3%81%BF/
世界モデル
セグメント
世界モデル
オブジェクト
世界モデル
主体性を持つオブジェクト(≒サブジェクト)
予測する脳にとっての世界モデル
• End-To-End 型
• モジュール型
主体性を含む世界のモデル
• End-To-End 型
• モジュール型
私 にとって、他者 の主体性
私 にとって、私 の主体性
以下は補⾜⽤スライド
予測する脳にとっての世界モデル
サブサンプションアーキテクチャ
MatcherNet を⽤いたキャラクタ動作⽣成
(2019, 2020 Hwang, Oba, et al.)
• 計算よりも
表象を⼯夫する
→ ⾃然な動作⽣成
24
Hwang
Japyung
モノ vs. コト
• 物理学
「世界はモノ(素粒⼦とその相互作⽤)からできている」
• 神経科学
「脳は神経細胞からできている」
「脳の働き(⼼)は神経細胞の相互作⽤からできている」
• 現象学
「世界はコトからできている」
全脳アーキテクチャの設計原理として
物理学 と 現象学 のどちらが近いか?
⽬的関数はELBO
(⾃由エネルギー原理)
• 所与
• 求めたいもの
• 求め⽅
ダイナミクスモデル 観測モデル
直前の状態 観測
次時点の状態
ELBO
を
に関して最⼤化
Evidence Lower Bound
エビデンスの変分下界
ただし
ELBO の定義式
状態空間モデルにおける
内部状態のオンライン更新
• 線形ダイナミクスと
ガウスノイズのもとでは、
カルマンフィルタと同じ
MatcherNet
(Oba et al. 2019; https://github.com/shigeyukioba/matchernet/)
• 状態 x=(x(1),x(2),x(3),x(4)) と観測 y=(y(1),y(2),y(3))
を複数モダリティに分け、任意に疎結合を与えたとき、
状態更新を(擬似)⾮同期な局所計算でおこなう仕組み
グラフ構造は
任意に与えてよい
MatcherNet による⾏動⽣成
(Oba et al. 2019; https://github.com/shigeyukioba/matchernet/)
• 上位層が⽬標状態 x*(の確率分布)を持ち、
下位層が現状態 x (の確率分布)を持つとき、
誤差を⼩さくするような制御信号 u を計算
• PID, LQR のような線形制御も、
iLQG のような⾮線形制御も
扱うための⼤枠は同じ
MatcherNet を⽤いたキャラクタ動作⽣成
(2019, 2020 Hwang, Oba, et al.)
• 計算よりも
表象を⼯夫する
→ ⾃然な動作⽣成
32
Hwang
Japyung
では、ELBO (⾃由エネルギー) だけで
本当に良さそうか? ← たぶん全然ダメ
• ELBO最⼤化原理でアーキテクチャまで決められるか?
• 定式化としてはアリ
• 実態としてはダメ
• マルチエージェント環境
⾃分とは?他者とは?主体とは?
他者にとっての⾃分とは?
⽬的関数 ELBO の便利さ
• 所与
• 求めたいもの
• 求め⽅
ダイナミクスモデル 観測モデル
直前の状態 観測
次時点の状態および各種モデルパラメタ
ELBO
を
に関して最⼤化する
⽅向へ更新
例:
事前確率
状態空間モデル
内部状態
外部環境
観測状態
内部状態
外部環境
観測状態
知覚
抽象化
知覚
予測誤差
誤差フィードバック
予測
内部状態
外部環境
観測状態
知覚
予測誤差
誤差フィードバック
予測
内部状態
予測誤差
予測 誤差フィードバック
誤差フィードバック

WBA勉強会 〜予測する脳と主体性の現象学〜