Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

A I 研究のガイドとしての 能力マップの開発

54 views

Published on

第3回WBAシンポジウム 大森隆司氏講演資料

Published in: Science
  • Be the first to comment

  • Be the first to like this

A I 研究のガイドとしての 能力マップの開発

  1. 1. A I 研究のガイドとしての 能力マップの開発 玉川大学 工学部/脳科学研究所 大森隆司
  2. 2. 全部アーキテクチャを共同開発するために② 山川 : 第3回全脳アーキテクャシンポジウム 困難1 : AGIに必要な広範な 能力を網羅的に記述すること は困難 脳に学んで全部アーキテクチャを構 築するメリット 解決1:能力を脳器官に接地させつ つ能力を構造化することで、網羅性 を高める。 AGI開発の一般的な難しさ 特定の能力を階層的に機能分解 することによる設計はそぐわない 困難2 : 認知アーキテクチャ における機能分解には任意性 がある。何れのアーキテク チャがAGIに到達できるか不明 しかし、脳型AIのアーキテクチャは、 明らかでなく、エンジニアが設計す る仕様書になっていない。 解決2:AGI到達の保証 ある程度詳細に脳のアーキテクチャ を反映したAIは、人間や動物程度 の汎用知能の基盤となる。
  3. 3. 「エンジニアが着手できる WBAの仕様書」 Agent ロードマップ課題への対応: 能力マップの作製 St. ML St. St. Environment :スタブ :機械学習 :脳器官I/F St. ML タスク (テスト) 脳器官I/F (情報処理的 な意味付け) 能力マップ: AGIに必要な能力 を網羅的に構造化したもの。 WBCA (コネクトーム) 脳器官 の能力 ある粒度の能力が脳器 官に対応可能と仮説 能力とタスクの関係 C 1 C 2 C 3 C 4 T1 ◯ T2 ◯ T3 脳器官フレームワーク (標準外部仕様) ロードマップ 山川 : 第3回全脳アーキテクャシンポジウム
  4. 4. 本日のストーリー 1. ロードマップの限界 2. 「能力マップ」 の提案 3. 背景 : 脳は領野の組み合わせでタスクを解決 4. 能力マップの例 : ナビゲーション能力 5. 効用 : 能力マップの使い方 6. 理論 : 要素機能の組み合わせの可能性 → メタシステムの必要性
  5. 5. 「能力マップ」の提案 • 能力? : AGIに必要な知能要素への分解 • マップ? : 幅広い分野の開発の現状を表す • 基本概念 : 能力 = 要素機能の集合体で実現 例 迷路ナビゲーション 戦 略 反 射 強化学習 推 論 要 素 機 能 環境認識 ← 同左 ← 同左 行動生成 ← 同左 ← 同左 試行錯誤 ← 同左 ← 同左 Hebb学習 地図獲得 ← 同左 仮想評価 ← 同左 Belman方程式 予測 作業記憶
  6. 6. 能力とは? 「ナビゲーション能力」 「文章理解能力」 「計算能力」 etc. ex. 「計算能力」 • 定義 ← 何をさせたいか = タスク • 「計算」の戦術 • 1桁の数表を覚え桁ごとに → 数値操作能力 • 2桁の数表を覚え2桁ごと → 数値操作能力 • 答えをマル覚えする → 記憶力 • 指折り数える → 身体操作能力 能力 = タスク と 解決戦略 で定義される情報処理 • これを要素に分解・体系化したい
  7. 7. 脳 =機能要素の組み合わせ 機能要素 機能要素 機能要素 機能要素 機能要素 機能要素 機能要素 機能要素 タスク 検出器 能力 組合せ器 外部感覚 + 内部感覚 状況・組合せ探索器 報酬 組合せ ライブラリ 組合せ ライブラリ 組合せ ライブラリ 組合せ ライブラリ 組合せ ライブラリ タスク ライブラリ 利用と蓄積 情動・本能システム 制御 外部感覚 + 内部感覚 感 覚 入 力 行 動 出 力 ヒトは報酬に基づいて 行動を獲得する 強化学習の理論 ヒトはタスクに応じて 行動(内部処理)を決める タスク → 手続き モデル 脳の内部処理(能力)は 機能要素の動的な 組み合わせにより実現 脳内処理の機能要素 組み合わせモデル
  8. 8. 能力マップ 「ナビゲーション」領域 仮説 : 機能部品の追加 → 段階的な能力の高度化 ナビゲーション ナビゲーション (地図なし) ナビゲーション (強化学習) ナビゲーション (推論) 環境 認識 行動 生成 Belman 方程式 Hebb 学習 試行 錯誤 環境 予測 仮想 評価 作業 記憶 地図 獲得 大脳 基底核 海馬 辺縁系新皮質 感覚系 新皮質 運動系 新皮質 どこか 脳内 どこか 前頭葉 タスク(戦術) レベル タスク総称 要素機能 脳部位レベル 参考書 Github 実装事例 参考文献 Github 応用事例 参考文献 Github 応用事例 参考書 Github 実装事例 参考文献 Github 応用事例
  9. 9. 能力マップ 「ナビゲーション」領域 試行 錯誤 新皮質 どこか 一様 乱数 確率 分布 確率分布 の学習 ベイジアン ネット生成 創造 性 探索 評価 辺縁系前頭葉 物理 予測 地図 獲得 海馬 視覚系? 環境 認識 遷移 記憶 遷移 記銘 遷移 想起 環境 再認 記憶方略 予測方略 イメージ 生成 視覚系 タスク (戦術) レベル タスク総称 要素 機能 脳部位 レベル 参考文献 Github 研究事例 参考文献 Github 応用事例 参考書 Github 事例 参考文献 Github 事例 解決済領域 → 先端領域 → 未解決領域 参考書 Github 事例 参考書 Github 事例
  10. 10. 能力マップの使い方 AI応用の開発者 • 自分の課題に類似のマップ領域 → 研究・開発の現状を把握 • 利用できるアルゴリズム,プログラムの発見 • 新規に開発するべき項目(新規性)の確認 → 応用開発の促進,参加障壁の低下 AIの基礎研究者 • 個々の要素機能の高機能化 ← 再利用による要素の鍛錬 • 未解決な能力の探索の指標 • 対応する脳領域の機能の特定 → AGI の開発に向けての前進
  11. 11. 追加開発 シード開発 シード開発 マージ開発 シード開発 特化課題への対応:全部アーキ構築プロセス ML St. St. St. Environment St. ML St. St. Environment St. St. ML St. Environment ML ML St. St. Environment St. St. ML ML Environment 追加開発 改良開発 ML ML St. St. Environment St. ML ML ML Environment マージ開発 ML ML ML ML Environment MLへの置き換え: 帰納推論の範囲の拡大 全部アーキ テクチャ (部品は揃 えた状態) 脳型アーキテク チャの汎用性 ①脳器官フレー ムワーク(I/F・能 力)で制約 ②脳にガイド されたリファ クタリング :スタブ :機械学習 :脳器官I/F St. ML 山川 : 第3回全脳アーキテクャシンポジウム
  12. 12. 構想 多方面の能力マップの実現 タスクの領域 • 物理領域 : ナビゲーション , 物体操作 , 身体制御 • 認知領域 : 言語認識・理解 ,対人インタラクション ... 領域を網羅的にそろえたい ⇔ タスク要求との関係 方法 • サーベイ → 多くのエキスパートの協力 • これを作ること(体系化)自体が研究的な意味合い 可能性と限界 • どの領域が書けるのか? → AGIの汎用性の領域? • 多重実装可能性への対応? → タスク分類の精緻化 • 従来から知識工学でも類似の検討:オントロジー → 網羅性,構造化という意味では困難?
  13. 13. A G I への路 = メタシステム •∑ 特化型人工知能 ≠ 汎用人工知能 • ∑ 要素機能 ≠ 汎用人工知能 AGIの本質的な要素 • 汎用性 = 知識・処理の新タスクへの再利用 • 再利用の仕掛け = メタシステム → 事例 : 対物/対人インタラクション • 必要に応じて要素機能の新規獲得
  14. 14. 事例 : 対人インタラクションに関わる内部過程 センシング 感覚処理 認識 他者モデル (知覚) 他者の内部 過程の推定 意思決定 働きかけの 効果の予測 他者モデル (反応) プラン選択行動生成 反射的 フィード バック 内的状態の ダイナミクス (知識,推論, 信念,感情) 行動生成 センシング 感覚処理 認識 意 図 ・目 的 行動 選択 意 思 決 定 物理モデル (行動) 物理モデル (感覚) 習慣的 行動 他者の内部過程 自己の内部過程 他者モデル (内的過程) 状況モデル (タスク)
  15. 15. 意図 行動 他者(行動主体) 対象状態 の認識 観察 環境の 知識 自己意図と 行動計画 行動 自己(対行動主体) 観察 他者意図 の推定環境の 知識 他者の モデル 反射的 運動計画 行動 自己(対物体) 観察 物理的 運動予測 物理法則 の知識 動き 対象(物体) 作用 運動の 物理法則 働きかけ 観察 物体との 相互作用 Intention of others intention action module module action perception 結合された機能要素群 機能要素の選択 (メタシステムの機能) 15 行動 他者(機械的反射) 観察 反射的な 行動生成 プログラム 自己の 行動計画 行動 自己(対 機械) 観察 機械動作 の予測 機械の 知識 機械との 相互作用 コミュニケーションの脳過程の計算モデル – 他者理解のための脳認知計算論 – コミュニケーション : 相互推定+メタ戦略 – 起きていることは, 他者,モノのモデルの 動的な運用 行動主体との 相互作用
  16. 16. 事前知識 の範囲 即応性の 到達可能範囲 知能 = 知識再利用型学習システム  知識再利用により 「即応性」 が創発  即応性 → 「知能」の定義そのもの 現在状態 タスクA 解領域 手持ちの 機能要素で 構成可能な 能力の空間 タスクB 解領域 機能要素の 学習適応で 構成可能な 能力の空間 タスクC 解領域 機能要素の増加による拡大 脳の手法 確率探索?: ある種の確率的な探索ではあろう 小川,大森:実環境ナビゲーションタスクへの即応性のための知識再利用型 学習システムの提案,電子情報通信学会論文誌D-II,Vol.J88-D-II,No.2, pp.378-389,2005

×