SlideShare a Scribd company logo
1 of 14
走行データを用いた
ビジュアルナビゲーション方策の学習
明治大学ロボット工学研究室(AMSL)
吉内航 島田航太 平川康則 伊原佑樹 有馬純平
つくばチャレンジ2020第2回LT大会
AMSLのつくチャレでの近年の活動
詳細な事前環境地図を必要としないNavigationシステムの開発(2017~)
● 地図作成のための手間が必要ない(電子地図からNode-Edge地図を用いる)
● 精度は下がるが、よりロバストな自己位置推定
地図ベースのナビゲーションから、
リアルタイムの認識に重点を移すことによって
人間によるengineeringを減らすことができた(特に地図作成)
(課題)
● 認識モジュールの精度向上にはある程度人手によるチューニングが必要
● 今まで何年も参加してきた経験を活かしきれていない
○ その場を乗り切るだけの調整が多い
2
走行データを用いた学習
走行データ(経験)からロボット自身が学習できるシステム(life-long navigation)
3
地図作成データ収集 自律走行 調整調整
学習データ収集 自律走行 自己改善
従来手法
機械学習
先行研究
実機のロボット学習の手法では、データ効率よく行うのが重要であり、
デモンストレーションデータから学習する研究が多くされている。
● BC(Behavior Cloning):模倣学習
○ 事前に収集したデータを教師として同様の行動を獲得するように学習
● RL(SA-CADRL, etc...):強化学習
○ 環境内で試行を繰り返してデータを収集
○ 環境との相互作用によって得られる報酬を最大化する方策を学習
● Deep Predictive Model * Model-based RL (BADGR):深層予測学習
○ 収集したデータからイベントの発生や姿勢を推定するモジュールを学習
○ 経路候補に対して推定結果に基づいてコストを計算し最適な経路を決定
4
調査内容
data-driven navigation手法の調査
つくばチャレンジなどで走行したrosbagデータからナビゲーション方策を学習
● 走行データのみからナビゲーションの方策を学習する
● データが増えると自己改善により精度が向上するような
life-longなシステムを目指すのが最終目的
Behavior Cloning(模倣学習)、逆強化学習、オフライン強化学習など
近年のデモンストレーションから方策を学習する手法を実装し、
つくばチャレンジのような屋外ナビゲーションのタスクに
どの程度使えるかを調査する
5
データ
● データ(rosbag形式)
○ Required(必要な最低条件の情報)
■ 観測(observation):RGB image
■ 行動(action):linear velocity, angular velocity
○ Option(学習アルゴリズムによって必要なもの)
■ 障害物情報: scan data
■ 地面凹凸情報: imu data
■ 位置情報: odom, pose, GPS
● 環境(生田キャンパス・つくば市役所付近・vtc_unity)
6
学習アルゴリズム
環境との相互作用なしで、走行データのみから学習できるBCとBADGRを実装
7
Algorithm dataset 学習対象 環境との相互作用 汎化性能
Behavior Cloning (o, a) π(a | o) ✖︎ ?
DAgger (o, a) π(a | o) ○ ?
GAIL (o, a, o’) π(a | o), D(a) ○ ?
BADGR (o, a, label’) Cost(o, at=0~h) △ ?
BCQ (o, a, r, o’) π(a | o) ✖︎ ?
進捗
● データセットの作成
○ つくば: 1h
○ 生田: 1h
○ vtc_unity: 30m
● 学習モデルの実装・学習
○ BC
■ ネットワーク構造: 3層CNN or ResNet(18,34,50),RNNの有無
■ 入力:image only or Goal Conditioned
○ BADGR
● vtc_unityでの動作確認(BehaviorCloning)
○ ネットワーク:3層CNN,RNNなし
○ image onlyで学習
8
今後
● ネットワーク構造による違いの調査
● 手法による違いを調査
● 実機での評価
● 自己改善能力(データが増えたら性能が上がるかどうか)の検証
9
補足資料
10
policy
behavior cloning
11
FC*4
- 512
- ReLU
Encoder
- ResNet18
- ResNet34
- ResNet50
- Default
img
(ot)
acs
(a`t)
acs
(at)
MSE
policy
FC*4
- 512
- ReLU
Encoder
- ResNet18
- ResNet34
- ResNet50
- Default
img
(ot:t+h)
acs
(a`t:t+h)
acs
(at:t+h)
MSE
RNN
Default
CNN*3
- 32-64-64
- 5-3-3
- 2-2-2
- ReLU
policy
behavior cloning (Goal-Conditioned)
12
FC*4
- 512
- ReLU
Encoder
- ResNet18
- ResNet34
- ResNet50
- Default
img
(ot)
acs
(a`t)
acs
(at)
MSE
goal
(gt)
Predictive Model
BADGR
13
FC*4
- 256-256-128-128
- ReLU
CNN*3
- 32-64-64
- 5-3-3
- 2-2-2
- ReLU
img
(ot)
collision
(c`t:t+h)
collision
(ct:t+h)
BCE
LSTM
acs
(at:t+h)
FC*2
- 16-16
- ReLU
FC
- 32
- ReLU
FC
- 32
- ReLU
FC
- 32
- ReLU
bumpine
ss
(b`t:t+h)
bumpin
esss
(bt:t+h)
BCE
position
(p`t:t+h)
position
(pt:t+h)
MSE
Predictive Model
BADGR
14
FC*4
- 256-256-128-128
- ReLU
CNN*3
- 32-64-64
- 5-3-3
- 2-2-2
- ReLU
img
(ot)
collision
(c`t:t+h)
collision
(ct:t+h)
BCE
LSTM
acs
(at:t+h)
FC*2
- 16-16
- ReLU
FC
- 32
- ReLU
FC
- 32
- ReLU
FC
- 32
- ReLU
bumpine
ss
(b`t:t+h)
bumpin
esss
(bt:t+h)
BCE
position
(p`t:t+h)
position
(pt:t+h)
MSE

More Related Content

What's hot

Mini Tokyo 3D
Mini Tokyo 3DMini Tokyo 3D
Mini Tokyo 3D
nagix
 
Mini Tokyo 3D − 交通デジタルツインとデジタルトランスフォーメーションの世界
Mini Tokyo 3D − 交通デジタルツインとデジタルトランスフォーメーションの世界Mini Tokyo 3D − 交通デジタルツインとデジタルトランスフォーメーションの世界
Mini Tokyo 3D − 交通デジタルツインとデジタルトランスフォーメーションの世界
nagix
 
Mini Tokyo 3D 2021 − 交通デジタルツイン、2年間の進化
Mini Tokyo 3D 2021 − 交通デジタルツイン、2年間の進化Mini Tokyo 3D 2021 − 交通デジタルツイン、2年間の進化
Mini Tokyo 3D 2021 − 交通デジタルツイン、2年間の進化
nagix
 
大浦工測 建築分野における3Dスキャナーの活用
大浦工測 建築分野における3Dスキャナーの活用大浦工測 建築分野における3Dスキャナーの活用
大浦工測 建築分野における3Dスキャナーの活用
Akira Oura
 
11t3804fsantoshインターンシップ
11t3804fsantoshインターンシップ11t3804fsantoshインターンシップ
11t3804fsantoshインターンシップ
Santosh Yonjan
 

What's hot (20)

【UDC2016】アクティビティ163 オープンマップ山口市
【UDC2016】アクティビティ163 オープンマップ山口市【UDC2016】アクティビティ163 オープンマップ山口市
【UDC2016】アクティビティ163 オープンマップ山口市
 
(配布用)Virtual shizuoka(静岡県)
(配布用)Virtual shizuoka(静岡県)(配布用)Virtual shizuoka(静岡県)
(配布用)Virtual shizuoka(静岡県)
 
第5回 地図の勉強会
第5回 地図の勉強会第5回 地図の勉強会
第5回 地図の勉強会
 
Virtual shizuoka20210623
Virtual shizuoka20210623Virtual shizuoka20210623
Virtual shizuoka20210623
 
地球観測データマッピングのための タイルマップサービスの開発
地球観測データマッピングのための タイルマップサービスの開発地球観測データマッピングのための タイルマップサービスの開発
地球観測データマッピングのための タイルマップサービスの開発
 
Mini Tokyo 3D
Mini Tokyo 3DMini Tokyo 3D
Mini Tokyo 3D
 
GHP2021技術者ハンズオンタイムライン
GHP2021技術者ハンズオンタイムラインGHP2021技術者ハンズオンタイムライン
GHP2021技術者ハンズオンタイムライン
 
静岡県が目指す「VIRTUAL SHIZUOKA構想」とは?
静岡県が目指す「VIRTUAL SHIZUOKA構想」とは?静岡県が目指す「VIRTUAL SHIZUOKA構想」とは?
静岡県が目指す「VIRTUAL SHIZUOKA構想」とは?
 
Mini Tokyo 3D − 交通デジタルツインとデジタルトランスフォーメーションの世界
Mini Tokyo 3D − 交通デジタルツインとデジタルトランスフォーメーションの世界Mini Tokyo 3D − 交通デジタルツインとデジタルトランスフォーメーションの世界
Mini Tokyo 3D − 交通デジタルツインとデジタルトランスフォーメーションの世界
 
ワークショップ「D3.js」入門
ワークショップ「D3.js」入門ワークショップ「D3.js」入門
ワークショップ「D3.js」入門
 
Virtual shizuoka(静岡県)
Virtual shizuoka(静岡県)Virtual shizuoka(静岡県)
Virtual shizuoka(静岡県)
 
【UDC2016】アプリ014 かわさきアプリ
【UDC2016】アプリ014 かわさきアプリ【UDC2016】アプリ014 かわさきアプリ
【UDC2016】アプリ014 かわさきアプリ
 
20190528asano
20190528asano20190528asano
20190528asano
 
Mini Tokyo 3D 2021 − 交通デジタルツイン、2年間の進化
Mini Tokyo 3D 2021 − 交通デジタルツイン、2年間の進化Mini Tokyo 3D 2021 − 交通デジタルツイン、2年間の進化
Mini Tokyo 3D 2021 − 交通デジタルツイン、2年間の進化
 
Slide digital fabrication2019_08_190531
Slide digital fabrication2019_08_190531Slide digital fabrication2019_08_190531
Slide digital fabrication2019_08_190531
 
大浦工測 建築分野における3Dスキャナーの活用
大浦工測 建築分野における3Dスキャナーの活用大浦工測 建築分野における3Dスキャナーの活用
大浦工測 建築分野における3Dスキャナーの活用
 
【UDC2016】アプリ187 営業時間定休日地図アプリ
【UDC2016】アプリ187 営業時間定休日地図アプリ【UDC2016】アプリ187 営業時間定休日地図アプリ
【UDC2016】アプリ187 営業時間定休日地図アプリ
 
Strolyによる古地図やイラスト地図を使ったまち歩きや、Wikipedia記事との連携の方法
Strolyによる古地図やイラスト地図を使ったまち歩きや、Wikipedia記事との連携の方法Strolyによる古地図やイラスト地図を使ったまち歩きや、Wikipedia記事との連携の方法
Strolyによる古地図やイラスト地図を使ったまち歩きや、Wikipedia記事との連携の方法
 
箱根駅伝 3D とその他いろいろ
箱根駅伝 3D とその他いろいろ箱根駅伝 3D とその他いろいろ
箱根駅伝 3D とその他いろいろ
 
11t3804fsantoshインターンシップ
11t3804fsantoshインターンシップ11t3804fsantoshインターンシップ
11t3804fsantoshインターンシップ
 

Similar to AMSL rwrc20 LT

Similar to AMSL rwrc20 LT (7)

3Dマップを活用したVisual Localization
3Dマップを活用したVisual Localization3Dマップを活用したVisual Localization
3Dマップを活用したVisual Localization
 
グラフィックレコーディング~構造化のコツ~160213 Devlove関西
グラフィックレコーディング~構造化のコツ~160213 Devlove関西グラフィックレコーディング~構造化のコツ~160213 Devlove関西
グラフィックレコーディング~構造化のコツ~160213 Devlove関西
 
A12  坂井研究室 澤田純礼
A12  坂井研究室 澤田純礼A12  坂井研究室 澤田純礼
A12  坂井研究室 澤田純礼
 
13 takai
13 takai13 takai
13 takai
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection survey
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)
 
【出張ヒストリア2018】モーションキャプチャーを取り入れるには?
【出張ヒストリア2018】モーションキャプチャーを取り入れるには? 【出張ヒストリア2018】モーションキャプチャーを取り入れるには?
【出張ヒストリア2018】モーションキャプチャーを取り入れるには?
 

AMSL rwrc20 LT

Editor's Notes

  1. 過去のつくばチャレンジは全て参加 2017年から独自の手法で参加している ・Node-Edge-Map グラフ構造の地図(交差点と直線) 内界センサとリアルタイムの環境認識による自己位置推定 芝生の認識や道の縁石などの道の形状が課題
  2. 自動ロボットの高知能化、リアルタイムの認識からの環境によらない柔軟な行動計画 機械学習ベースのNavigation ・従来手法 人の手によるエンジニアリングが必要 調整はいわゆる職人技 ・学習ベース 人によるチューニングが必要ない 走行したデータによる自己改善も可能
  3. ################################################# SA-CADRL:動的障害物を考慮したRLベースの動作計画
  4. ・なぜ画像を使うか? 環境のゼマンティクスも考慮した学習が可能 センサが安価 応用範囲が広い ###########################################################
  5. BCとBADGRを実装中 蓄積されたデータから方策を獲得 -> BC, BADGR BC:実装が容易であり、基本となる手法 BADGR:論文中で実際のナビゲーションタスクへの応用がされている ########################################################### DAgger:学習している方策による行動列とエキスパートによる行動列を用いて学習 GAIL:逆強化学習+GAN BCQ:offline RL 出そうな質問 ・なぜBCQを外した?
  6. 現状の結果について ・学習に用いたデータ数が少なく偏りがあるためうまくいっていないのでは? ・
  7. BADGRの学習
  8. 吉内 TODO:基本のエンコーダーの構造を追加
  9. 吉内 現在の実装上はbumpinessに未対応