SlideShare a Scribd company logo
1 of 23
1
DEEP LEARNING JP
[DL Papers]
http://deeplearning.jp/
BADGR: An Autonomous Self-Supervised
Learning-Based Navigation System
Jumpei Arima
書誌情報
• BADGR: An Autonomous Self-Supervised Learning-Based Navigation
System
• author : Gregory Kahn, Pieter Abbeel, Sergey Levine
– Berkeley AI Research (BAIR), University of California, Berkeley
• arxiv : https://arxiv.org/abs/2002.05700
• project page : https://sites.google.com/view/badgr
• code : https://github.com/gkahn13/badgr
2
Introduction
• 従来の手法
– S. ThrunらのProbabilistic Roboticsをベースとした手法
• SLAM, Path Planning
– Waymo, Skydioなどのベースとなる技術
<課題>
• texturelessなシーンでの性能が低下する
• 高価なセンサが必要(主にLiDAR)
• 経験から学習する機構がない
3
Related Works
• 学習ベースによるナビゲーションの関連研究
4
研究 技術 目的 input
[Zhu 17] RL(A3C) target driven navigation RGB image
[Anderson 18] IL(DAGGER) visual language navigation RGB image
[Pfiffer 16] IL(Behavior Cloning) mapless navigation 2D-LiDAR
[Tai 17] RL(DDPG) sim2real 2D-LiDAR
[Zhang 17] RL(DQN) successor features, transfer learning Depth image
[Fan 18] RL(PPO) multi agent collision avoidance 2D-LiDAR
[Tai 18] IL(GAIL) socially compliant navigation Depth image
[Chen 17], [Everett 18], [Chen 19] RL(A3C) multi agent collision avoidance motion prediction
[Wijmans 19] RL(PPO) point goal navigation RGBD image
[Kahn 18], [Kahn 18] RL(Model based) collision avoidance RGB image
Related Works
• 学習ベースによるナビゲーションの関連研究の課題
– inputにLiDARや人の行動予測結果を与える
• 意味情報などの幾何情報以外に対応できない
– シミュレーション上で学習
• sim2realへの対応が必要
• on-policyベースが多くが時間がかかる
– 実機のデータを使う
• デモンストレーションに依存
• サンプル効率
– 上位システムの認識結果を利用
• 自己改善機能がない 5
Proposed Method
• BADGR(Berkeley Autonomous Driving Ground Robot)
– ナビゲーションの問題は幾何学的問題として解かれてきた
– 幾何学情報のみでは、現実世界では限界がある
– ナビゲーションに必要な物理的なaffordanceを経験から獲得
• end-to-end-learning
• self-supervised
• off-policy
• real-world
• no simulation
• no human supervision
6
Proposed Method
• 学習
– (観測、行動)のデータ収集
– 自己教師でラベル付けて
データセットに追加
– 予測モデルの学習
• テスト
– タスクに応じて報酬を設計
– 予測モデルを用いて報酬を最大化する
行動列を算出
– 行動列の最初を実行
7
Proposed Method
• データ収集
– off-policyアルゴリズムを用いて学習する
– データ収集時の方策
• time-correlated random walk
• よりテスト時に近いような行動列
– リセット
• 衝突判断はLiDARとIMUを利用し自動化
• リセット方策は単純に後退と回転
• データ収集後4Hzでサブサンプリング
– 課題点
• 転倒した場合は人が治す必要がある
8
Proposed Method
• self-supervised データラベリング
– 衝突
• 都市環境ではLiDARの値
• オフロード環境ではIMU値が急落したとき
– 地面の凹凸
• IMU値の角速度成分の大きさが閾値以上になった場合
– 位置
• wheel encoderとIMUを統合して算出
9
Proposed Method
• 予測モデルの学習
– ネットワーク構造はCAPsとほぼ同じ
– 入力:画像、行動列
– 出力:各イベント(衝突、位置、凹凸)の予測値
– 交差エントロピー誤差、平均二乗誤差を最小化
10
Proposed Method
• プランニング
– Hステップの行動列、N個から報酬関数を最適化
• random-shootingやcross entropyによる最適化より良い
– PDDMと同様のプランニングを行う
• 実行中の行動列を中心に時間ステップ間に相関をもつようにする
– より自然な行動系列を生成
• 報酬加重平均を用いて実行する行動列を決定
11
https://www.slideshare.net/DeepLearningJP2016/dldeep-dynamics-models-for-learning-dexterous-manipulation
Proposed Method
• 報酬関数
– タスクに依存するが本研究では以下のように決定
– 衝突しないように・ゴール向くように・凹凸を避けるような設計
– 衝突を極力避けたいので、
衝突が予測されるは強制的にコストが最大となるようになっている
12
Experiments
• 実験内容
– 環境:都市環境とオフロード環境
– タスク:ナビゲーションタスク
• 衝突・スタックせず目標位置へ向かう
• 舗装された道をできるだけ通る
– ナビゲーション性能に加え
追加学習の効果、zero-shotでの未知環境への一般化性能を評価
13
Experiments
• ロボットプラットフォーム
– Clearpath Jackal
– センサ:カメラ*2
2D-LiDAR(提案手法の実行時には用いない)
6DoF IMU, GPS, wheel encoder, compass
– Nvidia Jetson TX2
– 事前に与える情報は目標位置のGPS座標のみ
• 比較手法
– SLAM+P : 局所的にマッピングし、幾何学ベースの経路計画(従来手法)
– naïve : 目標位置にただ向かう方策(baseline)
• データ収集
– 都市環境で34時間、オフロード環境で8時間
• 720,000データ (BADGR < CV < RL) 14
Experiments
• 都市環境
– SLAM+Pは舗装道は通らない
• 3D-LiDAR使って凹凸認識できるが、
砂利道と草地の区別は難しい
• 物理的な特性で評価するのが良い
15
Experiments
• オフロード環境
– SLAM+Pは草を障害物と判断し、スタックすることが多い
• 成功した場合でもそれが予測モデル的には衝突確率が高いと判断されるpathが多い
– BADGRは成功率が早いだけでなく、1.2倍到達時間が早い
16
Experiments
• self-improving(追加学習による性能改善)
– zero-shotではほぼ衝突する
– 3時間の追加データで学習した、finetunedモデルで成功率向上
– target domainだけのモデルより良い
– 以前の経験データと合わせることで、学習効率が上がる
17
Experiments
• 未知環境における一般化性能
– 42時間の複数での環境データで学習したモデルを未知環境で評価
– 森林、オフロード、都市環境の3つの未知環境でナビゲーション成功
18
Conclusion
• 現実世界での経験から自律的にナビゲーションを学習する
BADGRを提案
• より多くのデータを収集することで自己改善可能で、
未知環境にも一般化することができることを示した
• 実世界での自律的に自己改善型のロボット学習するシステムにとって有望
な一歩
<future works>
• onlineに未知環境に適応
• リセット問題
• 動的環境
– データ取得時のpolicyとの他agentの相互作用を考慮する必要がある
19
感想
• globalな経路計画は扱ってない(ナビゲーションの範囲が狭い)
– 今後、階層型RL・Goal Imagined系とかを絡めてきそう
• 衝突回避、凹凸回避、ナビゲートのマルチタスクを扱っているが、
センサや報酬を設計すれば拡張性がある
– 複数センサを統合的に扱う予測モデルがあると良いかも
• プランニングに使ってる時間相関型のサンプリング手法が
従来の手法(DWA・State Lattice Plannerなどの軌道生成)に比べて
どこらへんが優れているか気になる
20
References
• Gregory Kahn, Pieter Abbeel, and Sergey Levine. BADGR: An Autonomous Self-Supervised Learning-Based Navigation System.
– https://arxiv.org/abs/2002.05700
• Gregory Kahn, Adam Villaflor, Bosen Ding, Pieter Abbeel, and Sergey Levine. Self-supervised deep reinforcement learning with generalized
computation graphs for robot navigation. In ICRA, 2018.
– https://arxiv.org/abs/1709.10489
• Gregory Kahn, Adam Villaflor, Pieter Abbeel, and Sergey Levine. Composable Action-Conditioned Predictors: Flexible Off-Policy Learning for Robot
Navigation. In CoRL, 2018.
– https://arxiv.org/abs/1810.07167
• Anusha Nagabandi, Kurt Konoglie, Sergey Levine, and Vikash Kumar. Deep Dynamics Models for Learning Dexterous Manipulation. In CoRL, 2019.
– https://arxiv.org/abs/1909.11652
• Peter Anderson, Qi Wu, Damien Teney, Jake Bruce, Mark Johnson, Niko Sunderhauf , Ian Reid, Stephen Gould and Anton van den Hengel. Vision-
and-Language Navigation: Interpreting visually-grounded navigation instructions in real environments. In CVPR 2018.
– https://arxiv.org/abs/1711.07280
• Changan Chen, Yuejiang Liu, Sven Kreiss and Alexandre Alahi. Crowd-Robot Interaction: Crowd-aware Robot Navigation with Attention-based Deep
Reinforcement Learning. In ICRA 2019.
– https://arxiv.org/abs/1809.08835
• Jingwei Zhang, Jost Tobias Springenberg, Joschka Boedecker and Wolfram Burgard. Deep Reinforcement Learning with Successor Features for
Navigation across Similar Environments. In IROS 2017.
– https://arxiv.org/abs/1612.05533
• Lei Tai, Giuseppe Paolo and Ming Liu. Virtual-to-real Deep Reinforcement Learning: Continuous Control of Mobile Robots for Mapless Navigation. In
IROS 2017.
– https://arxiv.org/abs/1703.00420
21
References
• Lei Tai, Jingwei Zhang, Ming Liuand Wolfram Burgard. Socially Compliant Navigation through Raw Depth Inputs with Generative Adversarial Imitation
Learning. In ICRA 2018.
– https://arxiv.org/abs/1710.02543
• Yuke Zhu, Roozbeh Mottaghi, Eric Kolve, Joseph J. Lim, Abhinav Gupta, Li Fei-Fei and Ali Farhadi. Target-driven Visual Navigation in Indoor Scenes
using Deep Reinforcement Learning. In ICRA 2017.
– https://arxiv.org/abs/1609.05143
• Mark Pfeiffer, Michael Schaeuble, Juan Nieto, Roland Siegwart and Cesar Cadena. From Perception to Decision: A Data-driven Approach to End-to-
end Motion Planning for Autonomous Ground Robots. In ICRA 2017.
– https://arxiv.org/abs/1609.07910
• Jingwei Zhang, Jost Tobias Springenberg, Joschka Boedecker, Wolfram Burgard. Deep Reinforcement Learning with Successor Features for
Navigation across Similar Environments. In IROS 2017.
– https://arxiv.org/pdf/1612.05533.pdf
• Tingxiang Fan, Pinxin Long, Wenxi Liu and Jia Pan. Fully Distributed Multi-Robot Collision Avoidance via Deep Reinforcement Learning for Safe and
Efficient Navigation in Complex Scenarios.
– https://arxiv.org/abs/1808.03841
• Yu Fan Chen, Michael Everett, Miao Liu, and Jonathan P. How. Socially Aware Motion Planning with Deep Reinforcement Learning. In IROS 2017.
– https://arxiv.org/abs/1703.08862
• Michael Everett, Yu Fan Chen, and Jonathan P. How. Motion Planning Among Dynamic, Decision-Making Agents with Deep Reinforcement Learning. In
IROS 2018.
– https://arxiv.org/abs/1805.01956
• Erik Wijmans, Abhishek Kadian, Ari Morcos, Stefan Lee, Irfan Essa, Devi Parikh, Manolis Savva and Dhruv Batra. DD-PPO: LEARNING NEAR-
PERFECT POINTGOAL NAVIGATORS FROM 2.5 BILLION FRAMES. ICLR 2020.
– https://arxiv.org/abs/1911.00357
• S. Thrun, W. Burgard, and D. Fox. Probabilistic Robotics. MIT Press, 2008.
• WAYMO
– https://waymo.com/
• Skydio
– https://www.skydio.com/
22
appendix
<githubのコード動かしてみた感想>
• 学習は30分くらいで終わった (GTX1080 *1)
• 出力を見る感じGPSはやっぱり結構アバウト
• アクションがうねるのは連続値制御ではよくある挙動な気がする
https://github.com/Jumpei-Arima/badgr (dockerfile追加してあります)

More Related Content

What's hot

[DL輪読会]Learning Latent Dynamics for Planning from Pixels
[DL輪読会]Learning Latent Dynamics for Planning from Pixels[DL輪読会]Learning Latent Dynamics for Planning from Pixels
[DL輪読会]Learning Latent Dynamics for Planning from PixelsDeep Learning JP
 
[DL輪読会]The Neural Process Family−Neural Processes関連の実装を読んで動かしてみる−
[DL輪読会]The Neural Process Family−Neural Processes関連の実装を読んで動かしてみる−[DL輪読会]The Neural Process Family−Neural Processes関連の実装を読んで動かしてみる−
[DL輪読会]The Neural Process Family−Neural Processes関連の実装を読んで動かしてみる−Deep Learning JP
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門Shuyo Nakatani
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門Takuji Tahara
 
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話Yusuke Uchida
 
[DL輪読会]Neural Ordinary Differential Equations
[DL輪読会]Neural Ordinary Differential Equations[DL輪読会]Neural Ordinary Differential Equations
[DL輪読会]Neural Ordinary Differential EquationsDeep Learning JP
 
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"Ryohei Suzuki
 
Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Shohei Hido
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)Masahiro Suzuki
 
「世界モデル」と関連研究について
「世界モデル」と関連研究について「世界モデル」と関連研究について
「世界モデル」と関連研究についてMasahiro Suzuki
 
ORB-SLAMの手法解説
ORB-SLAMの手法解説ORB-SLAMの手法解説
ORB-SLAMの手法解説Masaya Kaneko
 
Decision Transformer: Reinforcement Learning via Sequence Modeling
Decision Transformer: Reinforcement Learning via Sequence ModelingDecision Transformer: Reinforcement Learning via Sequence Modeling
Decision Transformer: Reinforcement Learning via Sequence ModelingYasunori Ozaki
 
Transformer メタサーベイ
Transformer メタサーベイTransformer メタサーベイ
Transformer メタサーベイcvpaper. challenge
 
[DL輪読会]Flow-based Deep Generative Models
[DL輪読会]Flow-based Deep Generative Models[DL輪読会]Flow-based Deep Generative Models
[DL輪読会]Flow-based Deep Generative ModelsDeep Learning JP
 
コンピュータビジョン分野メジャー国際会議 Award までの道のり
コンピュータビジョン分野メジャー国際会議 Award までの道のりコンピュータビジョン分野メジャー国際会議 Award までの道のり
コンピュータビジョン分野メジャー国際会議 Award までの道のりcvpaper. challenge
 
KDD Cup 2021 時系列異常検知コンペ 参加報告
KDD Cup 2021 時系列異常検知コンペ 参加報告KDD Cup 2021 時系列異常検知コンペ 参加報告
KDD Cup 2021 時系列異常検知コンペ 参加報告GentaYoshimura
 
[DL輪読会]Temporal Abstraction in NeurIPS2019
[DL輪読会]Temporal Abstraction in NeurIPS2019[DL輪読会]Temporal Abstraction in NeurIPS2019
[DL輪読会]Temporal Abstraction in NeurIPS2019Deep Learning JP
 
Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)
Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)
Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)Yusuke Nakata
 
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...joisino
 

What's hot (20)

[DL輪読会]Learning Latent Dynamics for Planning from Pixels
[DL輪読会]Learning Latent Dynamics for Planning from Pixels[DL輪読会]Learning Latent Dynamics for Planning from Pixels
[DL輪読会]Learning Latent Dynamics for Planning from Pixels
 
[DL輪読会]World Models
[DL輪読会]World Models[DL輪読会]World Models
[DL輪読会]World Models
 
[DL輪読会]The Neural Process Family−Neural Processes関連の実装を読んで動かしてみる−
[DL輪読会]The Neural Process Family−Neural Processes関連の実装を読んで動かしてみる−[DL輪読会]The Neural Process Family−Neural Processes関連の実装を読んで動かしてみる−
[DL輪読会]The Neural Process Family−Neural Processes関連の実装を読んで動かしてみる−
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門
 
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
 
[DL輪読会]Neural Ordinary Differential Equations
[DL輪読会]Neural Ordinary Differential Equations[DL輪読会]Neural Ordinary Differential Equations
[DL輪読会]Neural Ordinary Differential Equations
 
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
 
Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)
 
「世界モデル」と関連研究について
「世界モデル」と関連研究について「世界モデル」と関連研究について
「世界モデル」と関連研究について
 
ORB-SLAMの手法解説
ORB-SLAMの手法解説ORB-SLAMの手法解説
ORB-SLAMの手法解説
 
Decision Transformer: Reinforcement Learning via Sequence Modeling
Decision Transformer: Reinforcement Learning via Sequence ModelingDecision Transformer: Reinforcement Learning via Sequence Modeling
Decision Transformer: Reinforcement Learning via Sequence Modeling
 
Transformer メタサーベイ
Transformer メタサーベイTransformer メタサーベイ
Transformer メタサーベイ
 
[DL輪読会]Flow-based Deep Generative Models
[DL輪読会]Flow-based Deep Generative Models[DL輪読会]Flow-based Deep Generative Models
[DL輪読会]Flow-based Deep Generative Models
 
コンピュータビジョン分野メジャー国際会議 Award までの道のり
コンピュータビジョン分野メジャー国際会議 Award までの道のりコンピュータビジョン分野メジャー国際会議 Award までの道のり
コンピュータビジョン分野メジャー国際会議 Award までの道のり
 
KDD Cup 2021 時系列異常検知コンペ 参加報告
KDD Cup 2021 時系列異常検知コンペ 参加報告KDD Cup 2021 時系列異常検知コンペ 参加報告
KDD Cup 2021 時系列異常検知コンペ 参加報告
 
[DL輪読会]Temporal Abstraction in NeurIPS2019
[DL輪読会]Temporal Abstraction in NeurIPS2019[DL輪読会]Temporal Abstraction in NeurIPS2019
[DL輪読会]Temporal Abstraction in NeurIPS2019
 
Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)
Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)
Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)
 
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
 

Similar to [DL輪読会]BADGR: An Autonomous Self-Supervised Learning-Based Navigation System

Open3DでSLAM入門 PyCon Kyushu 2018
Open3DでSLAM入門 PyCon Kyushu 2018Open3DでSLAM入門 PyCon Kyushu 2018
Open3DでSLAM入門 PyCon Kyushu 2018Satoshi Fujimoto
 
[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...
[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...
[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...Deep Learning JP
 
An evaluation of Distributions of the Environmental pollutants by (Web)GIS and R
An evaluation of Distributions of the Environmental pollutants by (Web)GIS and RAn evaluation of Distributions of the Environmental pollutants by (Web)GIS and R
An evaluation of Distributions of the Environmental pollutants by (Web)GIS and RJunji Yamakawa
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...cvpaper. challenge
 
物体検出の歴史まとめ(1) 20180417
物体検出の歴史まとめ(1) 20180417物体検出の歴史まとめ(1) 20180417
物体検出の歴史まとめ(1) 20180417Masakazu Shinoda
 
[DL輪読会]LightTrack: A Generic Framework for Online Top-Down Human Pose Tracking
[DL輪読会]LightTrack: A Generic Framework for Online Top-Down Human Pose Tracking[DL輪読会]LightTrack: A Generic Framework for Online Top-Down Human Pose Tracking
[DL輪読会]LightTrack: A Generic Framework for Online Top-Down Human Pose TrackingDeep Learning JP
 
生態系計測研究領域セミナー 20120802
生態系計測研究領域セミナー 20120802生態系計測研究領域セミナー 20120802
生態系計測研究領域セミナー 20120802IWASAKI NOBUSUKE
 
論文 Solo Advent Calendar
論文 Solo Advent Calendar論文 Solo Advent Calendar
論文 Solo Advent Calendar諒介 荒木
 
Foss4g Hokkaido 2019
Foss4g Hokkaido 2019Foss4g Hokkaido 2019
Foss4g Hokkaido 2019Takahiro Endo
 
Web時代のデスクトップGIS
Web時代のデスクトップGISWeb時代のデスクトップGIS
Web時代のデスクトップGISIWASAKI NOBUSUKE
 
動画像を用いた経路予測手法の分類
動画像を用いた経路予測手法の分類動画像を用いた経路予測手法の分類
動画像を用いた経路予測手法の分類Tsubasa Hirakawa
 
[DL輪読会]Geometric Unsupervised Domain Adaptation for Semantic Segmentation
[DL輪読会]Geometric Unsupervised Domain Adaptation for Semantic Segmentation[DL輪読会]Geometric Unsupervised Domain Adaptation for Semantic Segmentation
[DL輪読会]Geometric Unsupervised Domain Adaptation for Semantic SegmentationDeep Learning JP
 

Similar to [DL輪読会]BADGR: An Autonomous Self-Supervised Learning-Based Navigation System (14)

Open3DでSLAM入門 PyCon Kyushu 2018
Open3DでSLAM入門 PyCon Kyushu 2018Open3DでSLAM入門 PyCon Kyushu 2018
Open3DでSLAM入門 PyCon Kyushu 2018
 
[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...
[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...
[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...
 
An evaluation of Distributions of the Environmental pollutants by (Web)GIS and R
An evaluation of Distributions of the Environmental pollutants by (Web)GIS and RAn evaluation of Distributions of the Environmental pollutants by (Web)GIS and R
An evaluation of Distributions of the Environmental pollutants by (Web)GIS and R
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
 
物体検出の歴史まとめ(1) 20180417
物体検出の歴史まとめ(1) 20180417物体検出の歴史まとめ(1) 20180417
物体検出の歴史まとめ(1) 20180417
 
[DL輪読会]LightTrack: A Generic Framework for Online Top-Down Human Pose Tracking
[DL輪読会]LightTrack: A Generic Framework for Online Top-Down Human Pose Tracking[DL輪読会]LightTrack: A Generic Framework for Online Top-Down Human Pose Tracking
[DL輪読会]LightTrack: A Generic Framework for Online Top-Down Human Pose Tracking
 
OSC2013Cloud@Osaka
OSC2013Cloud@OsakaOSC2013Cloud@Osaka
OSC2013Cloud@Osaka
 
生態系計測研究領域セミナー 20120802
生態系計測研究領域セミナー 20120802生態系計測研究領域セミナー 20120802
生態系計測研究領域セミナー 20120802
 
論文 Solo Advent Calendar
論文 Solo Advent Calendar論文 Solo Advent Calendar
論文 Solo Advent Calendar
 
Foss4g Hokkaido 2019
Foss4g Hokkaido 2019Foss4g Hokkaido 2019
Foss4g Hokkaido 2019
 
03 chun
03 chun03 chun
03 chun
 
Web時代のデスクトップGIS
Web時代のデスクトップGISWeb時代のデスクトップGIS
Web時代のデスクトップGIS
 
動画像を用いた経路予測手法の分類
動画像を用いた経路予測手法の分類動画像を用いた経路予測手法の分類
動画像を用いた経路予測手法の分類
 
[DL輪読会]Geometric Unsupervised Domain Adaptation for Semantic Segmentation
[DL輪読会]Geometric Unsupervised Domain Adaptation for Semantic Segmentation[DL輪読会]Geometric Unsupervised Domain Adaptation for Semantic Segmentation
[DL輪読会]Geometric Unsupervised Domain Adaptation for Semantic Segmentation
 

More from Deep Learning JP

【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving PlannersDeep Learning JP
 
【DL輪読会】事前学習用データセットについて
【DL輪読会】事前学習用データセットについて【DL輪読会】事前学習用データセットについて
【DL輪読会】事前学習用データセットについてDeep Learning JP
 
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...Deep Learning JP
 
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】Zero-Shot Dual-Lens Super-ResolutionDeep Learning JP
 
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxivDeep Learning JP
 
【DL輪読会】マルチモーダル LLM
【DL輪読会】マルチモーダル LLM【DL輪読会】マルチモーダル LLM
【DL輪読会】マルチモーダル LLMDeep Learning JP
 
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
 【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo... 【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...Deep Learning JP
 
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】AnyLoc: Towards Universal Visual Place RecognitionDeep Learning JP
 
【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Can Neural Network Memorization Be Localized?【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Can Neural Network Memorization Be Localized?Deep Learning JP
 
【DL輪読会】Hopfield network 関連研究について
【DL輪読会】Hopfield network 関連研究について【DL輪読会】Hopfield network 関連研究について
【DL輪読会】Hopfield network 関連研究についてDeep Learning JP
 
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )Deep Learning JP
 
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...Deep Learning JP
 
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"Deep Learning JP
 
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
【DL輪読会】"Language Instructed Reinforcement Learning  for Human-AI Coordination "【DL輪読会】"Language Instructed Reinforcement Learning  for Human-AI Coordination "
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "Deep Learning JP
 
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat ModelsDeep Learning JP
 
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"Deep Learning JP
 
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...Deep Learning JP
 
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...Deep Learning JP
 
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...Deep Learning JP
 
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...Deep Learning JP
 

More from Deep Learning JP (20)

【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
 
【DL輪読会】事前学習用データセットについて
【DL輪読会】事前学習用データセットについて【DL輪読会】事前学習用データセットについて
【DL輪読会】事前学習用データセットについて
 
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
 
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
 
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
 
【DL輪読会】マルチモーダル LLM
【DL輪読会】マルチモーダル LLM【DL輪読会】マルチモーダル LLM
【DL輪読会】マルチモーダル LLM
 
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
 【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo... 【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
 
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
 
【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Can Neural Network Memorization Be Localized?【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Can Neural Network Memorization Be Localized?
 
【DL輪読会】Hopfield network 関連研究について
【DL輪読会】Hopfield network 関連研究について【DL輪読会】Hopfield network 関連研究について
【DL輪読会】Hopfield network 関連研究について
 
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
 
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
 
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
 
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
【DL輪読会】"Language Instructed Reinforcement Learning  for Human-AI Coordination "【DL輪読会】"Language Instructed Reinforcement Learning  for Human-AI Coordination "
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
 
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
 
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
 
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
 
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
 
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
 
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
 

Recently uploaded

SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 

Recently uploaded (9)

SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 

[DL輪読会]BADGR: An Autonomous Self-Supervised Learning-Based Navigation System

  • 1. 1 DEEP LEARNING JP [DL Papers] http://deeplearning.jp/ BADGR: An Autonomous Self-Supervised Learning-Based Navigation System Jumpei Arima
  • 2. 書誌情報 • BADGR: An Autonomous Self-Supervised Learning-Based Navigation System • author : Gregory Kahn, Pieter Abbeel, Sergey Levine – Berkeley AI Research (BAIR), University of California, Berkeley • arxiv : https://arxiv.org/abs/2002.05700 • project page : https://sites.google.com/view/badgr • code : https://github.com/gkahn13/badgr 2
  • 3. Introduction • 従来の手法 – S. ThrunらのProbabilistic Roboticsをベースとした手法 • SLAM, Path Planning – Waymo, Skydioなどのベースとなる技術 <課題> • texturelessなシーンでの性能が低下する • 高価なセンサが必要(主にLiDAR) • 経験から学習する機構がない 3
  • 4. Related Works • 学習ベースによるナビゲーションの関連研究 4 研究 技術 目的 input [Zhu 17] RL(A3C) target driven navigation RGB image [Anderson 18] IL(DAGGER) visual language navigation RGB image [Pfiffer 16] IL(Behavior Cloning) mapless navigation 2D-LiDAR [Tai 17] RL(DDPG) sim2real 2D-LiDAR [Zhang 17] RL(DQN) successor features, transfer learning Depth image [Fan 18] RL(PPO) multi agent collision avoidance 2D-LiDAR [Tai 18] IL(GAIL) socially compliant navigation Depth image [Chen 17], [Everett 18], [Chen 19] RL(A3C) multi agent collision avoidance motion prediction [Wijmans 19] RL(PPO) point goal navigation RGBD image [Kahn 18], [Kahn 18] RL(Model based) collision avoidance RGB image
  • 5. Related Works • 学習ベースによるナビゲーションの関連研究の課題 – inputにLiDARや人の行動予測結果を与える • 意味情報などの幾何情報以外に対応できない – シミュレーション上で学習 • sim2realへの対応が必要 • on-policyベースが多くが時間がかかる – 実機のデータを使う • デモンストレーションに依存 • サンプル効率 – 上位システムの認識結果を利用 • 自己改善機能がない 5
  • 6. Proposed Method • BADGR(Berkeley Autonomous Driving Ground Robot) – ナビゲーションの問題は幾何学的問題として解かれてきた – 幾何学情報のみでは、現実世界では限界がある – ナビゲーションに必要な物理的なaffordanceを経験から獲得 • end-to-end-learning • self-supervised • off-policy • real-world • no simulation • no human supervision 6
  • 7. Proposed Method • 学習 – (観測、行動)のデータ収集 – 自己教師でラベル付けて データセットに追加 – 予測モデルの学習 • テスト – タスクに応じて報酬を設計 – 予測モデルを用いて報酬を最大化する 行動列を算出 – 行動列の最初を実行 7
  • 8. Proposed Method • データ収集 – off-policyアルゴリズムを用いて学習する – データ収集時の方策 • time-correlated random walk • よりテスト時に近いような行動列 – リセット • 衝突判断はLiDARとIMUを利用し自動化 • リセット方策は単純に後退と回転 • データ収集後4Hzでサブサンプリング – 課題点 • 転倒した場合は人が治す必要がある 8
  • 9. Proposed Method • self-supervised データラベリング – 衝突 • 都市環境ではLiDARの値 • オフロード環境ではIMU値が急落したとき – 地面の凹凸 • IMU値の角速度成分の大きさが閾値以上になった場合 – 位置 • wheel encoderとIMUを統合して算出 9
  • 10. Proposed Method • 予測モデルの学習 – ネットワーク構造はCAPsとほぼ同じ – 入力:画像、行動列 – 出力:各イベント(衝突、位置、凹凸)の予測値 – 交差エントロピー誤差、平均二乗誤差を最小化 10
  • 11. Proposed Method • プランニング – Hステップの行動列、N個から報酬関数を最適化 • random-shootingやcross entropyによる最適化より良い – PDDMと同様のプランニングを行う • 実行中の行動列を中心に時間ステップ間に相関をもつようにする – より自然な行動系列を生成 • 報酬加重平均を用いて実行する行動列を決定 11 https://www.slideshare.net/DeepLearningJP2016/dldeep-dynamics-models-for-learning-dexterous-manipulation
  • 12. Proposed Method • 報酬関数 – タスクに依存するが本研究では以下のように決定 – 衝突しないように・ゴール向くように・凹凸を避けるような設計 – 衝突を極力避けたいので、 衝突が予測されるは強制的にコストが最大となるようになっている 12
  • 13. Experiments • 実験内容 – 環境:都市環境とオフロード環境 – タスク:ナビゲーションタスク • 衝突・スタックせず目標位置へ向かう • 舗装された道をできるだけ通る – ナビゲーション性能に加え 追加学習の効果、zero-shotでの未知環境への一般化性能を評価 13
  • 14. Experiments • ロボットプラットフォーム – Clearpath Jackal – センサ:カメラ*2 2D-LiDAR(提案手法の実行時には用いない) 6DoF IMU, GPS, wheel encoder, compass – Nvidia Jetson TX2 – 事前に与える情報は目標位置のGPS座標のみ • 比較手法 – SLAM+P : 局所的にマッピングし、幾何学ベースの経路計画(従来手法) – naïve : 目標位置にただ向かう方策(baseline) • データ収集 – 都市環境で34時間、オフロード環境で8時間 • 720,000データ (BADGR < CV < RL) 14
  • 15. Experiments • 都市環境 – SLAM+Pは舗装道は通らない • 3D-LiDAR使って凹凸認識できるが、 砂利道と草地の区別は難しい • 物理的な特性で評価するのが良い 15
  • 16. Experiments • オフロード環境 – SLAM+Pは草を障害物と判断し、スタックすることが多い • 成功した場合でもそれが予測モデル的には衝突確率が高いと判断されるpathが多い – BADGRは成功率が早いだけでなく、1.2倍到達時間が早い 16
  • 17. Experiments • self-improving(追加学習による性能改善) – zero-shotではほぼ衝突する – 3時間の追加データで学習した、finetunedモデルで成功率向上 – target domainだけのモデルより良い – 以前の経験データと合わせることで、学習効率が上がる 17
  • 19. Conclusion • 現実世界での経験から自律的にナビゲーションを学習する BADGRを提案 • より多くのデータを収集することで自己改善可能で、 未知環境にも一般化することができることを示した • 実世界での自律的に自己改善型のロボット学習するシステムにとって有望 な一歩 <future works> • onlineに未知環境に適応 • リセット問題 • 動的環境 – データ取得時のpolicyとの他agentの相互作用を考慮する必要がある 19
  • 20. 感想 • globalな経路計画は扱ってない(ナビゲーションの範囲が狭い) – 今後、階層型RL・Goal Imagined系とかを絡めてきそう • 衝突回避、凹凸回避、ナビゲートのマルチタスクを扱っているが、 センサや報酬を設計すれば拡張性がある – 複数センサを統合的に扱う予測モデルがあると良いかも • プランニングに使ってる時間相関型のサンプリング手法が 従来の手法(DWA・State Lattice Plannerなどの軌道生成)に比べて どこらへんが優れているか気になる 20
  • 21. References • Gregory Kahn, Pieter Abbeel, and Sergey Levine. BADGR: An Autonomous Self-Supervised Learning-Based Navigation System. – https://arxiv.org/abs/2002.05700 • Gregory Kahn, Adam Villaflor, Bosen Ding, Pieter Abbeel, and Sergey Levine. Self-supervised deep reinforcement learning with generalized computation graphs for robot navigation. In ICRA, 2018. – https://arxiv.org/abs/1709.10489 • Gregory Kahn, Adam Villaflor, Pieter Abbeel, and Sergey Levine. Composable Action-Conditioned Predictors: Flexible Off-Policy Learning for Robot Navigation. In CoRL, 2018. – https://arxiv.org/abs/1810.07167 • Anusha Nagabandi, Kurt Konoglie, Sergey Levine, and Vikash Kumar. Deep Dynamics Models for Learning Dexterous Manipulation. In CoRL, 2019. – https://arxiv.org/abs/1909.11652 • Peter Anderson, Qi Wu, Damien Teney, Jake Bruce, Mark Johnson, Niko Sunderhauf , Ian Reid, Stephen Gould and Anton van den Hengel. Vision- and-Language Navigation: Interpreting visually-grounded navigation instructions in real environments. In CVPR 2018. – https://arxiv.org/abs/1711.07280 • Changan Chen, Yuejiang Liu, Sven Kreiss and Alexandre Alahi. Crowd-Robot Interaction: Crowd-aware Robot Navigation with Attention-based Deep Reinforcement Learning. In ICRA 2019. – https://arxiv.org/abs/1809.08835 • Jingwei Zhang, Jost Tobias Springenberg, Joschka Boedecker and Wolfram Burgard. Deep Reinforcement Learning with Successor Features for Navigation across Similar Environments. In IROS 2017. – https://arxiv.org/abs/1612.05533 • Lei Tai, Giuseppe Paolo and Ming Liu. Virtual-to-real Deep Reinforcement Learning: Continuous Control of Mobile Robots for Mapless Navigation. In IROS 2017. – https://arxiv.org/abs/1703.00420 21
  • 22. References • Lei Tai, Jingwei Zhang, Ming Liuand Wolfram Burgard. Socially Compliant Navigation through Raw Depth Inputs with Generative Adversarial Imitation Learning. In ICRA 2018. – https://arxiv.org/abs/1710.02543 • Yuke Zhu, Roozbeh Mottaghi, Eric Kolve, Joseph J. Lim, Abhinav Gupta, Li Fei-Fei and Ali Farhadi. Target-driven Visual Navigation in Indoor Scenes using Deep Reinforcement Learning. In ICRA 2017. – https://arxiv.org/abs/1609.05143 • Mark Pfeiffer, Michael Schaeuble, Juan Nieto, Roland Siegwart and Cesar Cadena. From Perception to Decision: A Data-driven Approach to End-to- end Motion Planning for Autonomous Ground Robots. In ICRA 2017. – https://arxiv.org/abs/1609.07910 • Jingwei Zhang, Jost Tobias Springenberg, Joschka Boedecker, Wolfram Burgard. Deep Reinforcement Learning with Successor Features for Navigation across Similar Environments. In IROS 2017. – https://arxiv.org/pdf/1612.05533.pdf • Tingxiang Fan, Pinxin Long, Wenxi Liu and Jia Pan. Fully Distributed Multi-Robot Collision Avoidance via Deep Reinforcement Learning for Safe and Efficient Navigation in Complex Scenarios. – https://arxiv.org/abs/1808.03841 • Yu Fan Chen, Michael Everett, Miao Liu, and Jonathan P. How. Socially Aware Motion Planning with Deep Reinforcement Learning. In IROS 2017. – https://arxiv.org/abs/1703.08862 • Michael Everett, Yu Fan Chen, and Jonathan P. How. Motion Planning Among Dynamic, Decision-Making Agents with Deep Reinforcement Learning. In IROS 2018. – https://arxiv.org/abs/1805.01956 • Erik Wijmans, Abhishek Kadian, Ari Morcos, Stefan Lee, Irfan Essa, Devi Parikh, Manolis Savva and Dhruv Batra. DD-PPO: LEARNING NEAR- PERFECT POINTGOAL NAVIGATORS FROM 2.5 BILLION FRAMES. ICLR 2020. – https://arxiv.org/abs/1911.00357 • S. Thrun, W. Burgard, and D. Fox. Probabilistic Robotics. MIT Press, 2008. • WAYMO – https://waymo.com/ • Skydio – https://www.skydio.com/ 22
  • 23. appendix <githubのコード動かしてみた感想> • 学習は30分くらいで終わった (GTX1080 *1) • 出力を見る感じGPSはやっぱり結構アバウト • アクションがうねるのは連続値制御ではよくある挙動な気がする https://github.com/Jumpei-Arima/badgr (dockerfile追加してあります)