SlideShare a Scribd company logo
ICRA 2020 Open Survey
1
2020/7/13 - 2020/8/10
概要:この資料について
・2020/7/13から2020/8/10の間で進めていたICRA2020のOpen Surveyにおい
 て調査した論文のまとめです.
2
BayesOD: A Bayesian Approach for Uncertainty Estimation in Deep Object Detectors
Ali Harakeh, Michael Smart, Steven L. Waslander
まとめた人:Hachimine
- 深層学習を用いたクラス分類を行う際, NMS(Non-Maxmum Suppresion)を用いるのではなく,ベイズ推定
を用い出力クラスの不確かさをを推定する手法を提案した.
- 4種のデータセットにおいて,検出精度と,提案手法が示す不確かさの推定値に相関があることを示した.
- 提案手法を評価する尺度として, MUE(Minumun Uncertainty Error),PDQ(Probability Based Detection
Quality)を使用.
- 評価指標の多くで性能が向上( 0.57~1.7%)したが,使用するデータセットによっては,従来手法( Anchor
Redundancy,Sampling Free)のほうが性能が良い場合があった.
https://arxiv.org/abs/1903.03838
Differentiable Gaussian Process Motion Planning
Mohak Bhardwaj, Byron Boots, Mustafa Mukadam
まとめた人:Hachimine
- GPMPを微分可能な形で表現し直すことにより,障害物の大きさや密度が変化しても,教示データに則った
経路を生成することが可能な手法を提案した.
- 微分可能なGPMPは,入力画像から,最適な経路を推定することができるニューラルネットワークを作成す
ることが可能となる.
- 教示データには,RRT*やGPMP2を併用.
- 人間がチューニングを行った GPMP2と比べてdGPMPは障害物の大きさや密度が変化した場合,動作計
画の成功率が高い結果となった.
- 動作を探索する途中,障害物と接触する回数も dGPMPのほうが少ない.
https://arxiv.org/abs/1907.09591
Automatic tool for Gazebo world construction: from a grayscale image to a 3D solid model
Bulat Abbyasov, Roman Lavrenov, Aufar Zakiev, Konstantin Yakovlev,Mikhail Svinin and Evgeni Magid
まとめた人:Hachimine
- グレー画像を元に,gazeboで読み込み可能な3Dモデルを作成手法を提案した.
- グレー画像→3D(.dae format)は,画像の輝度値をもとに生成.
- HSMSTL tool,LIBTRIX library,ASSIMP libraryを使用.グレー画像 →ヒートマップ→.STL →.dae
- テクスチャの貼り付けには UVマッピングを使用.歪みの少ないモデルを生成することができる.
- 3Dマップ作成のためのスケールサイズや出力ファイル形式を簡単に設定できる, GUIツールLIRS World
Construction Tool (LIRS-WCT)を作成.
- 生成した3Dマップを利用し,複数の SLAMを実行.マップの生成に成功した.
- 評価指標として,GHPTベースと3Dマップベースのrealtime factor (RTF)を比較している.
https://www.researchgate.net/publication/341822865_Automatic_tool_for_Gazebo_world_construction_from_a_grayscale_image_to_a_3D_solid_model
Toward Sim-to-Real Directional Semantic Grasping
Shariq Iqbal, Jonathan Tremblay, Thang To, Jia Cheng, Erik Leitch, Andy Campbell, Kirby Leung, Duncan McKay, Stan Birchfield
まとめた人:Hachimine
- DDQN(double deep Q-netwprk)を用い2d画像を元に,pre-defineされたハンドの把持位置姿勢から,最
終的なオブジェクトに対する把持位置姿勢を算出する手法を提案.
- 更に,シミュレータと実空間の差異を domain-randomizationを用いることで可能な限り埋め,シミュレータ
でトレーニングした結果が実空間上でも使用できることを示した.
- UnrealEngine4を用いシミュレータを作成. URDF形式を取り扱うことが可能.
- domain-randomizationとして,環境のテクスチャや, 2d画像のぼかし,輝度などを変化.
- DDQNではなく教示あり学習を利用することで性能が向上する可能性を検討している.
https://arxiv.org/abs/1909.02075
6D Object Pose Regression via Supervised Learning on Point Clouds
Ge Gao, Mikko Lauri, Yulong Wang, Xiaolin Hu, Jianwei Zhang, Simone Frintrop
まとめた人:Hachimine
- 3次元物体の位置と姿勢をそれぞれ別のネットワークで推定する手法を提案した.
- 評価指標として,average distance(AD),average distance for a rotaionally symmetric(ADS)を使用
- 回転の表現には,quaternionではなくaxis-angleを使用.損失関数には, L2 lossではなく,geodesic
distanceを利用.
- quaternionと比較し,axis-angleを用いたほうが,姿勢の推定精度が高い結果となった.
- 位置と姿勢1つのネットワークで学習させた場合と比較し,それぞれ別のネットワークで推定するほうが精
度が向上した.
- ICPを利用した他手法が数値的に良い場合もあったが, ICPの精度は初期の位置姿勢の影響度が高い
https://arxiv.org/abs/2001.08942
Discrete Bimanual Manipulation for Wrench Balancing
Silvia Cruciani, Diogo Almeida, Danica Kragic, Yiannis Karayiannidis
まとめた人:Hachimine
- トレーに物体を乗せた場合に生じる重心とモーメントの偏りを算出,対象物がずれないように,把持位置姿
勢をより安定した状態に持ち替える手法を提案.
- 重心とモーメントには,準静力学を利用.幾何的に算出.
- 持ち替え動作には, Dexterous Manipulation Graphs (DMG)を使用.
- パス生成には,Dijkstra’s法を採用.collisionの制約にはトレー上を滑る指先の接触点だけでなく,指全体
を考慮.
- 双腕ロボットはABB+6軸トルクセンサ.トレー上の物体を検出するために KinectV2を使用.
- 提案手法を採用し,持ち替え動作を行うことで,指先に生じるモーメントを 0.15N·mから0.025N·mに減らすこと
ができた.
https://www.diva-portal.org/smash/get/diva2:1366107/FULLTEXT01.pdf
On Simple Reactive Neural Networks for Behaviour-Based Reinforcement Learning
Ameya Pore and Gerardo Aragon-Camarasa
- Behaviour-BasedのRLを用いたロボットの行動毎の学習手法の提案.
- 開発者のdomain-specificな知識を活用して行動(接近、把持、後退)を分解して訓練することで、タスクを単純化することが可能.
- 各行動を分離して学習し、それらを組み合わせてタスクを達成すると、学習がより効果的になることを示唆している.つまり、提案手
法ではピックアンドプレースタスクを 8,000エピソードで学習しており、これは end-to-endな手法(95,000エピソード)や既存の最新のア
ルゴリズムで必要とされる学習エピソード数を大幅に削減したエピソードで学習が可能.
まとめた人:souta hriose
https://arxiv.org/abs/2001.07973
Predicting optimal value functions by interpolating reward functions in scalarized
multi-objective reinforcement learning
Arpan Kusari and Jonathan P. How
- 多目的強化学習( MORL)の報酬関数と価値関数の関係を調べ、最適化問題が実際に解かれた重みのセットを超えて、価値関数を
どのように近似するかという問題へのアプローチを提案.
- 最適な価値関数の報酬関数重みに対する滑らかな補間を得るために、ガウス過程を用いている. Gridworld, Objectworld,
Pendulumの3つの例において,ガウシアン処理を用いて価値関数の報酬関数の重みを滑らかに補間する.その結果、この補間は離
散領域と連続領域の両方の問題において、サンプルの状態と行動に対してロバストな値を提供できることが示された.
- この補間手法を自律走行車の領域で利用することで、運転中のユーザーの嗜好を簡単に、瞬時に適応させることができ、訓練中の
障害物車両の行動嗜好を真の意味でランダム化することができるという大きな利点得られる.
まとめた人:souta hriose
https://arxiv.org/abs/1909.05004
Interactive Reinforcement Learning with Inaccurate Feedback
Taylor A. Kessler Faulkner, Elaine Schaertl Short, Andrea L. Thomaz
- 不完全な教師を持つ Interactive RL手法を特徴づけるためのフレームワークを導入し、不完全なフィードバックに対する修正を時間の
経過とともに推定できるアルゴリズムを提案 .
- 提案したアルゴリズムである Revision Estimation from Partially Incorrect Resources (REPAIR)では,不正確なフィードバックを受け
取る可能性が高い状態と行動を推定し、この推定に基づいてフィードバックを修正する.つまり,このアルゴリズムは、フィードバック
の質を事前に知る必要がないように、報酬関数と追加の環境フィードバックを持つ RLアルゴリズムのフィードバックフィルタとして機能
する.
- シミュレーション結果として,ベースライン手法( TAMER:報酬関数の代わりに人間からのフィードバックを使用する, Policy Shaping:
人間からの2値(positive or negative)フィードバックを学習に使用する)に REPAIR を追加することで、テストされたフィードバックのパ
フォーマンスが一致または改善されたことを確認した.
まとめた人:souta hriose
https://sim.ece.utexas.edu/static/papers/REPaIR-ICRA.pdf
Guided Uncertainty-Aware Policy Optimization: Combining Learning and Model-Based
Strategies for Sample-Efficient Policy Learning
Michelle A. Lee, Carlos Florensa, Jonathan Tremblay, Nathan Ratliff , Animesh Garg, Fabio Ramos, Dieter Fox
- モデルベース手法の長所と学習ベース手法の柔軟性を組み合わせ , 環境との相互作用を最小限に抑えながら、ロボットの認識から
作動までのパイプラインの不正確さを補償する手法を提案.
- 提案手法のGuided Uncertainty-Aware Policy Optimization(GUAPO)では,対象物の粗いモデルと、ある操作を行う必要がある領
域の大まかな表現のみを提供することで、実行すべきタスクを大雑把に定義している.
- 提案手法により環境の認識における不確実性の推定値を用いて,モデルベースのポリシーと、定義しやすい疎な報酬から学習でき
る学習ベースのポリシーを自動的に切り替えることで、モデルベース部分のモデル誤差や推定誤差を補償する事が可能になる.
- 実機検証では,ペグ挿入をタスクとしてテストしている.
まとめた人:souta hriose
https://arxiv.org/abs/2005.10872 https://sites.google.com/view/guapo-rl
High-speed Autonomous Drifting with Deep Reinforcement Learning
Peide Cai , Xiaodong Mei , Lei Tai, Yuxiang Sun, and Ming Liu
- model-freeな深層強化学習アルゴリズムである soft actor-criticを用いた明示的な運動方程式を用いないロバストな高速ドリフト制御
を提案.
- ドリフト制御問題は軌道追従タスクとして定式化され、誤差に基づく状態と報酬を設計している.
- 運転難易度の異なる 6つのマップにおいてトレーニングを行った結果、提案手法が変化する車両質量やタイヤの摩擦に対して十分に
ロバストであり、複雑なカーブのあるコースを迅速かつスムーズにドリフトすることを確認している.
まとめた人:souta hriose
https://arxiv.org/abs/2001.01377
https://www.youtube.com/watch?v=0paCdx5cWeQ
Robust Model-free Reinforcement Learning with Multi-objective
Bayesian Optimization
Matteo Turchetta, Andreas Krause, Sebastian Trimpe
- 多目的ベイズ最適化に基づくロバストな Policy最適化のためのデータ効率の良いアルゴリズムを提案.
- 提案手法では,Multi-Objectiveなベイジアン最適化を用いて,パフォーマンスとロバスト性の最適化を行っている.
- Policyのロバスト性を定量化するために、制御理論で一般的なロバスト性指標である位相余裕とゲイン余裕を用いている.
- Furuta pendulumを対象として,実験を行い,シミュレーションから実機への移行が容易になった事,単一の性能目標とするベイジア
ン最適化と比較してロバスト性が向上した事を確認している.
まとめた人:souta hriose
https://arxiv.org/abs/1910.13399
Learning Multi-Robot Decentralized Macro-Action-Based Policies
via a Centralized Q-Net
Yuchen Xiao, Joshua Hoffman, Tian Xia and Christopher Amato
- Action選択の為に,集中型 Q-netを用いて分散型 Q-netを学習するmacro-aciton-basedな分散型multi-agent Q-net
(MacDec-MADDRQN)を提案.
- 分散型のPolicy更新の為に、集中型 Q-netを用いることで、各エージェントの分散型 Q-netに他のエージェントの行動の効果を取り込
みながら学習することを可能にしている.
- ベンチマークのBox Pushingにおける結果では,分散型 trainingが中央集権型trainingと同様な性能を達成し,提案手法に優位性が
あることを確認した.また,移動ロボットを用いた倉庫内における物品配送を行い,実機検証を行っている.
まとめた人:souta hriose
https://arxiv.org/abs/1909.08776
https://www.youtube.com/watch?v=mk51MPgElj0
Barrier-Certified Adaptive Reinforcement Learning
With Applications to Brushbot Navigation
Motoya Ohnishi , Li Wang , Gennaro Notomista , and Magnus Egerstedt
- 非定常エージェントのダイナミクスを持つ可能性のあるシステムに対して、 Barrier Certificatesを用いた適応モデル学習アルゴリズム
による Safe Learingフレームワークを提案.
- モデルのダイナミクスを抽出するために、スパース最適化手法を使用している.また,学習したモデルを、状態空間内の特定の望まし
くない領域を回避することを意味する安全性を維持するために、 Policyを制限するControl Barrier Certificatesと組み合わせて使用し
ている.
- 提案手法は、先行研究で使用されたクワドローターのシミュレーションによって検証している.また,実機検証では,ダイナミクスが未
知であり、非常に複雑で非定常である実ロボットであるブラシボットで有効性を検証している.
まとめた人:souta hriose
https://arxiv.org/abs/1801.09627
Motor Synergy Development in High-performing
Deep Reinforcement Learning algorithms
Jiazheng Chai and Mitsuhiro Hayashibe
- 人間の運動学習では運動シナジーの概念が用いられているという一考から,訓練された模擬環境における多関節走行エージェント
を対象に、この概念を持つと考えられる関節空間シナジーの解析を深層強化学習アルゴリズムを用いて解析している.
- 結果として,シナジー関連指標と学習エージェントの性能やエネルギー効率との間に相関関係があることを示した.
- また,提案している相乗効果関連指標は、 TD3よりもSACの学習能力が高いことを反映していた.また,多関節ロボットがエネルギー
効率の良い動きをするためには,相乗効果が必要であることを示している.
- (ieeeの為アブストのみ)
まとめた人:souta hriose
https://www.youtube.com/watch?v=AxdQzhEAKgQ
https://ieeexplore.ieee.org/document/8966298
Planning, Learning and Reasoning Framework for Robot Truck Unloading
Fahad Islam, Anirudh Vemula, Sung-Kyun Kim, Andrew Dornbush, Oren Salzman, Maxim Likhachev
- 産業用マニピュレーターロボットを使って、自律的にトラックから箱を降ろすという課題に対しての手法提案.
- 提案手法には,構成要素として、運動計画、オフライン学習のための信念空間計画、オフライン学習に基づくオンライン意思決定、意
思決定と運動計画を組み合わせた実行モジュールが含まれている.また,これらの構成要素によって,箱やロボットへのダメージを
回避しつつ,箱の搬出率を最大化するようなロボットの衝突のない動作を計画している.
- 検証では,シミュレータ( V-REP)上でオフライン学習させたモデルを実機に移行して使用している.
まとめた人:souta hriose
https://arxiv.org/abs/1910.09453
Towards Efficient Human-Robot Collaboration with
Robust Plan Recognition and Trajectory Prediction
Yujiao Cheng, Liting Sun, Changliu Liu, and Masayoshi Tomizuka
- 人間-ロボット間の統合的連携フレームワークの提案.
- 提案手法では,ロボットは人間の作業計画を認識,予測,適応し,人間との衝突を回避することが可能.また,計画と軌道の間の階
層的な関係を明示的に活用することで、よりロバストな計画認識性能を実現することが可能.
- 産業用組立作業を対象に,実験を実施.その結果、提案したフレームワークを用いることで、人間とロボットの共同作業の効率と安全
性が向上し,平均的な作業完了時間は 29.1%短縮された.
まとめた人:souta hriose
https://arxiv.org/abs/1903.02199
Planetary Rover Exploration Combining Remote and In Situ Measurements for Active
Spectroscopic Mapping
Alberto Candela, Suhit Kodgule, Kevin Edelson, Srinivasan Vijayarangan
- 宇宙探索ローバーのミッション活動を自動化するために、スペースクラフト (Remote)及びローバー(In situ)
から得るセンシング情報を組み合わせることで、探索地表面の分光学的分布図を効率的に自動生成する
手法を提案
- Remoteデータ(広範囲だが低分解能 )とIn situデータ(狭範囲だが高分解能)を組み合わせるが、ガウス過
程回帰による空間解釈及び特徴抽出による手法で元データからの重要な情報を損なうことなく、組み合わ
せることが新規性
- ローバーが現地で自動センシングをするための経路計画アルゴリズムとして、 MCTS(Monte Carlo
tree-search)がシミュレーションとフィールド試験共に一番良い結果が出た
まとめた人:Kota Tomaru
ローバー
目標とする成果物(分光学的分布図)
フィールド試験結果の一例https://www.cs.cmu.edu/~albertoc/files/paper_9.pdf
Fast Local Planning and Mapping in Unknown Off-Road Terrain
Timothy Overbye and Srikanth Saripalli
- 未知のオフロード環境での高速によるリアルタイムでも経路計画手法を提案
- 既存の研究ではリアルタイム性と計画経路の精密さはトレードオフの関係であったが、本研究では両立さ
せる手法であることが新規性
- 移動用地図作成において、走行エリア全体の地図がどんどん更新される方針ではなく、すでに通り過ぎた
エリアで遠い場所などはデータを破棄することで情報量を節約している
- 計画段階ではA*アルゴリズムによる経路を作成するが、走行時はそれに追従する経路候補を Pure pursuit
により複数生成し、コスト計算と生成した地図情報に基づき最適な経路を選択しロボットは進むことになる
まとめた人:Kota Tomaru
フィールド試験結果 (左:A*アルゴリズムによる計画経路、右: pure pursuitによる進路候補 (赤)と実際
に進んだ進路(緑))
実験用ロボット
https://arxiv.org/abs/1910.08521
Visual-Inertial Telepresence for Aerial Manipulation
Jongseok Lee, Ribin Balachandran, Yuri S. Sarkisov, etc
- 3D視覚情報と慣性センサーからのフィードバックによる遠隔操作システムの構築を提案。3d情報による
フィードバック及びARマーカーを用いた物体の位置計測情報を組み込むことが新規性
- 遠隔操作中は、ユーザーとロボット間でロボットの位置と力覚情報がやりとりされる
- ARマーカー情報を用いた物体位置計測手法では、途中でマーカーを見失ってもそれを補完する手法を採っ
ている。
- 実証実験の結果、① ARマーカーによる物体位置計測手法が実際の物体位置情報を正確に追従②遠隔操
作により目標タスクの達成を確認した
まとめた人:Kota Tomaru
DBとしての3Dモデル例 ARマーカーの設置例
Object localizationの結
果例(本手法(緑)と他手
法の比較(赤と青))
提案手法による遠隔操作の一例
https://arxiv.org/abs/2003.11509
Revisiting Scaling Laws for Robotic Mobility in Granular Media
Andrew Thoesen, Teresa McBryan, Marko Green, Darwin Mick, Justin Martia, and Hamid Marvi
- 粒状の路面等の変形可能な路面を走行するロボットを開発する時、実験により得られるスケーリング則を適用す
るが、スケーリング則に基づき設計機能と実機の走行結果間に大きな食い違いが生じやすい
- 本研究では、軽量小型モバイルロボットの粒状路面に対するスケーリング則を深度化するため、既存研究よりも
適用現場に近しい条件下で実験を実施し、その結果を報告する
- 4タイプのホイールそれぞれに速さやロボット重量をいくつか変化させることで実験を実施
- ホイール沈下量が設計と実機の誤差に大きく関わると判明したため、設計時には沈下具合を測定する試験
を事前に実施することで、実機と設計間の誤差を少なくできると提案している
まとめた人:Kota Tomaru
重量と設計誤差の記録
https://www.researchgate.net/publication/338759664_Revisiting_Scaling_Laws_for_Robotic_Mobility_in_Granular_Media
Mine Tunnel Exploration using Multiple Quadrupedal Robots
Ian D.Miller, Fernando Cladera, Anthony Cowley, Shreyas S. Shivakumar,
- 4足ロボット用いたトンネル内の長時間自動探索システムの構築
→通信、物体検知と現場状況マッピングを一人のオペレータのみで実現できるシステムアーキテクチャ提案
- 通信が困難な環境下であるトンネル探索において、グローバルマップ作成や GNSS情報無しで自動探索を実施
することが新規性
- Depthカメラからの情報による周囲環境の地図作成、 LidarとIMUを組み合わせによる自己位置推定と経路計画
をロボットはローカルで行う
- トンネル内の物体検知は深層学習ベースの画像処理で行う(これもローカルで実施)
- 試験用の現場で複数回実験した結果、ロボットが安全にトンネル探索を実施し、トンネル内の物体検知を成功さ
せることができたことを確認した
まとめた人:Kota Tomaru
https://arxiv.org/abs/1909.09662
An Efficient Planning and Control Framework for Pruning Fruit Trees
Alexander You, Fouad Sukkar, Robert Fitch, Manoj Karkee, Joseph R. Davidson
- 効率的な剪定作業を行うための,産業用マニピュレータ, RGB-Dカメラ,空気圧カッターで構成されたシス
テム(Fig. 3)を提案
- 3次元の枝の姿勢を正確に推定するため,最新の閉ループ視覚フィードバックシステムを利用 (Fig. 5)
- マニピュレータ軌道の計画を,剪定順序を決定する最適化プロセスに統合
- 提案システムを切断点間のユークリッド距離を使用する計画器と比較し,成功率 92 %で10回の実験のス
ループットの平均が1.5倍早くなることを報告
まとめた人:Nemoto
Fig. 3. Our pruning robot setup, consisting of a UR5e arm, an Intel RealSense
D435 RGB-D camera, and custom pneumatically-actuated shears.
Fig. 5. An image from the simulation showing the OctoMap
representation of the tree system.
https://www.researchgate.net/publication/340006678_An_Efficient_Planning_and_Control_Framework_for_Pruning_Fruit_Trees
MinneApple: A Benchmark Dataset for Apple Detection and Segmentation
Nicolai Häni, Pravakar Roy and Volkan Isler
- コンピュータ・ビジョンによる果実検出アプローチのベンチマークに利用可能な,果樹園におけるリンゴの検
出,セグメンテーション,集計のためのデータセット “MinneApple”を提案(Fig. 1)
- MinneAppleは,1,000枚の画像の中に41,000個以上のラベル付けされたリンゴを含み, 1枚の画像につき
,約1~120個の目標物が含まれている( Fig. 2).
- 同時に,このデータセットを利用して,境界ボックス検出,セグメンテーション,果実集計と収量推定に対す
る基準値となるアルゴリズムの性能解析を提示
まとめた人:Nemoto
Fig. 1: MinneApple contains semantic object instance annotations,
from which one can extract bounding boxes for detection (1a) and
semantic labels (1b). We also provide a dataset to evaluate patch
based counting of overlapping fruits (1c). MinneApple contains
data from 17 different tree rows sporting large variety (1d).
Fig. 2: Samples of annotated images of the detection, segmentation
and counting datasets. The detection/segmentation datasets are
annotated with object instance masks, while the counting dataset
contains image patches and a corresponding ground truth count.
https://arxiv.org/abs/1909.06441
Sim-to-Real Transfer for Optical Tactile Sensing
Zihan Ding, Nathan F. Lepora, and Edward Johns
- 触覚センサのTacTipをUnity上にモデリングし,シミュレーション上で収集したデータで学習を行い,実機
上で推論を行う手法を提案
- Sim-to-Realのために力のスケール・摩擦係数などをランダムに変化させてデータ収集
(Domain Randomization)
- 入力パターンは実験結果より, Tactip上のピンの座標値が有効
- 三つのタスク(円柱の回転角予測,エッジからの距離予測,ポール上の位置予測 )で,
シミュレーションデータで学習した予測器が実機上で正確に動作することを確認
まとめた人:takayanagi
https://arxiv.org/abs/2004.00136
Adversarial Feature Training for Generalizable Robotic Visuomotor Control
Xi Chen, Ali Ghadirzadeh, M˚arten Bj¨orkman, and Patric Jensfelt
- ある物体に関して獲得したマニピュレーションスキルを似た形状の別物体に関して転移する手法を提案
- テンプレート物体に関して, RLによる実機を用いた学習をしてスキル獲得
その後,敵対的学習をすることで特徴量をターゲット物体に関して転移
- ネットワークは特徴抽出部・方策・モータ軌跡生成部から構成される
○ 敵対的学習には,ターゲット物体が含まれるかの識別 (Classification),テンプレート物体の画像か
ターゲット物体が含まれる画像かの識別 (Dsicriminator)を使用
○ Task Lossとして,方策による出力の二乗誤差を使用 (テンプレート物体のデータのみ )
- Pouring Task, Picking Taskにおいて,提案手法の有用性を確認
まとめた人:takayanagi
https://arxiv.org/abs/1909.07745
SA-Net: Robust State-Action Recognition for Learning from Observations
Nihal Soans, Ehsan Asali, Yi Hong, and Prashant Doshi
- Learning from Observation (LfD) で使用するState-Action Pairを,外部カメラの画像からロバストに推定 す
る手法の提案
- RGB-D画像とRGB画像から推定したExpertのBounding Box情報を入力し,State(Expertの絶対座標・回
転)とAction(4方向)を出力
○ 物体検出には,YOLOv2を使用
- TurtleBotによる巡回タスク,TurtleBot上のアームでPick-and-PlaceにおけるState-Actionの推定において
提案手法の有用性を確認
まとめた人:takayanagi
https://arxiv.org/abs/1905.04380
Self-Supervised Correspondence in Visuomotor Policy Learning
Peter Florence , Lucas Manuelli , and Russ Tedrake
- Dense Descriptor (https://arxiv.org/abs/1806.08756)を使った入力画像と目標物体上の Descriptorとの対応点
情報を用いるVisuomotor policy learning(Fig.2)
- Correspondense検出部の学習には複数視点カメラから同期して取得した画像を用いる
- Policyの出力は3次元姿勢とグリッパー開き量で、 Jacobianによるコントローラで手先を制御
- Policy学習は単純なBehavior Cloningで行うが、教示画像にはノイズを加えて Data Augmentationする
- シミュレーションによる検証では、提案手法による特徴は Policyの入力としてGroundtruth情報を与えた場
合に近い性能を示し、 AutoEncoder特徴や、EndToEnd学習で獲得した特徴表現を上回る
- 実ロボットを使った実験では対象物体形状のパラメータ変化にも頑健に対応点を堅守しており( Fig.5)、外
乱に強いマニピュレーションを実現している
- 複数インスタンスを区別したタスクが今後の課題
-
まとめた人:ochiai
https://www.youtube.com/watch?v=nDRBKb4AGmAhttps://arxiv.org/abs/1909.06933
Fog Robotics Algorithms for Distributed Motion Planning Using Lambda Serverless
Computing
Jeffrey Ichnowski, William Lee, Victor Murta, Samuel Paradis , Ron Alterovitz, Joseph E Gonzalez, Ion Stoica, Ken Goldberg
- RRTやRRT*のようなサンプリングベースの動作計画手法を Amazon Lambdaのようなサーバーレスアーキ
テクチャで計算する手法を提案
- 動作計画のような散発的に高い計算量が必要な処理を常時サーバを確保せず無駄なく実施する
- マルチスレッドでツリーを構築する Parallel-RRTと、複数のツリーを並列で構築して早いもの勝ちで解を見
つけるRRT-ORを組み合わせたPRRT-ORを提案(Fig.2)
○ 一つのLambda処理でPRRTを実行し、RRT-ORの要領で最速で得た解を返す
- PRRT-ORが求解速度に優れる一方、メッセージパッシングによる分散処理が特徴の C-FORESTと
Parallel-RRT*を組み合わせたPC-FORESTも提案(Fig.3)
○ 複数走るLambda処理でツリーを同期して共有しより優れた解が得られるよう更新する
- 実験ではFetchロボットの計画問題を扱い、 Lambda実行単位100並列までスケールすることを確認
まとめた人:ochiai
https://goldberg.berkeley.edu/pubs/2020-ICRA-Ichnowski-Fog_Robotics_Serverless_Motion_Planning.pdf
PrimiTect: Fast Continuous Hough Voting for Primitive Detection
Christiane Sommer, Yumin Sun, Erik Bylow, Daniel Cremers
- 3次元点群から高速かつ低リソースでプリミティブ形状を検出するアルゴリズムを提案
- プリミティブとしては平面、球、シリンダー、コーンをサポートする( Fig.1)
- Hough変換のアイディアを応用し、各プリミティブの形状と位置姿勢を低次元のパラメータで表現した上で
Accumulator Arrayを構成しVotingを行う(一度に全プリミティブを対象にできる (Fig.4))
- 入力点群から2つの点の組をサンプルし、それぞれの組について 4次元のPoint-Piar-Featureを計算し
Votingのための特徴量とする
- 性能評価の結果、実行速度と認識性能でベースラインの Efficient RANSACを凌駕
- SOTAのDNN-GPUモデルには速度で勝るものの性能では一歩及ばず
まとめた人:ochiai
https://arxiv.org/abs/2005.07457
ClearGrasp: 3D Shape Estimation of Transparent Objects for Manipulation
Shreeyak Sajjan, Matthew Moore, Mike Pan, Ganesh Nagaraja, Johnny Lee, Andy Zeng, Shuran Song
- 透明物体のマニピュレーションのために、正確な 3次元形状をRGB-D画像一枚から推定する深層学習ベー
スの手法(ClearGrasp)を提案(Fig.2)
1. RGB画像から法線、物体境界、透明物体マスク推定
2. 1で推定したマスクでDepth画像から透明領域をクリップ
3. 1,2の結果に既存のDepth補間アルゴリズムを適用し Depthを推定
- 学習には50,000枚のDomain Randomizationされた合成画像および Groundtruthラベルを用意
- 286枚の実データセットも作成しており、 Groudtruthを得るために透明物体+同形状で塗装された物体の組
を作りARを利用した位置合わせで形状データを取得する工夫が特徴
- 既存の3次元物体把持アルゴリズムと組み合わせ、 SOTAアルゴリズムと比較して吸着ハンド( 64%
→86%)、平行二指グリッパー( 12%→72%)の成功率向上を達成
まとめた人:ochiai
https://sites.google.com/view/cleargrasp
Fig.3: Input / Output / Groundtruth examples
LaryngoTORS: A Novel Cable-Driven Parallel
Robotic System for Transoral Laser Phonosurgery
Ming Zhao, Timo J.C. Oude Vrielink, Alexandros A. Kogkas, Mark S. Runciman, Daniel S. Elson, and George P. Mylonas
- ケーブル駆動平行機構( CDPM)を用いてレーザーファイバーの先端を制御することで,経口的レーザー音
声手術(喉頭組織の切開,アブレーションまたは光凝固のためにレーザービームを使用する外科的処置)
の限界を克服することを目的としたロボットシステム.
- スキャンパターンを自律的に生成したり,ユーザーが自由にパススキャンを行うことができる.
- パススキャンの検証では,誤差は 0.054±0.028 mmと低く,再現性は0.027±0.020 mm(6×2 mmの円弧線)
と高いことが実証され,ニワトリの組織を用いた Ex vivo試験でも高い精度と再現性で現行法の限界を克服
する能力があることが示された.
まとめた人:Shota Ekuni
https://spiral.imperial.ac.uk/bitstream/10044/1/76222/2/Final_Paper_ID19_1655 (1).pdf
Design and Prototyping of a Bio-inspired Kinematic Sensing Suit for the Shoulder Joint:
Precursor to a Multi-DoF Shoulder Exosuit
Rejin John Varghese, Benny P L Lo, and Guang-Zhong Yang
- 肩関節の運動学をセンシングすることが可能な多関節肩外骨格スーツのためのセンシングフレームワーク
- スーツ上に4本のワイヤーを這わせ、ポテンショメータで各ワイヤーの長さを計測。 ANNを用いて、マルチ
センサー空間から関節空間へのマッピングを行った.
- モーショントラッキングシステムで計測した方位角と仰角の関節角度との比較では、二乗平均誤差 (RMSE)
はそれぞれ≈5.43と≈3.65であった.
まとめた人:Shota Ekuni
https://arxiv.org/pdf/1910.04787.pdf

More Related Content

What's hot

What's hot (20)

【 xpaper.challenge 】ブレインストーミング法
【 xpaper.challenge 】ブレインストーミング法【 xpaper.challenge 】ブレインストーミング法
【 xpaper.challenge 】ブレインストーミング法
 
CVIM#11 3. 最小化のための数値計算
CVIM#11 3. 最小化のための数値計算CVIM#11 3. 最小化のための数値計算
CVIM#11 3. 最小化のための数値計算
 
Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩
 
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報
 
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
 [DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent [DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
 
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチMIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
 
[DL輪読会]Temporal Abstraction in NeurIPS2019
[DL輪読会]Temporal Abstraction in NeurIPS2019[DL輪読会]Temporal Abstraction in NeurIPS2019
[DL輪読会]Temporal Abstraction in NeurIPS2019
 
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
 
[DL輪読会]A Simple Unified Framework for Detecting Out-of-Distribution Samples a...
[DL輪読会]A Simple Unified Framework for Detecting Out-of-Distribution Samples a...[DL輪読会]A Simple Unified Framework for Detecting Out-of-Distribution Samples a...
[DL輪読会]A Simple Unified Framework for Detecting Out-of-Distribution Samples a...
 
CV分野におけるサーベイ方法
CV分野におけるサーベイ方法CV分野におけるサーベイ方法
CV分野におけるサーベイ方法
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
 
異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知
 
Semi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learningSemi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learning
 
【DL輪読会】GradMax: Growing Neural Networks using Gradient Information
【DL輪読会】GradMax: Growing Neural Networks using Gradient Information【DL輪読会】GradMax: Growing Neural Networks using Gradient Information
【DL輪読会】GradMax: Growing Neural Networks using Gradient Information
 
Sparse Codingをなるべく数式を使わず理解する(PCAやICAとの関係)
Sparse Codingをなるべく数式を使わず理解する(PCAやICAとの関係)Sparse Codingをなるべく数式を使わず理解する(PCAやICAとの関係)
Sparse Codingをなるべく数式を使わず理解する(PCAやICAとの関係)
 
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 
【DL輪読会】Code as Policies: Language Model Programs for Embodied Control
【DL輪読会】Code as Policies: Language Model Programs for Embodied Control【DL輪読会】Code as Policies: Language Model Programs for Embodied Control
【DL輪読会】Code as Policies: Language Model Programs for Embodied Control
 
[DL輪読会]Taskonomy: Disentangling Task Transfer Learning
[DL輪読会]Taskonomy: Disentangling Task Transfer Learning[DL輪読会]Taskonomy: Disentangling Task Transfer Learning
[DL輪読会]Taskonomy: Disentangling Task Transfer Learning
 
Tensor コアを使った PyTorch の高速化
Tensor コアを使った PyTorch の高速化Tensor コアを使った PyTorch の高速化
Tensor コアを使った PyTorch の高速化
 

Similar to ICRA2020 Open Survey

Data collection(データー集計 )
Data collection(データー集計 )Data collection(データー集計 )
Data collection(データー集計 )
Watanabe Carcass
 
Towards a robust modeling of temporal interest change patterns for behavioral...
Towards a robust modeling of temporal interest change patterns for behavioral...Towards a robust modeling of temporal interest change patterns for behavioral...
Towards a robust modeling of temporal interest change patterns for behavioral...
shima o
 

Similar to ICRA2020 Open Survey (6)

Data collection(データー集計 )
Data collection(データー集計 )Data collection(データー集計 )
Data collection(データー集計 )
 
効果測定入門 Rによる傾向スコア解析
効果測定入門  Rによる傾向スコア解析効果測定入門  Rによる傾向スコア解析
効果測定入門 Rによる傾向スコア解析
 
Towards a robust modeling of temporal interest change patterns for behavioral...
Towards a robust modeling of temporal interest change patterns for behavioral...Towards a robust modeling of temporal interest change patterns for behavioral...
Towards a robust modeling of temporal interest change patterns for behavioral...
 
JOSS2021_E7_FAIRなデータキュレーションの実践_FAIR_Evaluation.pptx
JOSS2021_E7_FAIRなデータキュレーションの実践_FAIR_Evaluation.pptxJOSS2021_E7_FAIRなデータキュレーションの実践_FAIR_Evaluation.pptx
JOSS2021_E7_FAIRなデータキュレーションの実践_FAIR_Evaluation.pptx
 
ECCV 2016 まとめ
ECCV 2016 まとめECCV 2016 まとめ
ECCV 2016 まとめ
 
Icra2020 v1
Icra2020 v1Icra2020 v1
Icra2020 v1
 

More from robotpaperchallenge

More from robotpaperchallenge (16)

Icra2020 v2
Icra2020 v2Icra2020 v2
Icra2020 v2
 
Pre-Survey 2020 05-25:2020-05-31
Pre-Survey 2020 05-25:2020-05-31Pre-Survey 2020 05-25:2020-05-31
Pre-Survey 2020 05-25:2020-05-31
 
Pre-Survey 2020 05-18:2020-05-24
Pre-Survey 2020 05-18:2020-05-24Pre-Survey 2020 05-18:2020-05-24
Pre-Survey 2020 05-18:2020-05-24
 
Pre-Survey 2020 05-11:2020-05-17
Pre-Survey 2020 05-11:2020-05-17Pre-Survey 2020 05-11:2020-05-17
Pre-Survey 2020 05-11:2020-05-17
 
Pre-Survey 2020 05-04:2020-05-10
Pre-Survey 2020 05-04:2020-05-10 Pre-Survey 2020 05-04:2020-05-10
Pre-Survey 2020 05-04:2020-05-10
 
Pre-Survey 2020 04-27:2020-05-03
Pre-Survey 2020 04-27:2020-05-03 Pre-Survey 2020 04-27:2020-05-03
Pre-Survey 2020 04-27:2020-05-03
 
Pre-Survey 2020 04-20:2020-04-26
Pre-Survey 2020 04-20:2020-04-26Pre-Survey 2020 04-20:2020-04-26
Pre-Survey 2020 04-20:2020-04-26
 
Pre-Survey 2020-04-13:2020-04-19
Pre-Survey 2020-04-13:2020-04-19Pre-Survey 2020-04-13:2020-04-19
Pre-Survey 2020-04-13:2020-04-19
 
強化学習勉強会_No3
強化学習勉強会_No3強化学習勉強会_No3
強化学習勉強会_No3
 
強化学習勉強会_No2
強化学習勉強会_No2強化学習勉強会_No2
強化学習勉強会_No2
 
強化学習勉強会_No1@産総研
強化学習勉強会_No1@産総研強化学習勉強会_No1@産総研
強化学習勉強会_No1@産総研
 
Robotpaper.Challenge 2019-10
Robotpaper.Challenge 2019-10Robotpaper.Challenge 2019-10
Robotpaper.Challenge 2019-10
 
robotpaper.Challenge概略_v2@mixi
robotpaper.Challenge概略_v2@mixirobotpaper.Challenge概略_v2@mixi
robotpaper.Challenge概略_v2@mixi
 
Robotpaper.Challenge 2019-09 ver2
Robotpaper.Challenge 2019-09 ver2Robotpaper.Challenge 2019-09 ver2
Robotpaper.Challenge 2019-09 ver2
 
Robotpaper.Challenge 2019-08
Robotpaper.Challenge 2019-08Robotpaper.Challenge 2019-08
Robotpaper.Challenge 2019-08
 
RobotPaperChallenge 2019-07
RobotPaperChallenge 2019-07RobotPaperChallenge 2019-07
RobotPaperChallenge 2019-07
 

Recently uploaded

ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介
ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介
ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介
miyp
 

Recently uploaded (8)

人的資本経営のための地理情報インテリジェンス 作業パターン分析と心身状態把握に関する実証事例
人的資本経営のための地理情報インテリジェンス 作業パターン分析と心身状態把握に関する実証事例人的資本経営のための地理情報インテリジェンス 作業パターン分析と心身状態把握に関する実証事例
人的資本経営のための地理情報インテリジェンス 作業パターン分析と心身状態把握に関する実証事例
 
Compute Units/Budget最適化 - Solana Developer Hub Online 6 #SolDevHub
Compute Units/Budget最適化 - Solana Developer Hub Online 6 #SolDevHubCompute Units/Budget最適化 - Solana Developer Hub Online 6 #SolDevHub
Compute Units/Budget最適化 - Solana Developer Hub Online 6 #SolDevHub
 
【登壇資料】スタートアップCTO経験からキャリアについて再考する CTO・VPoEに聞く by DIGGLE CTO 水上
【登壇資料】スタートアップCTO経験からキャリアについて再考する  CTO・VPoEに聞く by DIGGLE CTO 水上【登壇資料】スタートアップCTO経験からキャリアについて再考する  CTO・VPoEに聞く by DIGGLE CTO 水上
【登壇資料】スタートアップCTO経験からキャリアについて再考する CTO・VPoEに聞く by DIGGLE CTO 水上
 
ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介
ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介
ビジュアルプログラミングIotLT17-オープンソース化されたビジュアルプログラミング環境Noodlの紹介
 
今さら聞けない人のためのDevOps超入門 OSC2024名古屋 セミナー資料
今さら聞けない人のためのDevOps超入門 OSC2024名古屋  セミナー資料今さら聞けない人のためのDevOps超入門 OSC2024名古屋  セミナー資料
今さら聞けない人のためのDevOps超入門 OSC2024名古屋 セミナー資料
 
エンジニアのセルフブランディングと技術情報発信の重要性 テクニカルライターになろう 講演資料
エンジニアのセルフブランディングと技術情報発信の重要性 テクニカルライターになろう 講演資料エンジニアのセルフブランディングと技術情報発信の重要性 テクニカルライターになろう 講演資料
エンジニアのセルフブランディングと技術情報発信の重要性 テクニカルライターになろう 講演資料
 
Linuxサーバー構築 学習のポイントと環境構築 OSC2024名古屋 セミナー資料
Linuxサーバー構築 学習のポイントと環境構築 OSC2024名古屋 セミナー資料Linuxサーバー構築 学習のポイントと環境構築 OSC2024名古屋 セミナー資料
Linuxサーバー構築 学習のポイントと環境構築 OSC2024名古屋 セミナー資料
 
本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について
本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について
本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について
 

ICRA2020 Open Survey

  • 1. ICRA 2020 Open Survey 1 2020/7/13 - 2020/8/10
  • 3. BayesOD: A Bayesian Approach for Uncertainty Estimation in Deep Object Detectors Ali Harakeh, Michael Smart, Steven L. Waslander まとめた人:Hachimine - 深層学習を用いたクラス分類を行う際, NMS(Non-Maxmum Suppresion)を用いるのではなく,ベイズ推定 を用い出力クラスの不確かさをを推定する手法を提案した. - 4種のデータセットにおいて,検出精度と,提案手法が示す不確かさの推定値に相関があることを示した. - 提案手法を評価する尺度として, MUE(Minumun Uncertainty Error),PDQ(Probability Based Detection Quality)を使用. - 評価指標の多くで性能が向上( 0.57~1.7%)したが,使用するデータセットによっては,従来手法( Anchor Redundancy,Sampling Free)のほうが性能が良い場合があった. https://arxiv.org/abs/1903.03838
  • 4. Differentiable Gaussian Process Motion Planning Mohak Bhardwaj, Byron Boots, Mustafa Mukadam まとめた人:Hachimine - GPMPを微分可能な形で表現し直すことにより,障害物の大きさや密度が変化しても,教示データに則った 経路を生成することが可能な手法を提案した. - 微分可能なGPMPは,入力画像から,最適な経路を推定することができるニューラルネットワークを作成す ることが可能となる. - 教示データには,RRT*やGPMP2を併用. - 人間がチューニングを行った GPMP2と比べてdGPMPは障害物の大きさや密度が変化した場合,動作計 画の成功率が高い結果となった. - 動作を探索する途中,障害物と接触する回数も dGPMPのほうが少ない. https://arxiv.org/abs/1907.09591
  • 5. Automatic tool for Gazebo world construction: from a grayscale image to a 3D solid model Bulat Abbyasov, Roman Lavrenov, Aufar Zakiev, Konstantin Yakovlev,Mikhail Svinin and Evgeni Magid まとめた人:Hachimine - グレー画像を元に,gazeboで読み込み可能な3Dモデルを作成手法を提案した. - グレー画像→3D(.dae format)は,画像の輝度値をもとに生成. - HSMSTL tool,LIBTRIX library,ASSIMP libraryを使用.グレー画像 →ヒートマップ→.STL →.dae - テクスチャの貼り付けには UVマッピングを使用.歪みの少ないモデルを生成することができる. - 3Dマップ作成のためのスケールサイズや出力ファイル形式を簡単に設定できる, GUIツールLIRS World Construction Tool (LIRS-WCT)を作成. - 生成した3Dマップを利用し,複数の SLAMを実行.マップの生成に成功した. - 評価指標として,GHPTベースと3Dマップベースのrealtime factor (RTF)を比較している. https://www.researchgate.net/publication/341822865_Automatic_tool_for_Gazebo_world_construction_from_a_grayscale_image_to_a_3D_solid_model
  • 6. Toward Sim-to-Real Directional Semantic Grasping Shariq Iqbal, Jonathan Tremblay, Thang To, Jia Cheng, Erik Leitch, Andy Campbell, Kirby Leung, Duncan McKay, Stan Birchfield まとめた人:Hachimine - DDQN(double deep Q-netwprk)を用い2d画像を元に,pre-defineされたハンドの把持位置姿勢から,最 終的なオブジェクトに対する把持位置姿勢を算出する手法を提案. - 更に,シミュレータと実空間の差異を domain-randomizationを用いることで可能な限り埋め,シミュレータ でトレーニングした結果が実空間上でも使用できることを示した. - UnrealEngine4を用いシミュレータを作成. URDF形式を取り扱うことが可能. - domain-randomizationとして,環境のテクスチャや, 2d画像のぼかし,輝度などを変化. - DDQNではなく教示あり学習を利用することで性能が向上する可能性を検討している. https://arxiv.org/abs/1909.02075
  • 7. 6D Object Pose Regression via Supervised Learning on Point Clouds Ge Gao, Mikko Lauri, Yulong Wang, Xiaolin Hu, Jianwei Zhang, Simone Frintrop まとめた人:Hachimine - 3次元物体の位置と姿勢をそれぞれ別のネットワークで推定する手法を提案した. - 評価指標として,average distance(AD),average distance for a rotaionally symmetric(ADS)を使用 - 回転の表現には,quaternionではなくaxis-angleを使用.損失関数には, L2 lossではなく,geodesic distanceを利用. - quaternionと比較し,axis-angleを用いたほうが,姿勢の推定精度が高い結果となった. - 位置と姿勢1つのネットワークで学習させた場合と比較し,それぞれ別のネットワークで推定するほうが精 度が向上した. - ICPを利用した他手法が数値的に良い場合もあったが, ICPの精度は初期の位置姿勢の影響度が高い https://arxiv.org/abs/2001.08942
  • 8. Discrete Bimanual Manipulation for Wrench Balancing Silvia Cruciani, Diogo Almeida, Danica Kragic, Yiannis Karayiannidis まとめた人:Hachimine - トレーに物体を乗せた場合に生じる重心とモーメントの偏りを算出,対象物がずれないように,把持位置姿 勢をより安定した状態に持ち替える手法を提案. - 重心とモーメントには,準静力学を利用.幾何的に算出. - 持ち替え動作には, Dexterous Manipulation Graphs (DMG)を使用. - パス生成には,Dijkstra’s法を採用.collisionの制約にはトレー上を滑る指先の接触点だけでなく,指全体 を考慮. - 双腕ロボットはABB+6軸トルクセンサ.トレー上の物体を検出するために KinectV2を使用. - 提案手法を採用し,持ち替え動作を行うことで,指先に生じるモーメントを 0.15N·mから0.025N·mに減らすこと ができた. https://www.diva-portal.org/smash/get/diva2:1366107/FULLTEXT01.pdf
  • 9. On Simple Reactive Neural Networks for Behaviour-Based Reinforcement Learning Ameya Pore and Gerardo Aragon-Camarasa - Behaviour-BasedのRLを用いたロボットの行動毎の学習手法の提案. - 開発者のdomain-specificな知識を活用して行動(接近、把持、後退)を分解して訓練することで、タスクを単純化することが可能. - 各行動を分離して学習し、それらを組み合わせてタスクを達成すると、学習がより効果的になることを示唆している.つまり、提案手 法ではピックアンドプレースタスクを 8,000エピソードで学習しており、これは end-to-endな手法(95,000エピソード)や既存の最新のア ルゴリズムで必要とされる学習エピソード数を大幅に削減したエピソードで学習が可能. まとめた人:souta hriose https://arxiv.org/abs/2001.07973
  • 10. Predicting optimal value functions by interpolating reward functions in scalarized multi-objective reinforcement learning Arpan Kusari and Jonathan P. How - 多目的強化学習( MORL)の報酬関数と価値関数の関係を調べ、最適化問題が実際に解かれた重みのセットを超えて、価値関数を どのように近似するかという問題へのアプローチを提案. - 最適な価値関数の報酬関数重みに対する滑らかな補間を得るために、ガウス過程を用いている. Gridworld, Objectworld, Pendulumの3つの例において,ガウシアン処理を用いて価値関数の報酬関数の重みを滑らかに補間する.その結果、この補間は離 散領域と連続領域の両方の問題において、サンプルの状態と行動に対してロバストな値を提供できることが示された. - この補間手法を自律走行車の領域で利用することで、運転中のユーザーの嗜好を簡単に、瞬時に適応させることができ、訓練中の 障害物車両の行動嗜好を真の意味でランダム化することができるという大きな利点得られる. まとめた人:souta hriose https://arxiv.org/abs/1909.05004
  • 11. Interactive Reinforcement Learning with Inaccurate Feedback Taylor A. Kessler Faulkner, Elaine Schaertl Short, Andrea L. Thomaz - 不完全な教師を持つ Interactive RL手法を特徴づけるためのフレームワークを導入し、不完全なフィードバックに対する修正を時間の 経過とともに推定できるアルゴリズムを提案 . - 提案したアルゴリズムである Revision Estimation from Partially Incorrect Resources (REPAIR)では,不正確なフィードバックを受け 取る可能性が高い状態と行動を推定し、この推定に基づいてフィードバックを修正する.つまり,このアルゴリズムは、フィードバック の質を事前に知る必要がないように、報酬関数と追加の環境フィードバックを持つ RLアルゴリズムのフィードバックフィルタとして機能 する. - シミュレーション結果として,ベースライン手法( TAMER:報酬関数の代わりに人間からのフィードバックを使用する, Policy Shaping: 人間からの2値(positive or negative)フィードバックを学習に使用する)に REPAIR を追加することで、テストされたフィードバックのパ フォーマンスが一致または改善されたことを確認した. まとめた人:souta hriose https://sim.ece.utexas.edu/static/papers/REPaIR-ICRA.pdf
  • 12. Guided Uncertainty-Aware Policy Optimization: Combining Learning and Model-Based Strategies for Sample-Efficient Policy Learning Michelle A. Lee, Carlos Florensa, Jonathan Tremblay, Nathan Ratliff , Animesh Garg, Fabio Ramos, Dieter Fox - モデルベース手法の長所と学習ベース手法の柔軟性を組み合わせ , 環境との相互作用を最小限に抑えながら、ロボットの認識から 作動までのパイプラインの不正確さを補償する手法を提案. - 提案手法のGuided Uncertainty-Aware Policy Optimization(GUAPO)では,対象物の粗いモデルと、ある操作を行う必要がある領 域の大まかな表現のみを提供することで、実行すべきタスクを大雑把に定義している. - 提案手法により環境の認識における不確実性の推定値を用いて,モデルベースのポリシーと、定義しやすい疎な報酬から学習でき る学習ベースのポリシーを自動的に切り替えることで、モデルベース部分のモデル誤差や推定誤差を補償する事が可能になる. - 実機検証では,ペグ挿入をタスクとしてテストしている. まとめた人:souta hriose https://arxiv.org/abs/2005.10872 https://sites.google.com/view/guapo-rl
  • 13. High-speed Autonomous Drifting with Deep Reinforcement Learning Peide Cai , Xiaodong Mei , Lei Tai, Yuxiang Sun, and Ming Liu - model-freeな深層強化学習アルゴリズムである soft actor-criticを用いた明示的な運動方程式を用いないロバストな高速ドリフト制御 を提案. - ドリフト制御問題は軌道追従タスクとして定式化され、誤差に基づく状態と報酬を設計している. - 運転難易度の異なる 6つのマップにおいてトレーニングを行った結果、提案手法が変化する車両質量やタイヤの摩擦に対して十分に ロバストであり、複雑なカーブのあるコースを迅速かつスムーズにドリフトすることを確認している. まとめた人:souta hriose https://arxiv.org/abs/2001.01377 https://www.youtube.com/watch?v=0paCdx5cWeQ
  • 14. Robust Model-free Reinforcement Learning with Multi-objective Bayesian Optimization Matteo Turchetta, Andreas Krause, Sebastian Trimpe - 多目的ベイズ最適化に基づくロバストな Policy最適化のためのデータ効率の良いアルゴリズムを提案. - 提案手法では,Multi-Objectiveなベイジアン最適化を用いて,パフォーマンスとロバスト性の最適化を行っている. - Policyのロバスト性を定量化するために、制御理論で一般的なロバスト性指標である位相余裕とゲイン余裕を用いている. - Furuta pendulumを対象として,実験を行い,シミュレーションから実機への移行が容易になった事,単一の性能目標とするベイジア ン最適化と比較してロバスト性が向上した事を確認している. まとめた人:souta hriose https://arxiv.org/abs/1910.13399
  • 15. Learning Multi-Robot Decentralized Macro-Action-Based Policies via a Centralized Q-Net Yuchen Xiao, Joshua Hoffman, Tian Xia and Christopher Amato - Action選択の為に,集中型 Q-netを用いて分散型 Q-netを学習するmacro-aciton-basedな分散型multi-agent Q-net (MacDec-MADDRQN)を提案. - 分散型のPolicy更新の為に、集中型 Q-netを用いることで、各エージェントの分散型 Q-netに他のエージェントの行動の効果を取り込 みながら学習することを可能にしている. - ベンチマークのBox Pushingにおける結果では,分散型 trainingが中央集権型trainingと同様な性能を達成し,提案手法に優位性が あることを確認した.また,移動ロボットを用いた倉庫内における物品配送を行い,実機検証を行っている. まとめた人:souta hriose https://arxiv.org/abs/1909.08776 https://www.youtube.com/watch?v=mk51MPgElj0
  • 16. Barrier-Certified Adaptive Reinforcement Learning With Applications to Brushbot Navigation Motoya Ohnishi , Li Wang , Gennaro Notomista , and Magnus Egerstedt - 非定常エージェントのダイナミクスを持つ可能性のあるシステムに対して、 Barrier Certificatesを用いた適応モデル学習アルゴリズム による Safe Learingフレームワークを提案. - モデルのダイナミクスを抽出するために、スパース最適化手法を使用している.また,学習したモデルを、状態空間内の特定の望まし くない領域を回避することを意味する安全性を維持するために、 Policyを制限するControl Barrier Certificatesと組み合わせて使用し ている. - 提案手法は、先行研究で使用されたクワドローターのシミュレーションによって検証している.また,実機検証では,ダイナミクスが未 知であり、非常に複雑で非定常である実ロボットであるブラシボットで有効性を検証している. まとめた人:souta hriose https://arxiv.org/abs/1801.09627
  • 17. Motor Synergy Development in High-performing Deep Reinforcement Learning algorithms Jiazheng Chai and Mitsuhiro Hayashibe - 人間の運動学習では運動シナジーの概念が用いられているという一考から,訓練された模擬環境における多関節走行エージェント を対象に、この概念を持つと考えられる関節空間シナジーの解析を深層強化学習アルゴリズムを用いて解析している. - 結果として,シナジー関連指標と学習エージェントの性能やエネルギー効率との間に相関関係があることを示した. - また,提案している相乗効果関連指標は、 TD3よりもSACの学習能力が高いことを反映していた.また,多関節ロボットがエネルギー 効率の良い動きをするためには,相乗効果が必要であることを示している. - (ieeeの為アブストのみ) まとめた人:souta hriose https://www.youtube.com/watch?v=AxdQzhEAKgQ https://ieeexplore.ieee.org/document/8966298
  • 18. Planning, Learning and Reasoning Framework for Robot Truck Unloading Fahad Islam, Anirudh Vemula, Sung-Kyun Kim, Andrew Dornbush, Oren Salzman, Maxim Likhachev - 産業用マニピュレーターロボットを使って、自律的にトラックから箱を降ろすという課題に対しての手法提案. - 提案手法には,構成要素として、運動計画、オフライン学習のための信念空間計画、オフライン学習に基づくオンライン意思決定、意 思決定と運動計画を組み合わせた実行モジュールが含まれている.また,これらの構成要素によって,箱やロボットへのダメージを 回避しつつ,箱の搬出率を最大化するようなロボットの衝突のない動作を計画している. - 検証では,シミュレータ( V-REP)上でオフライン学習させたモデルを実機に移行して使用している. まとめた人:souta hriose https://arxiv.org/abs/1910.09453
  • 19. Towards Efficient Human-Robot Collaboration with Robust Plan Recognition and Trajectory Prediction Yujiao Cheng, Liting Sun, Changliu Liu, and Masayoshi Tomizuka - 人間-ロボット間の統合的連携フレームワークの提案. - 提案手法では,ロボットは人間の作業計画を認識,予測,適応し,人間との衝突を回避することが可能.また,計画と軌道の間の階 層的な関係を明示的に活用することで、よりロバストな計画認識性能を実現することが可能. - 産業用組立作業を対象に,実験を実施.その結果、提案したフレームワークを用いることで、人間とロボットの共同作業の効率と安全 性が向上し,平均的な作業完了時間は 29.1%短縮された. まとめた人:souta hriose https://arxiv.org/abs/1903.02199
  • 20. Planetary Rover Exploration Combining Remote and In Situ Measurements for Active Spectroscopic Mapping Alberto Candela, Suhit Kodgule, Kevin Edelson, Srinivasan Vijayarangan - 宇宙探索ローバーのミッション活動を自動化するために、スペースクラフト (Remote)及びローバー(In situ) から得るセンシング情報を組み合わせることで、探索地表面の分光学的分布図を効率的に自動生成する 手法を提案 - Remoteデータ(広範囲だが低分解能 )とIn situデータ(狭範囲だが高分解能)を組み合わせるが、ガウス過 程回帰による空間解釈及び特徴抽出による手法で元データからの重要な情報を損なうことなく、組み合わ せることが新規性 - ローバーが現地で自動センシングをするための経路計画アルゴリズムとして、 MCTS(Monte Carlo tree-search)がシミュレーションとフィールド試験共に一番良い結果が出た まとめた人:Kota Tomaru ローバー 目標とする成果物(分光学的分布図) フィールド試験結果の一例https://www.cs.cmu.edu/~albertoc/files/paper_9.pdf
  • 21. Fast Local Planning and Mapping in Unknown Off-Road Terrain Timothy Overbye and Srikanth Saripalli - 未知のオフロード環境での高速によるリアルタイムでも経路計画手法を提案 - 既存の研究ではリアルタイム性と計画経路の精密さはトレードオフの関係であったが、本研究では両立さ せる手法であることが新規性 - 移動用地図作成において、走行エリア全体の地図がどんどん更新される方針ではなく、すでに通り過ぎた エリアで遠い場所などはデータを破棄することで情報量を節約している - 計画段階ではA*アルゴリズムによる経路を作成するが、走行時はそれに追従する経路候補を Pure pursuit により複数生成し、コスト計算と生成した地図情報に基づき最適な経路を選択しロボットは進むことになる まとめた人:Kota Tomaru フィールド試験結果 (左:A*アルゴリズムによる計画経路、右: pure pursuitによる進路候補 (赤)と実際 に進んだ進路(緑)) 実験用ロボット https://arxiv.org/abs/1910.08521
  • 22. Visual-Inertial Telepresence for Aerial Manipulation Jongseok Lee, Ribin Balachandran, Yuri S. Sarkisov, etc - 3D視覚情報と慣性センサーからのフィードバックによる遠隔操作システムの構築を提案。3d情報による フィードバック及びARマーカーを用いた物体の位置計測情報を組み込むことが新規性 - 遠隔操作中は、ユーザーとロボット間でロボットの位置と力覚情報がやりとりされる - ARマーカー情報を用いた物体位置計測手法では、途中でマーカーを見失ってもそれを補完する手法を採っ ている。 - 実証実験の結果、① ARマーカーによる物体位置計測手法が実際の物体位置情報を正確に追従②遠隔操 作により目標タスクの達成を確認した まとめた人:Kota Tomaru DBとしての3Dモデル例 ARマーカーの設置例 Object localizationの結 果例(本手法(緑)と他手 法の比較(赤と青)) 提案手法による遠隔操作の一例 https://arxiv.org/abs/2003.11509
  • 23. Revisiting Scaling Laws for Robotic Mobility in Granular Media Andrew Thoesen, Teresa McBryan, Marko Green, Darwin Mick, Justin Martia, and Hamid Marvi - 粒状の路面等の変形可能な路面を走行するロボットを開発する時、実験により得られるスケーリング則を適用す るが、スケーリング則に基づき設計機能と実機の走行結果間に大きな食い違いが生じやすい - 本研究では、軽量小型モバイルロボットの粒状路面に対するスケーリング則を深度化するため、既存研究よりも 適用現場に近しい条件下で実験を実施し、その結果を報告する - 4タイプのホイールそれぞれに速さやロボット重量をいくつか変化させることで実験を実施 - ホイール沈下量が設計と実機の誤差に大きく関わると判明したため、設計時には沈下具合を測定する試験 を事前に実施することで、実機と設計間の誤差を少なくできると提案している まとめた人:Kota Tomaru 重量と設計誤差の記録 https://www.researchgate.net/publication/338759664_Revisiting_Scaling_Laws_for_Robotic_Mobility_in_Granular_Media
  • 24. Mine Tunnel Exploration using Multiple Quadrupedal Robots Ian D.Miller, Fernando Cladera, Anthony Cowley, Shreyas S. Shivakumar, - 4足ロボット用いたトンネル内の長時間自動探索システムの構築 →通信、物体検知と現場状況マッピングを一人のオペレータのみで実現できるシステムアーキテクチャ提案 - 通信が困難な環境下であるトンネル探索において、グローバルマップ作成や GNSS情報無しで自動探索を実施 することが新規性 - Depthカメラからの情報による周囲環境の地図作成、 LidarとIMUを組み合わせによる自己位置推定と経路計画 をロボットはローカルで行う - トンネル内の物体検知は深層学習ベースの画像処理で行う(これもローカルで実施) - 試験用の現場で複数回実験した結果、ロボットが安全にトンネル探索を実施し、トンネル内の物体検知を成功さ せることができたことを確認した まとめた人:Kota Tomaru https://arxiv.org/abs/1909.09662
  • 25. An Efficient Planning and Control Framework for Pruning Fruit Trees Alexander You, Fouad Sukkar, Robert Fitch, Manoj Karkee, Joseph R. Davidson - 効率的な剪定作業を行うための,産業用マニピュレータ, RGB-Dカメラ,空気圧カッターで構成されたシス テム(Fig. 3)を提案 - 3次元の枝の姿勢を正確に推定するため,最新の閉ループ視覚フィードバックシステムを利用 (Fig. 5) - マニピュレータ軌道の計画を,剪定順序を決定する最適化プロセスに統合 - 提案システムを切断点間のユークリッド距離を使用する計画器と比較し,成功率 92 %で10回の実験のス ループットの平均が1.5倍早くなることを報告 まとめた人:Nemoto Fig. 3. Our pruning robot setup, consisting of a UR5e arm, an Intel RealSense D435 RGB-D camera, and custom pneumatically-actuated shears. Fig. 5. An image from the simulation showing the OctoMap representation of the tree system. https://www.researchgate.net/publication/340006678_An_Efficient_Planning_and_Control_Framework_for_Pruning_Fruit_Trees
  • 26. MinneApple: A Benchmark Dataset for Apple Detection and Segmentation Nicolai Häni, Pravakar Roy and Volkan Isler - コンピュータ・ビジョンによる果実検出アプローチのベンチマークに利用可能な,果樹園におけるリンゴの検 出,セグメンテーション,集計のためのデータセット “MinneApple”を提案(Fig. 1) - MinneAppleは,1,000枚の画像の中に41,000個以上のラベル付けされたリンゴを含み, 1枚の画像につき ,約1~120個の目標物が含まれている( Fig. 2). - 同時に,このデータセットを利用して,境界ボックス検出,セグメンテーション,果実集計と収量推定に対す る基準値となるアルゴリズムの性能解析を提示 まとめた人:Nemoto Fig. 1: MinneApple contains semantic object instance annotations, from which one can extract bounding boxes for detection (1a) and semantic labels (1b). We also provide a dataset to evaluate patch based counting of overlapping fruits (1c). MinneApple contains data from 17 different tree rows sporting large variety (1d). Fig. 2: Samples of annotated images of the detection, segmentation and counting datasets. The detection/segmentation datasets are annotated with object instance masks, while the counting dataset contains image patches and a corresponding ground truth count. https://arxiv.org/abs/1909.06441
  • 27. Sim-to-Real Transfer for Optical Tactile Sensing Zihan Ding, Nathan F. Lepora, and Edward Johns - 触覚センサのTacTipをUnity上にモデリングし,シミュレーション上で収集したデータで学習を行い,実機 上で推論を行う手法を提案 - Sim-to-Realのために力のスケール・摩擦係数などをランダムに変化させてデータ収集 (Domain Randomization) - 入力パターンは実験結果より, Tactip上のピンの座標値が有効 - 三つのタスク(円柱の回転角予測,エッジからの距離予測,ポール上の位置予測 )で, シミュレーションデータで学習した予測器が実機上で正確に動作することを確認 まとめた人:takayanagi https://arxiv.org/abs/2004.00136
  • 28. Adversarial Feature Training for Generalizable Robotic Visuomotor Control Xi Chen, Ali Ghadirzadeh, M˚arten Bj¨orkman, and Patric Jensfelt - ある物体に関して獲得したマニピュレーションスキルを似た形状の別物体に関して転移する手法を提案 - テンプレート物体に関して, RLによる実機を用いた学習をしてスキル獲得 その後,敵対的学習をすることで特徴量をターゲット物体に関して転移 - ネットワークは特徴抽出部・方策・モータ軌跡生成部から構成される ○ 敵対的学習には,ターゲット物体が含まれるかの識別 (Classification),テンプレート物体の画像か ターゲット物体が含まれる画像かの識別 (Dsicriminator)を使用 ○ Task Lossとして,方策による出力の二乗誤差を使用 (テンプレート物体のデータのみ ) - Pouring Task, Picking Taskにおいて,提案手法の有用性を確認 まとめた人:takayanagi https://arxiv.org/abs/1909.07745
  • 29. SA-Net: Robust State-Action Recognition for Learning from Observations Nihal Soans, Ehsan Asali, Yi Hong, and Prashant Doshi - Learning from Observation (LfD) で使用するState-Action Pairを,外部カメラの画像からロバストに推定 す る手法の提案 - RGB-D画像とRGB画像から推定したExpertのBounding Box情報を入力し,State(Expertの絶対座標・回 転)とAction(4方向)を出力 ○ 物体検出には,YOLOv2を使用 - TurtleBotによる巡回タスク,TurtleBot上のアームでPick-and-PlaceにおけるState-Actionの推定において 提案手法の有用性を確認 まとめた人:takayanagi https://arxiv.org/abs/1905.04380
  • 30. Self-Supervised Correspondence in Visuomotor Policy Learning Peter Florence , Lucas Manuelli , and Russ Tedrake - Dense Descriptor (https://arxiv.org/abs/1806.08756)を使った入力画像と目標物体上の Descriptorとの対応点 情報を用いるVisuomotor policy learning(Fig.2) - Correspondense検出部の学習には複数視点カメラから同期して取得した画像を用いる - Policyの出力は3次元姿勢とグリッパー開き量で、 Jacobianによるコントローラで手先を制御 - Policy学習は単純なBehavior Cloningで行うが、教示画像にはノイズを加えて Data Augmentationする - シミュレーションによる検証では、提案手法による特徴は Policyの入力としてGroundtruth情報を与えた場 合に近い性能を示し、 AutoEncoder特徴や、EndToEnd学習で獲得した特徴表現を上回る - 実ロボットを使った実験では対象物体形状のパラメータ変化にも頑健に対応点を堅守しており( Fig.5)、外 乱に強いマニピュレーションを実現している - 複数インスタンスを区別したタスクが今後の課題 - まとめた人:ochiai https://www.youtube.com/watch?v=nDRBKb4AGmAhttps://arxiv.org/abs/1909.06933
  • 31. Fog Robotics Algorithms for Distributed Motion Planning Using Lambda Serverless Computing Jeffrey Ichnowski, William Lee, Victor Murta, Samuel Paradis , Ron Alterovitz, Joseph E Gonzalez, Ion Stoica, Ken Goldberg - RRTやRRT*のようなサンプリングベースの動作計画手法を Amazon Lambdaのようなサーバーレスアーキ テクチャで計算する手法を提案 - 動作計画のような散発的に高い計算量が必要な処理を常時サーバを確保せず無駄なく実施する - マルチスレッドでツリーを構築する Parallel-RRTと、複数のツリーを並列で構築して早いもの勝ちで解を見 つけるRRT-ORを組み合わせたPRRT-ORを提案(Fig.2) ○ 一つのLambda処理でPRRTを実行し、RRT-ORの要領で最速で得た解を返す - PRRT-ORが求解速度に優れる一方、メッセージパッシングによる分散処理が特徴の C-FORESTと Parallel-RRT*を組み合わせたPC-FORESTも提案(Fig.3) ○ 複数走るLambda処理でツリーを同期して共有しより優れた解が得られるよう更新する - 実験ではFetchロボットの計画問題を扱い、 Lambda実行単位100並列までスケールすることを確認 まとめた人:ochiai https://goldberg.berkeley.edu/pubs/2020-ICRA-Ichnowski-Fog_Robotics_Serverless_Motion_Planning.pdf
  • 32. PrimiTect: Fast Continuous Hough Voting for Primitive Detection Christiane Sommer, Yumin Sun, Erik Bylow, Daniel Cremers - 3次元点群から高速かつ低リソースでプリミティブ形状を検出するアルゴリズムを提案 - プリミティブとしては平面、球、シリンダー、コーンをサポートする( Fig.1) - Hough変換のアイディアを応用し、各プリミティブの形状と位置姿勢を低次元のパラメータで表現した上で Accumulator Arrayを構成しVotingを行う(一度に全プリミティブを対象にできる (Fig.4)) - 入力点群から2つの点の組をサンプルし、それぞれの組について 4次元のPoint-Piar-Featureを計算し Votingのための特徴量とする - 性能評価の結果、実行速度と認識性能でベースラインの Efficient RANSACを凌駕 - SOTAのDNN-GPUモデルには速度で勝るものの性能では一歩及ばず まとめた人:ochiai https://arxiv.org/abs/2005.07457
  • 33. ClearGrasp: 3D Shape Estimation of Transparent Objects for Manipulation Shreeyak Sajjan, Matthew Moore, Mike Pan, Ganesh Nagaraja, Johnny Lee, Andy Zeng, Shuran Song - 透明物体のマニピュレーションのために、正確な 3次元形状をRGB-D画像一枚から推定する深層学習ベー スの手法(ClearGrasp)を提案(Fig.2) 1. RGB画像から法線、物体境界、透明物体マスク推定 2. 1で推定したマスクでDepth画像から透明領域をクリップ 3. 1,2の結果に既存のDepth補間アルゴリズムを適用し Depthを推定 - 学習には50,000枚のDomain Randomizationされた合成画像および Groundtruthラベルを用意 - 286枚の実データセットも作成しており、 Groudtruthを得るために透明物体+同形状で塗装された物体の組 を作りARを利用した位置合わせで形状データを取得する工夫が特徴 - 既存の3次元物体把持アルゴリズムと組み合わせ、 SOTAアルゴリズムと比較して吸着ハンド( 64% →86%)、平行二指グリッパー( 12%→72%)の成功率向上を達成 まとめた人:ochiai https://sites.google.com/view/cleargrasp Fig.3: Input / Output / Groundtruth examples
  • 34. LaryngoTORS: A Novel Cable-Driven Parallel Robotic System for Transoral Laser Phonosurgery Ming Zhao, Timo J.C. Oude Vrielink, Alexandros A. Kogkas, Mark S. Runciman, Daniel S. Elson, and George P. Mylonas - ケーブル駆動平行機構( CDPM)を用いてレーザーファイバーの先端を制御することで,経口的レーザー音 声手術(喉頭組織の切開,アブレーションまたは光凝固のためにレーザービームを使用する外科的処置) の限界を克服することを目的としたロボットシステム. - スキャンパターンを自律的に生成したり,ユーザーが自由にパススキャンを行うことができる. - パススキャンの検証では,誤差は 0.054±0.028 mmと低く,再現性は0.027±0.020 mm(6×2 mmの円弧線) と高いことが実証され,ニワトリの組織を用いた Ex vivo試験でも高い精度と再現性で現行法の限界を克服 する能力があることが示された. まとめた人:Shota Ekuni https://spiral.imperial.ac.uk/bitstream/10044/1/76222/2/Final_Paper_ID19_1655 (1).pdf
  • 35. Design and Prototyping of a Bio-inspired Kinematic Sensing Suit for the Shoulder Joint: Precursor to a Multi-DoF Shoulder Exosuit Rejin John Varghese, Benny P L Lo, and Guang-Zhong Yang - 肩関節の運動学をセンシングすることが可能な多関節肩外骨格スーツのためのセンシングフレームワーク - スーツ上に4本のワイヤーを這わせ、ポテンショメータで各ワイヤーの長さを計測。 ANNを用いて、マルチ センサー空間から関節空間へのマッピングを行った. - モーショントラッキングシステムで計測した方位角と仰角の関節角度との比較では、二乗平均誤差 (RMSE) はそれぞれ≈5.43と≈3.65であった. まとめた人:Shota Ekuni https://arxiv.org/pdf/1910.04787.pdf