3 d object recognition

3D object recognition
（簡単まとめ）
柴田祐希

どんなもの？
先行研究と比べて何がすごい？
技術の手法や肝は？
議論はある？
どうやって有効だと検証した？
次に読むべき論文は？
Object Recognition in 3D Point Clouds Using Web Data and Domain
Adaptation,
The International Journal of Robotics Research,29:1019–1037, 2010
?
日常的なオブジェクトの大きなRGB-DデータセットRGB-D Object
Dataset [14]を使用して、カテゴリとインスタンス認識の両方を
調査。
オブジェクトのビ距離関数を一緒に学習することによる計算効
率のを大幅な向上。
グループ-ラッソ正則化を使用し、データセットを大幅にスパー
ス化して冗長なビューを破棄し、分類を高速化した。
巨大なデータセットの効率的な処理が可能。
Group-Lassoを使用することで正確さを犠牲にせず高速化が可能
、この学習で得た距離情報は、様々なロボット工学タスクへの
入力として使用できます。
RGB-Dカメラハードウェアの急速な進歩を考慮し、RGBと深度の
組み合わせによる３Dオブジェクト認識、検出、およびその他
のロボット認識タスクを使用できる方法を提案。
Sparse Distance Learning for Object Recognition Combining RGB and Depth Information
https://rse-lab.cs.washington.edu/postscripts/sparse-distance-icra-11.pdf
（9-13 May 2011）Kevin Lai, Liefeng Bo, Xiaofeng Ren, and Dieter Fox

どんなもの？
議論はある？
View planning for automated 3d object reconstruction inspection,
ACM Computing Surveys, 2003. 2, 3
計算コストが高い。
Volumetric CNNではボクセル化する際に、点群データの空間特性
が必然的に変化し、物体の凹凸表現が欠損してしまう。
大規模な3D CADモデルデータセットであるModelNetを使用した
分類予測。
畳み込み演算によるデータの特徴量変換。
特徴量間の類似度の計測。
単一のビュー2.5Dデプスマップ（一般的なRGB-Dセンサーなど）
からオブジェクトを共同で認識および再構築できる。
生のCADデータからさまざまなオブジェクトカテゴリと任意の
ポーズにまたがる複雑な3D形状の分布を学習し、階層的な構成
パーツ表現を自動的に検出する3D ShapeNetsを提案。
3D ShapeNets: A Deep Representation for Volumetric Shape
https://arxiv.org/pdf/1406.5670.pdf
（May 28, 2015）Zhirong Wu ; Shuran Song ; Aditya Khosla ; Fisher Yu ; Linguang Zhang ; Xiaoou Tang

どんなもの？
議論はある？
3D Semantic Parsing of Large-Scale Indoor Spaces, IEEE 12 December
2016
空間の細かい情報が抜けやすかったり、点密度を均一にすると
精度が落ちる。
ModelNet40を用いた形状分類。
ShapeNetパーツデータセットを用いたセグメンテーション。
Stanford 3D semantic parsing data setを用いたシーンのセマンティッ
クセグメンテーション。
アプローチの鍵は、単一の対称関数、最大プーリングの使用。
ネットワークは、３D点群の有益なポイントを選択し、その選
択理由をエンコードする最適化関数/基準のセットを効果的に学
習します。
同等以上の結果を取得しながら多くの3D認識タスクへの適用が
可能。
ネットワーク理解に向けた理論的分析と視覚化も提供できる。
点群の順序に対して不変であり、向きに対してロバスト。
3Dボクセル等への変換することなく、3D点群を直接使用した新
しいディープニューラルネットワークPointNetの提案。
PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation
（10 Apr 2017）Charles R. Qi • Hao Su • Kaichun Mo • Leonidas J. Guibas

どんなもの？
議論はある？
Visual learning and recognition of 3-D objects from appearance, 14(1),
1995
Delving deep into convolutional nets, In Proc. BMVC, 2014
最も有益な2Dデータや、その組み合わせは何か？
ビデオ映像からの実世界3Dオブジェクトの構築が可能か？
Princeton ModelNet datasetを用いた分類。
人間が判別可能なデータに絞ったhuman sketch datasetを用いた
分類、検索（予測）。
様々な角度からの物体2Dデータをそれぞれ畳み込んだ後に統合
する。
3Dデータを取得することなく、従来方法よりも高い精度を得る
ことができる。
スケッチを使用して3D形状を高精度で取得し、2Dビューに含ま
れる3D形状の暗黙の知識を活用できます。
複数視野2D画像から3D形状を認識させるモデルを提供。
学習したモデルを使用すれば単一の2D画像から3Dを予測するこ
とが可能。
Multi-view Convolutional Neural Networks for 3D Shape
Recognition
https://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Su_Multi-
View_Convolutional_Neural_ICCV_2015_paper.pdf
（May 2015）Hang Su • Subhransu Maji • Evangelos Kalogerakis • Erik Learned-Miller

どんなもの？
議論はある？
Multi-View 3D Object Detection Network for Autonomous Driving,
CVPR
Neural scene representation and rendering,Science 15 Jun 2018
既存ポイントベース法は近隣検索メカニズムのため計算コスト高い。
不均衡データから学習することは、点群セグメンテーションでは困難。
深度センサーによって取得された点群は通常、巨大で大規模。したがっ
て、大規模な点群の効率的な取り扱い方が必要。
S3DIS、Semantic3D、ScanNet、およびSemanticKITTIデータセット
を用いた、既存の手法の包括的な比較。
指標には全体精度(OA)、平均IoUm(IoU)を用いた。
Shape Classification : projection-based networks, point-based networks
Object Detection and Tracking : region proposal-based, single shot methods
3D Point Cloud Segmentation : semantic segmentation(scene level),
instance segmentation(object level), part segmentation(part level)
点群関連タスクの深層学習方法を包括的にカバーしている最初
の論文。
3Dセンサー技術の利用が進んでおり、3D dataの形式が複数ある
ことに言及。形状分類、オブジェクトの検出、セグメンテーシ
ョンと、それに関連してPublicなデータセットにおける比較検証
や、将来の方向性などについてもまとめている。
Deep Learning for 3D Point Clouds: A Survey
（27 Dec 2019）Yulan Guo∗, Hanyun Wang∗, Qingyong Hu∗, Hao Liu∗, Li Liu, and Mohammed Bennamoun

3 d object recognition

Recommended

Recommended

More Related Content

What's hot

What's hot (10)

Similar to 3 d object recognition

Similar to 3 d object recognition (20)

Recently uploaded

Recently uploaded (14)

3 d object recognition