SlideShare a Scribd company logo
1 of 6
3D object recognition
(簡単まとめ)
柴田祐希
どんなもの?
先行研究と比べて何がすごい?
技術の手法や肝は?
議論はある?
どうやって有効だと検証した?
次に読むべき論文は?
Object Recognition in 3D Point Clouds Using Web Data and Domain
Adaptation,
The International Journal of Robotics Research,29:1019–1037, 2010
?
日常的なオブジェクトの大きなRGB-DデータセットRGB-D Object
Dataset [14]を使用して、カテゴリとインスタンス認識の両方を
調査。
オブジェクトのビ距離関数を一緒に学習することによる計算効
率のを大幅な向上。
グループ-ラッソ正則化を使用し、データセットを大幅にスパー
ス化して冗長なビューを破棄し、分類を高速化した。
巨大なデータセットの効率的な処理が可能。
Group-Lassoを使用することで正確さを犠牲にせず高速化が可能
、この学習で得た距離情報は、様々なロボット工学タスクへの
入力として使用できます。
RGB-Dカメラハードウェアの急速な進歩を考慮し、RGBと深度の
組み合わせによる3Dオブジェクト認識、検出、およびその他
のロボット認識タスクを使用できる方法を提案。
Sparse Distance Learning for Object Recognition Combining RGB and Depth Information
https://rse-lab.cs.washington.edu/postscripts/sparse-distance-icra-11.pdf
(9-13 May 2011)Kevin Lai, Liefeng Bo, Xiaofeng Ren, and Dieter Fox
どんなもの?
先行研究と比べて何がすごい?
技術の手法や肝は?
議論はある?
どうやって有効だと検証した?
次に読むべき論文は?
View planning for automated 3d object reconstruction inspection,
ACM Computing Surveys, 2003. 2, 3
計算コストが高い。
Volumetric CNNではボクセル化する際に、点群データの空間特性
が必然的に変化し、物体の凹凸表現が欠損してしまう。
大規模な3D CADモデルデータセットであるModelNetを使用した
分類予測。
畳み込み演算によるデータの特徴量変換 。
特徴量間の類似度の計測。
単一のビュー2.5Dデプスマップ(一般的なRGB-Dセンサーなど)
からオブジェクトを共同で認識および再構築できる。
生のCADデータからさまざまなオブジェクトカテゴリと任意の
ポーズにまたがる複雑な3D形状の分布を学習し、階層的な構成
パーツ表現を自動的に検出する3D ShapeNetsを提案。
3D ShapeNets: A Deep Representation for Volumetric Shape
https://arxiv.org/pdf/1406.5670.pdf
(May 28, 2015)Zhirong Wu ; Shuran Song ; Aditya Khosla ; Fisher Yu ; Linguang Zhang ; Xiaoou Tang
どんなもの?
先行研究と比べて何がすごい?
技術の手法や肝は?
議論はある?
どうやって有効だと検証した?
次に読むべき論文は?
3D Semantic Parsing of Large-Scale Indoor Spaces, IEEE 12 December
2016
空間の細かい情報が抜けやすかったり、点密度を均一にすると
精度が落ちる。
ModelNet40を用いた形状分類。
ShapeNetパーツデータセットを用いたセグメンテーション。
Stanford 3D semantic parsing data setを用いたシーンのセマンティッ
クセグメンテーション。
アプローチの鍵は、単一の対称関数、最大プーリングの使用。
ネットワークは、3D点群の有益なポイントを選択し、その選
択理由をエンコードする最適化関数/基準のセットを効果的に学
習します。
同等以上の結果を取得しながら多くの3D認識タスクへの適用が
可能。
ネットワーク理解に向けた理論的分析と視覚化も提供できる。
点群の順序に対して不変であり、向きに対してロバスト。
3Dボクセル等への変換することなく、3D点群を直接使用した新
しいディープニューラルネットワークPointNetの提案。
PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation
https://arxiv.org/pdf/1612.00593.pdf
(10 Apr 2017)Charles R. Qi • Hao Su • Kaichun Mo • Leonidas J. Guibas
どんなもの?
先行研究と比べて何がすごい?
技術の手法や肝は?
議論はある?
どうやって有効だと検証した?
次に読むべき論文は?
Visual learning and recognition of 3-D objects from appearance, 14(1),
1995
Delving deep into convolutional nets, In Proc. BMVC, 2014
最も有益な2Dデータや、その組み合わせは何か?
ビデオ映像からの実世界3Dオブジェクトの構築が可能か?
Princeton ModelNet datasetを用いた分類。
人間が判別可能なデータに絞ったhuman sketch datasetを用いた
分類、検索(予測)。
様々な角度からの物体2Dデータをそれぞれ畳み込んだ後に統合
する。
3Dデータを取得することなく、従来方法よりも高い精度を得る
ことができる。
スケッチを使用して3D形状を高精度で取得し、2Dビューに含ま
れる3D形状の暗黙の知識を活用できます。
複数視野2D画像から3D形状を認識させるモデルを提供。
学習したモデルを使用すれば単一の2D画像から3Dを予測するこ
とが可能。
Multi-view Convolutional Neural Networks for 3D Shape
Recognition
https://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Su_Multi-
View_Convolutional_Neural_ICCV_2015_paper.pdf
(May 2015)Hang Su • Subhransu Maji • Evangelos Kalogerakis • Erik Learned-Miller
どんなもの?
先行研究と比べて何がすごい?
技術の手法や肝は?
議論はある?
どうやって有効だと検証した?
次に読むべき論文は?
Multi-View 3D Object Detection Network for Autonomous Driving,
CVPR
Neural scene representation and rendering,Science 15 Jun 2018
既存ポイントベース法は近隣検索メカニズムのため計算コスト高い。
不均衡データから学習することは、点群セグメンテーションでは困難。
深度センサーによって取得された点群は通常、巨大で大規模。したがっ
て、大規模な点群の効率的な取り扱い方が必要。
S3DIS、Semantic3D、ScanNet、およびSemanticKITTIデータセット
を用いた、既存の手法の包括的な比較。
指標には全体精度(OA)、平均IoUm(IoU)を用いた。
Shape Classification : projection-based networks, point-based networks
Object Detection and Tracking : region proposal-based, single shot methods
3D Point Cloud Segmentation : semantic segmentation(scene level),
instance segmentation(object level), part segmentation(part level)
点群関連タスクの深層学習方法を包括的にカバーしている最初
の論文。
3Dセンサー技術の利用が進んでおり、3D dataの形式が複数ある
ことに言及。形状分類、オブジェクトの検出、セグメンテーシ
ョンと、それに関連してPublicなデータセットにおける比較検証
や、将来の方向性などについてもまとめている。
Deep Learning for 3D Point Clouds: A Survey
https://arxiv.org/pdf/1912.12033.pdf
(27 Dec 2019)Yulan Guo∗, Hanyun Wang∗, Qingyong Hu∗, Hao Liu∗, Li Liu, and Mohammed Bennamoun

More Related Content

What's hot

【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Pose【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Posecvpaper. challenge
 
サブカルのためのWord2vec
サブカルのためのWord2vecサブカルのためのWord2vec
サブカルのためのWord2vecDeNA
 
汎用ニューラルネットワークポテンシャル「PFP」による材料探索_MRS-J2021招待講演_2021/12/15
汎用ニューラルネットワークポテンシャル「PFP」による材料探索_MRS-J2021招待講演_2021/12/15汎用ニューラルネットワークポテンシャル「PFP」による材料探索_MRS-J2021招待講演_2021/12/15
汎用ニューラルネットワークポテンシャル「PFP」による材料探索_MRS-J2021招待講演_2021/12/15Matlantis
 
Yoshio Kato Bachelor Thesis
Yoshio Kato Bachelor Thesis Yoshio Kato Bachelor Thesis
Yoshio Kato Bachelor Thesis pflab
 
Annotating object instances with a polygon rnn
Annotating object instances with a polygon rnnAnnotating object instances with a polygon rnn
Annotating object instances with a polygon rnnTakanori Ogata
 
Training object class detectors with click supervision
Training object class detectors with click supervisionTraining object class detectors with click supervision
Training object class detectors with click supervisionTakanori Ogata
 
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose EstimationDeep Learning JP
 
ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...
ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...
ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...Hajime Mihara
 
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...KCS Keio Computer Society
 
[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networksDeep Learning JP
 

What's hot (10)

【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Pose【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Pose
 
サブカルのためのWord2vec
サブカルのためのWord2vecサブカルのためのWord2vec
サブカルのためのWord2vec
 
汎用ニューラルネットワークポテンシャル「PFP」による材料探索_MRS-J2021招待講演_2021/12/15
汎用ニューラルネットワークポテンシャル「PFP」による材料探索_MRS-J2021招待講演_2021/12/15汎用ニューラルネットワークポテンシャル「PFP」による材料探索_MRS-J2021招待講演_2021/12/15
汎用ニューラルネットワークポテンシャル「PFP」による材料探索_MRS-J2021招待講演_2021/12/15
 
Yoshio Kato Bachelor Thesis
Yoshio Kato Bachelor Thesis Yoshio Kato Bachelor Thesis
Yoshio Kato Bachelor Thesis
 
Annotating object instances with a polygon rnn
Annotating object instances with a polygon rnnAnnotating object instances with a polygon rnn
Annotating object instances with a polygon rnn
 
Training object class detectors with click supervision
Training object class detectors with click supervisionTraining object class detectors with click supervision
Training object class detectors with click supervision
 
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
 
ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...
ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...
ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...
 
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
 
[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks
 

Similar to 3 d object recognition

MRについてのサーベイ
MRについてのサーベイMRについてのサーベイ
MRについてのサーベイtatsuki yasuda
 
Cross-modality meta-survey of dataset
Cross-modality meta-survey of datasetCross-modality meta-survey of dataset
Cross-modality meta-survey of datasetcvpaper. challenge
 
「モダンな」可視化アプリケーション開発とはどのようなものか?
「モダンな」可視化アプリケーション開発とはどのようなものか?「モダンな」可視化アプリケーション開発とはどのようなものか?
「モダンな」可視化アプリケーション開発とはどのようなものか?Keiichiro Ono
 
[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...
[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...
[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...Deep Learning JP
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネスMie Mori
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentationTakuya Minagawa
 
Creating and Using Links between Data Objects
Creating and Using Links between Data ObjectsCreating and Using Links between Data Objects
Creating and Using Links between Data ObjectsMitsuo Yamamoto
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)Takuya Minagawa
 
3Dマップを活用したVisual Localization
3Dマップを活用したVisual Localization3Dマップを活用したVisual Localization
3Dマップを活用したVisual LocalizationHajime Taira
 
MapReduceによる大規模データを利用した機械学習
MapReduceによる大規模データを利用した機械学習MapReduceによる大規模データを利用した機械学習
MapReduceによる大規模データを利用した機械学習Preferred Networks
 
ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題Kenta Oono
 
EfficientDet: Scalable and Efficient Object Detection
EfficientDet: Scalable and Efficient Object DetectionEfficientDet: Scalable and Efficient Object Detection
EfficientDet: Scalable and Efficient Object Detectionharmonylab
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムRecruit Technologies
 
cvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezakicvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezakikanejaki
 
[DL輪読会]Relational inductive biases, deep learning, and graph networks
[DL輪読会]Relational inductive biases, deep learning, and graph networks[DL輪読会]Relational inductive biases, deep learning, and graph networks
[DL輪読会]Relational inductive biases, deep learning, and graph networksDeep Learning JP
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - Tetsutaro Watanabe
 
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural imagesDeep Learning JP
 
データ集計基盤のいままでとこれから 〜Hadoopからdataflowまで使い込んだ経験を徹底共有〜
データ集計基盤のいままでとこれから 〜Hadoopからdataflowまで使い込んだ経験を徹底共有〜データ集計基盤のいままでとこれから 〜Hadoopからdataflowまで使い込んだ経験を徹底共有〜
データ集計基盤のいままでとこれから 〜Hadoopからdataflowまで使い込んだ経験を徹底共有〜Kazuhiro Mitsuhashi
 
先端技術とメディア表現 第4回レポートまとめ
先端技術とメディア表現 第4回レポートまとめ先端技術とメディア表現 第4回レポートまとめ
先端技術とメディア表現 第4回レポートまとめDigital Nature Group
 

Similar to 3 d object recognition (20)

20151028koyama
20151028koyama20151028koyama
20151028koyama
 
MRについてのサーベイ
MRについてのサーベイMRについてのサーベイ
MRについてのサーベイ
 
Cross-modality meta-survey of dataset
Cross-modality meta-survey of datasetCross-modality meta-survey of dataset
Cross-modality meta-survey of dataset
 
「モダンな」可視化アプリケーション開発とはどのようなものか?
「モダンな」可視化アプリケーション開発とはどのようなものか?「モダンな」可視化アプリケーション開発とはどのようなものか?
「モダンな」可視化アプリケーション開発とはどのようなものか?
 
[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...
[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...
[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネス
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
 
Creating and Using Links between Data Objects
Creating and Using Links between Data ObjectsCreating and Using Links between Data Objects
Creating and Using Links between Data Objects
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)
 
3Dマップを活用したVisual Localization
3Dマップを活用したVisual Localization3Dマップを活用したVisual Localization
3Dマップを活用したVisual Localization
 
MapReduceによる大規模データを利用した機械学習
MapReduceによる大規模データを利用した機械学習MapReduceによる大規模データを利用した機械学習
MapReduceによる大規模データを利用した機械学習
 
ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題
 
EfficientDet: Scalable and Efficient Object Detection
EfficientDet: Scalable and Efficient Object DetectionEfficientDet: Scalable and Efficient Object Detection
EfficientDet: Scalable and Efficient Object Detection
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
 
cvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezakicvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezaki
 
[DL輪読会]Relational inductive biases, deep learning, and graph networks
[DL輪読会]Relational inductive biases, deep learning, and graph networks[DL輪読会]Relational inductive biases, deep learning, and graph networks
[DL輪読会]Relational inductive biases, deep learning, and graph networks
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
 
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images
 
データ集計基盤のいままでとこれから 〜Hadoopからdataflowまで使い込んだ経験を徹底共有〜
データ集計基盤のいままでとこれから 〜Hadoopからdataflowまで使い込んだ経験を徹底共有〜データ集計基盤のいままでとこれから 〜Hadoopからdataflowまで使い込んだ経験を徹底共有〜
データ集計基盤のいままでとこれから 〜Hadoopからdataflowまで使い込んだ経験を徹底共有〜
 
先端技術とメディア表現 第4回レポートまとめ
先端技術とメディア表現 第4回レポートまとめ先端技術とメディア表現 第4回レポートまとめ
先端技術とメディア表現 第4回レポートまとめ
 

Recently uploaded

クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 

Recently uploaded (14)

クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 

3 d object recognition

  • 2. どんなもの? 先行研究と比べて何がすごい? 技術の手法や肝は? 議論はある? どうやって有効だと検証した? 次に読むべき論文は? Object Recognition in 3D Point Clouds Using Web Data and Domain Adaptation, The International Journal of Robotics Research,29:1019–1037, 2010 ? 日常的なオブジェクトの大きなRGB-DデータセットRGB-D Object Dataset [14]を使用して、カテゴリとインスタンス認識の両方を 調査。 オブジェクトのビ距離関数を一緒に学習することによる計算効 率のを大幅な向上。 グループ-ラッソ正則化を使用し、データセットを大幅にスパー ス化して冗長なビューを破棄し、分類を高速化した。 巨大なデータセットの効率的な処理が可能。 Group-Lassoを使用することで正確さを犠牲にせず高速化が可能 、この学習で得た距離情報は、様々なロボット工学タスクへの 入力として使用できます。 RGB-Dカメラハードウェアの急速な進歩を考慮し、RGBと深度の 組み合わせによる3Dオブジェクト認識、検出、およびその他 のロボット認識タスクを使用できる方法を提案。 Sparse Distance Learning for Object Recognition Combining RGB and Depth Information https://rse-lab.cs.washington.edu/postscripts/sparse-distance-icra-11.pdf (9-13 May 2011)Kevin Lai, Liefeng Bo, Xiaofeng Ren, and Dieter Fox
  • 3. どんなもの? 先行研究と比べて何がすごい? 技術の手法や肝は? 議論はある? どうやって有効だと検証した? 次に読むべき論文は? View planning for automated 3d object reconstruction inspection, ACM Computing Surveys, 2003. 2, 3 計算コストが高い。 Volumetric CNNではボクセル化する際に、点群データの空間特性 が必然的に変化し、物体の凹凸表現が欠損してしまう。 大規模な3D CADモデルデータセットであるModelNetを使用した 分類予測。 畳み込み演算によるデータの特徴量変換 。 特徴量間の類似度の計測。 単一のビュー2.5Dデプスマップ(一般的なRGB-Dセンサーなど) からオブジェクトを共同で認識および再構築できる。 生のCADデータからさまざまなオブジェクトカテゴリと任意の ポーズにまたがる複雑な3D形状の分布を学習し、階層的な構成 パーツ表現を自動的に検出する3D ShapeNetsを提案。 3D ShapeNets: A Deep Representation for Volumetric Shape https://arxiv.org/pdf/1406.5670.pdf (May 28, 2015)Zhirong Wu ; Shuran Song ; Aditya Khosla ; Fisher Yu ; Linguang Zhang ; Xiaoou Tang
  • 4. どんなもの? 先行研究と比べて何がすごい? 技術の手法や肝は? 議論はある? どうやって有効だと検証した? 次に読むべき論文は? 3D Semantic Parsing of Large-Scale Indoor Spaces, IEEE 12 December 2016 空間の細かい情報が抜けやすかったり、点密度を均一にすると 精度が落ちる。 ModelNet40を用いた形状分類。 ShapeNetパーツデータセットを用いたセグメンテーション。 Stanford 3D semantic parsing data setを用いたシーンのセマンティッ クセグメンテーション。 アプローチの鍵は、単一の対称関数、最大プーリングの使用。 ネットワークは、3D点群の有益なポイントを選択し、その選 択理由をエンコードする最適化関数/基準のセットを効果的に学 習します。 同等以上の結果を取得しながら多くの3D認識タスクへの適用が 可能。 ネットワーク理解に向けた理論的分析と視覚化も提供できる。 点群の順序に対して不変であり、向きに対してロバスト。 3Dボクセル等への変換することなく、3D点群を直接使用した新 しいディープニューラルネットワークPointNetの提案。 PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation https://arxiv.org/pdf/1612.00593.pdf (10 Apr 2017)Charles R. Qi • Hao Su • Kaichun Mo • Leonidas J. Guibas
  • 5. どんなもの? 先行研究と比べて何がすごい? 技術の手法や肝は? 議論はある? どうやって有効だと検証した? 次に読むべき論文は? Visual learning and recognition of 3-D objects from appearance, 14(1), 1995 Delving deep into convolutional nets, In Proc. BMVC, 2014 最も有益な2Dデータや、その組み合わせは何か? ビデオ映像からの実世界3Dオブジェクトの構築が可能か? Princeton ModelNet datasetを用いた分類。 人間が判別可能なデータに絞ったhuman sketch datasetを用いた 分類、検索(予測)。 様々な角度からの物体2Dデータをそれぞれ畳み込んだ後に統合 する。 3Dデータを取得することなく、従来方法よりも高い精度を得る ことができる。 スケッチを使用して3D形状を高精度で取得し、2Dビューに含ま れる3D形状の暗黙の知識を活用できます。 複数視野2D画像から3D形状を認識させるモデルを提供。 学習したモデルを使用すれば単一の2D画像から3Dを予測するこ とが可能。 Multi-view Convolutional Neural Networks for 3D Shape Recognition https://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Su_Multi- View_Convolutional_Neural_ICCV_2015_paper.pdf (May 2015)Hang Su • Subhransu Maji • Evangelos Kalogerakis • Erik Learned-Miller
  • 6. どんなもの? 先行研究と比べて何がすごい? 技術の手法や肝は? 議論はある? どうやって有効だと検証した? 次に読むべき論文は? Multi-View 3D Object Detection Network for Autonomous Driving, CVPR Neural scene representation and rendering,Science 15 Jun 2018 既存ポイントベース法は近隣検索メカニズムのため計算コスト高い。 不均衡データから学習することは、点群セグメンテーションでは困難。 深度センサーによって取得された点群は通常、巨大で大規模。したがっ て、大規模な点群の効率的な取り扱い方が必要。 S3DIS、Semantic3D、ScanNet、およびSemanticKITTIデータセット を用いた、既存の手法の包括的な比較。 指標には全体精度(OA)、平均IoUm(IoU)を用いた。 Shape Classification : projection-based networks, point-based networks Object Detection and Tracking : region proposal-based, single shot methods 3D Point Cloud Segmentation : semantic segmentation(scene level), instance segmentation(object level), part segmentation(part level) 点群関連タスクの深層学習方法を包括的にカバーしている最初 の論文。 3Dセンサー技術の利用が進んでおり、3D dataの形式が複数ある ことに言及。形状分類、オブジェクトの検出、セグメンテーシ ョンと、それに関連してPublicなデータセットにおける比較検証 や、将来の方向性などについてもまとめている。 Deep Learning for 3D Point Clouds: A Survey https://arxiv.org/pdf/1912.12033.pdf (27 Dec 2019)Yulan Guo∗, Hanyun Wang∗, Qingyong Hu∗, Hao Liu∗, Li Liu, and Mohammed Bennamoun