SlideShare a Scribd company logo
1 of 31
Download to read offline
第49回CV勉強会「ECCV2018読み会」
3DFeat-Net
2018/10/20 takmin
自己紹介
2
株式会社ビジョン&ITラボ 代表取締役
皆川 卓也(みながわ たくや)
「コンピュータビジョン勉強会@関東」主催
博士(工学)
略歴:
1999-2003年
日本HP(後にアジレント・テクノロジーへ分社)にて、ITエンジニアとしてシステム構築、プリ
セールス、プロジェクトマネジメント、サポート等の業務に従事
2004-2009年
コンピュータビジョンを用いたシステム/アプリ/サービス開発等に従事
2007-2010年
慶應義塾大学大学院 後期博士課程にて、コンピュータビジョンを専攻
単位取得退学後、博士号取得(2014年)
2009年-現在
フリーランスとして、コンピュータビジョンのコンサル/研究/開発等に従事(2018年法人化)
http://visitlab.jp
紹介する論文
6
 Yew, Z. J., & Lee, G. H. (2018). 3DFeat-Net:Weakly
Supervised Local 3D Features for Point Cloud
Registration. European Conference on ComputerVision.
 点群の位置合わせ(Registration)を行うためのキーポイント検
出器(Detector)および特徴量(Descriptor)を学習
画像のマッチングだと天候や時間変化に弱いが、点群のマッチングだと同じ
ロケーションでロバスト
関連研究:Hand-Crafted 3D Features
7
 人手で設計された3D特徴量
 ISS、PFH、FPFH、spin image、shape contextなど
A. Johnson, “Spin-images: a representation for 3-D surface matching”, Ph.D. Dissertation, The
Robotics Institute, Carnegie Mellon University, August 1997
Spin Images
関連研究:Learned 2D Features
8
 Deep Learningにより2D特徴量を学習
 LIFT、TILDE、DELFなど
Noh, H., Araujo, A., Sim, J., Weyand, T., & Han, B. (2017). Large-Scale Image Retrieval with Attentive Deep Local
Features. Proceedings of the IEEE International Conference on ComputerVision
DELF
関連研究:Learned 3D Features
9
 Deep Learningにより3D特徴量を学習
 3DMatch、PPFNetなど
Deng, H., Birdal,T., & Ilic, S. (2018). PPFNet: Global Context Aware Local Features for Robust 3D
Point Matching. Conference on Computer Vision and Pattern Recognition.
PPFNet
Contribution
10
従来のDeep Learningによる3D特徴量は、キーポイントと
は独立に学習
 キーポイント検出器(Detector)&特徴量(Descriptor)を
GPS/INSでタグ付けされた、精度の高くない学習データを
用いてWeakly Supervisedに学習
 Attention Layerを導入することで、3D Pointの顕著さを学
習
 トレーニングとベンチマークのデータセットをOxford
RobotCar datasetから作成
3D Feat-Net
11
 Triplet Lossを用いて、特徴量を学習
 学習データとして、大きな点群から半径Rで切り取った点
群を、以下の3パターン用意
 Anchor点群
 Positive点群(Anchorとの中心距離が𝜏 𝑝より小さい)
 Negative点群(Anchorとの中心距離が𝜏 𝑛より大きい)
 入力点群の姿勢は既知(GPS/INSなどで)
 精度は多少悪くても可
 コード(学習はまだアップされておらず)
 https://github.com/yewzijian/3DFeatNet
3D Feat-Netの学習
12
Positive点群
Anchor点群
Negative点群
3D Feat-Netの学習
13
PointNet++と同じ要
領で、半径𝑟𝑐𝑙𝑢𝑠𝑡𝑒𝑟で
クラスタリング
3D Feat-Net
14
各クラスタ𝐶𝑖
の顕著さ𝑤𝑖と
傾き𝜃𝑖を算出
3D Feat-Netの学習
15
各クラスタ𝐶𝑖の
点群座標(中心
座標を原点)
傾き
顕著さ
3D Feat-Netの学習
16
各クラスタ𝐶𝑖の
特徴ベクトル𝑓𝑖
を算出
3D Feat-Netの学習
17
各クラスタ𝐶𝑖の
特徴ベクトル
各クラスタ𝐶𝑖の点群
座標(中心座標を原
点とし、 𝜃𝑖 で補正)
3D Feat-Netの学習
18
特徴量同士の
ユークリッド距離
を算出
3D Feat-Netの学習
19
Anchorのクラス
タ毎に最も小さ
い距離を出力
3D Feat-Netの学習
20
Anchorクラスタ
毎の顕著さで重
み付き総和出力
3D Feat-Netの学習
21
𝐷 𝑚,𝑛 = ෍
𝐶 𝑖∈𝑪(𝑚)
𝑤𝑖′ ⋅ min
𝐶 𝑗∈𝑪(𝑛)
𝑓𝑖 − 𝑓𝑗
2
3D Feat-Netの学習
22
Triplet Lossで学習
𝐿 𝑡𝑟𝑖𝑝𝑙𝑒𝑡 = 𝐷 𝑎𝑛𝑐,𝑝𝑜𝑠 − 𝐷 𝑎𝑛𝑐,𝑛𝑒𝑔 + 𝛾
+
3D Feat-Netの推論
23
1. 入力点群の各点を中心としたパッチを作成し、
DetectorでAttentionWeightを算出
2. Non-Maximal Suppressionで、ピークを検出
3. 相対的に低いAttentionの点を除去
4. 残った点群からDescriptorを算出
実験:Descriptor Matching
24
 MatchingとNon-matchingの点群クラスタを30,000ペア用意し、
マッチングを判定
 Recall rateが95%の時のFalse Positiveと特徴量の次元を調査
 以後の実験では、32次元を使用
実験: Keypoint Detection and Feature
Description
 Oxford Robotcar Datasetで2つの点群(異なる時刻に取得)のそれ
ぞれからKeypointおよびDescriptorを算出し、最も類似した特徴量
の点の位置がGround Truthからどれだけ離れているかで閾値処理
実験:Analysis of Keypoint Detection
26
 AttentionWeightの可視化
 地面に近い壁側に強いAttention
 車や地面には弱いAttention
Attention 本手法のKeypoint (赤) ISSのKeypoint (赤)
実験:Geometric Registration
27
 Keypoint+Descriptor検出→Descriptor最近傍探索
→RANSACで位置合わせ(ICPは行わない)
 2つの点群の位置のずれ(RTE)と角度のずれ(RRE)を評価
 RTEが2m、RREが5度以内のずれならばSuccessとみなす
Oxford Robotcarの結果
実験:Geometric Registration
28
 Keypoint+Descriptor検出→Descriptor最近傍探索
→RANSACで位置合わせ(ICPは行わない)
 2つの点群の位置のずれ(RTE)と角度のずれ(RRE)を評価
 RTEが2m、RREが5度以内のずれならばSuccessとみなす
KITTI Odometryの結果
実験:Geometric Registration
29
 Keypoint+Descriptor検出→Descriptor最近傍探索
→RANSACで位置合わせ(ICPは行わない)
 2つの点群の位置のずれ(RTE)と角度のずれ(RRE)を評価
 RTEが2m、RREが5度以内のずれならばSuccessとみなす
ETH Datasetの結果
実験:Geometric Registration
30
 Regsitrationの例
まとめ
31
 三次元点群用同士のレジストレーションに用いるキーポ
イント検出器と特徴量を弱教師あり学習により求める手
法
 Triplet lossにより特徴量の類似度とキーポイントの顕著
さを同時に学習
 従来のHandcraftedな特徴量や学習ベースの特徴量と比
べても十分な性能
 課題
 回転不変性
 全体的にnoisyな点群に弱い
 PointNetは扱える点群数に限り
32
付録
PointNet
33
 Qi, C. R., Su, H., Mo, K., & Guibas, L. J. (2017). PointNet : Deep
Learning on Point Sets for 3D Classification and Segmentation
Big Data + Deep Representation Learning. IEEE Conference on
ComputerVision and Pattern Recognition (CVPR).
 各点群の点を独立に畳み込む
 Global Max Poolingで点群全体の特徴量を取得
各点を個別
に畳み込み
アフィン変換
各点の特徴を統合
PointNet++
34
 Qi, C. R.,Yi, L., Su, H., & Guibas, L. J. (2017). PointNet++: Deep
Hierarchical Feature Learning on Point Sets in a Metric Space.
Conference on Neural Information Processing Systems (NIPS).
 PointNetを階層的に適用
 点群をクラスタ分割→PointNet→クラスタ内で統合を繰り返す

More Related Content

What's hot

画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
MPRG_Chubu_University
 

What's hot (20)

【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
 
CVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetCVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNet
 
SSII2019企画: 点群深層学習の研究動向
SSII2019企画: 点群深層学習の研究動向SSII2019企画: 点群深層学習の研究動向
SSII2019企画: 点群深層学習の研究動向
 
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチMIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
 
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
 
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向
 
SSII2012 2D&3Dレジストレーション ~画像と3次元点群の合わせ方~ 第1部
SSII2012 2D&3Dレジストレーション ~画像と3次元点群の合わせ方~ 第1部SSII2012 2D&3Dレジストレーション ~画像と3次元点群の合わせ方~ 第1部
SSII2012 2D&3Dレジストレーション ~画像と3次元点群の合わせ方~ 第1部
 
Introduction to YOLO detection model
Introduction to YOLO detection modelIntroduction to YOLO detection model
Introduction to YOLO detection model
 
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
 
Transformer メタサーベイ
Transformer メタサーベイTransformer メタサーベイ
Transformer メタサーベイ
 
三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)
 
CVPR2019読み会@関東CV
CVPR2019読み会@関東CVCVPR2019読み会@関東CV
CVPR2019読み会@関東CV
 
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
 
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
 
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ
 
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
 
研究効率化Tips Ver.2
研究効率化Tips Ver.2研究効率化Tips Ver.2
研究効率化Tips Ver.2
 
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門
 
Depth Estimation論文紹介
Depth Estimation論文紹介Depth Estimation論文紹介
Depth Estimation論文紹介
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 

Similar to 3DFeat-Net

Similar to 3DFeat-Net (20)

20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation
 
object detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: surveyobject detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: survey
 
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading
 
ConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdf
 
20200704 bsp net
20200704 bsp net20200704 bsp net
20200704 bsp net
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)
 
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
 
20170806 Discriminative Optimization
20170806 Discriminative Optimization20170806 Discriminative Optimization
20170806 Discriminative Optimization
 
20160417dlibによる顔器官検出
20160417dlibによる顔器官検出20160417dlibによる顔器官検出
20160417dlibによる顔器官検出
 
Curiosity driven exploration
Curiosity driven explorationCuriosity driven exploration
Curiosity driven exploration
 
190904FIT情報処理学会の量子コンピュータ
190904FIT情報処理学会の量子コンピュータ190904FIT情報処理学会の量子コンピュータ
190904FIT情報処理学会の量子コンピュータ
 
2018/06/23 Sony"s deep learning software and the latest information
2018/06/23 Sony"s deep learning software and the latest information2018/06/23 Sony"s deep learning software and the latest information
2018/06/23 Sony"s deep learning software and the latest information
 
Pythonによる機械学習入門 ~SVMからDeep Learningまで~
Pythonによる機械学習入門 ~SVMからDeep Learningまで~Pythonによる機械学習入門 ~SVMからDeep Learningまで~
Pythonによる機械学習入門 ~SVMからDeep Learningまで~
 
Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal Problems
 
第34回CV勉強会「コンピュテーショナルフォトグラフィ」発表資料
第34回CV勉強会「コンピュテーショナルフォトグラフィ」発表資料第34回CV勉強会「コンピュテーショナルフォトグラフィ」発表資料
第34回CV勉強会「コンピュテーショナルフォトグラフィ」発表資料
 
Unreal Engine でアプリ開発~ MRTK UXTools for Unreal V0.9.0 ~
Unreal Engine でアプリ開発~ MRTK UXTools for Unreal V0.9.0 ~Unreal Engine でアプリ開発~ MRTK UXTools for Unreal V0.9.0 ~
Unreal Engine でアプリ開発~ MRTK UXTools for Unreal V0.9.0 ~
 
Show and tell takmin
Show and tell takminShow and tell takmin
Show and tell takmin
 
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ
 
run Keras model on opencv
run Keras model on opencvrun Keras model on opencv
run Keras model on opencv
 

More from Takuya Minagawa

車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術
Takuya Minagawa
 

More from Takuya Minagawa (17)

Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and Architecture
 
MobileNeRF
MobileNeRFMobileNeRF
MobileNeRF
 
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事
 
20210711 deepI2P
20210711 deepI2P20210711 deepI2P
20210711 deepI2P
 
20201010 personreid
20201010 personreid20201010 personreid
20201010 personreid
 
20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)
 
20190825 vins mono
20190825 vins mono20190825 vins mono
20190825 vins mono
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summary
 
Visual slam
Visual slamVisual slam
Visual slam
 
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection survey
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)
 
20180424 orb slam
20180424 orb slam20180424 orb slam
20180424 orb slam
 
「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料
 
車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術
 
Cvpr2017事前読み会
Cvpr2017事前読み会Cvpr2017事前読み会
Cvpr2017事前読み会
 
LiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせLiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせ
 

Recently uploaded

Recently uploaded (7)

Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 

3DFeat-Net