SlideShare a Scribd company logo
1 of 38
Download to read offline
Copyright © 2019 Morpho, Inc. All Rights Reserved.
Non-Local Spatial Propagation
Network for
Depth Completion
<文献紹介>
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
概要
RGB画像とsparse depth mapからdense depth mapを直接推論
同時に出力した3枚の特徴マップでrefinement
の2段階構成をend-to-endに学習する
• 各ピクセルの「近傍系」を選択的に学習
• Refinement時の重みの無駄な正規化を抑制
• Confidenceのrefinementへの組み込み
により11月現在おそらく最高性能を達成(2020/7/20に投稿)
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
結果
エッジ保存性が従来手法に比べて比較的良い
細い線などの細かいテクスチャも取れている
Non-Local Spatial Propagation
([1] Fig.6.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
結果
Non-Local Spatial Propagation
([1] Table 1.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
全体像は
初期depth推定 ⇒ Refinement
の2段構成
Non-Local Spatial Propagation
([1] Fig.2.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下3つのポイントを順に解説する
1. 各ピクセルの「近傍系」を選択的に学習
2. Refinement時の重みの無駄な正規化を抑制
3. Confidenceのrefinementへの組み込み
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下3つのポイントを順に解説する
1. 各ピクセルの「近傍系」を選択的に学習
2. Refinement時の重みの無駄な正規化を抑制
3. Confidenceのrefinementへの組み込み
が、その前にrefinementについて先に概説する
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
Refinementは下式を繰り返し適用することで行われる:
Non-Local Spatial Propagation
• 𝑥 𝑚,𝑛:depth mapの(m, n)座標におけるdepth値
• 𝑤 𝑚,𝑛
𝑖,𝑗
:ピクセル𝑥𝑖,𝑗 が𝑥 𝑚,𝑛にもたらす重み
• 𝑁 𝑚,𝑛:座標(m, n)の近傍
で、𝑤 𝑚,𝑛 + σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
𝑤 𝑚,𝑛
𝑖,𝑗
= 1 とする。𝑡はイテレータ
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑥 𝑚,𝑛
𝑡
= 𝑤 𝑚,𝑛
𝑐
𝑥 𝑚,𝑛
𝑡−1
෍
𝑖,𝑗 ∈𝑁 𝑚,𝑛
𝑤 𝑚,𝑛
𝑖,𝑗
𝑥𝑖,𝑗
𝑡−1
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
Refinementは下式を繰り返し適用することで行われる:
Non-Local Spatial Propagation
• 𝑥 𝑚,𝑛:depth mapの(m, n)座標におけるdepth値
• 𝑤 𝑚,𝑛
𝑖,𝑗
:ピクセル𝑥𝑖,𝑗 が𝑥 𝑚,𝑛にもたらす重み
• 𝑁 𝑚,𝑛:座標(m, n)の近傍
で、𝑤 𝑚,𝑛 + σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
𝑤 𝑚,𝑛
𝑖,𝑗
= 1 とする。𝑡はイテレータ。
この2つをrefinement前に
学習で求める
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑥 𝑚,𝑛
𝑡
= 𝑤 𝑚,𝑛
𝑐
𝑥 𝑚,𝑛
𝑡−1
෍
𝑖,𝑗 ∈𝑁 𝑚,𝑛
𝑤 𝑚,𝑛
𝑖,𝑗
𝑥𝑖,𝑗
𝑡−1
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下3つのポイントを順に解説する
1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 )
2. Refinement時の重みの無駄な正規化を抑制( 𝑤 𝑚,𝑛
𝑖,𝑗
)
3. Confidenceのrefinementへの組み込み
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
従来のrefinement手法では近傍画素の配置を固定にすると
境界付近で不要なピクセル情報を拾ってしまう
Non-Local Spatial Propagation
([1] Fig.3.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
従来のrefinement手法では近傍画素の配置を固定にすると
境界付近で不要なピクセル情報を拾ってしまう
そこで、近傍系の形を適応的に変形することを考える
Non-Local Spatial Propagation
([1] Fig.3.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
座標(m, n)の近傍は以下で定める:
Non-Local Spatial Propagation
φをパラメータとする「(m, n)
のK個の近傍」を返す関数
これを学習により求める
注目すべき点として、p, qは実数値
→サブピクセル精度で近傍探索が行われる!
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑁 𝑚,𝑛
𝑁𝐿
= {𝑥 𝑚+𝑝,𝑛+𝑞| 𝑝, 𝑞 ∈ 𝑓φ 𝑰, 𝑫, 𝑚, 𝑛 , 𝑝, 𝑞 ∈ 𝑹}
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下近傍を8個にした場合
カラー画像のエッジをうまく
とらえている
Non-Local Spatial Propagation
([1] Fig.8.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
実はCNNの場合には元ネタが存在([2], [3])
• Deformable Convolutional Networks
• Deformable ConvNets v2: More Deformable, Better Results
(上の論文のインターン生による改良版)
これら2つの論文では、convolutionのカーネルの形を動的に変
形(長方形でなく)することで物体形状の変化にロバストに対
応させることを提案している
これをカーネルではなくrefinementに援用したのがミソ
Non-Local Spatial Propagation
([2] Fig.1.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
実際に𝑓𝜑がどう定義されるかの記述は存在しなかったが、
前述の論文を見る限りおそらく次の通り
Non-Local Spatial Propagation
Inputの注目画素
(m,n)を中心に
普通のconv.を
2N枚かける
2枚かけるごとに(m,n)の
近傍としてoffset vector
(p,q)が1つ定まる
得られたN個の近
傍でrefinementを
実行
([2] Fig.2.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下3つのポイントを順に解説する
1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 )
2. Refinement時の重みの無駄な正規化を抑制( 𝒘 𝒎,𝒏
𝒊,𝒋
)
3. Confidenceのrefinementへの組み込み
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
Refinement時の重みについて以下の事実が知られている
([4] Theorem 3)
⚫ Refinementが収束する十分条件は
σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
|𝑤 𝑚,𝑛
𝑖,𝑗
| ≤ 1
ここでrefinementの式を思い出しておく
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑥 𝑚,𝑛
𝑡
= 𝑤 𝑚,𝑛
𝑐
𝑥 𝑚,𝑛
𝑡−1
෍
𝑖,𝑗 ∈𝑁 𝑚,𝑛
𝑤 𝑚,𝑛
𝑖,𝑗
𝑥𝑖,𝑗
𝑡−1
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
なので|𝑤 𝑚,𝑛
𝑖,𝑗
|の合計が1を上回る場合には正規化処理が必要
しかし単純に以下のように合計値で割るのは問題がある
𝑤 𝑚,𝑛
𝑖,𝑗
=
ෝ𝑤 𝑚,𝑛
𝑖,𝑗
σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
|ෝ𝑤 𝑚,𝑛
𝑖,𝑗
|
𝑁 𝑚,𝑛 = 2としてその理由を示す
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑥 𝑚,𝑛
𝑡
= 𝑤 𝑚,𝑛
𝑐
𝑥 𝑚,𝑛
𝑡−1
෍
𝑖,𝑗 ∈𝑁 𝑚,𝑛
𝑤 𝑚,𝑛
𝑖,𝑗
𝑥𝑖,𝑗
𝑡−1
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
𝑤1, 𝑤2 の𝐿1
ノルムによる正規化した結果を図示すると、
このように枠線上に 𝑤1, 𝑤2 が集中してしまい
𝑤1, 𝑤2の自由度(=モデルの表現力)が減ってしまう
Non-Local Spatial Propagation
( [1] Fig.4.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
では𝐿1
ノルムが1を超えた時だけ正規化したらどうなのか?
→これも実は失敗する
正規化が発生する頻度がどの程度かを考えればよいが、
𝑤1, 𝑤2が独立に標準正規分布に従うとして同じく図示すると、
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
大半が正規化されて端に寄っている
もし4変数にすると、98%が端に位置する
Non-Local Spatial Propagation
( [1] Fig.4.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
正規化しても自由度が減らないようスケール変換したい
→本論文では以下で解決
ここでKは変数の個数
これならσ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
|𝑤 𝑚,𝑛
𝑖,𝑗
| ≤ 1
は常に成立するが果たして自由度は?
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑤 𝑚,𝑛
𝑖,𝑗
= tanh(ෝ𝑤 𝑚,𝑛
𝑖,𝑗
)/𝐶 , 𝐶 ≥ 𝐾
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
正規化後も端に寄りにくくなっている
すなわち、この方がモデルの表現力が高い
Non-Local Spatial Propagation
( [1] Fig.4.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
そこで σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
|𝑤 𝑚,𝑛
𝑖,𝑗
| が1を超えたときのみtanhによる正規
化を行うことで表現力をできる限り高める
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
そこで σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
|𝑤 𝑚,𝑛
𝑖,𝑗
| が1を超えたときのみtanhによる正規
化を行うことで表現力をできる限り高める
結果:
Non-Local Spatial Propagation
( [1] Fig.4.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
一覧すると以下の通り
右端のグラフは 𝑤1,, 𝑤2 を複数生成したときに
正規化されるものの割合を示したもの
(青が単純な割り算、黄がtanhを使う方法)
Non-Local Spatial Propagation
( [1] Fig.4.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
ところでtanhを使う場合には
よりCを決める必要があった
→Cも学習で自動的に決定されるようにする
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑤 𝑚,𝑛
𝑖,𝑗
= tanh(ෝ𝑤 𝑚,𝑛
𝑖,𝑗
)/𝐶
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下3つのポイントを順に解説する。
1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 )
2. Refinement時の重みの無駄な正規化を抑制( 𝑤 𝑚,𝑛
𝑖,𝑗
)
3. Confidenceのrefinementへの組み込み
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
考察1,2では入力depthの誤測定が加味できていない
そこでinitial depth mapと同時にconfidence mapも推論させる
Non-Local Spatial Propagation
( [1] Fig.5.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
取得したconfidence、𝑐 𝑖,𝑗
∈ [0, 1]はrefinement時の重み𝑤 𝑚,𝑛
𝑖,𝑗
を
弱めるのに用いる
Non-Local Spatial Propagation
( [1] Fig.5.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑤 𝑚,𝑛
𝑖,𝑗
= 𝑐 𝑖,𝑗
⋅ tanh(ෝ𝑤 𝑚,𝑛
𝑖,𝑗
)/𝛾
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下confidenceありなしで結果を比較
Depthの誤測定が修正されているのが分かる
Non-Local Spatial Propagation
( [1] Fig.5.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下3つのポイントを順に解説する
1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 )
2. Refinement時の重みの無駄な正規化を抑制( 𝑤 𝑚,𝑛
𝑖,𝑗
)
3. Confidenceのrefinementへの組み込み
Non-Local Spatial Propagation
最後に実際のネットワーク構造を確認する
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
Non-Local Spatial Propagation
( [1] Fig.A.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
ロスは単純に入力時点でdepthが観測されたピクセルの集合
Vに対して
ここでρ = 1,2のどちらでもよいが、ρ = 1の方が一般に
エッジのキレが良いらしい
その他の中間出力に対してロスは定めない(データ取得が困難)
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
考察
⚫ Initial estimation → refinementは効果が出る
⚫ Deformable convolutionがエッジ保存の肝か
⚫ Weight normalizationの効果は如何ほどか疑問
⚫ Confidence mapが実測できている場合には、ロスに組み込
めばさらに精度向上する?(スケール合わせが問題?)
正規化の定数Cは学習データの傾向によって変動する模様
使う環境が不定の場合は中々最適に決まらなそう
入力がearly fusionなのは改善の余地ありか?
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
著者実装:https://github.com/zzangjinsun/NLSPN_ECCV20
Non-Local Spatial Propagation
( [1] Fig.D.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
参考文献
[1] J. Park, K. Joo, Z. Hu, C.-K. Liu, and I. S. Kweon.: Nonlocal spatial propagation network for depth
completion. In: Proc. Of European Conference on Computer Vision (ECCV), 2020
[2] J. Dai, H. Qi, Y. Xiong, Y. Li, G. Zhang, H. Hu, and Y. Wei. Deformable convolutional networks. In
ICCV, 2017.
[3] Zhu, X., Hu, H., Lin, S., & Dai, J. (2019). Deformable convnets V2: More deformable, better results.
Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition,
2019-June, 9300–9308. https://doi.org/10.1109/CVPR.2019.00953
[4] Liu, S., De Mello, S., Gu, J., Zhong, G., Yang, M.H., Kautz, J.: Learning affinity via spatial
propagation networks. In: Proc. of Advances in Neural Information Processing Systems (2017)
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.

More Related Content

What's hot

SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII
 
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイcvpaper. challenge
 
[DL輪読会]画像を使ったSim2Realの現況
[DL輪読会]画像を使ったSim2Realの現況[DL輪読会]画像を使ったSim2Realの現況
[DL輪読会]画像を使ったSim2Realの現況Deep Learning JP
 
20090924 姿勢推定と回転行列
20090924 姿勢推定と回転行列20090924 姿勢推定と回転行列
20090924 姿勢推定と回転行列Toru Tamaki
 
【DL輪読会】HexPlaneとK-Planes
【DL輪読会】HexPlaneとK-Planes【DL輪読会】HexPlaneとK-Planes
【DL輪読会】HexPlaneとK-PlanesDeep Learning JP
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Yusuke Uchida
 
ガイデットフィルタとその周辺
ガイデットフィルタとその周辺ガイデットフィルタとその周辺
ガイデットフィルタとその周辺Norishige Fukushima
 
3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)Toru Tamaki
 
3次元計測とフィルタリング
3次元計測とフィルタリング3次元計測とフィルタリング
3次元計測とフィルタリングNorishige Fukushima
 
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII
 
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...Deep Learning JP
 
デプスセンサとその応用
デプスセンサとその応用デプスセンサとその応用
デプスセンサとその応用Norishige Fukushima
 
ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...
ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...
ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...Hajime Mihara
 
Transformer メタサーベイ
Transformer メタサーベイTransformer メタサーベイ
Transformer メタサーベイcvpaper. challenge
 
Anomaly detection 系の論文を一言でまとめた
Anomaly detection 系の論文を一言でまとめたAnomaly detection 系の論文を一言でまとめた
Anomaly detection 系の論文を一言でまとめたぱんいち すみもと
 
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法についてSfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法についてRyutaro Yamauchi
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII
 
確率モデルを用いた3D点群レジストレーション
確率モデルを用いた3D点群レジストレーション確率モデルを用いた3D点群レジストレーション
確率モデルを用いた3D点群レジストレーションKenta Tanaka
 

What's hot (20)

SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
 
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ
 
[DL輪読会]画像を使ったSim2Realの現況
[DL輪読会]画像を使ったSim2Realの現況[DL輪読会]画像を使ったSim2Realの現況
[DL輪読会]画像を使ったSim2Realの現況
 
20090924 姿勢推定と回転行列
20090924 姿勢推定と回転行列20090924 姿勢推定と回転行列
20090924 姿勢推定と回転行列
 
【DL輪読会】HexPlaneとK-Planes
【DL輪読会】HexPlaneとK-Planes【DL輪読会】HexPlaneとK-Planes
【DL輪読会】HexPlaneとK-Planes
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
 
ガイデットフィルタとその周辺
ガイデットフィルタとその周辺ガイデットフィルタとその周辺
ガイデットフィルタとその周辺
 
3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)
 
3次元計測とフィルタリング
3次元計測とフィルタリング3次元計測とフィルタリング
3次元計測とフィルタリング
 
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
 
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...
 
デプスセンサとその応用
デプスセンサとその応用デプスセンサとその応用
デプスセンサとその応用
 
ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...
ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...
ECCV読み会 "Materials for Masses: SVBRDF Acquisition with a Single Mobile Phone ...
 
Semantic segmentation
Semantic segmentationSemantic segmentation
Semantic segmentation
 
Transformer メタサーベイ
Transformer メタサーベイTransformer メタサーベイ
Transformer メタサーベイ
 
Anomaly detection 系の論文を一言でまとめた
Anomaly detection 系の論文を一言でまとめたAnomaly detection 系の論文を一言でまとめた
Anomaly detection 系の論文を一言でまとめた
 
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法についてSfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法について
 
SLAM勉強会(PTAM)
SLAM勉強会(PTAM)SLAM勉強会(PTAM)
SLAM勉強会(PTAM)
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 
確率モデルを用いた3D点群レジストレーション
確率モデルを用いた3D点群レジストレーション確率モデルを用いた3D点群レジストレーション
確率モデルを用いた3D点群レジストレーション
 

Similar to (文献紹介)Depth Completionの最新動向

(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定Morpho, Inc.
 
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~SSII
 
if-up 2019 | A2. クラウドにつながり始めたハードウェア
if-up 2019 | A2. クラウドにつながり始めたハードウェアif-up 2019 | A2. クラウドにつながり始めたハードウェア
if-up 2019 | A2. クラウドにつながり始めたハードウェアSORACOM,INC
 
SSII2018TS: 大規模深層学習
SSII2018TS: 大規模深層学習SSII2018TS: 大規模深層学習
SSII2018TS: 大規模深層学習SSII
 
リアルタイムレイトレーシング時代を生き抜くためのデノイザー開発入門
リアルタイムレイトレーシング時代を生き抜くためのデノイザー開発入門リアルタイムレイトレーシング時代を生き抜くためのデノイザー開発入門
リアルタイムレイトレーシング時代を生き抜くためのデノイザー開発入門Silicon Studio Corporation
 
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとMBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとInsight Technology, Inc.
 
20160913 gpu deep-learningcomminity-morpho_20160912-公開用rev2
20160913 gpu deep-learningcomminity-morpho_20160912-公開用rev220160913 gpu deep-learningcomminity-morpho_20160912-公開用rev2
20160913 gpu deep-learningcomminity-morpho_20160912-公開用rev2Tomokazu Kanazawa
 
Transformer 動向調査 in 画像認識(修正版)
Transformer 動向調査 in 画像認識(修正版)Transformer 動向調査 in 画像認識(修正版)
Transformer 動向調査 in 画像認識(修正版)Kazuki Maeno
 
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォームJubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォームPreferred Networks
 
Spring 5に備えるリアクティブプログラミング入門
Spring 5に備えるリアクティブプログラミング入門Spring 5に備えるリアクティブプログラミング入門
Spring 5に備えるリアクティブプログラミング入門Takuya Iwatsuka
 
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座Silicon Studio Corporation
 
深層学習とTensorFlow入門
深層学習とTensorFlow入門深層学習とTensorFlow入門
深層学習とTensorFlow入門tak9029
 

Similar to (文献紹介)Depth Completionの最新動向 (13)

(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
 
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
 
if-up 2019 | A2. クラウドにつながり始めたハードウェア
if-up 2019 | A2. クラウドにつながり始めたハードウェアif-up 2019 | A2. クラウドにつながり始めたハードウェア
if-up 2019 | A2. クラウドにつながり始めたハードウェア
 
SSII2018TS: 大規模深層学習
SSII2018TS: 大規模深層学習SSII2018TS: 大規模深層学習
SSII2018TS: 大規模深層学習
 
UE4を用いたTPS制作事例 EDF:IR アニメーション作成事例紹介
UE4を用いたTPS制作事例 EDF:IR アニメーション作成事例紹介UE4を用いたTPS制作事例 EDF:IR アニメーション作成事例紹介
UE4を用いたTPS制作事例 EDF:IR アニメーション作成事例紹介
 
リアルタイムレイトレーシング時代を生き抜くためのデノイザー開発入門
リアルタイムレイトレーシング時代を生き抜くためのデノイザー開発入門リアルタイムレイトレーシング時代を生き抜くためのデノイザー開発入門
リアルタイムレイトレーシング時代を生き抜くためのデノイザー開発入門
 
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとMBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごと
 
20160913 gpu deep-learningcomminity-morpho_20160912-公開用rev2
20160913 gpu deep-learningcomminity-morpho_20160912-公開用rev220160913 gpu deep-learningcomminity-morpho_20160912-公開用rev2
20160913 gpu deep-learningcomminity-morpho_20160912-公開用rev2
 
Transformer 動向調査 in 画像認識(修正版)
Transformer 動向調査 in 画像認識(修正版)Transformer 動向調査 in 画像認識(修正版)
Transformer 動向調査 in 画像認識(修正版)
 
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォームJubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
 
Spring 5に備えるリアクティブプログラミング入門
Spring 5に備えるリアクティブプログラミング入門Spring 5に備えるリアクティブプログラミング入門
Spring 5に備えるリアクティブプログラミング入門
 
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
 
深層学習とTensorFlow入門
深層学習とTensorFlow入門深層学習とTensorFlow入門
深層学習とTensorFlow入門
 

More from Morpho, Inc.

(文献紹介)デブラー手法の紹介
(文献紹介)デブラー手法の紹介(文献紹介)デブラー手法の紹介
(文献紹介)デブラー手法の紹介Morpho, Inc.
 
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)Morpho, Inc.
 
Vieurekaを用いた混雑状況の配信
Vieurekaを用いた混雑状況の配信Vieurekaを用いた混雑状況の配信
Vieurekaを用いた混雑状況の配信Morpho, Inc.
 
Limits on Super-Resolution and How to Break them
Limits on Super-Resolution and How to Break themLimits on Super-Resolution and How to Break them
Limits on Super-Resolution and How to Break themMorpho, Inc.
 
(文献紹介) 画像復元:Plug-and-Play ADMM
(文献紹介) 画像復元:Plug-and-Play ADMM(文献紹介) 画像復元:Plug-and-Play ADMM
(文献紹介) 画像復元:Plug-and-Play ADMMMorpho, Inc.
 
前景と背景の画像合成技術
前景と背景の画像合成技術前景と背景の画像合成技術
前景と背景の画像合成技術Morpho, Inc.
 
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature FilterMorpho, Inc.
 
(文献紹介)HDR+, Night Sight
(文献紹介)HDR+, Night Sight(文献紹介)HDR+, Night Sight
(文献紹介)HDR+, Night SightMorpho, Inc.
 
Demosaicing(デモザイキング)
Demosaicing(デモザイキング)Demosaicing(デモザイキング)
Demosaicing(デモザイキング)Morpho, Inc.
 
Company Profile (Japanese)
Company Profile (Japanese)Company Profile (Japanese)
Company Profile (Japanese)Morpho, Inc.
 

More from Morpho, Inc. (10)

(文献紹介)デブラー手法の紹介
(文献紹介)デブラー手法の紹介(文献紹介)デブラー手法の紹介
(文献紹介)デブラー手法の紹介
 
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
 
Vieurekaを用いた混雑状況の配信
Vieurekaを用いた混雑状況の配信Vieurekaを用いた混雑状況の配信
Vieurekaを用いた混雑状況の配信
 
Limits on Super-Resolution and How to Break them
Limits on Super-Resolution and How to Break themLimits on Super-Resolution and How to Break them
Limits on Super-Resolution and How to Break them
 
(文献紹介) 画像復元:Plug-and-Play ADMM
(文献紹介) 画像復元:Plug-and-Play ADMM(文献紹介) 画像復元:Plug-and-Play ADMM
(文献紹介) 画像復元:Plug-and-Play ADMM
 
前景と背景の画像合成技術
前景と背景の画像合成技術前景と背景の画像合成技術
前景と背景の画像合成技術
 
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
 
(文献紹介)HDR+, Night Sight
(文献紹介)HDR+, Night Sight(文献紹介)HDR+, Night Sight
(文献紹介)HDR+, Night Sight
 
Demosaicing(デモザイキング)
Demosaicing(デモザイキング)Demosaicing(デモザイキング)
Demosaicing(デモザイキング)
 
Company Profile (Japanese)
Company Profile (Japanese)Company Profile (Japanese)
Company Profile (Japanese)
 

Recently uploaded

TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 

Recently uploaded (10)

TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 

(文献紹介)Depth Completionの最新動向

  • 1. Copyright © 2019 Morpho, Inc. All Rights Reserved. Non-Local Spatial Propagation Network for Depth Completion <文献紹介> Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 2. Copyright © 2019 Morpho, Inc. All Rights Reserved. 概要 RGB画像とsparse depth mapからdense depth mapを直接推論 同時に出力した3枚の特徴マップでrefinement の2段階構成をend-to-endに学習する • 各ピクセルの「近傍系」を選択的に学習 • Refinement時の重みの無駄な正規化を抑制 • Confidenceのrefinementへの組み込み により11月現在おそらく最高性能を達成(2020/7/20に投稿) Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 3. Copyright © 2019 Morpho, Inc. All Rights Reserved. 結果 エッジ保存性が従来手法に比べて比較的良い 細い線などの細かいテクスチャも取れている Non-Local Spatial Propagation ([1] Fig.6.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 4. Copyright © 2019 Morpho, Inc. All Rights Reserved. 結果 Non-Local Spatial Propagation ([1] Table 1.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 5. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 全体像は 初期depth推定 ⇒ Refinement の2段構成 Non-Local Spatial Propagation ([1] Fig.2.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 6. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下3つのポイントを順に解説する 1. 各ピクセルの「近傍系」を選択的に学習 2. Refinement時の重みの無駄な正規化を抑制 3. Confidenceのrefinementへの組み込み Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 7. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下3つのポイントを順に解説する 1. 各ピクセルの「近傍系」を選択的に学習 2. Refinement時の重みの無駄な正規化を抑制 3. Confidenceのrefinementへの組み込み が、その前にrefinementについて先に概説する Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 8. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 Refinementは下式を繰り返し適用することで行われる: Non-Local Spatial Propagation • 𝑥 𝑚,𝑛:depth mapの(m, n)座標におけるdepth値 • 𝑤 𝑚,𝑛 𝑖,𝑗 :ピクセル𝑥𝑖,𝑗 が𝑥 𝑚,𝑛にもたらす重み • 𝑁 𝑚,𝑛:座標(m, n)の近傍 で、𝑤 𝑚,𝑛 + σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 𝑤 𝑚,𝑛 𝑖,𝑗 = 1 とする。𝑡はイテレータ Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑥 𝑚,𝑛 𝑡 = 𝑤 𝑚,𝑛 𝑐 𝑥 𝑚,𝑛 𝑡−1 ෍ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 𝑤 𝑚,𝑛 𝑖,𝑗 𝑥𝑖,𝑗 𝑡−1
  • 9. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 Refinementは下式を繰り返し適用することで行われる: Non-Local Spatial Propagation • 𝑥 𝑚,𝑛:depth mapの(m, n)座標におけるdepth値 • 𝑤 𝑚,𝑛 𝑖,𝑗 :ピクセル𝑥𝑖,𝑗 が𝑥 𝑚,𝑛にもたらす重み • 𝑁 𝑚,𝑛:座標(m, n)の近傍 で、𝑤 𝑚,𝑛 + σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 𝑤 𝑚,𝑛 𝑖,𝑗 = 1 とする。𝑡はイテレータ。 この2つをrefinement前に 学習で求める Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑥 𝑚,𝑛 𝑡 = 𝑤 𝑚,𝑛 𝑐 𝑥 𝑚,𝑛 𝑡−1 ෍ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 𝑤 𝑚,𝑛 𝑖,𝑗 𝑥𝑖,𝑗 𝑡−1
  • 10. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下3つのポイントを順に解説する 1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 ) 2. Refinement時の重みの無駄な正規化を抑制( 𝑤 𝑚,𝑛 𝑖,𝑗 ) 3. Confidenceのrefinementへの組み込み Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 11. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 従来のrefinement手法では近傍画素の配置を固定にすると 境界付近で不要なピクセル情報を拾ってしまう Non-Local Spatial Propagation ([1] Fig.3.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 12. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 従来のrefinement手法では近傍画素の配置を固定にすると 境界付近で不要なピクセル情報を拾ってしまう そこで、近傍系の形を適応的に変形することを考える Non-Local Spatial Propagation ([1] Fig.3.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 13. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 座標(m, n)の近傍は以下で定める: Non-Local Spatial Propagation φをパラメータとする「(m, n) のK個の近傍」を返す関数 これを学習により求める 注目すべき点として、p, qは実数値 →サブピクセル精度で近傍探索が行われる! Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑁 𝑚,𝑛 𝑁𝐿 = {𝑥 𝑚+𝑝,𝑛+𝑞| 𝑝, 𝑞 ∈ 𝑓φ 𝑰, 𝑫, 𝑚, 𝑛 , 𝑝, 𝑞 ∈ 𝑹}
  • 14. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下近傍を8個にした場合 カラー画像のエッジをうまく とらえている Non-Local Spatial Propagation ([1] Fig.8.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 15. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 実はCNNの場合には元ネタが存在([2], [3]) • Deformable Convolutional Networks • Deformable ConvNets v2: More Deformable, Better Results (上の論文のインターン生による改良版) これら2つの論文では、convolutionのカーネルの形を動的に変 形(長方形でなく)することで物体形状の変化にロバストに対 応させることを提案している これをカーネルではなくrefinementに援用したのがミソ Non-Local Spatial Propagation ([2] Fig.1.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 16. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 実際に𝑓𝜑がどう定義されるかの記述は存在しなかったが、 前述の論文を見る限りおそらく次の通り Non-Local Spatial Propagation Inputの注目画素 (m,n)を中心に 普通のconv.を 2N枚かける 2枚かけるごとに(m,n)の 近傍としてoffset vector (p,q)が1つ定まる 得られたN個の近 傍でrefinementを 実行 ([2] Fig.2.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 17. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下3つのポイントを順に解説する 1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 ) 2. Refinement時の重みの無駄な正規化を抑制( 𝒘 𝒎,𝒏 𝒊,𝒋 ) 3. Confidenceのrefinementへの組み込み Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 18. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 Refinement時の重みについて以下の事実が知られている ([4] Theorem 3) ⚫ Refinementが収束する十分条件は σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 |𝑤 𝑚,𝑛 𝑖,𝑗 | ≤ 1 ここでrefinementの式を思い出しておく Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑥 𝑚,𝑛 𝑡 = 𝑤 𝑚,𝑛 𝑐 𝑥 𝑚,𝑛 𝑡−1 ෍ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 𝑤 𝑚,𝑛 𝑖,𝑗 𝑥𝑖,𝑗 𝑡−1
  • 19. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 なので|𝑤 𝑚,𝑛 𝑖,𝑗 |の合計が1を上回る場合には正規化処理が必要 しかし単純に以下のように合計値で割るのは問題がある 𝑤 𝑚,𝑛 𝑖,𝑗 = ෝ𝑤 𝑚,𝑛 𝑖,𝑗 σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 |ෝ𝑤 𝑚,𝑛 𝑖,𝑗 | 𝑁 𝑚,𝑛 = 2としてその理由を示す Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑥 𝑚,𝑛 𝑡 = 𝑤 𝑚,𝑛 𝑐 𝑥 𝑚,𝑛 𝑡−1 ෍ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 𝑤 𝑚,𝑛 𝑖,𝑗 𝑥𝑖,𝑗 𝑡−1
  • 20. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 𝑤1, 𝑤2 の𝐿1 ノルムによる正規化した結果を図示すると、 このように枠線上に 𝑤1, 𝑤2 が集中してしまい 𝑤1, 𝑤2の自由度(=モデルの表現力)が減ってしまう Non-Local Spatial Propagation ( [1] Fig.4.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 21. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 では𝐿1 ノルムが1を超えた時だけ正規化したらどうなのか? →これも実は失敗する 正規化が発生する頻度がどの程度かを考えればよいが、 𝑤1, 𝑤2が独立に標準正規分布に従うとして同じく図示すると、 Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 22. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 大半が正規化されて端に寄っている もし4変数にすると、98%が端に位置する Non-Local Spatial Propagation ( [1] Fig.4.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 23. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 正規化しても自由度が減らないようスケール変換したい →本論文では以下で解決 ここでKは変数の個数 これならσ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 |𝑤 𝑚,𝑛 𝑖,𝑗 | ≤ 1 は常に成立するが果たして自由度は? Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑤 𝑚,𝑛 𝑖,𝑗 = tanh(ෝ𝑤 𝑚,𝑛 𝑖,𝑗 )/𝐶 , 𝐶 ≥ 𝐾
  • 24. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 正規化後も端に寄りにくくなっている すなわち、この方がモデルの表現力が高い Non-Local Spatial Propagation ( [1] Fig.4.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 25. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 そこで σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 |𝑤 𝑚,𝑛 𝑖,𝑗 | が1を超えたときのみtanhによる正規 化を行うことで表現力をできる限り高める Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 26. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 そこで σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 |𝑤 𝑚,𝑛 𝑖,𝑗 | が1を超えたときのみtanhによる正規 化を行うことで表現力をできる限り高める 結果: Non-Local Spatial Propagation ( [1] Fig.4.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 27. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 一覧すると以下の通り 右端のグラフは 𝑤1,, 𝑤2 を複数生成したときに 正規化されるものの割合を示したもの (青が単純な割り算、黄がtanhを使う方法) Non-Local Spatial Propagation ( [1] Fig.4.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 28. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 ところでtanhを使う場合には よりCを決める必要があった →Cも学習で自動的に決定されるようにする Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑤 𝑚,𝑛 𝑖,𝑗 = tanh(ෝ𝑤 𝑚,𝑛 𝑖,𝑗 )/𝐶
  • 29. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下3つのポイントを順に解説する。 1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 ) 2. Refinement時の重みの無駄な正規化を抑制( 𝑤 𝑚,𝑛 𝑖,𝑗 ) 3. Confidenceのrefinementへの組み込み Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 30. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 考察1,2では入力depthの誤測定が加味できていない そこでinitial depth mapと同時にconfidence mapも推論させる Non-Local Spatial Propagation ( [1] Fig.5.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 31. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 取得したconfidence、𝑐 𝑖,𝑗 ∈ [0, 1]はrefinement時の重み𝑤 𝑚,𝑛 𝑖,𝑗 を 弱めるのに用いる Non-Local Spatial Propagation ( [1] Fig.5.)Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑤 𝑚,𝑛 𝑖,𝑗 = 𝑐 𝑖,𝑗 ⋅ tanh(ෝ𝑤 𝑚,𝑛 𝑖,𝑗 )/𝛾
  • 32. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下confidenceありなしで結果を比較 Depthの誤測定が修正されているのが分かる Non-Local Spatial Propagation ( [1] Fig.5.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 33. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下3つのポイントを順に解説する 1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 ) 2. Refinement時の重みの無駄な正規化を抑制( 𝑤 𝑚,𝑛 𝑖,𝑗 ) 3. Confidenceのrefinementへの組み込み Non-Local Spatial Propagation 最後に実際のネットワーク構造を確認する Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 34. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 Non-Local Spatial Propagation ( [1] Fig.A.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 35. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 ロスは単純に入力時点でdepthが観測されたピクセルの集合 Vに対して ここでρ = 1,2のどちらでもよいが、ρ = 1の方が一般に エッジのキレが良いらしい その他の中間出力に対してロスは定めない(データ取得が困難) Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 36. Copyright © 2019 Morpho, Inc. All Rights Reserved. 考察 ⚫ Initial estimation → refinementは効果が出る ⚫ Deformable convolutionがエッジ保存の肝か ⚫ Weight normalizationの効果は如何ほどか疑問 ⚫ Confidence mapが実測できている場合には、ロスに組み込 めばさらに精度向上する?(スケール合わせが問題?) 正規化の定数Cは学習データの傾向によって変動する模様 使う環境が不定の場合は中々最適に決まらなそう 入力がearly fusionなのは改善の余地ありか? Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 37. Copyright © 2019 Morpho, Inc. All Rights Reserved. 著者実装:https://github.com/zzangjinsun/NLSPN_ECCV20 Non-Local Spatial Propagation ( [1] Fig.D.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 38. Copyright © 2019 Morpho, Inc. All Rights Reserved. 参考文献 [1] J. Park, K. Joo, Z. Hu, C.-K. Liu, and I. S. Kweon.: Nonlocal spatial propagation network for depth completion. In: Proc. Of European Conference on Computer Vision (ECCV), 2020 [2] J. Dai, H. Qi, Y. Xiong, Y. Li, G. Zhang, H. Hu, and Y. Wei. Deformable convolutional networks. In ICCV, 2017. [3] Zhu, X., Hu, H., Lin, S., & Dai, J. (2019). Deformable convnets V2: More deformable, better results. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2019-June, 9300–9308. https://doi.org/10.1109/CVPR.2019.00953 [4] Liu, S., De Mello, S., Gu, J., Zhong, G., Yang, M.H., Kautz, J.: Learning affinity via spatial propagation networks. In: Proc. of Advances in Neural Information Processing Systems (2017) Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.