SlideShare a Scribd company logo
1 of 11
第39回 CV勉強会@関東
CV最先端ガイド6
第2章 幾何学推定のための最適化手法:最小化を越えて
冒頭~2.2 幾何学的推定
2017年4月8日 @OZ_Z_C
2017/4/8 CV勉強会@関東 CV最先端ガイド6 幾何学的推定のための最適化手法 1
自己紹介
@OZ_Z_C (twitter)
 某企業研究所所属
経歴
学生時代~2014/3
画像符号化方式の研究、H.264 encoderの開発、など
2014/4~2016/3
Ethernet switchの開発
2016/4~
CV的な研究テーマ(広く浅く・・・)に従事
よろしくお願いします!
2017/4/8 CV勉強会@関東 CV最先端ガイド6 幾何学的推定のための最適化手法 2
2章の概要
2017/4/8 CV勉強会@関東 CV最先端ガイド6 幾何学的推定のための最適化手法 3
2.背景
◆”最適”な推定 = 評価関数の最大・最小問題・・・ではない!
◆仮定したノイズの統計的性質に依存
3.最小化に基づく手法
◆最小二乗法
◆ Taubin法
◆超精度最小二乗法
◆最尤推定
◆ etc.
◆超精度補正
4.最小化に基づかない手法
◆重み反復法
◆くりこみ法
◆超精度くりこみ法
5.手法間の精度比較実験例
◆最尤推定より超精度くりこみ法のほうが高精度!更にノイズにもロバスト!
◆超精度くりこみ法は世界一ィィィ!
主題:ノイズのあるデータからの幾何学的推定を最適に行う手法のまとめ
幾何学的問題の最適化
一般的な最適化
評価関数の最大/最小化
最大化:利益・利得・効率、etc.
最小化:損失・誤差・遅延、etc.
幾何学的問題の最適化
与えられた方程式の解を求めること
2017/4/8 CV勉強会@関東 CV最先端ガイド6 幾何学的推定のための最適化手法 4
𝐴𝑥 + 𝐵𝑦 + 𝐶 = 0
A, B, C ?
・・・しかし、実際はノイズがあって
解けない!
データ
𝐴𝑥 + 𝐵𝑦 + 𝐶 ≠ 0
A, B, C ???
幾何学的推定
ノイズがある場合どうやって解く?
ノイズの統計的性質を適切に仮定
観測データの真値が得られた際に持つであろう解を推定
つまり・・・
幾何学的推定は仮定するノイズの統計的性質に依存
評価関数を最小化問題(通常の最適化)に帰着させても解ける
しかし、必ずしもその必要はないことを強調したい!
2017/4/8 CV勉強会@関東 CV最先端ガイド6 幾何学的推定のための最適化手法 5
真値
観測データ = 真値 + ノイズ
𝐴𝑥 + 𝐵𝑦 + 𝐶 = 0
A, B, C ?
幾何学的推定の定式化
幾何学的拘束 (geometric constraint)
幾何学的推定:ノイズのあるデータからθ を推定
θ について線形に書き換えると?
x に対しては非線形
θ には定数倍の不定性あり → 𝜽 =1と正規化する
2017/4/8 CV勉強会@関東 CV最先端ガイド6 幾何学的推定のための最適化手法 6
𝝃 𝒙 , 𝜽 = 0 ⋯ (3)
𝐹 𝒙; 𝜽 = 0 ⋯ 1
𝐹 𝒙 𝜶; 𝜽 ≈ 0 ⋯ (2)
パラメータ (ベクトル)
理想的に観測されるデータ(ベクトル)
ノイズを含むデータ(ベクトル) α=1,…,N
幾何学的推定の定式化:具体例1&2
2017/4/8 CV勉強会@関東 CV最先端ガイド6 幾何学的推定のための最適化手法 7
𝐴𝑥 + 𝐵𝑦 + 𝐶 = 0
𝝃 𝑥, 𝑦 , 𝜽 = 0
𝝃 𝑥, 𝑦 ≡ 𝑥, 𝑦, 1 ⊤
𝜽 ≡ 𝐴, 𝐵, 𝐶 ⊤
例1:直線 例2:楕円
直線の式
変形すると・・・
𝝃 𝑥, 𝑦 , 𝜽 = 0
𝝃 𝑥, 𝑦 ≡ 𝑥2
, 2𝑥𝑦, 𝑦2
, 2𝑥, 2𝑦, 1 ⊤
𝜽 ≡ 𝐴, 𝐵, 𝐶, 𝐷, 𝐸, 𝐹 ⊤
楕円(というか2次曲線)の式
変形すると・・・
𝐴𝑥2 + 2𝐵𝑥𝑦 + 𝐶𝑦2 + 2 𝐷𝑥 + 𝐸𝑦 + 𝐹 = 0
⋯ (7)
⋯ (9)
⋯ (8)
⋯ (6)
⋯ (5)
⋯ (4)
幾何学的推定の定式化:具体例3
2017/4/8 CV勉強会@関東 CV最先端ガイド6 幾何学的推定のための最適化手法 8
𝑥
𝑦
1
, 𝑭
𝑥′
𝑦′
1
= 0 𝑭 =
𝐹11 𝐹12 𝐹13
𝐹21 𝐹22 𝐹23
𝐹31 𝐹32 𝐹33
𝝃 𝑥, 𝑦, 𝑥′
, 𝑦′ , 𝜽 = 0 𝝃 𝑥, 𝑦 ≡ 𝑥𝑥′
, 𝑥𝑦′
, 𝑥, 𝑦𝑥′
, 𝑦𝑦′
, 𝑦, 𝑥′
, 𝑦′
, 1 ⊤
𝜽 ≡ 𝐹11, 𝐹12, 𝐹13, 𝐹21, 𝐹22, 𝐹23, 𝐹31, 𝐹32, 𝐹33
⊤
例3:カメラの基礎行列
エピ極線方程式 (エピ極線拘束条件)
𝑥 𝛼, 𝑦 𝛼 の対応点 𝑥′
𝛼, 𝑦′
𝛼
はこの直線(エピ極線)上に存在
変形すると・・・
⋯ (10)
⋯ (13) ⋯ (11)
⋯ (12)
今回は触れないけど考慮すべきこと
演算精度
丸め誤差の影響が出るので、式(11)のx, y’などをO(1)に正規化すべき
アウトライア
インライア:真値が得られたときに幾何学的拘束を満たすデータ
アウトライア:何らかの原因で拘束を満たさないデータ
例:基礎行列推定の場合 → 対応点の誤マッチングなど
対処法
RANSAC
最小メジアン法(LMedS)
ロバスト推定(M推定子)
2017/4/8 CV勉強会@関東 CV最先端ガイド6 幾何学的推定のための最適化手法 9
𝝃 𝑥, 𝑦 ≡ 𝑥𝑥′
, 𝑥𝑦′
, 𝑥, 𝑦𝑥′
, 𝑦𝑦′
, 𝑦, 𝑥′
, 𝑦′
, 1 ⊤
⋯ (11)
金澤, 金谷, “2画像間の特徴点対応の自動探索” より抜粋
参考文献
1. 3次元コンピュータビジョン計算ハンドブック
https://www.morikita.co.jp/books/book/3016
2. 【コンピュータビジョン】ネコと学ぶエピポーラ幾何
http://qiita.com/ykoga/items/14300e8cdf5aa7bd8d31
3. 2画像間の特徴点対応の自動探索
 http://www.iim.cs.tut.ac.jp/~kanatani/papers/imlab-matching-pub.pdf
2017/4/8 CV勉強会@関東 CV最先端ガイド6 幾何学的推定のための最適化手法 10
fin.
2017年4月8日 @OZ_Z_C
2017/4/8 CV勉強会@関東 CV最先端ガイド6 幾何学的推定のための最適化手法 11

More Related Content

What's hot

MMDs10.6-7
MMDs10.6-7MMDs10.6-7
MMDs10.6-7mfumi
 
カラコレ講座
カラコレ講座カラコレ講座
カラコレ講座gessoku
 
Magnitude ~ extend the Euler Characteristics via Möbius Inversion ~
Magnitude ~ extend the Euler Characteristics via  Möbius Inversion ~Magnitude ~ extend the Euler Characteristics via  Möbius Inversion ~
Magnitude ~ extend the Euler Characteristics via Möbius Inversion ~Tatsuki SHIMIZU
 
Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recog...
Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recog...Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recog...
Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recog...yukihiro domae
 
Operad and Recognition Principle
Operad and Recognition PrincipleOperad and Recognition Principle
Operad and Recognition PrincipleTatsuki SHIMIZU
 
OpenGLと行列
OpenGLと行列OpenGLと行列
OpenGLと行列miyosuda
 
FeaStNet: Feature-Steered Graph Convolutions for 3D Shape Analysis
FeaStNet: Feature-Steered Graph Convolutions for 3D Shape AnalysisFeaStNet: Feature-Steered Graph Convolutions for 3D Shape Analysis
FeaStNet: Feature-Steered Graph Convolutions for 3D Shape Analysisyukihiro domae
 
競技プログラミングでの線型方程式系
競技プログラミングでの線型方程式系競技プログラミングでの線型方程式系
競技プログラミングでの線型方程式系tmaehara
 
最小カットを使って「燃やす埋める問題」を解く
最小カットを使って「燃やす埋める問題」を解く最小カットを使って「燃やす埋める問題」を解く
最小カットを使って「燃やす埋める問題」を解くshindannin
 
Processingによるプログラミング入門 第4回
Processingによるプログラミング入門 第4回Processingによるプログラミング入門 第4回
Processingによるプログラミング入門 第4回Ryo Suzuki
 
Processingによるプログラミング入門 第2回
Processingによるプログラミング入門 第2回Processingによるプログラミング入門 第2回
Processingによるプログラミング入門 第2回Ryo Suzuki
 

What's hot (20)

MMDs10.6-7
MMDs10.6-7MMDs10.6-7
MMDs10.6-7
 
CG2013 02
CG2013 02CG2013 02
CG2013 02
 
カラコレ講座
カラコレ講座カラコレ講座
カラコレ講座
 
Magnitude ~ extend the Euler Characteristics via Möbius Inversion ~
Magnitude ~ extend the Euler Characteristics via  Möbius Inversion ~Magnitude ~ extend the Euler Characteristics via  Möbius Inversion ~
Magnitude ~ extend the Euler Characteristics via Möbius Inversion ~
 
Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recog...
Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recog...Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recog...
Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recog...
 
CG2013 09
CG2013 09CG2013 09
CG2013 09
 
Operad and Recognition Principle
Operad and Recognition PrincipleOperad and Recognition Principle
Operad and Recognition Principle
 
OpenGLと行列
OpenGLと行列OpenGLと行列
OpenGLと行列
 
FeaStNet: Feature-Steered Graph Convolutions for 3D Shape Analysis
FeaStNet: Feature-Steered Graph Convolutions for 3D Shape AnalysisFeaStNet: Feature-Steered Graph Convolutions for 3D Shape Analysis
FeaStNet: Feature-Steered Graph Convolutions for 3D Shape Analysis
 
CG2013 01
CG2013 01CG2013 01
CG2013 01
 
競技プログラミングでの線型方程式系
競技プログラミングでの線型方程式系競技プログラミングでの線型方程式系
競技プログラミングでの線型方程式系
 
最小カットを使って「燃やす埋める問題」を解く
最小カットを使って「燃やす埋める問題」を解く最小カットを使って「燃やす埋める問題」を解く
最小カットを使って「燃やす埋める問題」を解く
 
Processingによるプログラミング入門 第4回
Processingによるプログラミング入門 第4回Processingによるプログラミング入門 第4回
Processingによるプログラミング入門 第4回
 
CG2013 06
CG2013 06CG2013 06
CG2013 06
 
CG2013 07
CG2013 07CG2013 07
CG2013 07
 
ロマ数16 simizut
ロマ数16 simizutロマ数16 simizut
ロマ数16 simizut
 
Processingによるプログラミング入門 第2回
Processingによるプログラミング入門 第2回Processingによるプログラミング入門 第2回
Processingによるプログラミング入門 第2回
 
日曜数学会 Ofdm
日曜数学会 Ofdm日曜数学会 Ofdm
日曜数学会 Ofdm
 
CG2013 03
CG2013 03CG2013 03
CG2013 03
 
CG2013 05
CG2013 05CG2013 05
CG2013 05
 

Recently uploaded

TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 

Recently uploaded (12)

TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 

20170408 cv geometric_estimation_1-2.2