cvpaper.challenge
Twitter@CVPaperChalleng
http://www.slideshare.net/cvpaperchallenge
【101】
Nian Liu, Junwei Han, Dingwen Zhang, Shifeng Wen and Tianming Liu, “Predicting Eye Fixations using Convolutional Neural
Networks”, in CVPR2015.
Mr-CNN(multi resolution)を用いた Saliency Map の生成.
三段階のスケールから人物が凝視する領域を学習し,saliency map を生成する.
実験結果
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Predicting_Eye_Fixations_2015_CVPR_paper.pdf
【102】
Sheng Huang, Mohamed Elhoseiny, Ahmed Elgammal and Dan Yang, “Learning Hypergraph-regularized Attribute Predictors”, in
CVPR2015.
Attribute learning フレームワーク(Hypergraph-regularzed Attributte Predictor: HAP)の提案.
HAP は
・attribute 間の相関性を考慮していない
・attribure 学習においてサイド情報が活用されていない
といった問題に対処している.
HAP の処理は以下の通り.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Huang_Learning_Hypergraph-
Regularized_Attribute_2015_CVPR_paper.pdf
【プロジェクトページ(コードあり)】
https://sites.google.com/site/siteshuang/home/project/hap
【103】
D. Stamos, S. Martelli, M. Nabi, “Learning with Dataset Bias in Latent Subcategory Models”, in CVPR2015.
Latent Subcategory Models (LSMs)は潜在的なサブカテゴリを学習する概念であり,識別に有効な手法となっている.しかし,局所最適化された
識別モデルや目的関数,さらにはデータの増加により複雑化するモデルを捉える必要が出てくる.これらの問題を解決するため提案手法では
データセットに内在する複数のバイアスを多タスク学習の課題と捉えてモデリングする.下は概念図であり,例えば二つのデータセット間(赤
と青に色分け)のクラス(例:犬)を複数のサブカテゴリ(例:3 視点の画像)により捉える.多タスク学習によりこれらの性質を捉える.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Stamos_Learning_With_Dataset_2015_CVPR_paper.pdf
【104】
T.-T. Do, Q. D. Tran, N.-M. Cheung, “FAemb: a fuction approximation-based embedding method for image retrieval”, in
CVPR2015.
画像の局所特徴(e.g. SIFT)を用いた高次元表現について.この問題に関しては VLAD や TLCC が有名な手法として挙げられる.VLAD はベク
トルの分布を捉えてボロノイ図により空間を分割するのに対して TLCC は非線形関数を用いて高次元空間を近似することが目的である.
TLCC では非線形関数は 1 次の特徴として設定されているが,提案手法ではこの表現をより高次にする.Holidays dataset や Oxford5k dataset を
用いた結果は下の表のようになった.VLAD や Fisher vector と比較しても精度が向上している.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Do_FAemb_A_Function_2015_CVPR_paper.pdf
【105】
Johannes Hofmanninger, Georg Langs, “Mapping Visual Features to Semantic Profiles for Retrieval in Medical Imaging”, in
CVPR2015.
医療画像において,どのような症状となっているかを推定する手法.
複数のサンプル画像と,それのレポートから簡単なラベル付けを行い,その画像のどこにラベルが付加されるかを学習する.そして,一番多
いラベルの症状を結果として出力する.
Link(s) 【論文ページ】
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Hofmanninger_Mapping_Visual_Features_2015_CVPR_paper.pdf
【著者ページ】
http://www.cir.meduniwien.ac.at/team/johannes-hofmanninger/
【106】
Daniel Pr ˚uša, “Graph-based Simplex Method for Pairwise Energy Minimization with Binary Variables”, in CVPR2015.
グラフ理論ベースの pairwise エネルギー最小化問題.
左図は,エネルギー最小化グラフ,右図はサブグラフ.灰色はルートの主要な要素となっている
実験の結果,処理を大幅に高速化することができた.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Prusa_Graph-
Based_Simplex_Method_2015_CVPR_paper.pdf
【107】
D. Turmukhambetov, N. D. F. Campbell, S. J. D. Prince, J. Kautz, “Modeling Object Appearance using Context-Conditioned
Component Analysis”, in CVPR2015.
論文では,画像のアラインメントを補正する部分空間モデルを提案する.物体間から取得・共有した形状特徴により,複雑な形状に対応して
もモデリングできることが判明した.下図は上から(1 行目)トレーニングセット,(2 行目)トレーニングセットの復元結果,(3-5 行目)別種のネ
コの姿勢変化の結果である.
Link(s) 論文ページ:
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Turmukhambetov_Modeling_Object_Appearance_2015_CVPR_paper.pdf
【108】
C. Li, L. Lin, W. Zuo, S. Yan, J. Tang, “SOLD: Sub-Optimal Low-rank Decomposition for Efficient Video Segmentation”, in
CVPR2015.
低ランク近似を適用した映像に対するセグメンテーション.現在までの映像に対するセグメンテーションは low-level の特徴量を用いていて精
度が良くないことや,時系列のフレームであるということを活かしきれていなかったと指摘.そこで,時系列の画像列を長期のボクセルデー
タとみなして処理する必要があるとした.提案手法では Sub-Optimal Low-rank Decomposition (SOLD)を適用して映像に対するセグメンテーショ
ンを実行する.ここでは superpixel の代わりに supervoxel を用いる.データを 6(x)x6(y)x6(t)のボクセルデータとして扱い,拡張ラグランジュ
関数や Linearized 拡張ラグランジュ関数により低ランク近似の式を解く.SOLD は部分最適化や非凸最適化の問題として扱われている.下図
は比較実験の一例である.(a)が入力画像,(f)が正解,(e)が SOLD の最適化によるセグメンテーション結果である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_SOLD_Sub-Optimal_Low-rank_2015_CVPR_paper.pdf
【109】
N. Savinov, L. Ladicky, C. Hane, M. Pollefeys, “Discrete Optimazation of Ray Potentials for Semantic 3D Reconstruction”, in
CVPR2015.
密な 3 次元再構成(dense 3D reconstruction)は困難な課題であるが,ボクセルのラベリング問題として捉えることができる.提案手法では主に体
積表現(volumetric representation)を用いることであるが,データのコストを抑える必要が生じる.この 3 次元データの最適化を行うために,1.
多項式によりポテンシャルを表現, 2. 高次の劣モジュラポテンシャルを用いてパラメータを追加, 3. 高次の劣モジュラポテンシャルの pairwise
のグラフ構造化, 4.構造化された計算パラメータを統合, 5. 3 次元データを正規化.下図は入力,距離画像,semantic segmentation,3 次元再構成
の例である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Savinov_Discrete_Optimization_of_2015_CVPR_paper.pdf
【110】
A. Pentina, V. Sharmanska, C. H. Lampert, “Curriculum Learning of Multiple Tasks”, in CVPR2015.
Curriculum Learning は機械学習の概念であり,簡単なタスクから学習し次に一般的な学習をしたほうが精度が良くなるという方法である.(人
間でも簡単な問題を解いて応用問題を解く) 提案手法では,多タスク学習を適用して靴の認識を行うが Curriculum Learning の概念も同時進行
させて学習を効率的にする.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Pentina_Curriculum_Learning_of_2015_CVPR_paper.pdf
SlideShare:
http://www.slideshare.net/YoshitakaUshiku/20150530-kantocv-curriculumlearning
【111】
Hangfan Liu, Ruiqin Xiong, Jian Zhang and Wen Gao, “Image Denoising via Adaptive Soft-Thresholding Based on Non-Local
Samples”, in CVPR2015.
信号モデルと緩い閾値で denoise する手法
画像に発生しているノイズを,信号としてモデル化する.
信号の係数を求めたら,緩い閾値を設けてそれを除去する.
ノイズ除去結果が以下の通り.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Image_Denoising_via_2015_CVPR_paper.pdf
【112】
Gottfried Graber, Jonathan Balzer, Stefano Soatto, Thomas Pock, “Efficient Minimal-Surface Regularization of Perspective Depth
Maps in Variational Stereo”, in CVPR2015.
ステレオマッチングにおいて正則化を最適化することで 3D 再構成の精度を向上している.
従来,分散モデルは Total Variation(TV)正則化されていた.
しかし,この論文では Total Generalized Variation (TGV)にすることで,最適化している.
これは,ステレオマッチングの本質的な問題にチャレンジしている.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Graber_Efficient_Minimal-
Surface_Regularization_2015_CVPR_paper.pdf
【プロジェクトページ(コードあり(python))】
http://gpu4vision.icg.tugraz.at/index.php?expand=e,c,c,c,c,c,c,c,c,c,c,c,c,c,c,c,c&content=Cat_4#pub96
【113】
Gottfried Graber, Jonathan Balzer, Stefano Soatto, Thomas Pock, “Efficient Minimal-Surface Regularization of Perspective Depth
Maps in Variational Stereo”, in CVPR2015.
NP-hard 問題に対して,グラフィカルモデルを用いて最適化している.
実験により,処理の高速化が見受けられる.
Link(s) 【論文ページ】
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Shekhovtsov_Maximum_Persistency_via_2015_CVPR_paper.pdf
【プロジェクトページ(コードあり(MATLAB))】
http://cmp.felk.cvut.cz/~shekhovt/persistency/
【114】
A. Davis, K. L. Bouman, J. G. Chen, M. Rubinstein, F. Durand, W. T. Freeman, “Visual Vibrometry: Estimating Material
Properties from Small Motions in Video”, in CVPR2015.
材料の性質(Material Properties)はシーン認識にとって重要な課題である.振動メカニズムの解析により,この材質の把握を実現する.そのため
に,微小な画像のモーションを解析する.下図は提案のフローであり,(A) 複数の生地やロッドを部屋の音や空気による振動を利用して計測
する.(B) 材質や密度により並べた例.(C) 画像からの観測により周波数やスペクトル解析.実験の結果,材質と解析の結果に高い相関値があ
ることが判明した.詳細はビデオ参照.
Link(s) 論文ページ:
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Davis_Visual_Vibrometry_Estimating_2015_CVPR_paper.pdf
プロジェクトページ:
http://www.visualvibrometry.com/
YouTube:
https://www.youtube.com/watch?v=5apFqYEx5ew
データセット:
http://www.visualvibrometry.com/cvpr2015/dataset.html
【115】
Z. Liao, K. Karsch, D. Forsyth, “An Approximate Shading Model for Object Relighting”, in CVPR2015.
影の推定と光源の生成は重要な課題に位置付けられている.図 1 では入力から形状,影推定を行い,光源を生成する処理を示している.提案
手法を利用して,図 2 のように新しい物体を自然に画像中に合成することができる.
図 1
図 2
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liao_An_Approximate_Shading_2015_CVPR_paper.pdf
【116】
Xiaochun Cao, Changqing Zhang, Huazhu Fu, Si Liu, Hua Zhang,, “Diversity-induced Multi-view Subspace Clustering ”, in
CVPR2015.
multi-view クラスタリングで,情報を逐次的に補完していく手法(DiMSC).
従来手法は,multi-view data を,個別のものとして見なしていたが,欠損している情報を補完的にすることで,クラスタリングの精度を向上
している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Cao_Diversity-Induced_Multi-
View_Subspace_2015_CVPR_paper.pdf
【117】
Zuzana Kukelova, Jan Heller, Martin Bujnak, Tomas Pajdla, “Radial Distortion Homography”, in CVPR2015.
より少ない情報でホモグラフィを推定する.
これを解決するため,2 つのアルゴリズムを提案する.
(i)5 点のマッチングポイントのみで,H5λ1λ2 :Grobner をベースに非線形な多項式を推定する.
(ii)H6λ1λ2:6 点のマッチングポイントで 6 つの線形式を解く.
Link(s) 【論文ページ】
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Kukelova_Radial_Distortion_Homography_2015_CVPR_paper.pdf
【118】
Jianping Shi, Li Xu‡ , Jiaya Jia, “Just Noticeable Defocus Blur Detection and Estimation”, in CVPR2015.
ブラーを検出・推定するための Just Noticeable Dedocus(JND)特徴の提案.
図の赤枠が焦点,青枠がブラー(ぼけている)領域.
関数を組み合わせてエッジを表現する.
クリア領域はエッジが明確なので,組み合わせる関数が多くなる.
一方,ブラー領域は少ない関数で表現できる.
こうした違いから,クリア領域とブラー領域を検出・推定している.
ブラーマップ
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Shi_Just_Noticeable_Defocus_2015_CVPR_paper.pdf
【プロジェクトページ(コードあり(MATLAB))】
http://shijianping.me/jnb/index.html
【119】
Hang Yang, Ming Zhu, Yan Niu, Yujing Guan, Zhongbo Zhang, “Dual Domain Filters based Texture and Structure Preserving
Image Non-blind Deconvolution”, in CVPR2015.
Defocused 画像の品質を向上させる課題.
Rolling guidance filter と short-time Fourier transform(STFT)を統合する.
はじめに,rolling guidance filter を用いてノイズ除去したハイコントラスト領域を求める.
次に,ローコントラスト画像を抽出することによって,エネルギー関数を最小化させる(STFT).
最後に,2 つのノイズ除去した画像を足し合わせることで,オリジナル画像と近似させる.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Yang_Dual_Domain_Filters_2015_CVPR_paper.pdf
【120】
Xuan Dong, Boyan Bonev, Yu Zhu, Alan L. Yuille, “Region-based Temporally Consistent Video Post-processing ”, in CVPR2015.
画像の品質を,領域ごとに向上させる手法の提案.
逆光になっている部分などを補正する手法は,従来は画像全体で行われてきた.
しかし,逆光部分のみを抽出して,そこだけ直せばより効率化され,必要な情報のみを抽出できるのではないか.
本手法では,super pixel で領域を分割した後に,領域間の対応関係を推定する.そして,領域の画像品質を調整する.
手法の結果
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Dong_Region-
Based_Temporally_Consistent_2015_CVPR_paper.pdf
【121】
Shaoqing Ren, Xudong Cao, Yichen Wei, Jian Sun, “Global Refinement of Random Forest ”, in CVPR2015.
学習済み Random Forests のリファインメント手法.
いらない枝を切ることで高精度・省メモリ化し,RFs を SVM や SVR のように扱う.
RFs がバイナリ特徴と重みの積和であることに着目し,構造をそのままで重みを変えている.
その中で,重みの小さい枝を省いている.
実験では,kinect の部位認識や顔年齢推定を行っており,いずれも精度向上している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ren_Global_Refinement_of_2015_CVPR_paper.pdf
【スライドシェア】
http://www.slideshare.net/akisatokimura/cvpr2015-reading-understainding-image-virality-in-japanese-50914712
【122】
Mohammad Rastegari, Hannaneh Hajishirzi, Ali Farhadi, “Discriminative and Consistent Similarities in Instance-Level Multiple
Instance Learning ”, in CVPR2015.
Discriminative で consistent な類似尺度を導入した MIL.
下図において,緑線のアイテムは差別的(discriminative)かつ一貫性(consistents)がある.オレンジの線は,一貫性はあるが識別的でない.紫の線
は,差別的であるが一貫性がない.
Link(s) 【論文ページ】
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Rastegari_Discriminative_and_Consistent_2015_CVPR_paper.pdf
【123】
Yao Xiao, Cewu Lu, Efstratios Tsougenis, Yongyi Lu, Chi-Keung Tang , “Complexity-Adaptive Distance Metric for Object
Proposals Generation ”, in CVPR2015.
物体検出のための super pixel のグルーピング手法.
下図のように,単純な色の場合は識別しやすいが,色が複雑に折り合っている場合,平均をとると本来とは全く異なる色となる.これが原因
で,super pixel のグルーピングが失敗する可能性がある.
2 つの super pixel 間で最も距離の遠い組み合わせと,最も距離の近い組み合わせを抽出し,グルーピングする.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Xiao_Complexity-
Adaptive_Distance_Metric_2015_CVPR_paper.pdf
【プロジェクトページ】
http://www.cse.ust.hk/~yxiaoab/cvpr2015/CADM.html
【124】
X. Chen, A. Ritter, A. Gupta, T. Mitchell, “Sense Discovery via Co-Clustering on Images and Text”, in CVPR2015.
ある名詞句に引用される単語はどのくらいあるのか?提案手法では,ある単語と関連する画像を抽出する.下図では,Columbia や Apple とい
う NP とそれに関連する画像を検索している.Columbia であれば地名や人物,コロンビア大学,メーカーなどの関連するものが抽出される.
このような取り組みのことを”Sense Discovery”と呼んでいる.実験では 30 種類の NP,各クラス数百枚の画像が含まれている.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Chen_Sense_Discovery_via_2015_CVPR_paper.pdf
プロジェクトページ:
http://www.cs.cmu.edu/~xinleic/poly.html
【125】
Xian-Ming Liu, Rongrong Ji, Changhu Wang, Wei Liu, Bineng Zhong, Thomas S. Huang,”Handling Motion Blur in Multi-Frame
Super-Resolution”, in CVPR, 2015.
複数フレームでの超解像技術(MFSR)において重要な問題であるモーションブラーへの対策の提案.
モーションブラーの性質と勾配強度に着目して推定をし,モデル化.
ノイズにも強い手法であることが述べられている.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ma_Handling_Motion_Blur_2015_CVPR_paper.pdf
【126】
D. Gong, Z. Li, D. Tao, J. Liu, X. Li, “A Maximum Entropy Feature Descriptor for Age Invariant Face Recognition”, in
CVPR2015.
年齢変化に対して頑健な顔特徴(AIFR; Age Invariant Face Recognition)の研究.本論文ではこの問題に対して,Maximum Entropy Feature
Descriptor (MEFD)と呼ばれる特徴量や Identify Factor Analysis (IFA)と呼ばれるマッチング手法を提案して、AIFR の問題解決に貢献した.下は
木構造ベースのエンコーディング手法である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Gong_A_Maximum_Entropy_2015_CVPR_paper.pdf
著者ページ:
http://www.cise.ufl.edu/~dihong/cv.html
【127】
Y. Verdie, K. M. Yi, P. Fua, V. Lepetit, “TLIDE: A Temporarlly Invariant Learned DEtector”, in CVPR2015.
天気や照明の影響に頑健なキーポイントマッチングの提案.学習ベースのキーポイントマッチングを提案する.識別的損失・形状正規化項・
時系列の正規化項を最小化することでマッチングを実現する.下図は SURF(左)と比較している図であり,ある場所の夜の画像と昼の画像をキ
ーポイントマッチングしている.SURF では特徴的なポイントに対して集中的にマッチングしているが,同じ数のキーポイントを提案手法に
よりマッチングさせたところ,グローバルにキーポイントをマッチングできた.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Verdie_TILDE_A_Temporally_2015_CVPR_paper.pdf
プロジェクトページ(コード,データ,動画あり):
http://cvlab.epfl.ch/research/tilde
【128】
Y. Jin, C.-S. Bouganis, “Robust Multi-Image Based Blind Face Hallucination”, in CVPR2015.
複数画像からの顔画像の再構成問題.超解像画像として再構成するために,提案手法では PCA による部分空間を適用するが,ここではさらに
Mixture Probabilistic PCA (MPPCA)を用いて事前情報としている.下図は復元された例である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Jin_Robust_Multi-Image_Based_2015_CVPR_paper.pdf
【129】
Miguel Á. Carreira-Perpiñán, Ramin Raziperchikolaei, “Hashing with Binary Autoencoders”, in CVPR2015.
高次元ベクトルを binary hashing によって次元削減する.
この手法は 2step で構成されている.
(1)hash 関数を学習し,それを出力する.(filter)
(2)最適解を得るために,hash 関数を最適化する(wrapper)
実験の結果は以下の通り
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Carreira-
Perpinan_Hashing_With_Binary_2015_CVPR_paper.pdf
【130】
Masaki Saito, Takayuki Okatani , “Transformation of Markov Random Fields for Marginal Distribution Estimation”, in
CVPR2015.
MRF をより単純に変換することによって,marginal inference problem を解決する.
関数をすべて使うのではなく,離散化することで情報量を削減する.(discretization)
そして,それぞれのラベルをグルーピングする(grouping)
以上の設計をし,荒い MRF を構築する.
実験の結果,速度の向上が見受けられる.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Saito_Transformation_of_Markov_2015_CVPR_paper.pdf
【131】
Olga Veksler, “Efficient Parallel Optimization for Potts Energy with Hierarchical Fusion ”, in CVPR2015.
Potts energy を最小化させる graph-cut 手法の提案.
階層的な並列化をすることにより,解決している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Saito_Transformation_of_Markov_2015_CVPR_paper.pdf
【132】
A. Kovnatsky, M. M. Bronstein, Xavier Bresson, and Pierre Vandergheynst, “Functional correspondence by matrix completion”, in
CVPR2015.
Geometric matrix completion として,機能の対応付けを行う.
平滑化,位置合わせ,簡易化をし,機能マップを生成している.さらに,manifold を最適化している.
Link(s) 【論文ページ】
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Kovnatsky_Functional_Correspondence_by_2015_CVPR_paper.pdf
【133】
Eunwoo Kim, Minsik Lee, and Songhwai Oh, “Elastic-Net Regularization of Singular Values for Robust Subspace Learning ”, in
CVPR2015.
頑健な subspace 学習のための elastic-net 正則化.
低ランク行列と sparse 行列を,convex envelopes の基づいた問題に分割している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Kim_Elastic-Net_Regularization_of_2015_CVPR_paper.pdf
【134】
R. Litman, S. Korman, A. Bronstein, S. Avidan, “Inverting RANSAC: Global Model Detection via Inlier Rate Estimation”, in
CVPR2015.
Inlier と outlier が混合しているサンプリングから効果的に inlier を抽出する例として RANSAC があげられる.RANSAC ではまずランダムにサ
ンプルを選び,試行を繰り返すことで inlier の含有率を高めるが,提案手法はその逆で,inlier の rate をまずデータから求め,エラーを最小化
する仕組みである.下図がその概念図であり,効果的にエラーが最小化される.提案手法では幾何学的な変換に対して効果的なサンプリング
,グローバルに inlier を求めることができる,外的な検出がなくてもマッチングの inlier の含有率を計算できることがコントリビューションと
してあげられる.
Link(s) 論文ページ:
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Litman_Inverting_RANSAC_Global_2015_CVPR_paper.pdf
【135】
N. Li, B. Sun, J. Yu, “A Weighted Sparse Coding Framework for Saliency Detection”, in CVPR2015.
Color, texture, depth など複数の空間において顕著性マップを実行するための辞書(dictionary)を生成.辞書には saliency/non-saliency な特徴が抽出
されており,superpixels の領域をベースとして構築される.特徴空間は複数のバリエーション-- 色空間,テクスチャ,focusness,視差画像,
4D light field を適用している.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_A_Weighted_Sparse_2015_CVPR_paper.pdf
【136】
M. Schoeler, J. Papon, F. Worgotter, “Constrained Planar Cuts- Object Partitioning for Point Clouds”, in CVPR2015.
3 次元物体のポイントクラウドデータに対してパーツの分割を実行する論文.左図のように(A) supervoxel データとして変換.(B) Supervoxel
adjacency graph を適用して convex(凸形状)/ concave (凹形状)の位置を推定する.(C)肩の位置などは複数の convex が発生してしまい複雑な領域
であるが,データドリブンの手法により分割を高精度にする.右図は段階を追って分割した例である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Schoeler_Constrained_Planar_Cuts_2015_CVPR_paper.pdf
著者ページ:
http://www.dpi.physik.uni-
goettingen.de/cns/index.php?mact=Profilliste,cntnt01,default,0&cntnt01what=Mitarbeiter&cntnt01alias=Schoeler&cntnt01returnid
=65
【137】
X. Liu, R. Ji, C. Wang, W. Liu, B. Zhong, T. S. Huang, “Understanding Image Structure via Hierarchical Shape Parsing”, in
CVPR2015.
画像内構造の把握は物体候補領域抽出のための重要な課題として位置づけられている.下図は画像の意味的な解析であり,左がエッジ解析,
右がアピアランスによる解析である.階層的な構造をツリーモデルにより表現している.親ノードと子ノードの関係性を保存するような解析
が重要である.ここでは Hierarchical Edge Tree と呼ばれるツリーモデルを構築することとして,Markov Process をベースとしてエッジやアピ
アランスを参照することで階層構造化する.ツリーモデルのノードに対して候補領域を割り当てていく.
Link(s) 論文ページ:
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Liu_Understanding_Image_Structure_2015_CVPR_paper.pdf
【138】
Da Kuang, Alex Gittens, Raffay Hamid, “Hardware Compliant Approximate Image Codes ”, in CVPR2015.
ハードウェアへの負担を考慮した符号化手法.
従来の符号化は,1 つの特徴点からの距離を算出していた.しかし,これでは計算時間が大きく,ハードウェアに負担を与える.そこで,ク
ラスタリングしたその中心からの距離を求める.さらに,全探索ではなく,一定の範囲内の点とのみ距離を算出する.
実験の結果,精度をやや向上させながら,速度も 40 倍近く高速にしている.
Link(s) 【論文ページ】
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Kuang_Hardware_Compliant_Approximate_2015_CVPR_paper.pdf
【139】
A. Chatterjee, V. M. Govindu, “Photometric Refinement of Depth Maps for Multi-albedo Objects”, in CVPR2015.
3D 再構成のための Photometric 手法の改良.
Depth camera で取得した depth map に対して,multi-albedo を考慮して再構成する.
Link(s) 【論文ページ】
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Chatterjee_Photometric_Refinement_of_2015_CVPR_paper.pdf
【140】
Christoph H. Lampert, “Predicting the Future Behavior of a Time-Varying Probability Distribution ”, in CVPR2015.
事変量から未来を予測する extrapolating the distribution dynamics(EDD)の提案.
Emprical embedding を通して Hilbert 空間に特徴をプロットする.その際,特徴の相関を取ることにより,reproduction kernel Hilbert
space(RKHS)に変換する.
RKHS での事変量を解析し,予測する.
将来的には,車の進化を学習し,未来の車を予測することも検討している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Lampert_Predicting_the_Future_2015_CVPR_paper.pdf
【141】
Anna Khoreva, Fabio Galasso, Matthias Hein, Bernt Schiele, “Classifier Based Graph Construction for Video Segmentation ”, in
CVPR2015.
グラフベースで video segmentation する手法の提案.
実現するために,
1.feature extraction:外観特徴,モーション特徴,形状特徴を組み合わせた super pixel 特徴
2.graph construction:2 つの super pixel 間の重みエッジを算出
3.graph partitioning:複数の特徴を組み合わせた learnt graph
を導入している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Khoreva_Classifier_Based_Graph_2015_CVPR_paper.pdf
【142】
Hosnieh Sattar, Sabine Müller, Mario Fritz, Andreas Bulling, “Prediction of Search Targets From Fixations in Open-World Settings
”, in CVPR2015.
Open world の中で,人の凝視から検索対象を予測する.
閉じた世界では,人が探している対象を見分けるのはある程度絞れるが,open world ではそうはいかない.教師なしで視点の凝視対象を学習
している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Sattar_Prediction_of_Search_2015_CVPR_paper.pdf
【143】
Dongliang Cheng1 , Brian Price2 , Scott Cohen2 , Michael S. Brown1 , “Effective Learning-Based Illuminant Estimation Using
Simple Features”, in CVPR2015.
Simple な特徴で回帰木を生成する色推定の手法.
特徴は RGB の平均値や明るさといった単純なものを用いている.
図に示す 4 つの特徴から回帰木を生成し,回帰したメディアンをとることで色補正している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Sattar_Prediction_of_Search_2015_CVPR_paper.pdf
【144】
Yu Kong,Yun Fu, Wei Liu,”Bilinear Heterogeneous Information Machine for RGB-D Action Recognition”, in CVPR, 2015.
RGB-D カメラで動作判別を行う.
RGB データと Depth データは異なる特徴空間を持つため一緒くたにして特徴を計算できないが,それぞれのパラメータ行列を用い,両者の時
空間的な関係に着目することでクロスモーダルな特徴を計算する.
2 つのデータセットでの実験が行われ,うち1つでは Accuracy が 100%と非常に高精度.
Link(s) 論文ページ:
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Kong_Bilinear_Heterogeneous_Information_2015_CVPR_paper.pdf
【145】
X. Liu, X. Wu, J. Zhou, D. Zhao, “Data-driven Sparsity-based Restoration of JPEG-compressed Images in Dual Transform-Pixel
Domain”, in CVPR2015.
画像復元をする際に,信号処理 DCT による方法(DCT domain learning),JPEG 圧縮の仕組みを用いる方法(pixel domain learning)という dual
domain 学習を採用した.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Data-Driven_Sparsity-
Based_Restoration_2015_CVPR_paper.pdf
【146】
Pedro Rodrigues1 , João P. Barreto1,2, “Single-Image Estimation of the Camera Response Function in Near-Lighting”, in
CVPR2015.
Camera Response Function を単眼画像から推定する手法.
アルベド(反射光の比)を,2 つの色領域で解析し,表面の単眼画像から CRF を推定している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Rodrigues_Single-
Image_Estimation_of_2015_CVPR_paper.pdf
【147】
X. Li, M. Larson, A. Hanjalic, “Pairwise Geometric Matching for Large-scale Object Retrieval”, in CVPR2015.
画像中からのマッチングを,pairwise に実行する.下の図では複数のマッチングされた特徴点の拘束からグローバルの回転やスケール,特徴
ベクトルを評価する.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Pairwise_Geometric_Matching_2015_CVPR_paper.pdf
【148】
T. Ajanthan, R. Hartley, M. Salzmann, H. Li, “Iteratively Reweighted Graph Cut for Multi-label MRFs with Non-convex Priors”,
in CVPR2015.
MRF において,マルチラベルの非凸関数最適化は非常に困難な最適化問題である.従来法として graph cut ベースのアルゴリズムが存在する
が,依然として困難な課題である.提案手法ではこの最適化を,エネルギー関数の代替を考案してより単純な最小化手法にすることで最適化
問題を解決する.IRLS アルゴリズムが連続的な最適化問題に適用されているが,この戦略を MRF に取り入れることが新規性である.下図は
マルチラベルのグラフ制約である.
Link(s) 論文ページ:
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Ajanthan_Iteratively_Reweighted_Graph_2015_CVPR_paper.pdf
【149】
K. Jiang, Q. Que, B. Kulis, “Revisiting Kernelized Locality-Sensitive Hashing for Improved Large-Scale Image Retrieval”, in
CVPR2015.
ハッシングの分野にて Kernelized Locality Sensitive Hashing (KLSH)を提案.KLSH は approximate nearest-neighbor(近似的 NN 法)を採用しており
,カーネルとしては Reproducing Kernel Hilbert Space (RKHS)を用いている.KLSH に対して Low-rank 表現や Monotone Transformation も施して
おり,表は Recall による各精度である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Jiang_Revisiting_Kernelized_Locality-
Sensitive_2015_CVPR_paper.pdf
【150】
M. Lam, J. R. Doppa, S. Todorovic, T. G. Dietterich, “HC-Search for Structured Prediction in Computer Vision”, in CVPR2015.
自然言語処理で有効な手法である HC-Search を用いて意味的セグメンテーション(semantic segmentation)を実行する.下図が提案手法の概要で
ある.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Lam_HC-Search_for_Structured_2015_CVPR_paper.pdf
ご質問・コメント等ありましたら,cvpaper.challenge@gmail.com / Twitter@CVPaperChalleng までお願いします.

【2015.08】(3/5)cvpaper.challenge@CVPR2015

  • 1.
  • 2.
    【101】 Nian Liu, JunweiHan, Dingwen Zhang, Shifeng Wen and Tianming Liu, “Predicting Eye Fixations using Convolutional Neural Networks”, in CVPR2015. Mr-CNN(multi resolution)を用いた Saliency Map の生成. 三段階のスケールから人物が凝視する領域を学習し,saliency map を生成する. 実験結果 Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Predicting_Eye_Fixations_2015_CVPR_paper.pdf
  • 3.
    【102】 Sheng Huang, MohamedElhoseiny, Ahmed Elgammal and Dan Yang, “Learning Hypergraph-regularized Attribute Predictors”, in CVPR2015. Attribute learning フレームワーク(Hypergraph-regularzed Attributte Predictor: HAP)の提案. HAP は ・attribute 間の相関性を考慮していない ・attribure 学習においてサイド情報が活用されていない といった問題に対処している. HAP の処理は以下の通り. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Huang_Learning_Hypergraph- Regularized_Attribute_2015_CVPR_paper.pdf 【プロジェクトページ(コードあり)】 https://sites.google.com/site/siteshuang/home/project/hap
  • 4.
    【103】 D. Stamos, S.Martelli, M. Nabi, “Learning with Dataset Bias in Latent Subcategory Models”, in CVPR2015. Latent Subcategory Models (LSMs)は潜在的なサブカテゴリを学習する概念であり,識別に有効な手法となっている.しかし,局所最適化された 識別モデルや目的関数,さらにはデータの増加により複雑化するモデルを捉える必要が出てくる.これらの問題を解決するため提案手法では データセットに内在する複数のバイアスを多タスク学習の課題と捉えてモデリングする.下は概念図であり,例えば二つのデータセット間(赤 と青に色分け)のクラス(例:犬)を複数のサブカテゴリ(例:3 視点の画像)により捉える.多タスク学習によりこれらの性質を捉える. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Stamos_Learning_With_Dataset_2015_CVPR_paper.pdf
  • 5.
    【104】 T.-T. Do, Q.D. Tran, N.-M. Cheung, “FAemb: a fuction approximation-based embedding method for image retrieval”, in CVPR2015. 画像の局所特徴(e.g. SIFT)を用いた高次元表現について.この問題に関しては VLAD や TLCC が有名な手法として挙げられる.VLAD はベク トルの分布を捉えてボロノイ図により空間を分割するのに対して TLCC は非線形関数を用いて高次元空間を近似することが目的である. TLCC では非線形関数は 1 次の特徴として設定されているが,提案手法ではこの表現をより高次にする.Holidays dataset や Oxford5k dataset を 用いた結果は下の表のようになった.VLAD や Fisher vector と比較しても精度が向上している. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Do_FAemb_A_Function_2015_CVPR_paper.pdf
  • 6.
    【105】 Johannes Hofmanninger, GeorgLangs, “Mapping Visual Features to Semantic Profiles for Retrieval in Medical Imaging”, in CVPR2015. 医療画像において,どのような症状となっているかを推定する手法. 複数のサンプル画像と,それのレポートから簡単なラベル付けを行い,その画像のどこにラベルが付加されるかを学習する.そして,一番多 いラベルの症状を結果として出力する. Link(s) 【論文ページ】 http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Hofmanninger_Mapping_Visual_Features_2015_CVPR_paper.pdf 【著者ページ】 http://www.cir.meduniwien.ac.at/team/johannes-hofmanninger/
  • 7.
    【106】 Daniel Pr ˚uša,“Graph-based Simplex Method for Pairwise Energy Minimization with Binary Variables”, in CVPR2015. グラフ理論ベースの pairwise エネルギー最小化問題. 左図は,エネルギー最小化グラフ,右図はサブグラフ.灰色はルートの主要な要素となっている 実験の結果,処理を大幅に高速化することができた. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Prusa_Graph- Based_Simplex_Method_2015_CVPR_paper.pdf
  • 8.
    【107】 D. Turmukhambetov, N.D. F. Campbell, S. J. D. Prince, J. Kautz, “Modeling Object Appearance using Context-Conditioned Component Analysis”, in CVPR2015. 論文では,画像のアラインメントを補正する部分空間モデルを提案する.物体間から取得・共有した形状特徴により,複雑な形状に対応して もモデリングできることが判明した.下図は上から(1 行目)トレーニングセット,(2 行目)トレーニングセットの復元結果,(3-5 行目)別種のネ コの姿勢変化の結果である. Link(s) 論文ページ: http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Turmukhambetov_Modeling_Object_Appearance_2015_CVPR_paper.pdf
  • 9.
    【108】 C. Li, L.Lin, W. Zuo, S. Yan, J. Tang, “SOLD: Sub-Optimal Low-rank Decomposition for Efficient Video Segmentation”, in CVPR2015. 低ランク近似を適用した映像に対するセグメンテーション.現在までの映像に対するセグメンテーションは low-level の特徴量を用いていて精 度が良くないことや,時系列のフレームであるということを活かしきれていなかったと指摘.そこで,時系列の画像列を長期のボクセルデー タとみなして処理する必要があるとした.提案手法では Sub-Optimal Low-rank Decomposition (SOLD)を適用して映像に対するセグメンテーショ ンを実行する.ここでは superpixel の代わりに supervoxel を用いる.データを 6(x)x6(y)x6(t)のボクセルデータとして扱い,拡張ラグランジュ 関数や Linearized 拡張ラグランジュ関数により低ランク近似の式を解く.SOLD は部分最適化や非凸最適化の問題として扱われている.下図 は比較実験の一例である.(a)が入力画像,(f)が正解,(e)が SOLD の最適化によるセグメンテーション結果である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_SOLD_Sub-Optimal_Low-rank_2015_CVPR_paper.pdf
  • 10.
    【109】 N. Savinov, L.Ladicky, C. Hane, M. Pollefeys, “Discrete Optimazation of Ray Potentials for Semantic 3D Reconstruction”, in CVPR2015. 密な 3 次元再構成(dense 3D reconstruction)は困難な課題であるが,ボクセルのラベリング問題として捉えることができる.提案手法では主に体 積表現(volumetric representation)を用いることであるが,データのコストを抑える必要が生じる.この 3 次元データの最適化を行うために,1. 多項式によりポテンシャルを表現, 2. 高次の劣モジュラポテンシャルを用いてパラメータを追加, 3. 高次の劣モジュラポテンシャルの pairwise のグラフ構造化, 4.構造化された計算パラメータを統合, 5. 3 次元データを正規化.下図は入力,距離画像,semantic segmentation,3 次元再構成 の例である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Savinov_Discrete_Optimization_of_2015_CVPR_paper.pdf
  • 11.
    【110】 A. Pentina, V.Sharmanska, C. H. Lampert, “Curriculum Learning of Multiple Tasks”, in CVPR2015. Curriculum Learning は機械学習の概念であり,簡単なタスクから学習し次に一般的な学習をしたほうが精度が良くなるという方法である.(人 間でも簡単な問題を解いて応用問題を解く) 提案手法では,多タスク学習を適用して靴の認識を行うが Curriculum Learning の概念も同時進行 させて学習を効率的にする. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Pentina_Curriculum_Learning_of_2015_CVPR_paper.pdf SlideShare: http://www.slideshare.net/YoshitakaUshiku/20150530-kantocv-curriculumlearning
  • 12.
    【111】 Hangfan Liu, RuiqinXiong, Jian Zhang and Wen Gao, “Image Denoising via Adaptive Soft-Thresholding Based on Non-Local Samples”, in CVPR2015. 信号モデルと緩い閾値で denoise する手法 画像に発生しているノイズを,信号としてモデル化する. 信号の係数を求めたら,緩い閾値を設けてそれを除去する. ノイズ除去結果が以下の通り. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Image_Denoising_via_2015_CVPR_paper.pdf
  • 13.
    【112】 Gottfried Graber, JonathanBalzer, Stefano Soatto, Thomas Pock, “Efficient Minimal-Surface Regularization of Perspective Depth Maps in Variational Stereo”, in CVPR2015. ステレオマッチングにおいて正則化を最適化することで 3D 再構成の精度を向上している. 従来,分散モデルは Total Variation(TV)正則化されていた. しかし,この論文では Total Generalized Variation (TGV)にすることで,最適化している. これは,ステレオマッチングの本質的な問題にチャレンジしている. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Graber_Efficient_Minimal- Surface_Regularization_2015_CVPR_paper.pdf 【プロジェクトページ(コードあり(python))】 http://gpu4vision.icg.tugraz.at/index.php?expand=e,c,c,c,c,c,c,c,c,c,c,c,c,c,c,c,c&content=Cat_4#pub96
  • 14.
    【113】 Gottfried Graber, JonathanBalzer, Stefano Soatto, Thomas Pock, “Efficient Minimal-Surface Regularization of Perspective Depth Maps in Variational Stereo”, in CVPR2015. NP-hard 問題に対して,グラフィカルモデルを用いて最適化している. 実験により,処理の高速化が見受けられる. Link(s) 【論文ページ】 http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Shekhovtsov_Maximum_Persistency_via_2015_CVPR_paper.pdf 【プロジェクトページ(コードあり(MATLAB))】 http://cmp.felk.cvut.cz/~shekhovt/persistency/
  • 15.
    【114】 A. Davis, K.L. Bouman, J. G. Chen, M. Rubinstein, F. Durand, W. T. Freeman, “Visual Vibrometry: Estimating Material Properties from Small Motions in Video”, in CVPR2015. 材料の性質(Material Properties)はシーン認識にとって重要な課題である.振動メカニズムの解析により,この材質の把握を実現する.そのため に,微小な画像のモーションを解析する.下図は提案のフローであり,(A) 複数の生地やロッドを部屋の音や空気による振動を利用して計測 する.(B) 材質や密度により並べた例.(C) 画像からの観測により周波数やスペクトル解析.実験の結果,材質と解析の結果に高い相関値があ ることが判明した.詳細はビデオ参照. Link(s) 論文ページ: http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Davis_Visual_Vibrometry_Estimating_2015_CVPR_paper.pdf プロジェクトページ: http://www.visualvibrometry.com/ YouTube: https://www.youtube.com/watch?v=5apFqYEx5ew データセット: http://www.visualvibrometry.com/cvpr2015/dataset.html
  • 16.
    【115】 Z. Liao, K.Karsch, D. Forsyth, “An Approximate Shading Model for Object Relighting”, in CVPR2015. 影の推定と光源の生成は重要な課題に位置付けられている.図 1 では入力から形状,影推定を行い,光源を生成する処理を示している.提案 手法を利用して,図 2 のように新しい物体を自然に画像中に合成することができる. 図 1 図 2 Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liao_An_Approximate_Shading_2015_CVPR_paper.pdf
  • 17.
    【116】 Xiaochun Cao, ChangqingZhang, Huazhu Fu, Si Liu, Hua Zhang,, “Diversity-induced Multi-view Subspace Clustering ”, in CVPR2015. multi-view クラスタリングで,情報を逐次的に補完していく手法(DiMSC). 従来手法は,multi-view data を,個別のものとして見なしていたが,欠損している情報を補完的にすることで,クラスタリングの精度を向上 している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Cao_Diversity-Induced_Multi- View_Subspace_2015_CVPR_paper.pdf
  • 18.
    【117】 Zuzana Kukelova, JanHeller, Martin Bujnak, Tomas Pajdla, “Radial Distortion Homography”, in CVPR2015. より少ない情報でホモグラフィを推定する. これを解決するため,2 つのアルゴリズムを提案する. (i)5 点のマッチングポイントのみで,H5λ1λ2 :Grobner をベースに非線形な多項式を推定する. (ii)H6λ1λ2:6 点のマッチングポイントで 6 つの線形式を解く. Link(s) 【論文ページ】 http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Kukelova_Radial_Distortion_Homography_2015_CVPR_paper.pdf
  • 19.
    【118】 Jianping Shi, LiXu‡ , Jiaya Jia, “Just Noticeable Defocus Blur Detection and Estimation”, in CVPR2015. ブラーを検出・推定するための Just Noticeable Dedocus(JND)特徴の提案. 図の赤枠が焦点,青枠がブラー(ぼけている)領域. 関数を組み合わせてエッジを表現する. クリア領域はエッジが明確なので,組み合わせる関数が多くなる. 一方,ブラー領域は少ない関数で表現できる. こうした違いから,クリア領域とブラー領域を検出・推定している.
  • 20.
  • 21.
    【119】 Hang Yang, MingZhu, Yan Niu, Yujing Guan, Zhongbo Zhang, “Dual Domain Filters based Texture and Structure Preserving Image Non-blind Deconvolution”, in CVPR2015. Defocused 画像の品質を向上させる課題. Rolling guidance filter と short-time Fourier transform(STFT)を統合する. はじめに,rolling guidance filter を用いてノイズ除去したハイコントラスト領域を求める. 次に,ローコントラスト画像を抽出することによって,エネルギー関数を最小化させる(STFT). 最後に,2 つのノイズ除去した画像を足し合わせることで,オリジナル画像と近似させる. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Yang_Dual_Domain_Filters_2015_CVPR_paper.pdf
  • 22.
    【120】 Xuan Dong, BoyanBonev, Yu Zhu, Alan L. Yuille, “Region-based Temporally Consistent Video Post-processing ”, in CVPR2015. 画像の品質を,領域ごとに向上させる手法の提案. 逆光になっている部分などを補正する手法は,従来は画像全体で行われてきた. しかし,逆光部分のみを抽出して,そこだけ直せばより効率化され,必要な情報のみを抽出できるのではないか. 本手法では,super pixel で領域を分割した後に,領域間の対応関係を推定する.そして,領域の画像品質を調整する. 手法の結果 Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Dong_Region- Based_Temporally_Consistent_2015_CVPR_paper.pdf
  • 23.
    【121】 Shaoqing Ren, XudongCao, Yichen Wei, Jian Sun, “Global Refinement of Random Forest ”, in CVPR2015. 学習済み Random Forests のリファインメント手法. いらない枝を切ることで高精度・省メモリ化し,RFs を SVM や SVR のように扱う. RFs がバイナリ特徴と重みの積和であることに着目し,構造をそのままで重みを変えている. その中で,重みの小さい枝を省いている. 実験では,kinect の部位認識や顔年齢推定を行っており,いずれも精度向上している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ren_Global_Refinement_of_2015_CVPR_paper.pdf 【スライドシェア】 http://www.slideshare.net/akisatokimura/cvpr2015-reading-understainding-image-virality-in-japanese-50914712
  • 24.
    【122】 Mohammad Rastegari, HannanehHajishirzi, Ali Farhadi, “Discriminative and Consistent Similarities in Instance-Level Multiple Instance Learning ”, in CVPR2015. Discriminative で consistent な類似尺度を導入した MIL. 下図において,緑線のアイテムは差別的(discriminative)かつ一貫性(consistents)がある.オレンジの線は,一貫性はあるが識別的でない.紫の線 は,差別的であるが一貫性がない. Link(s) 【論文ページ】 http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Rastegari_Discriminative_and_Consistent_2015_CVPR_paper.pdf
  • 25.
    【123】 Yao Xiao, CewuLu, Efstratios Tsougenis, Yongyi Lu, Chi-Keung Tang , “Complexity-Adaptive Distance Metric for Object Proposals Generation ”, in CVPR2015. 物体検出のための super pixel のグルーピング手法. 下図のように,単純な色の場合は識別しやすいが,色が複雑に折り合っている場合,平均をとると本来とは全く異なる色となる.これが原因 で,super pixel のグルーピングが失敗する可能性がある. 2 つの super pixel 間で最も距離の遠い組み合わせと,最も距離の近い組み合わせを抽出し,グルーピングする. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Xiao_Complexity- Adaptive_Distance_Metric_2015_CVPR_paper.pdf 【プロジェクトページ】 http://www.cse.ust.hk/~yxiaoab/cvpr2015/CADM.html
  • 26.
    【124】 X. Chen, A.Ritter, A. Gupta, T. Mitchell, “Sense Discovery via Co-Clustering on Images and Text”, in CVPR2015. ある名詞句に引用される単語はどのくらいあるのか?提案手法では,ある単語と関連する画像を抽出する.下図では,Columbia や Apple とい う NP とそれに関連する画像を検索している.Columbia であれば地名や人物,コロンビア大学,メーカーなどの関連するものが抽出される. このような取り組みのことを”Sense Discovery”と呼んでいる.実験では 30 種類の NP,各クラス数百枚の画像が含まれている. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Chen_Sense_Discovery_via_2015_CVPR_paper.pdf プロジェクトページ: http://www.cs.cmu.edu/~xinleic/poly.html
  • 27.
    【125】 Xian-Ming Liu, RongrongJi, Changhu Wang, Wei Liu, Bineng Zhong, Thomas S. Huang,”Handling Motion Blur in Multi-Frame Super-Resolution”, in CVPR, 2015. 複数フレームでの超解像技術(MFSR)において重要な問題であるモーションブラーへの対策の提案. モーションブラーの性質と勾配強度に着目して推定をし,モデル化. ノイズにも強い手法であることが述べられている. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ma_Handling_Motion_Blur_2015_CVPR_paper.pdf
  • 28.
    【126】 D. Gong, Z.Li, D. Tao, J. Liu, X. Li, “A Maximum Entropy Feature Descriptor for Age Invariant Face Recognition”, in CVPR2015. 年齢変化に対して頑健な顔特徴(AIFR; Age Invariant Face Recognition)の研究.本論文ではこの問題に対して,Maximum Entropy Feature Descriptor (MEFD)と呼ばれる特徴量や Identify Factor Analysis (IFA)と呼ばれるマッチング手法を提案して、AIFR の問題解決に貢献した.下は 木構造ベースのエンコーディング手法である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Gong_A_Maximum_Entropy_2015_CVPR_paper.pdf 著者ページ: http://www.cise.ufl.edu/~dihong/cv.html
  • 29.
    【127】 Y. Verdie, K.M. Yi, P. Fua, V. Lepetit, “TLIDE: A Temporarlly Invariant Learned DEtector”, in CVPR2015. 天気や照明の影響に頑健なキーポイントマッチングの提案.学習ベースのキーポイントマッチングを提案する.識別的損失・形状正規化項・ 時系列の正規化項を最小化することでマッチングを実現する.下図は SURF(左)と比較している図であり,ある場所の夜の画像と昼の画像をキ ーポイントマッチングしている.SURF では特徴的なポイントに対して集中的にマッチングしているが,同じ数のキーポイントを提案手法に よりマッチングさせたところ,グローバルにキーポイントをマッチングできた. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Verdie_TILDE_A_Temporally_2015_CVPR_paper.pdf プロジェクトページ(コード,データ,動画あり): http://cvlab.epfl.ch/research/tilde
  • 30.
    【128】 Y. Jin, C.-S.Bouganis, “Robust Multi-Image Based Blind Face Hallucination”, in CVPR2015. 複数画像からの顔画像の再構成問題.超解像画像として再構成するために,提案手法では PCA による部分空間を適用するが,ここではさらに Mixture Probabilistic PCA (MPPCA)を用いて事前情報としている.下図は復元された例である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Jin_Robust_Multi-Image_Based_2015_CVPR_paper.pdf
  • 31.
    【129】 Miguel Á. Carreira-Perpiñán,Ramin Raziperchikolaei, “Hashing with Binary Autoencoders”, in CVPR2015. 高次元ベクトルを binary hashing によって次元削減する. この手法は 2step で構成されている. (1)hash 関数を学習し,それを出力する.(filter) (2)最適解を得るために,hash 関数を最適化する(wrapper) 実験の結果は以下の通り Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Carreira- Perpinan_Hashing_With_Binary_2015_CVPR_paper.pdf
  • 32.
    【130】 Masaki Saito, TakayukiOkatani , “Transformation of Markov Random Fields for Marginal Distribution Estimation”, in CVPR2015. MRF をより単純に変換することによって,marginal inference problem を解決する. 関数をすべて使うのではなく,離散化することで情報量を削減する.(discretization) そして,それぞれのラベルをグルーピングする(grouping) 以上の設計をし,荒い MRF を構築する. 実験の結果,速度の向上が見受けられる. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Saito_Transformation_of_Markov_2015_CVPR_paper.pdf
  • 33.
    【131】 Olga Veksler, “EfficientParallel Optimization for Potts Energy with Hierarchical Fusion ”, in CVPR2015. Potts energy を最小化させる graph-cut 手法の提案. 階層的な並列化をすることにより,解決している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Saito_Transformation_of_Markov_2015_CVPR_paper.pdf
  • 34.
    【132】 A. Kovnatsky, M.M. Bronstein, Xavier Bresson, and Pierre Vandergheynst, “Functional correspondence by matrix completion”, in CVPR2015. Geometric matrix completion として,機能の対応付けを行う. 平滑化,位置合わせ,簡易化をし,機能マップを生成している.さらに,manifold を最適化している. Link(s) 【論文ページ】 http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Kovnatsky_Functional_Correspondence_by_2015_CVPR_paper.pdf
  • 35.
    【133】 Eunwoo Kim, MinsikLee, and Songhwai Oh, “Elastic-Net Regularization of Singular Values for Robust Subspace Learning ”, in CVPR2015. 頑健な subspace 学習のための elastic-net 正則化. 低ランク行列と sparse 行列を,convex envelopes の基づいた問題に分割している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Kim_Elastic-Net_Regularization_of_2015_CVPR_paper.pdf
  • 36.
    【134】 R. Litman, S.Korman, A. Bronstein, S. Avidan, “Inverting RANSAC: Global Model Detection via Inlier Rate Estimation”, in CVPR2015. Inlier と outlier が混合しているサンプリングから効果的に inlier を抽出する例として RANSAC があげられる.RANSAC ではまずランダムにサ ンプルを選び,試行を繰り返すことで inlier の含有率を高めるが,提案手法はその逆で,inlier の rate をまずデータから求め,エラーを最小化 する仕組みである.下図がその概念図であり,効果的にエラーが最小化される.提案手法では幾何学的な変換に対して効果的なサンプリング ,グローバルに inlier を求めることができる,外的な検出がなくてもマッチングの inlier の含有率を計算できることがコントリビューションと してあげられる. Link(s) 論文ページ: http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Litman_Inverting_RANSAC_Global_2015_CVPR_paper.pdf
  • 37.
    【135】 N. Li, B.Sun, J. Yu, “A Weighted Sparse Coding Framework for Saliency Detection”, in CVPR2015. Color, texture, depth など複数の空間において顕著性マップを実行するための辞書(dictionary)を生成.辞書には saliency/non-saliency な特徴が抽出 されており,superpixels の領域をベースとして構築される.特徴空間は複数のバリエーション-- 色空間,テクスチャ,focusness,視差画像, 4D light field を適用している. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_A_Weighted_Sparse_2015_CVPR_paper.pdf
  • 38.
    【136】 M. Schoeler, J.Papon, F. Worgotter, “Constrained Planar Cuts- Object Partitioning for Point Clouds”, in CVPR2015. 3 次元物体のポイントクラウドデータに対してパーツの分割を実行する論文.左図のように(A) supervoxel データとして変換.(B) Supervoxel adjacency graph を適用して convex(凸形状)/ concave (凹形状)の位置を推定する.(C)肩の位置などは複数の convex が発生してしまい複雑な領域 であるが,データドリブンの手法により分割を高精度にする.右図は段階を追って分割した例である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Schoeler_Constrained_Planar_Cuts_2015_CVPR_paper.pdf 著者ページ: http://www.dpi.physik.uni- goettingen.de/cns/index.php?mact=Profilliste,cntnt01,default,0&cntnt01what=Mitarbeiter&cntnt01alias=Schoeler&cntnt01returnid =65
  • 39.
    【137】 X. Liu, R.Ji, C. Wang, W. Liu, B. Zhong, T. S. Huang, “Understanding Image Structure via Hierarchical Shape Parsing”, in CVPR2015. 画像内構造の把握は物体候補領域抽出のための重要な課題として位置づけられている.下図は画像の意味的な解析であり,左がエッジ解析, 右がアピアランスによる解析である.階層的な構造をツリーモデルにより表現している.親ノードと子ノードの関係性を保存するような解析 が重要である.ここでは Hierarchical Edge Tree と呼ばれるツリーモデルを構築することとして,Markov Process をベースとしてエッジやアピ アランスを参照することで階層構造化する.ツリーモデルのノードに対して候補領域を割り当てていく. Link(s) 論文ページ: http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Liu_Understanding_Image_Structure_2015_CVPR_paper.pdf
  • 40.
    【138】 Da Kuang, AlexGittens, Raffay Hamid, “Hardware Compliant Approximate Image Codes ”, in CVPR2015. ハードウェアへの負担を考慮した符号化手法. 従来の符号化は,1 つの特徴点からの距離を算出していた.しかし,これでは計算時間が大きく,ハードウェアに負担を与える.そこで,ク ラスタリングしたその中心からの距離を求める.さらに,全探索ではなく,一定の範囲内の点とのみ距離を算出する. 実験の結果,精度をやや向上させながら,速度も 40 倍近く高速にしている. Link(s) 【論文ページ】 http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Kuang_Hardware_Compliant_Approximate_2015_CVPR_paper.pdf
  • 41.
    【139】 A. Chatterjee, V.M. Govindu, “Photometric Refinement of Depth Maps for Multi-albedo Objects”, in CVPR2015. 3D 再構成のための Photometric 手法の改良. Depth camera で取得した depth map に対して,multi-albedo を考慮して再構成する. Link(s) 【論文ページ】 http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Chatterjee_Photometric_Refinement_of_2015_CVPR_paper.pdf
  • 42.
    【140】 Christoph H. Lampert,“Predicting the Future Behavior of a Time-Varying Probability Distribution ”, in CVPR2015. 事変量から未来を予測する extrapolating the distribution dynamics(EDD)の提案. Emprical embedding を通して Hilbert 空間に特徴をプロットする.その際,特徴の相関を取ることにより,reproduction kernel Hilbert space(RKHS)に変換する. RKHS での事変量を解析し,予測する. 将来的には,車の進化を学習し,未来の車を予測することも検討している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Lampert_Predicting_the_Future_2015_CVPR_paper.pdf
  • 43.
    【141】 Anna Khoreva, FabioGalasso, Matthias Hein, Bernt Schiele, “Classifier Based Graph Construction for Video Segmentation ”, in CVPR2015. グラフベースで video segmentation する手法の提案. 実現するために, 1.feature extraction:外観特徴,モーション特徴,形状特徴を組み合わせた super pixel 特徴 2.graph construction:2 つの super pixel 間の重みエッジを算出 3.graph partitioning:複数の特徴を組み合わせた learnt graph を導入している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Khoreva_Classifier_Based_Graph_2015_CVPR_paper.pdf
  • 44.
    【142】 Hosnieh Sattar, SabineMüller, Mario Fritz, Andreas Bulling, “Prediction of Search Targets From Fixations in Open-World Settings ”, in CVPR2015. Open world の中で,人の凝視から検索対象を予測する. 閉じた世界では,人が探している対象を見分けるのはある程度絞れるが,open world ではそうはいかない.教師なしで視点の凝視対象を学習 している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Sattar_Prediction_of_Search_2015_CVPR_paper.pdf
  • 45.
    【143】 Dongliang Cheng1 ,Brian Price2 , Scott Cohen2 , Michael S. Brown1 , “Effective Learning-Based Illuminant Estimation Using Simple Features”, in CVPR2015. Simple な特徴で回帰木を生成する色推定の手法. 特徴は RGB の平均値や明るさといった単純なものを用いている. 図に示す 4 つの特徴から回帰木を生成し,回帰したメディアンをとることで色補正している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Sattar_Prediction_of_Search_2015_CVPR_paper.pdf
  • 46.
    【144】 Yu Kong,Yun Fu,Wei Liu,”Bilinear Heterogeneous Information Machine for RGB-D Action Recognition”, in CVPR, 2015. RGB-D カメラで動作判別を行う. RGB データと Depth データは異なる特徴空間を持つため一緒くたにして特徴を計算できないが,それぞれのパラメータ行列を用い,両者の時 空間的な関係に着目することでクロスモーダルな特徴を計算する. 2 つのデータセットでの実験が行われ,うち1つでは Accuracy が 100%と非常に高精度. Link(s) 論文ページ: http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Kong_Bilinear_Heterogeneous_Information_2015_CVPR_paper.pdf
  • 47.
    【145】 X. Liu, X.Wu, J. Zhou, D. Zhao, “Data-driven Sparsity-based Restoration of JPEG-compressed Images in Dual Transform-Pixel Domain”, in CVPR2015. 画像復元をする際に,信号処理 DCT による方法(DCT domain learning),JPEG 圧縮の仕組みを用いる方法(pixel domain learning)という dual domain 学習を採用した. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Data-Driven_Sparsity- Based_Restoration_2015_CVPR_paper.pdf
  • 48.
    【146】 Pedro Rodrigues1 ,João P. Barreto1,2, “Single-Image Estimation of the Camera Response Function in Near-Lighting”, in CVPR2015. Camera Response Function を単眼画像から推定する手法. アルベド(反射光の比)を,2 つの色領域で解析し,表面の単眼画像から CRF を推定している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Rodrigues_Single- Image_Estimation_of_2015_CVPR_paper.pdf
  • 49.
    【147】 X. Li, M.Larson, A. Hanjalic, “Pairwise Geometric Matching for Large-scale Object Retrieval”, in CVPR2015. 画像中からのマッチングを,pairwise に実行する.下の図では複数のマッチングされた特徴点の拘束からグローバルの回転やスケール,特徴 ベクトルを評価する. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Pairwise_Geometric_Matching_2015_CVPR_paper.pdf
  • 50.
    【148】 T. Ajanthan, R.Hartley, M. Salzmann, H. Li, “Iteratively Reweighted Graph Cut for Multi-label MRFs with Non-convex Priors”, in CVPR2015. MRF において,マルチラベルの非凸関数最適化は非常に困難な最適化問題である.従来法として graph cut ベースのアルゴリズムが存在する が,依然として困難な課題である.提案手法ではこの最適化を,エネルギー関数の代替を考案してより単純な最小化手法にすることで最適化 問題を解決する.IRLS アルゴリズムが連続的な最適化問題に適用されているが,この戦略を MRF に取り入れることが新規性である.下図は マルチラベルのグラフ制約である. Link(s) 論文ページ: http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Ajanthan_Iteratively_Reweighted_Graph_2015_CVPR_paper.pdf
  • 51.
    【149】 K. Jiang, Q.Que, B. Kulis, “Revisiting Kernelized Locality-Sensitive Hashing for Improved Large-Scale Image Retrieval”, in CVPR2015. ハッシングの分野にて Kernelized Locality Sensitive Hashing (KLSH)を提案.KLSH は approximate nearest-neighbor(近似的 NN 法)を採用しており ,カーネルとしては Reproducing Kernel Hilbert Space (RKHS)を用いている.KLSH に対して Low-rank 表現や Monotone Transformation も施して おり,表は Recall による各精度である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Jiang_Revisiting_Kernelized_Locality- Sensitive_2015_CVPR_paper.pdf
  • 52.
    【150】 M. Lam, J.R. Doppa, S. Todorovic, T. G. Dietterich, “HC-Search for Structured Prediction in Computer Vision”, in CVPR2015. 自然言語処理で有効な手法である HC-Search を用いて意味的セグメンテーション(semantic segmentation)を実行する.下図が提案手法の概要で ある. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Lam_HC-Search_for_Structured_2015_CVPR_paper.pdf
  • 53.