SlideShare a Scribd company logo
cvpaper.challenge
Twitter@CVPaperChalleng
http://www.slideshare.net/cvpaperchallenge
【51】
B. Ham, M. Cho, J. Ponce, “Robust Image Filtering Using Joint Static and Dynamic Guidance”, in CVPR2015.
Computer Vision と Computational Photography の技術を統合したフィルターを提案する.画像フィルタは非凸最適化(nonconvex optimization)を適
用しており,majorization-minimization algorithm を適用する.下図はフィルタリングの例であり,(c)の入力から(d)や(e)の平滑化結果を得る.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ham_Robust_Image_Filtering_2015_CVPR_paper.pdf
プロジェクトページ(コードあり):
http://www.di.ens.fr/willow/research/sdfilter/
【52】
G. Paikin, A. Tal, “Solving Multiple Square Jigsaw Puzzles with Missing Piece”, in CVPR2015.
Jigsaw Puzzle を解くように画像復元を行う問題.提案手法は[Pomeranz+, CVPR2011]の手法にインスパイアされてその改善に取り組んだ.ある
パーツが無くなっていてもその他全ての画像を復元することに成功し,複数の Jigsaw Puzzle を同時に解くことにも成功している.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Paikin_Solving_Multiple_Square_2015_CVPR_paper.pdf
プロジェクトページ:
http://webee.technion.ac.il/people/ayellet/Abstracts/15-PT.html
著者ページ:
http://webee.technion.ac.il/people/ayellet/papers.html
【53】
B. Klein, L. Wolf, Y. Afek, “A Dynamic Convolutional Layer for Short Range Weather Prediction”, in CVPR2015.
Convolutional neural networks (CNN)を用いた,気象予報(weather prediction).Dynamic Convolutional Layer という新しい畳み込み層を提案(図 1).
前畳み込み層から特徴マップを抽出し,次の層の畳み込みに反映させる.Tel Aviv dataset(図 2)に対して予測をした結果,通常の畳み込み層を
用いた CNN よりも,Dynamic Convolutional Layer の方が高い精度での予測を実現した.
図 1
図 2
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Klein_A_Dynamic_Convolutional_2015_CVPR_paper.pdf
著者ページ:
http://www.cs.tau.ac.il/~wolf/
【54】
Xiaochuan Fan, Kang Zheng, Yuewei Lin, Song Wang, “Combining Local Appearance and Holistic View: Dual-Source Deep
Neural Networks for Human Pose Estimation ”, in CVPR2015.
局所的なパッチと全身の 2 つの CNN 特徴を組み合わせた pose 推定手法.
局所的なパッチと全身の画像から CNN 特徴を抽出し,学習しておく.
実験結果において,有効な結果が出ている.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Fan_Combining_Local_Appearance_2015_CVPR_paper.pdf
【55】
Jiyan Pan, Martial Hebert, Takeo Kanade, “Inferring 3D Layout of Building Facades from a Single Image ”, in CVPR2015.
Single image からビルなどの 3D レイアウトを推定する手法.
画像から直線を大量に検出し,3D 世界を構成する xyz 軸を推定する.そして,その軸にマッチングする建物の直線から面を推定し,3D レイ
アウトを推定している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Pan_Inferring_3D_Layout_2015_CVPR_paper.pdf
【56】
Junho Yim, Heechul Jung, ByungIn Yoo , Changkyu Choi, Dusik Park, Junmo Kim, “Rotating Your Face Using Multi-task Deep
Neural Network”, in CVPR2015.
一枚の顔画像から,それを回転させた画像を生成する.
Deep Learning の層を特徴抽出,回転,画像化,再構成の 4 段階に分割している.
回転角度は-60~60[deg]まで対応している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Yim_Rotating_Your_Face_2015_CVPR_paper.pdf
【57】
Zhibin Hong , Zhe Chen, Chaohui Wang, Xue Mei, Danil Prokhorov, Dacheng Tao, “MUlti-Store Tracker (MUSTer): a Cognitive
Psychology Inspired Approach to Object Tracking”, in CVPR2015.
AtkinsonShiffrin Memory Model (ASMM)に基づいた物体追跡.
入力画像から特徴量と特徴点を抽出し,特徴点をマッチングする.マッチングの精度を上げるため,RANSAC でノイズを除去し,追跡する.
その追跡した情報を用いて特徴量をフィルタリングし,より頑健な追跡を可能にしている.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Hong_MUlti-
Store_Tracker_MUSTer_2015_CVPR_paper.pdf
【プロジェクトページ】
https://sites.google.com/site/zhibinhong4131/Projects/muster
【58】
C. S. Mathialagan, A. C. Gallagher, D. Batra, “VIP: Finding Important People in Images”, in CVPR2015.
画像の中の複数人物の中で,だれが VIP(最重要人物)かを当てる問題.im2text を用いており,image-level importance や corpus-level importance
に分類して問題を解いている.感覚的には,用意したデータから顔を抽出して,特徴抽出により 1-by-1 の attribute を計算している.特徴量と
して計算されたのは,scale, sharpness, face pose features, aspect ratio, face occlusion, DPM face scores, face detection success などである.表は実験結
果であり,人がタグ付けした結果(71.43%)と提案手法(57.14%),その他の手法に分けている.
Link(s) 論文ページ:
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Mathialagan_VIP_Finding_Important_2015_CVPR_paper.pdf
プロジェクトページ:
https://computing.ece.vt.edu/~mclint/vip/
デモ:
http://cloudcv.org/vip/
【59】
M. Jaberi, M. Pensky, H. Foroosh, “SWIFT: Sparse Withdrawal of Inliers in a First Trial”, in CVPR2015.
RANSAC のような multiple model instances detection は対応点を求める上で重要な課題となっている.論文ではサンプリングステップに着目し
ており,Sparse Withdrawal of Inliers in a First Trial (SWIFT)と呼ばれるクラスタリングベースの手法を提案する.Mean-shift のような教師なしク
ラスタリングを用いることにより,複数の物体を同時に含んでいても一度にサンプリング点を把握する方法である.下図は(a)segmented の画
像からサンプリング点をも t メタ結果である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Jaberi_SWIFT_Sparse_Withdrawal_2015_CVPR_paper.pdf
【60】
Guilin Liu, Yotam Gingold, Jyh-Ming Lien , “Continuous Visibility Feature ”, in CVPR2015.
新しい特徴(Continuous Visibility Feature)の提案.
ある頂点から別の頂点まで,”視える”かどうかを特徴量としている.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Continuous_Visibility_Feature_2015_CVPR_paper.pdf
【プロジェクトページ】
http://masc.cs.gmu.edu/wiki/CVF
【61】
Abhijit Bendale, Terrance Boult , “Towards Open World Recognition ”, in CVPR2015.
従来の認識は,データセット内のラベルのみを認識している.しかし,実際には未知なものに遭遇する可能性は十分あるため,より開けた世
界を認識する必要がある.この課題を Open World Recognition と呼ぶ.
この課題を解決するため,Nearest Non-Outlier(NNO)アルゴリズムを提案している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Bendale_Towards_Open_World_2015_CVPR_paper.pdf
【62】
Pedro O. Pinheiro, Ronan Collobert, “From Image-level to Pixel-level Labeling with Convolutional Networks ”, in CVPR2015.
CNN を用いて,画像からピクセルレベルでラベル付する手法.
簡単なラベルだけを付加した画像から CNN 特徴を抽出し,画像レベルで学習する.
その結果をピクセルレベルでラベル付けする.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Pinheiro_From_Image-Level_to_2015_CVPR_paper.pdf
【63】
S. Kolouri, G. K. Rohde, “Transport-Based Single Frame Super Resolution of Very Low Resolution Face Images”, in CVPR2015.
超低解像(16x16pixles)の顔画像を入力とした超解像に関する研究.非線形の Lagrangian モデルによりこの問題を解決する.下図は提案手法の
流れである.(i)では各画像の顔パーツの配置(displacement)を覚えさせておく.(ii)では主成分(principal components)空間を生成する.(iii)入力の
顔画像と計算した主成分から各パラメータを計算.(iv)にて超解像のサンプルを計算する.(iv)の(a), (g)がそれぞれ低解像/高解像のペアであり
,(f)が提案手法による超解像結果,他が比較手法である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Kolouri_Transport-
Based_Single_Frame_2015_CVPR_paper.pdf
著者ページ:
http://www.andrew.cmu.edu/user/skolouri/Index.html
【64】
T. Liu, G. Wang, Q. Yang, “Real-time part-based visual tracking via adaptive correlation filters”, in CVPR2015.
相関ベースフィルタ(correlation filter)による追跡は CV 分野における適用例が増加しているが,オクルージョンの場面への対策が不十分であっ
た.提案手法では部位毎の相関を計算することにより,オクルージョン状況下においても頑健な追跡を目指す.下図は処理フローを示してい
る.まず最初のフレームでは対象物体の位置が与えられていることとする.それぞれの部位を推定するために KCF filter を適用して尤度マッ
プを生成する.ベイズ推定のフィルタリングにより追跡するべき部位を切り分ける.単峰性であった追跡から複数のピークを持った追跡対象
へと拡張することで,オクルージョンに頑健な追跡手法として確立した.表は実験結果である.PASCAL VOC dataset に対してほとんどのタス
クで良好な性能を示しただけでなく,約 30fps で動作した.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Real-Time_Part-Based_Visual_2015_CVPR_paper.pdf
【65】
C. Li, A. Reiter, G. D. Hager, “Beyond Spatial Pooling: Fine-Grained Representation Learning in Multiple Domains”, in
CVPR2015.
Convolutional neural networks (CNN)において,空間的なプーリング手法を改善.プーリングの粒度として,多段階スケールのプーリングを実装
したことや,プーリングのドメイン設定,新しいデータセットして 50 の工業製品を含む JHUIT-50 dataset を提案した.畳み込みとプーリング
において小サイズのパッチは大サイズのパッチよりも invariant な特徴表現になることや,マルチスケールのパッチから畳み込んだ特徴を連結
する方が表現能力の高い特徴が生成できることが判明した.識別には Linear SVM を用いている.表は JHUIT-50 dataset における比較である.
表の右側に提案手法の種々の設定で精度を出している.左側の従来法と比較しても明らかな有効性が見られる.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Beyond_Spatial_Pooling_2015_CVPR_paper.pdf
プロジェクトページ:
http://cirl.lcsr.jhu.edu/research/human-machine-collaborative-systems/representation-learning-and-large-scale-object-recognition/
【66】
Y. Li, C. Chen, F. Yang, J. Huang, “Deep Sparse Representation for Robust Image Registration”, in CVPR2015.
スパース表現を用いた画像レジストレーションを行う.1st layer では画像からエッジ空間へと変換する.2nd layer では sparse error tensor が分
解される.3rd layer では Fourier 係数によりさらにスパースな空間に投影することによりレジストレーションの精度を向上させた.実験では空
撮画像に対して画像レジストレーションを実施しており,有効な位置合わせ手法として確立した.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Deep_Sparse_Representation_2015_CVPR_paper.pdf
著者ページ:
http://cseweb.uta.edu/~yeqing/
【67】
L. Wang, Z. Xiong, D. Gao, G. Shi, W. Zeng, F. Wu, “High-speed Hyperspectral Video Acquisition with a Dual-camera
Architecture”, in CVPR2015.
時系列で取得できる 4D の Hyperspectral カメラ(HSHS; high-speed hyperspectral)を提案する.下図は提案手法のフロー図であり,dual-camera シ
ステムを構築することでこうフレームレートにしてもブレずに撮像できる.従来の hyperspectral では 30fps の CASSI が存在したが,提案手法
では 100fps でもブラーがなく撮影可能.
図 1
図 2
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Deep_Sparse_Representation_2015_CVPR_paper.pdf
著者ページ:
http://cseweb.uta.edu/~yeqing/
【68】
Z. Wang, Q. Ji, “Classifier Learning with Hidden Information”, in CVPR2015.
従来の機械学習の方法は(X1,Y1)...(Xn, Yn)のように入力ベクトルと出力ベクトルがペアとして与えられてきたが,より柔軟性を向上させるた
めに画像と潜在情報(hidden information)を与える方が良いと主張(下図).この概念に対して 2 つの手法- Loss Inequality Regularization (LIR)と
Relationship Preserving Regularization (RPR)を提案する.LIR では第二の特徴量として潜在情報を取り入れる.例えば attribute は多くの場合画像
特徴量よりも識別性能が高いことが知られている.また,RPR では潜在情報を第二の目的関数として与える手法である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Wang_Classifier_Learning_With_2015_CVPR_paper.pdf
著者ページ:
http://homepages.rpi.edu/~wangz10/
【69】
M. Faraki, M. T. Harandi, F. Porikli, “More About VLAD: A Leap from Euclidean to Riemannian Manifolds”, in CVPR2015.
VLAD (Vector of Locally Aggregated Descriptors)を改良するために Riemannian manifolds を適用する.Region Covariance Descriptors (RCovD)を考
慮することで,VLAD を拡張した R-VLAD として強力な特徴コーディング手法とする.下は YouTube Celebrities, Dyntex++, UPENN dataset に
おける比較である.Bag-of-words, VLAD, R-VLAD を比較しており,提案手法が最も高い精度を示した.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Faraki_More_About_VLAD_2015_CVPR_paper.pdf
【70】
Fang Wang, Le Kang, and Yi Li, “Sketch-based 3D Shape Retrieval using Convolutional Neural Networks ”, in CVPR2015.
2D のスケッチから 3D モデルを検索する手法.
1 つの 3D モデルから複数視点のスケッチ画像を生成しておき,そのスケッチ画像と入力スケッチ画像を CNN 特徴でマッチングすることで,
3D モデルを提示している.
また,Siamese CNN を用いて次元を削減しつつ特徴を抽出している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Wang_Sketch-Based_3D_Shape_2015_CVPR_paper.pdf
【71】
A. Mosleh, P. Green, E. Onzon, I. Begin, J. M. P. Langlois, “Camera Intrinsic Blur Kernel Estimation: A Reliable Framework”, in
CVPR2015.
カメラのデブラーを行うためには Point Spread Function (PSF)が非常に重要である.提案手法ではデブラー手法を拡張するために,カメラの内
的なブラーを計測する.下図は提案手法のフローである.パターンに対するボケの性質を捉えて PSF を調整する.Deconvolution を施した結果
も図の右側に示されている.撮影に用いられたのはスマートフォンのカメラ(Blackberry mobile phone camera)である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Mosleh_Camera_Intrinsic_Blur_2015_CVPR_paper.pdf
【72】
Fang Wang, Le Kang, and Yi Li, “Sketch-based 3D Shape Retrieval using Convolutional Neural Networks ”, in CVPR2015.
テキストから映像を結びつける手法とデータセットの提案.
キャラクターの名前などの情報を用いて,グラフの最短経路を探索してマッチングしている.
データセットには TV シリーズの Game of Thrones と映画 Harry Potter の動画とその文章が格納されている.
Link(s) 【論文ページ】
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Tapaswi_Book2Movie_Aligning_Video_2015_CVPR_paper.pdf
【プロジェクトページ】
https://cvhci.anthropomatik.kit.edu/~mtapaswi/projects-book_align.html
【73】
Z. Li, P. Tan, R. T. Tan, D. Zou, S. Z. Zhou, L.-F. Cheong, “Simultaneous Video Defogging and Stereo Reconstruction”, in
CVPR2015.
提案手法では入力映像から,シーンのデプス推定と霧がかった(foggy)潜在画像を補正する処理を同時に行う.霧をノイズとして,また動画像
から SfM 的に距離画像を推定する関数を設定し,両者の最適化を同時に実行することでこの問題を解決している.下図は処理結果の一例であ
る.一番右側が提案手法による defogging とデプス画像推定である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Simultaneous_Video_Defogging_2015_CVPR_paper.pdf
【74】
Cong Leng, Jiaxiang Wu, Jian Cheng, Xiao Bai, Hanqing Lu, “Online Sketching Hashing ”, in CVPR2015.
2 つの問題に言及した online hashing 手法の提案.
2 つの問題とは,
・新しいデータが入力された際に,再学習する必要がある
・大規模データになると計算コストが大きい
である.これらの問題を解決するため.skech データに基づいた効率的な hash 関数を示す.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Leng_Online_Sketching_Hashing_2015_CVPR_paper.pdf
【75】
S. Zhu, C. Li, C. C. Loy, X. Tang, “Face Alignment by Coarse-to-Fine Shape Searching”, in CVPR2015.
顔画像から特徴点を取得するための Coarse-to-Fine な探索.3 ステージに分割して考案する.最初に与えられた顔の特徴点をより密にする毎に
正確な位置に最適化する.下図の CFSS が提案手法であり,実験では特徴点位置推定精度は最も高かった.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Zhu_Face_Alignment_by_2015_CVPR_paper.pdf
【76】
Y. Luo, Y. Wong, Q. Zhao, “Label Consistent Quadratic Surrogate Model for Visual Saliency”, in CVPR2015.
Saliency の問題点として,新しいデータが追加された際に対応できないことが挙げられる.提案手法ではこの問題を解決するために Label
Consistent Quadratic Surrogate と呼ばれるアルゴリズムを提案する.繰り返しによりスパース辞書を学習し,データ間の共通性を学習すること
で新しいデータが入力されたとしても処理可能にする.下図のように,与えられたデータからスパース性の損失項と識別の損失項を求めるこ
とにより,識別性能の高いスパース辞書(sparse dictionary)を生成できる.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Luo_Label_Consistent_Quadratic_2015_CVPR_paper.pdf
【77】
Y. Suh, K. Adamczewski, K. M. Lee, “Subgraph Matching using Compactness Prior for Robust Feature Correspondence”, in
CVPR2015.
複雑な環境下での対応点マッチングに挑戦する問題.論文ではマッチングに応じて事前情報を変化させることで outlier を適切に除去する
subgraph matching を提案する.最適化の手法としては Markov chain Monte Carlo (MCMC)を採用した.下図は提案手法と従来手法の比較を示す
.青線が正解,赤線が非正解である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Suh_Subgraph_Matching_Using_2015_CVPR_paper.pdf
【78】
G. Yuan, B. Ghanem, “L0TV: A New Method for Image Restoration in the Presense of Impulse Noise”, in CVPR2015.
Total Variation (TV)は画像処理の正規化において有効な prior model である.提案手法では L0-norm を適用した TV を提案することでノイズ除去
を行う.図 1 は繰り返しによる最適化とその結果である.100 回程度の繰り返しで収束している.図 2 は修復の結果であり,ノイズと元画像
が分離できている.
図 1
図 2
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Yuan_L0TV_A_New_2015_CVPR_paper.pdf
著者ページ(コードあり):
http://yuanganzhao.weebly.com/
オーラルスライド:
http://yuanganzhao.weebly.com/uploads/1/0/7/5/10759809/slide-l0tv.pdf
【79】
F. Heide, W. Heidrich, G. Wetzstein, “Fast and Flexible Convolutional Sparse Coding”, in CVPR2015.
Convolutional sparse coding (CSC)に関する手法は幾つか発表されている.著者らは splitting ベースの新しい CSC の枠組みを提案する.提案手法
は高速かつ高精度な手法を提供することが可能である.下図はフィルタの学習をした結果である.左が提案手法,右が従来法である.提案手
法はより鮮明な特徴抽出が可能であり,なおかつ 3-4 倍高速に処理可能である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Heide_Fast_and_Flexible_2015_CVPR_paper.pdf
プロジェクトページ(コード・データセットあり):
http://www.cs.ubc.ca/labs/imager/tr/2015/FastFlexibleCSC/
【80】
T. H. Kim, K. M. Lee, “Generalized Video Deblurring for Dynamic Scenes”, in CVPR2015.
著者らは双方向オプティカルフローを採用することで pixel-wise にカーネルを推定する方法を提案する.単一のエネルギー関数にてモデリン
グして,オプティカルフローと潜在的な正解画像を同時に推定することでデブラーを実行する.下図はブラー画像(a)とローカルにカーネルを
推定した結果(b),さらには双方向オプティカルフロー(c)による pixel-wise カーネル推定である.詳細な結果は YouTube 動画参照.
Link(s) 論文ページ:
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Kim_Generalized_Video_Deblurring_2015_CVPR_paper.pdf
YouTube:
https://www.youtube.com/watch?v=T6F5QzRm2lQ
【81】
N. Ben-Zrihem, L. Zelnik-Manor, “Approximate Nearest Neighbor Fields in Video”, in CVPR2015.
Approximate Nearest Neighbor (ANN)は近似的に NN を解く方法であるが,正確な処理結果がでないことも多い.これを,すべてのパッチから
取得した特徴から構成される ANN-Field (ANNF)を適用するだけでなく,提案手法ではさらにビデオに対して ANNF を適用する.下図は処理
例であり,(a)はビデオフレーム,(b)は参照画像である.(c)それぞれのフレームにて ANNF が参照され,マッチングを行う.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ben-
Zrihem_Approximate_Nearest_Neighbor_2015_CVPR_paper.pdf
【82】
J.-B. Huang, A. Singh, N. Ahuja, “Single Image Super-resolution fro Transformed Self-Exemplars”, in CVPR2015.
提案手法では self-similarity based super-resolution を改良する.アフィン変換と局所的な形状のバリエーションを同時に推定する.外的/内的
(self-similarity)な辞書との比較を行うことで,鮮明な画像に対応づける.詳細な比較はプロジェクトページ参照.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ben-
Zrihem_Approximate_Nearest_Neighbor_2015_CVPR_paper.pdf
プロジェクトページ:
https://sites.google.com/site/jbhuang0604/publications/struct_sr
【83】
S. H. Khatoonabadi, N. Vasconcelos, I. V. Bajic, Y. Shan, “How many bits does it take for a stimulus to be salient?”, in
CVPR2015.
提案手法では顕著性の計算に operational block description length (OBDL)のモデルを用いている.ビデオを圧縮する際には必要な部分のみを更新
するが,顕著性ではその機能が使えないかを検討した.この機能により,かなり高速な処理をおこなえただけでなく,人間の注視の機能を模
倣することにも成功し,saliency の精度も向上した.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Khatoonabadi_How_Many_Bits_2015_CVPR_paper.pdf
著者ページ(コードあり):
http://www.sfu.ca/~ibajic/software.html
プロジェクトページ:
http://www.svcl.ucsd.edu/projects/hossein/
【84】
X. Zhang, H. Su, L. Yang, S. Zhang, “Fine-Grained Histopathological Image Analysis via Robust Segmentation and Large-Scale
Retrieval”, in CVPR2015.
医用画像の解析は重要なテーマの一つである.論文では細胞領域のセグメンテーションや大規模細胞画像データの検索を実現するための手法
を提案する.下図は提案手法の概要であり,上はオンラインの識別,下はオフラインの学習を示す.黄色・緑色はそれぞれの病理学的に意味
のある対象クラス,青色の境界線は識別クラスが不明のものを示す.87.3%の精度,1.68 秒での識別を達成した.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Zhang_Fine-
Grained_Histopathological_Image_2015_CVPR_paper.pdf
著者ページ:
http://research.rutgers.edu/~shaoting/index.html
【85】
H. Li, Z. Lin, X. Shen, J. Brandt, G. Hua, “A Convolutional Neural Network Cascade for Face Detection”, in CVPR2015.
カスケード(Cascade)識別器は処理速度と精度を両立するための手法として知られており,広く用いられるに至っている.しかし,カスケード
構造をした検出器には単純な特徴量のみが使用されているため,著者らはこれに convolutional neural networks (CNN)ベースの特徴量を用いるこ
とで,顔検出の精度を向上させることを試みた.ここでロバスト性を高めるため,複数解像度の画像にて識別器を走査した.提案手法は単一
の CPU 上にて 14FPS で処理できることが判明した.下図は検出の各工程の様子である.12-net は 12x12pxls のパッチサイズにて検出している
結果である.それぞれの設定にて NMS を実行する.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_A_Convolutional_Neural_2015_CVPR_paper.pdf
【86】
Xianzhi Du, David Doermann, Wael Abd-Almageed,”A Graphical Model Approach for Matching Partial Signatures”, in CVPR,
2015.
左上図のように,手書きの署名には完全なもの(左)と省略したもの(右)がある.省略して書かれた署名と,事前に登録された完全な署名を高精
度で照合する手法が提案されている.
Shape context 特徴は署名の輪郭点から抽出され,2 次元のバイナリ型で文字の形状を表現する.輪郭上の 2 点の相対的距離と角度に基づいて
ヒストグラムを作成し,K-means で署名をクラスタリングしていく.
3 つのデータセットを使っての実験が行われ,照合の正解率は従来手法と比べてそれぞれ 70%,4%,15%向上した.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Du_A_Graphical_Model_2015_CVPR_paper.pdf
【87】
Q. N. Ngoc, A. Gautier, M. Hein, “A Flexible Tensor Block Coordinate Ascent Scheme for Hypergraph Matching”, in CVPR2015.
より高次元の特徴マッチングを実現するために Hypergraph Matching 問題を解決する.提案手法では 3 次(third order)の Hypergraph のマッチン
グを仮定している.ここで,3 次の,それぞれの空間の幾何的な位置関係を示すテンソルを用意している.実験では CMU house dataset にて従
来手法との比較を行っており,下図が特徴マッチングの結果である.提案手法は BCAGM+IPFP, BCAGM+MP として紹介されている.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Nguyen_A_Flexible_Tensor_2015_CVPR_paper.pdf
プロジェクトページ(コードあり):
http://www.ml.uni-saarland.de/code/CVPR15/FlexTensorBlock.htm
【88】
Y. Chen, W. Yu, T. Pock, “On learning optimized reaction diffusion processes for effective image restoration”, in CVPR2015.
画像復元(image restoration)は長年の課題であり,解決により種々のアプリケーションへの応用が期待される.効率的かつ高品質な画像復元を
実現するために,提案手法では(1) ガウシアンノイズを仮定してデノイジング ,(2)JPEG により人工的にノイズ除去を採用した.下図は提案手
法におけるネットワークのアーキテクチャ,表はノイズ除去の比較結果である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Chen_On_Learning_Optimized_2015_CVPR_paper.pdf
【89】
Y. Zhu, Y. Zhang, B. Bonev, A. L. Yuille, “Modeling Deformable Gradient Compositions for Single-Image Super-resolution”, in
CVPR2015.
単一画像による超解像(single-image super-resolution)の問題は今後のディスプレイシステムを考える上でも重要な課題に挙げられる.提案手法
では,形状変化に対応した参照辞書を用いることで超解像に取り組んでいる.下図は提案手法のフロー図である.前処理として Gradient Ridge
Image を施しており,辞書とのマッチングにより解像度を上げている.PSNR 値の面でも数値が良くなっている.画像による訂正的な評価は論
文参照.
Link(s) 論文ページ:
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Zhu_Modeling_Deformable_Gradient_2015_CVPR_paper.pdf
プロジェクトページ:
http://www.stat.ucla.edu/~zhuyu/CVPR15.html
【90】
Haoxiang Li, Gang Hua,”Hierarchical-PEP Model for Real-world Face Recognition”, in CVPR, 2015.
顔認証システムにおいてはある人物がどのような表情や変顔をしようとも,その人であると正しく認証されることが要求される.従来研究の
PEP モデルは顔をパーツの組み合わせとして考え,パーツごとのパッチ画像の特徴を連結することで顔の表情を構築するという考え方を用い
ている.提案手法はこの PEP モデルを階層的に拡張したもので,テストの顔画像をトップダウン的にパッチへと分解していき,そのパッチ画
像に対して SIFT などの特徴量を計算しておく.そして PCA と LDA を用いて次元数を減らしていき,ボトムアップ的に出力を得ることで異
なる表情の同一人物への対応が可能となり,実験では高い正解率での顔認証が実現できた(下図).
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Hierarchical-PEP_Model_for_2015_CVPR_paper.pdf
【91】
Rahaf Aljundi, Rémi Emonet, Damien Muselet, Marc Sebban, “Landmarks-based Kernelized Subspace Alignment for
Unsupervised Domain Adaptation ”, in CVPR2015.
サブスペースにおけるランドマークベースの教師なし位置合わせ.
Taget と Source から特徴を抽出し,特徴空間にプロットする.そのプロットの分布から,ランドマークを決定する.そのランドマークを中心
に PCA を行い,サブスペースにおける位置合わせを行う.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Aljundi_Landmarks-
Based_Kernelized_Subspace_2015_CVPR_paper.pdf
【92】
Feng Lu, Imari Sato, Yoichi Sato, “Uncalibrated Photometric Stereo Based on Elevation Angle Recovery from BRDF Symmetry of
Isotropic Materials”, in CVPR2015.
表面の反射率特性を表現する手法.
本手法の contribution は以下の 3 点
1 half-vector 対称性の制約を導出
2 対称性を利用した視点角度の決定
3 反射率を持ちた光源を推定
Link(s) 【論文ページ】
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Lu_Uncalibrated_Photometric_Stereo_2015_CVPR_paper.pdf
【93】
Mostafa Abdelrahman, Aly Farag, David Swanson,and Moumen T. El-Melegy, “Heat Diffusion Over Weighted Manifolds: A New
Descriptor for Textured 3D Non-Rigid Shapes”, in CVPR2015.
Weighted Heat Kernel Signature(W-HKS)に基づく 3D 非剛体テクスチャ記述子の提案.
スケールへの不変性,形状/色記述子を有している.
特徴記述の流れは以下のとおり.
SHREC'13 および SHREC'14 で実験した結果
一番左が query で,それ以降がマッチング率の高かった 3D モデルである.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Abdelrahman_Heat_Diffusion_Over_2015_CVPR_paper.pdf
【94】
B. Shuai, G. Wang, Z. Zuo, B. Wang, L. Zhao, “Integrating Parametric and Non-parametric Models For Scene Labeling”, in
CVPR2015.
CNN の特徴抽出や識別器を局所的なパッチ識別器として適用する.例えば下図の sand の領域と sidewalk の領域はピクセルの特徴ではほとん
ど差が出ないと思われる.しかし,局所領域として特徴量を取得すれば判別が可能である.提案手法ではグローバルなシーンの意味付けを適
用して,ローカルな意味付けの曖昧性を除去する.ここではグローバルなラベリングと,ローカルな特徴量のエネルギー関数の最小化により
最終的なラベリング結果を得る.表は[Farabet+, PAMI2013]や[Pinheiro+, ICML2014]の結果と比較した結果である.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Shuai_Integrating_Parametric_and_2015_CVPR_paper.pdf
著者ページ(コードあり):
https://sites.google.com/site/beinshuai/
【95】
Dongping Li, Kaiming He, Jian Sun, Kun Zhou, “A Geodesic-Preserving Method for Image Warping”, in CVPR2015.
パノラマ画像を通常の画像に変換する手法.
画像上から,物体を構成する曲線や直線を検出し,それを保つような画像変換を行う.(Geodesic-Preserving)
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_A_Geodesic-Preserving_Method_2015_CVPR_paper.pdf
【著者ページ】
http://research.microsoft.com/en-us/um/people/kahe/
【96】
X. Mei, W. Dong, B.-G. Hu, S. Lyu, “UniHIST: A Unified Framework for Image Restoration With Marginal Histogram
Constraints”, in CVPR2015.
UniHIST という,複数制約を同時に満たすヒストグラムという概念を提案して,画像復元(image restoration)問題に適用する.UniHIST では
quadratic Wasserstein 距離 (W2 distance)を用いて参照の特徴と復元画像の対応づけを行う.W2 distance では密度関数や平滑化,差分などに頼る
ことなくヒストグラム間の距離を直接求めるフレームワークである.下図は提案手法と比較手法との比較実験の例である.(a),(b)はそれぞれ
オリジナル画像とノイズ画像,(c)は従来手法による復元画像であり PSNR 20.29, SSIM は 0.83 であった.それに対して(d)提案手法では NLDD
に UniHIST を追加しており,PSNR 24.80, SSIM 0.90 と数値の面でも改善した.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Mei_UniHIST_A_Unified_2015_CVPR_paper.pdf
【97】
Marko Ristin, Juergen Gall, Matthieu Guillaumin, Luc Van Gool, “From Categories to Subcategories: Large-scale Image
Classification with Partial Class Label Refinement ”, in CVPR2015.
データセットに対し,subcategory を定義することで,再ラベル付けを行う.
例えば,ネコとライオンがいるが,両者はネコ科であるため,”ネコ”と荒くラベル付けする.
これを,NCM forests を用いて学習して実現している.
こうして荒くラベル付することで,認識精度を向上している.
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ristin_From_Categories_to_2015_CVPR_paper.pdf
【プロジェクトページ】
http://www.iai.uni-bonn.de/~gall/projects/coarse2fine/coarse2fine.html
【98】
Yang Li, Jianke Zhu, Steven C.H. Ho, “Reliable Patch Trackers: Robust Visual Tracking by Exploiting Reliable Patches”, in
CVPR2015.
パッチ単位で物体を追跡する Reliable Patch Trackers (RPT)の提案.
連続的なモンテカルロ法のフレームワークで,particle filter を通してパッチを追跡する.
追跡の際,追跡に有効なパッチを逐次更新し,頑健な追跡を実現する.
追跡結果
Link(s) 【論文ページ】
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Reliable_Patch_Trackers_2015_CVPR_paper.pdf
【著者ページ(コードあり)】
http://ihpdep.github.io/
【99】
W. Liu, T. Mei, Y. Zhang, C. Che, J. Luo, “Multi-Task Deep Visual-Semantic Embedding for Video Thumbnail Selection”, in
CVPR2015.
映像のサムネイル自動選択の問題を解決するために,multi-task deep visual-semantic embedding を適用する.提案手法では,タイトルやキャプ
ション,映像などを用いる.与えられた画像とテキストの情報から潜在的な意味を対応づける.従来法との主な違いは多タスク学習によりド
メイン間の違いを理解したロバストな意味づけに拡張できたことである.CNN の構成は基本的には AlexNet を用いる(右図)が,出力層
(softmax)を projection layer M に変更する.さらには Latent Semantic Space にてテキスト側の情報を組み合わせる.画像とテキストの学習の違い
を補うために多タスクが適用されており,下の表から有効な精度が出ていることが判明した.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Multi-Task_Deep_Visual-
Semantic_2015_CVPR_paper.pdf
著者ページ:
http://liuwu.weebly.com/
【100】
Wei Liu, Rongrong Ji, Shaozi Li, ”Towards 3D Object Detection with Bimodal Deep Boltzmann Machines over”, in CVPR, 2015.
RGB-D での物体認識が難しい理由のひとつとして,そのトレーニングデータの不足が挙げられる.そのため既に大量のデータが存在する 2 次
元画像を RGB-D の話でも利用できるようにすれば良いのではないか,という趣旨.その実現のためにディープボルツマンマシンに基づいた
ディープラーニング手法を提案している.集めてきた CAD データと 2 次元のポジティブサンプルに対し,R-CNN を利用して RGB と Depth そ
れぞれから特徴を抽出する.ロバストな検出のために, ディープボルツマンマシンと Exemplar-SVMs により柔軟性と汎用性を保証.
Link(s) 論文ページ:
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Towards_3D_Object_2015_CVPR_paper.pdf
ご質問・コメント等ありましたら,cvpaper.challenge@gmail.com / Twitter@CVPaperChalleng までお願いします.

More Related Content

What's hot

【2016.06】cvpaper.challenge2016
【2016.06】cvpaper.challenge2016【2016.06】cvpaper.challenge2016
【2016.06】cvpaper.challenge2016
cvpaper. challenge
 
【2016.02】cvpaper.challenge2016
【2016.02】cvpaper.challenge2016【2016.02】cvpaper.challenge2016
【2016.02】cvpaper.challenge2016
cvpaper. challenge
 
【2016.01】(1/3)cvpaper.challenge2016
【2016.01】(1/3)cvpaper.challenge2016【2016.01】(1/3)cvpaper.challenge2016
【2016.01】(1/3)cvpaper.challenge2016
cvpaper. challenge
 
【2016.08】cvpaper.challenge2016
【2016.08】cvpaper.challenge2016【2016.08】cvpaper.challenge2016
【2016.08】cvpaper.challenge2016
cvpaper. challenge
 
【2015.08】(4/5)cvpaper.challenge@CVPR2015
【2015.08】(4/5)cvpaper.challenge@CVPR2015【2015.08】(4/5)cvpaper.challenge@CVPR2015
【2015.08】(4/5)cvpaper.challenge@CVPR2015
cvpaper. challenge
 
【2015.05】cvpaper.challenge@CVPR2015
【2015.05】cvpaper.challenge@CVPR2015【2015.05】cvpaper.challenge@CVPR2015
【2015.05】cvpaper.challenge@CVPR2015
cvpaper. challenge
 
【2015.07】(2/2)cvpaper.challenge@CVPR2015
【2015.07】(2/2)cvpaper.challenge@CVPR2015【2015.07】(2/2)cvpaper.challenge@CVPR2015
【2015.07】(2/2)cvpaper.challenge@CVPR2015
cvpaper. challenge
 
ECCV 2016 まとめ
ECCV 2016 まとめECCV 2016 まとめ
ECCV 2016 まとめ
cvpaper. challenge
 
cvpaper.challenge@CVPR2015(Action Recognition)
cvpaper.challenge@CVPR2015(Action Recognition)cvpaper.challenge@CVPR2015(Action Recognition)
cvpaper.challenge@CVPR2015(Action Recognition)
cvpaper. challenge
 
【2016.05】cvpaper.challenge2016
【2016.05】cvpaper.challenge2016【2016.05】cvpaper.challenge2016
【2016.05】cvpaper.challenge2016
cvpaper. challenge
 
【2015.08】(5/5)cvpaper.challenge@CVPR2015
【2015.08】(5/5)cvpaper.challenge@CVPR2015【2015.08】(5/5)cvpaper.challenge@CVPR2015
【2015.08】(5/5)cvpaper.challenge@CVPR2015
cvpaper. challenge
 
【2016.03】cvpaper.challenge2016
【2016.03】cvpaper.challenge2016【2016.03】cvpaper.challenge2016
【2016.03】cvpaper.challenge2016
cvpaper. challenge
 
【2017.05】 cvpaper.challenge 2017
【2017.05】 cvpaper.challenge 2017【2017.05】 cvpaper.challenge 2017
【2017.05】 cvpaper.challenge 2017
cvpaper. challenge
 
【2016.01】(3/3)cvpaper.challenge2016
【2016.01】(3/3)cvpaper.challenge2016【2016.01】(3/3)cvpaper.challenge2016
【2016.01】(3/3)cvpaper.challenge2016
cvpaper. challenge
 
CVPR 2016 まとめ v1
CVPR 2016 まとめ v1CVPR 2016 まとめ v1
CVPR 2016 まとめ v1
cvpaper. challenge
 
【2017.06】 cvpaper.challenge 2017
【2017.06】 cvpaper.challenge 2017【2017.06】 cvpaper.challenge 2017
【2017.06】 cvpaper.challenge 2017
cvpaper. challenge
 
【2016.09】cvpaper.challenge2016
【2016.09】cvpaper.challenge2016【2016.09】cvpaper.challenge2016
【2016.09】cvpaper.challenge2016
cvpaper. challenge
 
【2017.03】cvpaper.challenge2017
【2017.03】cvpaper.challenge2017【2017.03】cvpaper.challenge2017
【2017.03】cvpaper.challenge2017
cvpaper. challenge
 
【2016.04】cvpaper.challenge2016
【2016.04】cvpaper.challenge2016【2016.04】cvpaper.challenge2016
【2016.04】cvpaper.challenge2016
cvpaper. challenge
 
【2015.08】(1/5)cvpaper.challenge@CVPR2015
【2015.08】(1/5)cvpaper.challenge@CVPR2015【2015.08】(1/5)cvpaper.challenge@CVPR2015
【2015.08】(1/5)cvpaper.challenge@CVPR2015
cvpaper. challenge
 

What's hot (20)

【2016.06】cvpaper.challenge2016
【2016.06】cvpaper.challenge2016【2016.06】cvpaper.challenge2016
【2016.06】cvpaper.challenge2016
 
【2016.02】cvpaper.challenge2016
【2016.02】cvpaper.challenge2016【2016.02】cvpaper.challenge2016
【2016.02】cvpaper.challenge2016
 
【2016.01】(1/3)cvpaper.challenge2016
【2016.01】(1/3)cvpaper.challenge2016【2016.01】(1/3)cvpaper.challenge2016
【2016.01】(1/3)cvpaper.challenge2016
 
【2016.08】cvpaper.challenge2016
【2016.08】cvpaper.challenge2016【2016.08】cvpaper.challenge2016
【2016.08】cvpaper.challenge2016
 
【2015.08】(4/5)cvpaper.challenge@CVPR2015
【2015.08】(4/5)cvpaper.challenge@CVPR2015【2015.08】(4/5)cvpaper.challenge@CVPR2015
【2015.08】(4/5)cvpaper.challenge@CVPR2015
 
【2015.05】cvpaper.challenge@CVPR2015
【2015.05】cvpaper.challenge@CVPR2015【2015.05】cvpaper.challenge@CVPR2015
【2015.05】cvpaper.challenge@CVPR2015
 
【2015.07】(2/2)cvpaper.challenge@CVPR2015
【2015.07】(2/2)cvpaper.challenge@CVPR2015【2015.07】(2/2)cvpaper.challenge@CVPR2015
【2015.07】(2/2)cvpaper.challenge@CVPR2015
 
ECCV 2016 まとめ
ECCV 2016 まとめECCV 2016 まとめ
ECCV 2016 まとめ
 
cvpaper.challenge@CVPR2015(Action Recognition)
cvpaper.challenge@CVPR2015(Action Recognition)cvpaper.challenge@CVPR2015(Action Recognition)
cvpaper.challenge@CVPR2015(Action Recognition)
 
【2016.05】cvpaper.challenge2016
【2016.05】cvpaper.challenge2016【2016.05】cvpaper.challenge2016
【2016.05】cvpaper.challenge2016
 
【2015.08】(5/5)cvpaper.challenge@CVPR2015
【2015.08】(5/5)cvpaper.challenge@CVPR2015【2015.08】(5/5)cvpaper.challenge@CVPR2015
【2015.08】(5/5)cvpaper.challenge@CVPR2015
 
【2016.03】cvpaper.challenge2016
【2016.03】cvpaper.challenge2016【2016.03】cvpaper.challenge2016
【2016.03】cvpaper.challenge2016
 
【2017.05】 cvpaper.challenge 2017
【2017.05】 cvpaper.challenge 2017【2017.05】 cvpaper.challenge 2017
【2017.05】 cvpaper.challenge 2017
 
【2016.01】(3/3)cvpaper.challenge2016
【2016.01】(3/3)cvpaper.challenge2016【2016.01】(3/3)cvpaper.challenge2016
【2016.01】(3/3)cvpaper.challenge2016
 
CVPR 2016 まとめ v1
CVPR 2016 まとめ v1CVPR 2016 まとめ v1
CVPR 2016 まとめ v1
 
【2017.06】 cvpaper.challenge 2017
【2017.06】 cvpaper.challenge 2017【2017.06】 cvpaper.challenge 2017
【2017.06】 cvpaper.challenge 2017
 
【2016.09】cvpaper.challenge2016
【2016.09】cvpaper.challenge2016【2016.09】cvpaper.challenge2016
【2016.09】cvpaper.challenge2016
 
【2017.03】cvpaper.challenge2017
【2017.03】cvpaper.challenge2017【2017.03】cvpaper.challenge2017
【2017.03】cvpaper.challenge2017
 
【2016.04】cvpaper.challenge2016
【2016.04】cvpaper.challenge2016【2016.04】cvpaper.challenge2016
【2016.04】cvpaper.challenge2016
 
【2015.08】(1/5)cvpaper.challenge@CVPR2015
【2015.08】(1/5)cvpaper.challenge@CVPR2015【2015.08】(1/5)cvpaper.challenge@CVPR2015
【2015.08】(1/5)cvpaper.challenge@CVPR2015
 

Viewers also liked

【2015.06】cvpaper.challenge@CVPR2015
【2015.06】cvpaper.challenge@CVPR2015【2015.06】cvpaper.challenge@CVPR2015
【2015.06】cvpaper.challenge@CVPR2015
cvpaper. challenge
 
cvpaper.challengeについて
cvpaper.challengeについてcvpaper.challengeについて
cvpaper.challengeについて
cvpaper. challenge
 
cvpaper.challenge in CVPR2015 (PRMU2015年12月)
cvpaper.challenge in CVPR2015 (PRMU2015年12月)cvpaper.challenge in CVPR2015 (PRMU2015年12月)
cvpaper.challenge in CVPR2015 (PRMU2015年12月)
cvpaper. challenge
 
TensorFlowによるCNNアーキテクチャ構築
TensorFlowによるCNNアーキテクチャ構築TensorFlowによるCNNアーキテクチャ構築
TensorFlowによるCNNアーキテクチャ構築
Hirokatsu Kataoka
 
cvpaper.challenge@R-CNN
cvpaper.challenge@R-CNNcvpaper.challenge@R-CNN
cvpaper.challenge@R-CNN
cvpaper. challenge
 
cvpaper.challenge@CVPR2015(Deep Neural Networks)
cvpaper.challenge@CVPR2015(Deep Neural Networks)cvpaper.challenge@CVPR2015(Deep Neural Networks)
cvpaper.challenge@CVPR2015(Deep Neural Networks)
cvpaper. challenge
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
cvpaper. challenge
 
【チュートリアル】動的な人物・物体認識技術 -Dense Trajectories-
【チュートリアル】動的な人物・物体認識技術 -Dense Trajectories-【チュートリアル】動的な人物・物体認識技術 -Dense Trajectories-
【チュートリアル】動的な人物・物体認識技術 -Dense Trajectories-
Hirokatsu Kataoka
 
【チュートリアル】コンピュータビジョンによる動画認識
【チュートリアル】コンピュータビジョンによる動画認識【チュートリアル】コンピュータビジョンによる動画認識
【チュートリアル】コンピュータビジョンによる動画認識
Hirokatsu Kataoka
 
Multi Scale Recognition with DAG-CNNs
Multi Scale Recognition with DAG-CNNsMulti Scale Recognition with DAG-CNNs
Multi Scale Recognition with DAG-CNNs
Hiroki Yamamoto
 
BIOMASS PROJECT RTB 5 mw
BIOMASS PROJECT RTB  5 mwBIOMASS PROJECT RTB  5 mw
BIOMASS PROJECT RTB 5 mw
Alessandro Pavan
 

Viewers also liked (11)

【2015.06】cvpaper.challenge@CVPR2015
【2015.06】cvpaper.challenge@CVPR2015【2015.06】cvpaper.challenge@CVPR2015
【2015.06】cvpaper.challenge@CVPR2015
 
cvpaper.challengeについて
cvpaper.challengeについてcvpaper.challengeについて
cvpaper.challengeについて
 
cvpaper.challenge in CVPR2015 (PRMU2015年12月)
cvpaper.challenge in CVPR2015 (PRMU2015年12月)cvpaper.challenge in CVPR2015 (PRMU2015年12月)
cvpaper.challenge in CVPR2015 (PRMU2015年12月)
 
TensorFlowによるCNNアーキテクチャ構築
TensorFlowによるCNNアーキテクチャ構築TensorFlowによるCNNアーキテクチャ構築
TensorFlowによるCNNアーキテクチャ構築
 
cvpaper.challenge@R-CNN
cvpaper.challenge@R-CNNcvpaper.challenge@R-CNN
cvpaper.challenge@R-CNN
 
cvpaper.challenge@CVPR2015(Deep Neural Networks)
cvpaper.challenge@CVPR2015(Deep Neural Networks)cvpaper.challenge@CVPR2015(Deep Neural Networks)
cvpaper.challenge@CVPR2015(Deep Neural Networks)
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
 
【チュートリアル】動的な人物・物体認識技術 -Dense Trajectories-
【チュートリアル】動的な人物・物体認識技術 -Dense Trajectories-【チュートリアル】動的な人物・物体認識技術 -Dense Trajectories-
【チュートリアル】動的な人物・物体認識技術 -Dense Trajectories-
 
【チュートリアル】コンピュータビジョンによる動画認識
【チュートリアル】コンピュータビジョンによる動画認識【チュートリアル】コンピュータビジョンによる動画認識
【チュートリアル】コンピュータビジョンによる動画認識
 
Multi Scale Recognition with DAG-CNNs
Multi Scale Recognition with DAG-CNNsMulti Scale Recognition with DAG-CNNs
Multi Scale Recognition with DAG-CNNs
 
BIOMASS PROJECT RTB 5 mw
BIOMASS PROJECT RTB  5 mwBIOMASS PROJECT RTB  5 mw
BIOMASS PROJECT RTB 5 mw
 

Similar to 【2015.08】(2/5)cvpaper.challenge@CVPR2015

論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
atsushi061452
 
MIRU2018 tutorial
MIRU2018 tutorialMIRU2018 tutorial
MIRU2018 tutorial
Takayoshi Yamashita
 
MS COCO Dataset Introduction
MS COCO Dataset IntroductionMS COCO Dataset Introduction
MS COCO Dataset Introduction
Shinagawa Seitaro
 
【SSII2015】人を観る技術の先端的研究
【SSII2015】人を観る技術の先端的研究【SSII2015】人を観る技術の先端的研究
【SSII2015】人を観る技術の先端的研究
Hirokatsu Kataoka
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII
 
IEEE/ACM SC2013報告
IEEE/ACM SC2013報告IEEE/ACM SC2013報告
IEEE/ACM SC2013報告
Ryousei Takano
 
【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems
cvpaper. challenge
 
自習形式で学ぶ「DIGITS による画像分類入門」
自習形式で学ぶ「DIGITS による画像分類入門」自習形式で学ぶ「DIGITS による画像分類入門」
自習形式で学ぶ「DIGITS による画像分類入門」
NVIDIA Japan
 
【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2
Hirokatsu Kataoka
 
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
 
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
de:code 2017
 
推薦システムを構築する手順書 with Azure Machine Learning
推薦システムを構築する手順書 with Azure Machine Learning推薦システムを構築する手順書 with Azure Machine Learning
推薦システムを構築する手順書 with Azure Machine Learning
Masayuki Ota
 
CNNの構造最適化手法について
CNNの構造最適化手法についてCNNの構造最適化手法について
CNNの構造最適化手法について
MasanoriSuganuma
 
CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)
MasanoriSuganuma
 
Top-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender SystemTop-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender System
harmonylab
 
広島画像情報学セミナ 2011.9.16
広島画像情報学セミナ 2011.9.16広島画像情報学セミナ 2011.9.16
広島画像情報学セミナ 2011.9.16
Akisato Kimura
 
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields [DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
Deep Learning JP
 
非技術者でもわかる(?)コンピュータビジョン紹介資料
非技術者でもわかる(?)コンピュータビジョン紹介資料非技術者でもわかる(?)コンピュータビジョン紹介資料
非技術者でもわかる(?)コンピュータビジョン紹介資料
Takuya Minagawa
 
おしゃスタ@リクルート
おしゃスタ@リクルートおしゃスタ@リクルート
おしゃスタ@リクルートIssei Kurahashi
 
MapReduceによる大規模データを利用した機械学習
MapReduceによる大規模データを利用した機械学習MapReduceによる大規模データを利用した機械学習
MapReduceによる大規模データを利用した機械学習
Preferred Networks
 

Similar to 【2015.08】(2/5)cvpaper.challenge@CVPR2015 (20)

論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
 
MIRU2018 tutorial
MIRU2018 tutorialMIRU2018 tutorial
MIRU2018 tutorial
 
MS COCO Dataset Introduction
MS COCO Dataset IntroductionMS COCO Dataset Introduction
MS COCO Dataset Introduction
 
【SSII2015】人を観る技術の先端的研究
【SSII2015】人を観る技術の先端的研究【SSII2015】人を観る技術の先端的研究
【SSII2015】人を観る技術の先端的研究
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
 
IEEE/ACM SC2013報告
IEEE/ACM SC2013報告IEEE/ACM SC2013報告
IEEE/ACM SC2013報告
 
【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems
 
自習形式で学ぶ「DIGITS による画像分類入門」
自習形式で学ぶ「DIGITS による画像分類入門」自習形式で学ぶ「DIGITS による画像分類入門」
自習形式で学ぶ「DIGITS による画像分類入門」
 
【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2
 
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
 
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
 
推薦システムを構築する手順書 with Azure Machine Learning
推薦システムを構築する手順書 with Azure Machine Learning推薦システムを構築する手順書 with Azure Machine Learning
推薦システムを構築する手順書 with Azure Machine Learning
 
CNNの構造最適化手法について
CNNの構造最適化手法についてCNNの構造最適化手法について
CNNの構造最適化手法について
 
CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)
 
Top-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender SystemTop-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender System
 
広島画像情報学セミナ 2011.9.16
広島画像情報学セミナ 2011.9.16広島画像情報学セミナ 2011.9.16
広島画像情報学セミナ 2011.9.16
 
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields [DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
 
非技術者でもわかる(?)コンピュータビジョン紹介資料
非技術者でもわかる(?)コンピュータビジョン紹介資料非技術者でもわかる(?)コンピュータビジョン紹介資料
非技術者でもわかる(?)コンピュータビジョン紹介資料
 
おしゃスタ@リクルート
おしゃスタ@リクルートおしゃスタ@リクルート
おしゃスタ@リクルート
 
MapReduceによる大規模データを利用した機械学習
MapReduceによる大規模データを利用した機械学習MapReduceによる大規模データを利用した機械学習
MapReduceによる大規模データを利用した機械学習
 

【2015.08】(2/5)cvpaper.challenge@CVPR2015

  • 2. 【51】 B. Ham, M. Cho, J. Ponce, “Robust Image Filtering Using Joint Static and Dynamic Guidance”, in CVPR2015. Computer Vision と Computational Photography の技術を統合したフィルターを提案する.画像フィルタは非凸最適化(nonconvex optimization)を適 用しており,majorization-minimization algorithm を適用する.下図はフィルタリングの例であり,(c)の入力から(d)や(e)の平滑化結果を得る. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ham_Robust_Image_Filtering_2015_CVPR_paper.pdf プロジェクトページ(コードあり): http://www.di.ens.fr/willow/research/sdfilter/
  • 3. 【52】 G. Paikin, A. Tal, “Solving Multiple Square Jigsaw Puzzles with Missing Piece”, in CVPR2015. Jigsaw Puzzle を解くように画像復元を行う問題.提案手法は[Pomeranz+, CVPR2011]の手法にインスパイアされてその改善に取り組んだ.ある パーツが無くなっていてもその他全ての画像を復元することに成功し,複数の Jigsaw Puzzle を同時に解くことにも成功している. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Paikin_Solving_Multiple_Square_2015_CVPR_paper.pdf プロジェクトページ: http://webee.technion.ac.il/people/ayellet/Abstracts/15-PT.html 著者ページ: http://webee.technion.ac.il/people/ayellet/papers.html
  • 4. 【53】 B. Klein, L. Wolf, Y. Afek, “A Dynamic Convolutional Layer for Short Range Weather Prediction”, in CVPR2015. Convolutional neural networks (CNN)を用いた,気象予報(weather prediction).Dynamic Convolutional Layer という新しい畳み込み層を提案(図 1). 前畳み込み層から特徴マップを抽出し,次の層の畳み込みに反映させる.Tel Aviv dataset(図 2)に対して予測をした結果,通常の畳み込み層を 用いた CNN よりも,Dynamic Convolutional Layer の方が高い精度での予測を実現した. 図 1 図 2 Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Klein_A_Dynamic_Convolutional_2015_CVPR_paper.pdf 著者ページ: http://www.cs.tau.ac.il/~wolf/
  • 5. 【54】 Xiaochuan Fan, Kang Zheng, Yuewei Lin, Song Wang, “Combining Local Appearance and Holistic View: Dual-Source Deep Neural Networks for Human Pose Estimation ”, in CVPR2015. 局所的なパッチと全身の 2 つの CNN 特徴を組み合わせた pose 推定手法. 局所的なパッチと全身の画像から CNN 特徴を抽出し,学習しておく. 実験結果において,有効な結果が出ている. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Fan_Combining_Local_Appearance_2015_CVPR_paper.pdf
  • 6. 【55】 Jiyan Pan, Martial Hebert, Takeo Kanade, “Inferring 3D Layout of Building Facades from a Single Image ”, in CVPR2015. Single image からビルなどの 3D レイアウトを推定する手法. 画像から直線を大量に検出し,3D 世界を構成する xyz 軸を推定する.そして,その軸にマッチングする建物の直線から面を推定し,3D レイ アウトを推定している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Pan_Inferring_3D_Layout_2015_CVPR_paper.pdf
  • 7. 【56】 Junho Yim, Heechul Jung, ByungIn Yoo , Changkyu Choi, Dusik Park, Junmo Kim, “Rotating Your Face Using Multi-task Deep Neural Network”, in CVPR2015. 一枚の顔画像から,それを回転させた画像を生成する. Deep Learning の層を特徴抽出,回転,画像化,再構成の 4 段階に分割している. 回転角度は-60~60[deg]まで対応している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Yim_Rotating_Your_Face_2015_CVPR_paper.pdf
  • 8. 【57】 Zhibin Hong , Zhe Chen, Chaohui Wang, Xue Mei, Danil Prokhorov, Dacheng Tao, “MUlti-Store Tracker (MUSTer): a Cognitive Psychology Inspired Approach to Object Tracking”, in CVPR2015. AtkinsonShiffrin Memory Model (ASMM)に基づいた物体追跡. 入力画像から特徴量と特徴点を抽出し,特徴点をマッチングする.マッチングの精度を上げるため,RANSAC でノイズを除去し,追跡する. その追跡した情報を用いて特徴量をフィルタリングし,より頑健な追跡を可能にしている. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Hong_MUlti- Store_Tracker_MUSTer_2015_CVPR_paper.pdf 【プロジェクトページ】 https://sites.google.com/site/zhibinhong4131/Projects/muster
  • 9. 【58】 C. S. Mathialagan, A. C. Gallagher, D. Batra, “VIP: Finding Important People in Images”, in CVPR2015. 画像の中の複数人物の中で,だれが VIP(最重要人物)かを当てる問題.im2text を用いており,image-level importance や corpus-level importance に分類して問題を解いている.感覚的には,用意したデータから顔を抽出して,特徴抽出により 1-by-1 の attribute を計算している.特徴量と して計算されたのは,scale, sharpness, face pose features, aspect ratio, face occlusion, DPM face scores, face detection success などである.表は実験結 果であり,人がタグ付けした結果(71.43%)と提案手法(57.14%),その他の手法に分けている. Link(s) 論文ページ: http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Mathialagan_VIP_Finding_Important_2015_CVPR_paper.pdf プロジェクトページ: https://computing.ece.vt.edu/~mclint/vip/ デモ: http://cloudcv.org/vip/
  • 10. 【59】 M. Jaberi, M. Pensky, H. Foroosh, “SWIFT: Sparse Withdrawal of Inliers in a First Trial”, in CVPR2015. RANSAC のような multiple model instances detection は対応点を求める上で重要な課題となっている.論文ではサンプリングステップに着目し ており,Sparse Withdrawal of Inliers in a First Trial (SWIFT)と呼ばれるクラスタリングベースの手法を提案する.Mean-shift のような教師なしク ラスタリングを用いることにより,複数の物体を同時に含んでいても一度にサンプリング点を把握する方法である.下図は(a)segmented の画 像からサンプリング点をも t メタ結果である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Jaberi_SWIFT_Sparse_Withdrawal_2015_CVPR_paper.pdf
  • 11. 【60】 Guilin Liu, Yotam Gingold, Jyh-Ming Lien , “Continuous Visibility Feature ”, in CVPR2015. 新しい特徴(Continuous Visibility Feature)の提案. ある頂点から別の頂点まで,”視える”かどうかを特徴量としている. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Continuous_Visibility_Feature_2015_CVPR_paper.pdf 【プロジェクトページ】 http://masc.cs.gmu.edu/wiki/CVF
  • 12. 【61】 Abhijit Bendale, Terrance Boult , “Towards Open World Recognition ”, in CVPR2015. 従来の認識は,データセット内のラベルのみを認識している.しかし,実際には未知なものに遭遇する可能性は十分あるため,より開けた世 界を認識する必要がある.この課題を Open World Recognition と呼ぶ. この課題を解決するため,Nearest Non-Outlier(NNO)アルゴリズムを提案している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Bendale_Towards_Open_World_2015_CVPR_paper.pdf
  • 13. 【62】 Pedro O. Pinheiro, Ronan Collobert, “From Image-level to Pixel-level Labeling with Convolutional Networks ”, in CVPR2015. CNN を用いて,画像からピクセルレベルでラベル付する手法. 簡単なラベルだけを付加した画像から CNN 特徴を抽出し,画像レベルで学習する. その結果をピクセルレベルでラベル付けする. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Pinheiro_From_Image-Level_to_2015_CVPR_paper.pdf
  • 14. 【63】 S. Kolouri, G. K. Rohde, “Transport-Based Single Frame Super Resolution of Very Low Resolution Face Images”, in CVPR2015. 超低解像(16x16pixles)の顔画像を入力とした超解像に関する研究.非線形の Lagrangian モデルによりこの問題を解決する.下図は提案手法の 流れである.(i)では各画像の顔パーツの配置(displacement)を覚えさせておく.(ii)では主成分(principal components)空間を生成する.(iii)入力の 顔画像と計算した主成分から各パラメータを計算.(iv)にて超解像のサンプルを計算する.(iv)の(a), (g)がそれぞれ低解像/高解像のペアであり ,(f)が提案手法による超解像結果,他が比較手法である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Kolouri_Transport- Based_Single_Frame_2015_CVPR_paper.pdf 著者ページ: http://www.andrew.cmu.edu/user/skolouri/Index.html
  • 15. 【64】 T. Liu, G. Wang, Q. Yang, “Real-time part-based visual tracking via adaptive correlation filters”, in CVPR2015. 相関ベースフィルタ(correlation filter)による追跡は CV 分野における適用例が増加しているが,オクルージョンの場面への対策が不十分であっ た.提案手法では部位毎の相関を計算することにより,オクルージョン状況下においても頑健な追跡を目指す.下図は処理フローを示してい る.まず最初のフレームでは対象物体の位置が与えられていることとする.それぞれの部位を推定するために KCF filter を適用して尤度マッ プを生成する.ベイズ推定のフィルタリングにより追跡するべき部位を切り分ける.単峰性であった追跡から複数のピークを持った追跡対象 へと拡張することで,オクルージョンに頑健な追跡手法として確立した.表は実験結果である.PASCAL VOC dataset に対してほとんどのタス クで良好な性能を示しただけでなく,約 30fps で動作した. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Real-Time_Part-Based_Visual_2015_CVPR_paper.pdf
  • 16. 【65】 C. Li, A. Reiter, G. D. Hager, “Beyond Spatial Pooling: Fine-Grained Representation Learning in Multiple Domains”, in CVPR2015. Convolutional neural networks (CNN)において,空間的なプーリング手法を改善.プーリングの粒度として,多段階スケールのプーリングを実装 したことや,プーリングのドメイン設定,新しいデータセットして 50 の工業製品を含む JHUIT-50 dataset を提案した.畳み込みとプーリング において小サイズのパッチは大サイズのパッチよりも invariant な特徴表現になることや,マルチスケールのパッチから畳み込んだ特徴を連結 する方が表現能力の高い特徴が生成できることが判明した.識別には Linear SVM を用いている.表は JHUIT-50 dataset における比較である. 表の右側に提案手法の種々の設定で精度を出している.左側の従来法と比較しても明らかな有効性が見られる. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Beyond_Spatial_Pooling_2015_CVPR_paper.pdf プロジェクトページ: http://cirl.lcsr.jhu.edu/research/human-machine-collaborative-systems/representation-learning-and-large-scale-object-recognition/
  • 17. 【66】 Y. Li, C. Chen, F. Yang, J. Huang, “Deep Sparse Representation for Robust Image Registration”, in CVPR2015. スパース表現を用いた画像レジストレーションを行う.1st layer では画像からエッジ空間へと変換する.2nd layer では sparse error tensor が分 解される.3rd layer では Fourier 係数によりさらにスパースな空間に投影することによりレジストレーションの精度を向上させた.実験では空 撮画像に対して画像レジストレーションを実施しており,有効な位置合わせ手法として確立した. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Deep_Sparse_Representation_2015_CVPR_paper.pdf 著者ページ: http://cseweb.uta.edu/~yeqing/
  • 18. 【67】 L. Wang, Z. Xiong, D. Gao, G. Shi, W. Zeng, F. Wu, “High-speed Hyperspectral Video Acquisition with a Dual-camera Architecture”, in CVPR2015. 時系列で取得できる 4D の Hyperspectral カメラ(HSHS; high-speed hyperspectral)を提案する.下図は提案手法のフロー図であり,dual-camera シ ステムを構築することでこうフレームレートにしてもブレずに撮像できる.従来の hyperspectral では 30fps の CASSI が存在したが,提案手法 では 100fps でもブラーがなく撮影可能. 図 1 図 2 Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Deep_Sparse_Representation_2015_CVPR_paper.pdf 著者ページ: http://cseweb.uta.edu/~yeqing/
  • 19. 【68】 Z. Wang, Q. Ji, “Classifier Learning with Hidden Information”, in CVPR2015. 従来の機械学習の方法は(X1,Y1)...(Xn, Yn)のように入力ベクトルと出力ベクトルがペアとして与えられてきたが,より柔軟性を向上させるた めに画像と潜在情報(hidden information)を与える方が良いと主張(下図).この概念に対して 2 つの手法- Loss Inequality Regularization (LIR)と Relationship Preserving Regularization (RPR)を提案する.LIR では第二の特徴量として潜在情報を取り入れる.例えば attribute は多くの場合画像 特徴量よりも識別性能が高いことが知られている.また,RPR では潜在情報を第二の目的関数として与える手法である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Wang_Classifier_Learning_With_2015_CVPR_paper.pdf 著者ページ: http://homepages.rpi.edu/~wangz10/
  • 20. 【69】 M. Faraki, M. T. Harandi, F. Porikli, “More About VLAD: A Leap from Euclidean to Riemannian Manifolds”, in CVPR2015. VLAD (Vector of Locally Aggregated Descriptors)を改良するために Riemannian manifolds を適用する.Region Covariance Descriptors (RCovD)を考 慮することで,VLAD を拡張した R-VLAD として強力な特徴コーディング手法とする.下は YouTube Celebrities, Dyntex++, UPENN dataset に おける比較である.Bag-of-words, VLAD, R-VLAD を比較しており,提案手法が最も高い精度を示した. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Faraki_More_About_VLAD_2015_CVPR_paper.pdf
  • 21. 【70】 Fang Wang, Le Kang, and Yi Li, “Sketch-based 3D Shape Retrieval using Convolutional Neural Networks ”, in CVPR2015. 2D のスケッチから 3D モデルを検索する手法. 1 つの 3D モデルから複数視点のスケッチ画像を生成しておき,そのスケッチ画像と入力スケッチ画像を CNN 特徴でマッチングすることで, 3D モデルを提示している. また,Siamese CNN を用いて次元を削減しつつ特徴を抽出している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Wang_Sketch-Based_3D_Shape_2015_CVPR_paper.pdf
  • 22. 【71】 A. Mosleh, P. Green, E. Onzon, I. Begin, J. M. P. Langlois, “Camera Intrinsic Blur Kernel Estimation: A Reliable Framework”, in CVPR2015. カメラのデブラーを行うためには Point Spread Function (PSF)が非常に重要である.提案手法ではデブラー手法を拡張するために,カメラの内 的なブラーを計測する.下図は提案手法のフローである.パターンに対するボケの性質を捉えて PSF を調整する.Deconvolution を施した結果 も図の右側に示されている.撮影に用いられたのはスマートフォンのカメラ(Blackberry mobile phone camera)である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Mosleh_Camera_Intrinsic_Blur_2015_CVPR_paper.pdf
  • 23. 【72】 Fang Wang, Le Kang, and Yi Li, “Sketch-based 3D Shape Retrieval using Convolutional Neural Networks ”, in CVPR2015. テキストから映像を結びつける手法とデータセットの提案. キャラクターの名前などの情報を用いて,グラフの最短経路を探索してマッチングしている. データセットには TV シリーズの Game of Thrones と映画 Harry Potter の動画とその文章が格納されている. Link(s) 【論文ページ】 http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Tapaswi_Book2Movie_Aligning_Video_2015_CVPR_paper.pdf 【プロジェクトページ】 https://cvhci.anthropomatik.kit.edu/~mtapaswi/projects-book_align.html
  • 24. 【73】 Z. Li, P. Tan, R. T. Tan, D. Zou, S. Z. Zhou, L.-F. Cheong, “Simultaneous Video Defogging and Stereo Reconstruction”, in CVPR2015. 提案手法では入力映像から,シーンのデプス推定と霧がかった(foggy)潜在画像を補正する処理を同時に行う.霧をノイズとして,また動画像 から SfM 的に距離画像を推定する関数を設定し,両者の最適化を同時に実行することでこの問題を解決している.下図は処理結果の一例であ る.一番右側が提案手法による defogging とデプス画像推定である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Simultaneous_Video_Defogging_2015_CVPR_paper.pdf
  • 25. 【74】 Cong Leng, Jiaxiang Wu, Jian Cheng, Xiao Bai, Hanqing Lu, “Online Sketching Hashing ”, in CVPR2015. 2 つの問題に言及した online hashing 手法の提案. 2 つの問題とは, ・新しいデータが入力された際に,再学習する必要がある ・大規模データになると計算コストが大きい である.これらの問題を解決するため.skech データに基づいた効率的な hash 関数を示す. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Leng_Online_Sketching_Hashing_2015_CVPR_paper.pdf
  • 26. 【75】 S. Zhu, C. Li, C. C. Loy, X. Tang, “Face Alignment by Coarse-to-Fine Shape Searching”, in CVPR2015. 顔画像から特徴点を取得するための Coarse-to-Fine な探索.3 ステージに分割して考案する.最初に与えられた顔の特徴点をより密にする毎に 正確な位置に最適化する.下図の CFSS が提案手法であり,実験では特徴点位置推定精度は最も高かった. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Zhu_Face_Alignment_by_2015_CVPR_paper.pdf
  • 27. 【76】 Y. Luo, Y. Wong, Q. Zhao, “Label Consistent Quadratic Surrogate Model for Visual Saliency”, in CVPR2015. Saliency の問題点として,新しいデータが追加された際に対応できないことが挙げられる.提案手法ではこの問題を解決するために Label Consistent Quadratic Surrogate と呼ばれるアルゴリズムを提案する.繰り返しによりスパース辞書を学習し,データ間の共通性を学習すること で新しいデータが入力されたとしても処理可能にする.下図のように,与えられたデータからスパース性の損失項と識別の損失項を求めるこ とにより,識別性能の高いスパース辞書(sparse dictionary)を生成できる. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Luo_Label_Consistent_Quadratic_2015_CVPR_paper.pdf
  • 28. 【77】 Y. Suh, K. Adamczewski, K. M. Lee, “Subgraph Matching using Compactness Prior for Robust Feature Correspondence”, in CVPR2015. 複雑な環境下での対応点マッチングに挑戦する問題.論文ではマッチングに応じて事前情報を変化させることで outlier を適切に除去する subgraph matching を提案する.最適化の手法としては Markov chain Monte Carlo (MCMC)を採用した.下図は提案手法と従来手法の比較を示す .青線が正解,赤線が非正解である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Suh_Subgraph_Matching_Using_2015_CVPR_paper.pdf
  • 29. 【78】 G. Yuan, B. Ghanem, “L0TV: A New Method for Image Restoration in the Presense of Impulse Noise”, in CVPR2015. Total Variation (TV)は画像処理の正規化において有効な prior model である.提案手法では L0-norm を適用した TV を提案することでノイズ除去 を行う.図 1 は繰り返しによる最適化とその結果である.100 回程度の繰り返しで収束している.図 2 は修復の結果であり,ノイズと元画像 が分離できている. 図 1 図 2 Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Yuan_L0TV_A_New_2015_CVPR_paper.pdf 著者ページ(コードあり): http://yuanganzhao.weebly.com/ オーラルスライド: http://yuanganzhao.weebly.com/uploads/1/0/7/5/10759809/slide-l0tv.pdf
  • 30. 【79】 F. Heide, W. Heidrich, G. Wetzstein, “Fast and Flexible Convolutional Sparse Coding”, in CVPR2015. Convolutional sparse coding (CSC)に関する手法は幾つか発表されている.著者らは splitting ベースの新しい CSC の枠組みを提案する.提案手法 は高速かつ高精度な手法を提供することが可能である.下図はフィルタの学習をした結果である.左が提案手法,右が従来法である.提案手 法はより鮮明な特徴抽出が可能であり,なおかつ 3-4 倍高速に処理可能である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Heide_Fast_and_Flexible_2015_CVPR_paper.pdf プロジェクトページ(コード・データセットあり): http://www.cs.ubc.ca/labs/imager/tr/2015/FastFlexibleCSC/
  • 31. 【80】 T. H. Kim, K. M. Lee, “Generalized Video Deblurring for Dynamic Scenes”, in CVPR2015. 著者らは双方向オプティカルフローを採用することで pixel-wise にカーネルを推定する方法を提案する.単一のエネルギー関数にてモデリン グして,オプティカルフローと潜在的な正解画像を同時に推定することでデブラーを実行する.下図はブラー画像(a)とローカルにカーネルを 推定した結果(b),さらには双方向オプティカルフロー(c)による pixel-wise カーネル推定である.詳細な結果は YouTube 動画参照. Link(s) 論文ページ: http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Kim_Generalized_Video_Deblurring_2015_CVPR_paper.pdf YouTube: https://www.youtube.com/watch?v=T6F5QzRm2lQ
  • 32. 【81】 N. Ben-Zrihem, L. Zelnik-Manor, “Approximate Nearest Neighbor Fields in Video”, in CVPR2015. Approximate Nearest Neighbor (ANN)は近似的に NN を解く方法であるが,正確な処理結果がでないことも多い.これを,すべてのパッチから 取得した特徴から構成される ANN-Field (ANNF)を適用するだけでなく,提案手法ではさらにビデオに対して ANNF を適用する.下図は処理 例であり,(a)はビデオフレーム,(b)は参照画像である.(c)それぞれのフレームにて ANNF が参照され,マッチングを行う. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ben- Zrihem_Approximate_Nearest_Neighbor_2015_CVPR_paper.pdf
  • 33. 【82】 J.-B. Huang, A. Singh, N. Ahuja, “Single Image Super-resolution fro Transformed Self-Exemplars”, in CVPR2015. 提案手法では self-similarity based super-resolution を改良する.アフィン変換と局所的な形状のバリエーションを同時に推定する.外的/内的 (self-similarity)な辞書との比較を行うことで,鮮明な画像に対応づける.詳細な比較はプロジェクトページ参照. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ben- Zrihem_Approximate_Nearest_Neighbor_2015_CVPR_paper.pdf プロジェクトページ: https://sites.google.com/site/jbhuang0604/publications/struct_sr
  • 34. 【83】 S. H. Khatoonabadi, N. Vasconcelos, I. V. Bajic, Y. Shan, “How many bits does it take for a stimulus to be salient?”, in CVPR2015. 提案手法では顕著性の計算に operational block description length (OBDL)のモデルを用いている.ビデオを圧縮する際には必要な部分のみを更新 するが,顕著性ではその機能が使えないかを検討した.この機能により,かなり高速な処理をおこなえただけでなく,人間の注視の機能を模 倣することにも成功し,saliency の精度も向上した. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Khatoonabadi_How_Many_Bits_2015_CVPR_paper.pdf 著者ページ(コードあり): http://www.sfu.ca/~ibajic/software.html プロジェクトページ: http://www.svcl.ucsd.edu/projects/hossein/
  • 35. 【84】 X. Zhang, H. Su, L. Yang, S. Zhang, “Fine-Grained Histopathological Image Analysis via Robust Segmentation and Large-Scale Retrieval”, in CVPR2015. 医用画像の解析は重要なテーマの一つである.論文では細胞領域のセグメンテーションや大規模細胞画像データの検索を実現するための手法 を提案する.下図は提案手法の概要であり,上はオンラインの識別,下はオフラインの学習を示す.黄色・緑色はそれぞれの病理学的に意味 のある対象クラス,青色の境界線は識別クラスが不明のものを示す.87.3%の精度,1.68 秒での識別を達成した. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Zhang_Fine- Grained_Histopathological_Image_2015_CVPR_paper.pdf 著者ページ: http://research.rutgers.edu/~shaoting/index.html
  • 36. 【85】 H. Li, Z. Lin, X. Shen, J. Brandt, G. Hua, “A Convolutional Neural Network Cascade for Face Detection”, in CVPR2015. カスケード(Cascade)識別器は処理速度と精度を両立するための手法として知られており,広く用いられるに至っている.しかし,カスケード 構造をした検出器には単純な特徴量のみが使用されているため,著者らはこれに convolutional neural networks (CNN)ベースの特徴量を用いるこ とで,顔検出の精度を向上させることを試みた.ここでロバスト性を高めるため,複数解像度の画像にて識別器を走査した.提案手法は単一 の CPU 上にて 14FPS で処理できることが判明した.下図は検出の各工程の様子である.12-net は 12x12pxls のパッチサイズにて検出している 結果である.それぞれの設定にて NMS を実行する. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_A_Convolutional_Neural_2015_CVPR_paper.pdf
  • 37. 【86】 Xianzhi Du, David Doermann, Wael Abd-Almageed,”A Graphical Model Approach for Matching Partial Signatures”, in CVPR, 2015. 左上図のように,手書きの署名には完全なもの(左)と省略したもの(右)がある.省略して書かれた署名と,事前に登録された完全な署名を高精 度で照合する手法が提案されている. Shape context 特徴は署名の輪郭点から抽出され,2 次元のバイナリ型で文字の形状を表現する.輪郭上の 2 点の相対的距離と角度に基づいて ヒストグラムを作成し,K-means で署名をクラスタリングしていく. 3 つのデータセットを使っての実験が行われ,照合の正解率は従来手法と比べてそれぞれ 70%,4%,15%向上した. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Du_A_Graphical_Model_2015_CVPR_paper.pdf
  • 38. 【87】 Q. N. Ngoc, A. Gautier, M. Hein, “A Flexible Tensor Block Coordinate Ascent Scheme for Hypergraph Matching”, in CVPR2015. より高次元の特徴マッチングを実現するために Hypergraph Matching 問題を解決する.提案手法では 3 次(third order)の Hypergraph のマッチン グを仮定している.ここで,3 次の,それぞれの空間の幾何的な位置関係を示すテンソルを用意している.実験では CMU house dataset にて従 来手法との比較を行っており,下図が特徴マッチングの結果である.提案手法は BCAGM+IPFP, BCAGM+MP として紹介されている. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Nguyen_A_Flexible_Tensor_2015_CVPR_paper.pdf プロジェクトページ(コードあり): http://www.ml.uni-saarland.de/code/CVPR15/FlexTensorBlock.htm
  • 39. 【88】 Y. Chen, W. Yu, T. Pock, “On learning optimized reaction diffusion processes for effective image restoration”, in CVPR2015. 画像復元(image restoration)は長年の課題であり,解決により種々のアプリケーションへの応用が期待される.効率的かつ高品質な画像復元を 実現するために,提案手法では(1) ガウシアンノイズを仮定してデノイジング ,(2)JPEG により人工的にノイズ除去を採用した.下図は提案手 法におけるネットワークのアーキテクチャ,表はノイズ除去の比較結果である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Chen_On_Learning_Optimized_2015_CVPR_paper.pdf
  • 40. 【89】 Y. Zhu, Y. Zhang, B. Bonev, A. L. Yuille, “Modeling Deformable Gradient Compositions for Single-Image Super-resolution”, in CVPR2015. 単一画像による超解像(single-image super-resolution)の問題は今後のディスプレイシステムを考える上でも重要な課題に挙げられる.提案手法 では,形状変化に対応した参照辞書を用いることで超解像に取り組んでいる.下図は提案手法のフロー図である.前処理として Gradient Ridge Image を施しており,辞書とのマッチングにより解像度を上げている.PSNR 値の面でも数値が良くなっている.画像による訂正的な評価は論 文参照. Link(s) 論文ページ: http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Zhu_Modeling_Deformable_Gradient_2015_CVPR_paper.pdf プロジェクトページ: http://www.stat.ucla.edu/~zhuyu/CVPR15.html
  • 41. 【90】 Haoxiang Li, Gang Hua,”Hierarchical-PEP Model for Real-world Face Recognition”, in CVPR, 2015. 顔認証システムにおいてはある人物がどのような表情や変顔をしようとも,その人であると正しく認証されることが要求される.従来研究の PEP モデルは顔をパーツの組み合わせとして考え,パーツごとのパッチ画像の特徴を連結することで顔の表情を構築するという考え方を用い ている.提案手法はこの PEP モデルを階層的に拡張したもので,テストの顔画像をトップダウン的にパッチへと分解していき,そのパッチ画 像に対して SIFT などの特徴量を計算しておく.そして PCA と LDA を用いて次元数を減らしていき,ボトムアップ的に出力を得ることで異 なる表情の同一人物への対応が可能となり,実験では高い正解率での顔認証が実現できた(下図). Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Hierarchical-PEP_Model_for_2015_CVPR_paper.pdf
  • 42. 【91】 Rahaf Aljundi, Rémi Emonet, Damien Muselet, Marc Sebban, “Landmarks-based Kernelized Subspace Alignment for Unsupervised Domain Adaptation ”, in CVPR2015. サブスペースにおけるランドマークベースの教師なし位置合わせ. Taget と Source から特徴を抽出し,特徴空間にプロットする.そのプロットの分布から,ランドマークを決定する.そのランドマークを中心 に PCA を行い,サブスペースにおける位置合わせを行う. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Aljundi_Landmarks- Based_Kernelized_Subspace_2015_CVPR_paper.pdf
  • 43. 【92】 Feng Lu, Imari Sato, Yoichi Sato, “Uncalibrated Photometric Stereo Based on Elevation Angle Recovery from BRDF Symmetry of Isotropic Materials”, in CVPR2015. 表面の反射率特性を表現する手法. 本手法の contribution は以下の 3 点 1 half-vector 対称性の制約を導出 2 対称性を利用した視点角度の決定 3 反射率を持ちた光源を推定 Link(s) 【論文ページ】 http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Lu_Uncalibrated_Photometric_Stereo_2015_CVPR_paper.pdf
  • 44. 【93】 Mostafa Abdelrahman, Aly Farag, David Swanson,and Moumen T. El-Melegy, “Heat Diffusion Over Weighted Manifolds: A New Descriptor for Textured 3D Non-Rigid Shapes”, in CVPR2015. Weighted Heat Kernel Signature(W-HKS)に基づく 3D 非剛体テクスチャ記述子の提案. スケールへの不変性,形状/色記述子を有している. 特徴記述の流れは以下のとおり. SHREC'13 および SHREC'14 で実験した結果 一番左が query で,それ以降がマッチング率の高かった 3D モデルである. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Abdelrahman_Heat_Diffusion_Over_2015_CVPR_paper.pdf
  • 45. 【94】 B. Shuai, G. Wang, Z. Zuo, B. Wang, L. Zhao, “Integrating Parametric and Non-parametric Models For Scene Labeling”, in CVPR2015. CNN の特徴抽出や識別器を局所的なパッチ識別器として適用する.例えば下図の sand の領域と sidewalk の領域はピクセルの特徴ではほとん ど差が出ないと思われる.しかし,局所領域として特徴量を取得すれば判別が可能である.提案手法ではグローバルなシーンの意味付けを適 用して,ローカルな意味付けの曖昧性を除去する.ここではグローバルなラベリングと,ローカルな特徴量のエネルギー関数の最小化により 最終的なラベリング結果を得る.表は[Farabet+, PAMI2013]や[Pinheiro+, ICML2014]の結果と比較した結果である. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Shuai_Integrating_Parametric_and_2015_CVPR_paper.pdf 著者ページ(コードあり): https://sites.google.com/site/beinshuai/
  • 46. 【95】 Dongping Li, Kaiming He, Jian Sun, Kun Zhou, “A Geodesic-Preserving Method for Image Warping”, in CVPR2015. パノラマ画像を通常の画像に変換する手法. 画像上から,物体を構成する曲線や直線を検出し,それを保つような画像変換を行う.(Geodesic-Preserving) Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_A_Geodesic-Preserving_Method_2015_CVPR_paper.pdf 【著者ページ】 http://research.microsoft.com/en-us/um/people/kahe/
  • 47. 【96】 X. Mei, W. Dong, B.-G. Hu, S. Lyu, “UniHIST: A Unified Framework for Image Restoration With Marginal Histogram Constraints”, in CVPR2015. UniHIST という,複数制約を同時に満たすヒストグラムという概念を提案して,画像復元(image restoration)問題に適用する.UniHIST では quadratic Wasserstein 距離 (W2 distance)を用いて参照の特徴と復元画像の対応づけを行う.W2 distance では密度関数や平滑化,差分などに頼る ことなくヒストグラム間の距離を直接求めるフレームワークである.下図は提案手法と比較手法との比較実験の例である.(a),(b)はそれぞれ オリジナル画像とノイズ画像,(c)は従来手法による復元画像であり PSNR 20.29, SSIM は 0.83 であった.それに対して(d)提案手法では NLDD に UniHIST を追加しており,PSNR 24.80, SSIM 0.90 と数値の面でも改善した. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Mei_UniHIST_A_Unified_2015_CVPR_paper.pdf
  • 48. 【97】 Marko Ristin, Juergen Gall, Matthieu Guillaumin, Luc Van Gool, “From Categories to Subcategories: Large-scale Image Classification with Partial Class Label Refinement ”, in CVPR2015. データセットに対し,subcategory を定義することで,再ラベル付けを行う. 例えば,ネコとライオンがいるが,両者はネコ科であるため,”ネコ”と荒くラベル付けする. これを,NCM forests を用いて学習して実現している. こうして荒くラベル付することで,認識精度を向上している. Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ristin_From_Categories_to_2015_CVPR_paper.pdf 【プロジェクトページ】 http://www.iai.uni-bonn.de/~gall/projects/coarse2fine/coarse2fine.html
  • 49. 【98】 Yang Li, Jianke Zhu, Steven C.H. Ho, “Reliable Patch Trackers: Robust Visual Tracking by Exploiting Reliable Patches”, in CVPR2015. パッチ単位で物体を追跡する Reliable Patch Trackers (RPT)の提案. 連続的なモンテカルロ法のフレームワークで,particle filter を通してパッチを追跡する. 追跡の際,追跡に有効なパッチを逐次更新し,頑健な追跡を実現する. 追跡結果 Link(s) 【論文ページ】 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Reliable_Patch_Trackers_2015_CVPR_paper.pdf 【著者ページ(コードあり)】 http://ihpdep.github.io/
  • 50. 【99】 W. Liu, T. Mei, Y. Zhang, C. Che, J. Luo, “Multi-Task Deep Visual-Semantic Embedding for Video Thumbnail Selection”, in CVPR2015. 映像のサムネイル自動選択の問題を解決するために,multi-task deep visual-semantic embedding を適用する.提案手法では,タイトルやキャプ ション,映像などを用いる.与えられた画像とテキストの情報から潜在的な意味を対応づける.従来法との主な違いは多タスク学習によりド メイン間の違いを理解したロバストな意味づけに拡張できたことである.CNN の構成は基本的には AlexNet を用いる(右図)が,出力層 (softmax)を projection layer M に変更する.さらには Latent Semantic Space にてテキスト側の情報を組み合わせる.画像とテキストの学習の違い を補うために多タスクが適用されており,下の表から有効な精度が出ていることが判明した. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Multi-Task_Deep_Visual- Semantic_2015_CVPR_paper.pdf 著者ページ: http://liuwu.weebly.com/
  • 51. 【100】 Wei Liu, Rongrong Ji, Shaozi Li, ”Towards 3D Object Detection with Bimodal Deep Boltzmann Machines over”, in CVPR, 2015. RGB-D での物体認識が難しい理由のひとつとして,そのトレーニングデータの不足が挙げられる.そのため既に大量のデータが存在する 2 次 元画像を RGB-D の話でも利用できるようにすれば良いのではないか,という趣旨.その実現のためにディープボルツマンマシンに基づいた ディープラーニング手法を提案している.集めてきた CAD データと 2 次元のポジティブサンプルに対し,R-CNN を利用して RGB と Depth そ れぞれから特徴を抽出する.ロバストな検出のために, ディープボルツマンマシンと Exemplar-SVMs により柔軟性と汎用性を保証. Link(s) 論文ページ: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Liu_Towards_3D_Object_2015_CVPR_paper.pdf