2017/11/17のDLゼミにて発表した論文です。
# Title
Generating Videos with Scene Dynamic
- NIPS 2016
# Author
Carl Vondrick, Hamed Pirsiavash, Antonio Torralba
- MIT, University of Maryland Baltimore Country
# Overview
3D GANを用いて動画を学習する研究です。
# References
* http://carlvondrick.com/tinyvideo/
* https://youtu.be/Pt1W_v-yQhw
5. Keywords: 3D Pose estimate, Human Eva II dataset, tracking by detection
新規性・差分
手法
結果 概要
単眼カメラでの3次元姿勢推定.
混雑状況においても実現できるよう,3段階の処理を加えてい
る.
Human Eva IIベンチマークで最先端の結果を示した.
従来の単眼カメラでの3D姿勢推定は,かなり制限のある環境
でのみ実現されてきた.それに対し,本手法は雑多な環境で
も実現できるように手法を設計した.
はじめに,1フレームから人物の視点と2D関節を推定する.
次に,フレーム間の関連性を,tracking by detectionに基づい
て求める.
最後に,追跡情報から3Dの姿勢を復元する.
Human Eva II datasetで実験した結果
Mykhaylo Andriluka, Stefan Roth, Bernt Schiele, “Monocular 3D Pose Estimation and Tracking by Detection”, in
CVPR, 2010.
【3】
Links
論文:http://www.gris.informatik.tu-darmstadt.de/~sroth/pubs/cvpr10andriluka.pdf
プロジェクトページ:https://www.d2.mpi-inf.mpg.de/node/428
6. Keywords: Deep Learning, Convolutional Neural Networks (CNN), Visualization, AlexNet, Caltech 101, Caltech 256
新規性・差分
手法
結果
概要
Deep Learningは非常に有効な特徴量を抽出することで知られ
ているが,その構造はブラックボックスであった.本稿ではCNN
特徴を可視化することにより少しでも特徴抽出に関する理解を
深める.
Deep Learningによる識別を行うだけでなく,可視化を行う.ここ
ではAlexNetを適用している.可視化により,特徴量の傾向を把
握し,さらに識別精度の高いモデルを構築できる.
次ページに可視化のフロー図を示す.
下図は可視化の例である.識別に有効な特徴量を選択して可視化してい
る.層が進むほど高次な特徴になっている.
Matthew D. Zieler, Rob Fergus, “Visualizing and Understanding Convolutional Networks”, in ECCV, 2014.
【4】
Links
論文ページ
http://www.matthewzeiler.com/pubs/arxive2013/eccv2014.pdf
著者ページ
http://www.matthewzeiler.com/
著者による講演動画
https://www.youtube.com/watch?v=ghEmQSxT6tw
8. Keywords: Person re-identification,iLIDS,VIPeR,ETZH,SDALF,Color Feature
新規性・差分
手法
結果 概要
人物の対称性を用いたPerson Re-IDの提案.Stmmetry-
Driven Accumulation of Local Features(SDALF)と呼ばれてい
る.
iLIDS, VIPeR, ETZH datasetで実験し,有効性を確認した.
従来のPerson Re-IDは,色特徴やテクスチャ特徴などの設計
方法に焦点が当てられていた.しかし,本論文では,「人物は左
右で対称性がある」という構造情報を加える事で,Re-IDの精度
を向上させている.
はじめに,人物領域から顔・胴体・下半身を分離し,胴体と
下半身は対称性があるとして領域分割する.次に,各領域
から特徴(Weight Color Histgoram,Maximally Stable Color
Regions,Reccurent High-Structures Pathes)を抽出する.
最後に,特徴を重み付けした距離計さんによってマッチング
する
iLIDS, VIPeR, ETZH datasetで実験した結果が以下のとおり
M. Farenzena, L. Bazzani, A. Perina, V. Murino, M. Cristani, “Person Re-Identification by Symmetry-Driven
Accumulation of Local Features ”, in CVPR, 2010.
【5】
Links
・PDF:http://www.lorisbazzani.info/papers/proceedings/FarenzenaetalCVPR10.pdf
・Project:http://www.lorisbazzani.info/sdalf.html
・Code:https://github.com/lorisbaz/SDALF
実験結果はCMC曲線で評価されている.CMC曲線は,横軸にRank,
縦軸に累積確率をとっており,面積が大きいほど性能が高い.
9. Keywords:Automatic Attribute Discovery, Automatic Characterization and MiLBoost
新規性・差分
手法
結果
概要
Web上の画像から自動的に物体判別のための属性を抽出
するシステムを提案した.
・物体を識別するための特徴を自動的に発
見・順位付けができる.
・人の手でラベル付けする必要なく,物体の
appearance modelを学習できる.
・特定のための属性として,外見的特徴だ
けでなく,その特徴が局所的な特徴か全体
的な特徴かの尺度(Localizability)を持つ.
外見的特徴としては色・形状・テクスチャを
用いている.
1.Webから大量の画像とその説明文を集める.
2.集めた説明文から画像の特徴の属性の検出や順位付けをす
る
3.順位の高い属性を外見的特徴として,MIL Boostを用いて属性
ごとのLocalizabilityを設定する.
Web上のイヤリングとバック,ネクタイ,靴の画像
に対して提案システムを用いて属性付けした.
人が属性付けしたデータと比べて,
イヤリングとバックで80%,ネクタイで90%,靴で70%
の精度で正しく属性付けできた.
TL Berg, AC Berg, J Shih, “Automatic Attribute Discovery and Characterization from Noisy Web Data”, in
ECCV, 2010.
【6】
Links
論文
10. Keywords:Person Re-ID, Metric Learning, PRDC,
新規性・差分
手法
結果 概要
Person R-IDにおけるMetric Learningの提案.Probabilistic
Relative Distance Comparison(PRDC).実験の結果,ブースティ
ングなどの手法よりも高性能となった.
從來手法ではクラス内分散を最小化することに焦点が当てられ
ていたが,それよりも,ペアワイズに学習することで正しいクラス
の尤度を最大化している.これにより,外観変化に頑健になり,
モデルの過学習を防ぐことが出来る.
クラス内分散を最小化するのではなく,ペアワイズに学習
することで正しいクラスの尤度を最大化している.
Wei-Shi Zheng, Shaogang Gong and Tao Xiang, “Person Re-identification by Probabilistic Relative Distance
Comparison”, in CVPR, 2011.
【7】
Links
論文:http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=5995598
11. Keywords: Person Re-ID, HSV, YCrCb, RGB, Gabor, Schmid, attribute
新規性・差分
結果
概要
Person Re-IDにおける複数の外観特徴の有効性を調査してい
る.RGB・HSV・YCrCb・Gabol Filter・Schmid Filterに対して実
験している.
從來,多くの外観特徴が提案されてきたが,どの特徴が有効
か調査されていなかった.そのため本論文では,複数の特徴
を適用して有効性を調査している.
Chunxiao Liu, Shaogang Gong, Chen Change Loy and Xinggang Lin, “Person Re-identification: What Features
Are Important?”, in ICCV, 2012.
【8】
Links
論文:
http://citeseerx.ist.psu.edu/viewdoc/download?
doi=10.1.1.415.589&rep=rep1&type=pdf
全体的に,HSVとYCbCrが良い性能だった.
さらに,下記のAttribute情報を追加した上でも調査しており,
Attributeを加える事で,高性能となることも示している.
12. Keywords:Face Recognition, HOG, LBP Local Descriptor, Lerning-based, uunsupervised learning
新規性・差分
手法
結果
概要
学習ベースで顔認識用のencoderを生成する手法.実験の結
果,HOGなどよりも7[%]程度精度が向上しており,90[%]の精度
を誇っている.
従来手法のHOGやLBPのような人間が設計した特徴量ではな
く,unsupervised学習で特徴量を設計している.
Z Cao, Q Yin, X Tang, J Sun, “Face Recognition with Learning-based Descriptor”, in CVPR,2010.
【9】
Links
論文:
http://research.microsoft.com/en-us/um/people/jiansun/papers/
CVPR10_FaceReco.pdf
13. Keywords: Pedestrian Detection, Benchmark, Caltech Pedestrian Detection Benchmark
新規性・差分
結果
概要
歩行者検出用のベンチマークとして知られるCaltech
Pedestrian Detection Benchmarkの提案.
手法
データセットの撮影方法に関する項目や,歩行者のオクルージョン度合いな
ど歩行者の統計情報を評価した.学習画像はpositive 67k, negative 61k, テ
スト画像はpositive 65k, negative 56kのデータが収集されており,歩行者検出
データセットの中でも最大である.さらには,映像やオクルージョンラベルも含
まれている.比較にはHaar-like特徴をはじめShapelet, HOG, ChnFtrs,
PoseInv, PLS, HOGLBPなどの特徴量が比較されている.
データセットの説明はもちろん,映像に含まれる歩行者の特性
や手法の違いについても言及.データの収集,アノテーション,
歩行者検出手法の比較まで詳細に行っていることが新規性.
精度の面では[Walk+, CVPR2010]が最も高い精度を実現した.(表)
Piotr Dollar, Christian Wojek, Bernt Schiele, Pietro Perona, “Pedestrian Detection: An Evaluation of the State
of the Art”, in PAMI2012.
【10】
Links
論文 http://vision.ucsd.edu/~pdollar/files/papers/DollarPAMI12peds.pdf
プロジェクト http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/
14. Keywords:Bag of words, Fisher Vector, Image searching, image retrival
新規性・差分
手法
結果 概要
Fisher Vectorの提案論文.画像検索に用いることを想定してお
り,従来のBoWと比較して,精度・検索速度・メモリーの点で優位
性があることを示している.
従来のBoWのようなフレームワークではなく,確率的な生成モデ
ルを構築して画像検索の精度を上げている.
入力特徴量をGMMでクラスタリングし,平均ベクトル・分散・
重みといった統計的特徴量を算出し,特徴ベクトルとして扱
う.
3つのbinarization(α=0 binarization, Local Senstive Hashing, Spectral
Hashing)で精度を比較している,その結果,α=0 binarizationが最も
高精度となった.以下の画像は画像検索の出力例.
Florent Perronnin, Yan Liu, Jorge Sa ́nchez and Herve ́ Poirier , “Large-scale Image Retrival with Compresed
Fisher Vector”, in CVPR, 2010.
【11】
Links
論文:
http://citeseerx.ist.psu.edu/viewdoc/download?
doi=10.1.1.401.9140&rep=rep1&type=pdf
著者:https://scholar.google.co.jp/citations?user=r8Zh-jwAAAAJ&hl=ja
参考:http://www.slideshare.net/takao-y/fisher-vector
Code: http://jacobcv.blogspot.jp/2014/12/fisher-vector-in-python.html
15. Keywords: Integral Channel Features, Pedestrian Detection
新規性・差分
手法
結果
概要
複数のチャネルの蓄積により特徴量を構成する”Integral
Channel Features”の提案.
複数チャネルから単純な特徴量を取得するのみで特徴量を構
成しているので,高速かつ高精度な歩行者検出精度を達成し
た.
複数の変換画像(gray, 1次, LUV, edges, Gabor, Gradient
histogram, DOG, Thresholding)から積分した特徴量を蓄積す
る.基本的なアイディアはViola&JonesのHaark-like特徴の単純
な拡張である.識別器にはカスケード識別器の拡張版である
soft cascadeを用いる.
下はINRIA, Caltech Pedestrian datasetにて比較・評価した結果である.
Piotr Dollar, Zhuowen Tu, Pietro Perona, Serge Belongie, “Integral Channel Features”, in BMVC, 2009.
【12】
Links
論文
http://authors.library.caltech.edu/60048/1/dollarBMVC09ChnFtrs.pdf
Piotr Dollar
https://scholar.google.com/citations?user=a8Y2OJMAAAAJ&hl=ja
YouTube https://www.youtube.com/watch?v=SrX1TBjxNq0
OpenCV実装
http://docs.opencv.org/3.0-beta/modules/xobjdetect/doc/
integral_channel_features.html
16. Keywords:Background Subtraction, evaluation, video surveillance
新規性・差分
結果 概要
監視カメラにおける背景差分手法の比較を行っている.9つの
手法は,McFarlance・Stauffer・Oliver・McKenna・Li・Kim・
Zivkovic・Maddalena・Barnichである.
背景差分の欠点などを洗い出すために,9つの手法の比較評
価を行っている.各手法の特徴は下記の通り.
Sebastian Brutzer, Benjamin Hoferlin, Gunther Heidemann, “Evaluation of Background Subtraction Techniques
for Video Surveillance”, in CVPR, 2011.
【13】
Links
論文:http://www.vis.uni-stuttgart.de/uploads/tx_vispublications/Brutzer2011-2.pdf
著者:http://ikw.uni-osnabrueck.de/en/heidemann
17. Keywords:Action Recognition, Dense Trajecotories, HOG, HOF, MBH
新規性・差分
手法
結果 概要
行動認識のための特徴抽出手法の提案.密な軌跡上から複
数の局所特徴量を求めることによって,詳細な特徴抽出を可
能にしている.
従来の動作特徴と異なり,時間的にも空間的にもより密に特
徴を抽出している.
1.画像ピラミッドの生成&5[pixel]間隔で特徴点抽出.この
と特徴点は誤対応を防ぐため閾値判定している.
2.Farneback アルゴリズムによって15[frame]特徴点追跡
3.軌跡上からHOG,HOF,MBH特徴量を算出
H Wang, A Kläser, C Schmid, CL Liu, “Action Recognition by Dense Trajectories”, in CVPR, 2011.
【14】
Links
論文:https://hal.inria.fr/inria-00583818/document
Project:http://lear.inrialpes.fr/people/wang/dense_trajectories
18. Keywords: Object Retrieval, RootSIFT,
新規性・差分
手法
結果
概要
物体検索のための特徴設計(RootSIFT)・クエリ拡張・特徴の補
完を提案している.実験の結果,3つの提案手法をすべて組み
合わせると最高精度となった.
物体検索における複数の概念を組み合わせて精度を向上さ
せている.
(i)特徴設計
SIFTのベクトルをL1正規化した後,各次元のルートを
取ったベクトルを用いている.
(ii)クエリ拡張
ROIを平均的に修正していく
Ox5k,Ox10k, Paris6kに
対して実験を行った.
結果は右の通り.
Relja Arandjelovi´c, Andrew Zisserman, “Three things everyone should know to improve object retrieval ”, in
CVPR, 2012.
【15】
Links
論文:https://www.robots.ox.ac.uk/~vgg/publications/2012/Arandjelovic12/arandjelovic12.pdf
プレゼン:http://www.robots.ox.ac.uk/~vgg/publications/2012/Arandjelovic12/presentation.pdf
ポスター:http://www.robots.ox.ac.uk/~vgg/publications/2012/Arandjelovic12/poster.pdf
著者:http://www.relja.info/publications.html
(iii)特徴の補完
データセット内の結びつきを考慮してグラフを構築する.
19. Keywords:asymmetric transforms, object recognition, kernel learning, domain adaptation
手法
結果 概要
物体認識のための特徴空間設計.ペアワイズに,非対称で特
徴を変換している.
Brian Kulis, Kate Saenko, and Trevor Darrell, “What You Saw is Not What You Get: Domain Adaptation Using
Asymmetric Kernel Transforms”, in CVPR,2011.
【16】
Links
PDF:ftp://192.33.221.237/pub/courses/EE-700/material/05-12-2012/cvpr_adapt.pdf
Citation:https://scholar.google.co.jp/citations?user=okcbLqoAAAAJ&hl=ja
日本語資料:
http://www.isi.imi.i.u-tokyo.ac.jp/~harada/pdf/
trend_in_scene_object_recognition_cvpr2011.pdf
20. Keywords:Random Projection, Texture classification,
新規性・差分
手法
結果 概要
特徴次元手法であるRandom Projection(RP)によるテクスチャ分
類.RPにおけるパッチサイズや次元数などを詳細に検討してい
る.実験では従来のPCAや複数の特徴と比較している.
テクスチャ分類の汎用性を向上するため,RPをテクスチャ分類
用にfine-tuningしている.万能辞書の作成.
Li Liu, Paul Fieguth, “Texture Classification using Compressed Sensing ”, in PAMI, 2012.
【17】
Links
3つのデータセット(Brodatz, CUReT, MSRC)に対して検証実験してい
る.
論文:http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=6136524
著者:http://www.sbs.ox.ac.uk/community/people/li-liu
21. Keywords:Acion recognition, Data mining, machine learning, temporal feature
新規性・差分
手法
結果 概要
行動認識にデータマイニングの概念を取り入れている.STIPで特
徴を抽出し,Association ruleでマイニングしている.KTHデータ
セットで実験し,95.7%の精度で実現している.
新しい特徴などを設計することなく,データマイニングによって精
度向上している.
A Gilbert, J Illingworth, R Bowden, “Action Recognition Using Mined Hierarchical Compound Features”, in PAMI,
2011.
【18】
Links
論文:http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5551150&tag=1
著者:https://scholar.google.com/citations?user=NNhnVwoAAAAJ&hl=ja
日本語解説:http://hirokatsu16.blog.fc2.com/blog-entry-97.html
KTHデータセットにおいて複数
の手法に対して実験している.
実験結果を右図に示す.