紹介する論文
Fast,Accurate Detectionof 100,000 Object Classes on
a Single Machine
Thomas Dean, Mark A. Ruzon, Mar Segal, Jonathon Shlens,
SudheendraVijayanarashmhan, JayYagnik (Google)
CVPR2013 Best Paper
この論文の目的:
カテゴリ数が膨大な場合でも高速に物体検出を行
う。
Multi-band LSH-style hashtable (検索)
001 010 001 100 010 100
K
N*K
・・・
001 010HashTables
001 100 010 100・・・
WTAVector
001 010 001 100 010 100
W*K
・・・SubVectors
A B C D E F G H I J K L M
Threshold
Histogram
A, C, D, M
Filter IDs A D M・・・ C D K・・・ A C M・・・・・・
24.
Deformable Part Modelsへの適用
Deformable Part Models
P. Felzenswalb et al,“Object Detection with Discriminatively Trained
Part Based Models”, PAMI, 32(9), 2010
物体を「パーツの類似度+パーツ位置の歪み」で認識
各パーツはHOG特徴量で記述しLatent SVMで学習
学習後の各パーツのHOGフィルターにWTAを適用
25.
実験(PASCAL VOC2007)
PASCALVOC2007
20カテゴリ
訓練画像5000枚+試験画像最大5000枚
パラメータ
パーツサイズ:6x6 cells
rootフィルタなし
K=4,W=4, 3000 hash tables
Average Precision
Base = Deformable Part Model
100,000カテゴリでの実験
ImageSearch-100kというデータセット
を新たに作成
“Freebase”*からカテゴリをリスト化して、
GoogleImage Searchで画像を取得
Bounding Boxはない
1クエリーあたり最大500枚。平均300枚。
80%を学習に、20%を評価に使用。
*K. Bollacker et al. ,“Freebase: a collaboratively created graph database for structuring
human knowledge”, In ACM SIGMOD International Conference on Management of Data,
pp.1247-1250. 2008