More Related Content
Similar to 【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.2 (12)
【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.2
- 2. 2
Detectionの傾向
• 問題設定や学習方式など、広がりが見える
– 問題設定
• 3D(時系列または三次元空間)
• NAS(Neural Architecture Search)
• 条件がつかない「一般物体検出の論文」は少ない
– EfficientDetやSaccadeNetなどPoster採択はあり
– Instance Segmentationでは、いくつか論文も
– 学習方式
• Long-Tailな不均衡データセットに対する学習
• Few-Shot学習/弱教師あり学習
- 4. 4
Person Re-Identification/Person Search
• CVPR 2020で、多数が中国の組織からの論文
– Person Re-Identification: 複数カメラに映った人物を識別
• 題名に含む論文21本のうち17本が、中国の組織を含む
– Person Search: 同一人物を、複数カメラの映像から検索
• 題名に含む論文6本の全てが、中国の組織から
– 組織的・非組織的な要因による、複合要因と推測
• 組織的な要因
– 国家的な方策と合致し、研究資金を獲得しやすい
– 研究資金があれば、必要なデータセットも作成可能
• 非組織的な要因
– CNNの特徴抽出の応用研究として、課題が幅広い
- 5. 5
論文全般の傾向
• 当然ではあるが、全体が整った論文が多い
– 既存の課題設定
• やはりSOTAを出していることは強い
• SOTAでない場合、Ablation Studyや補足実験
– 新たな課題設定
• 既存のCV課題に対し、何らかのアレンジ
• 自分でデータセットを作っている場合も多い
– コスト(費用・期間)が発生するが、データは必要
– その他、読みやすさに対する工夫
• Figure 1とAbstract(次頁)
- 6. 6
Figure 1とAbstract
• CVPRでは、Figure 1で「印象を残す」傾向
– 査読者は多忙で、かつ専門が近い論文の査読とは限らない
• 査読者は得意分野でなくても、読まなければならない
• 「読みにくい」だけで、心証を損なう可能性が高い
– 査読者ではない読者にも「読みやすさ」は重要
⇒ Figure 1とAbstractで、第一印象を判断される
– Figure 1で印象を残すため、大きく分けると以下の傾向
• 提案手法の要点をアピール
• 課題解決の特色をアピール
- 7. 7
Figure 1の例
• 本文が読まれるように、論文の意図をアピール
– 「提案手法の要点をアピール」の例
• Unsupervised Person Re-Identification
via Multi-Label Classification
– CVPR 2020で、Oral採択
– 教師なし学習による人物再同定
– Figure 1で、提案手法の枠組みを図解
– 「課題解決の特色をアピール」の例
• ABCNet: Real-time Scene Text Spotting
with Adaptive Bezier-Curve Network
– CVPR 2020で、Oral採択
– テキスト領域が、曲がっていても検出
– Figure 1で、曲がったテキストに対し
検出結果をセグメンテーションと比較
一番上の例は、京都の居酒屋の看板
- 9. 9
Adelaide Intelligent Machines Group
• University of Adelaideの研究グループ
– アデレード大学は、オーストラリアの公立大学
– Chunhua Shen教授が中心的な人物の模様
• FCOS (ICCV 2019採択)
• CVPR 2020では、前述のABCNetを含め12本の論文
• ECCV 2020にも、11本の論文が採択されている模様
– GitHubで、Detectron2ベースの実装「AdelaiDet」を公開
• https://github.com/aim-uofa/AdelaiDet
• FCOSに加え、BlendMaskやABCNetなどの実装も
- 10. 10
GPU事情
• 組織によって使用できるGPUリソースは違う
– 一部の企業は、潤沢なリソースを保有
• 国外: Google/DeepMind、Facebook AI、NVIDIA
• 国内: Preferred Networks
– 上記以外の組織は、千差万別の模様
• CVPR 2020では、1080Ti×2枚が戦える最低ラインか
• Abstractで「1080Tiで動く」とアピールする論文も
• 「V100×4で実験した」とある大学からの論文も多い
• Tiny ImageNetなどでリソースを節約している論文も
– 非CNNの論文ではCPUのみの実験も見られたが、例外的