Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

CVPR 2016 速報

7,889 views

Published on

CVPR 2016 ( http://cvpr2016.thecvf.com/ )の参加速報で、CVPR2015とCVPR2016の差分をメモ的に書きました。
前提として、CVPR2015の論文もしくは論文まとめ資料 ( http://www.slideshare.net/cvpaperchallenge )に全て目を通したことと、CVPR2016の全日程に参加しております。

Published in: Science

CVPR 2016 速報

  1. 1. CVPR2016 速報 – 2015と2016の差分 – 片岡 裕雄 http://www.hirokatsukataoka.net/
  2. 2. 概要 •  CV分野のトップ会議CVPR – 2015/2016の差分 –  CVPR2016 (本会議 2016/6/27 – 2016/6/30)の速報 –  CVPR2015 と CVPR2016の差分をまとめました –  前提としてCVPR2015の論文もしくはまとめ資料全てに目を通し た※ & CVPR2016に参加した ※ cvpaper.challenge (h=p://www.slideshare.net/cvpaperchallenge)より –  速報性を重視したためメモ程度であることにご注意
  3. 3. CNNの扱いについて –  Deep Learningはもはや当たり前となったので、あまり気にしなく なっている •  論文検索でタイトルや内容検索すると約400件/643件 •  発表で聞いている感じだと80~85%はCNN/RNNなど使っている印象 •  もちろん,この先どうするか?という議論は絶えない –  RNNが昨年よりも確実に増えた •  2015年は画像生成文や一部の動画処理だった •  2016年は画像生成文,質問回答 (Visual QuesMon Answering; VQA)をはじ め動画処理や画像解析 (Image Parsing)など文脈を考慮するモデルなら RNNを用いるという傾向
  4. 4. 激戦区? –  物体検出 •  文字通り画像内の位置を求める問題で,現在ではクラスも含めて位置を 推定 –  セマンティックセグメンテーション •  物体検出からさらに踏み込んで,ピクセルレベルで位置を推定,もちろん クラスも推定 –  画像解析 •  画像認識が高精度にできたことで,画像解析(Image Parsing)も徐々に増え た •  静止画から総合的な画像の理解を求める問題が増えた
  5. 5. CNNと並列に用いられる手法 –  MRF / CRFやRandom Forests •  セグメンテーションや文脈解析などはMRF/CRFが根強く残る •  Random Forestsは並列処理も可能でCPUでの実応用に耐えうるから? •  両者の理論は未だに面白いため,洗練されたものであれば査読を突破す ることが可能
  6. 6. オーラル発表から (1) –  Visual QuesMon Answering (VQA)が初日オーラルの一番最初の ひとつに •  言語とビジョンがひとつのトレンド •  もちろん画像説明文は健在 •  画像説明文からの派生も含まれる (動画応用、アプリケーション等)
  7. 7. オーラル発表から (2) –  ボリュームデータの活用 •  時系列解析,動画像 •  3次元データ処理 •  両者が昨年よりも目立っている気がする
  8. 8. 時系列解析 –  行動認識 –  イベント認識 –  一人称ビジョン –  ビデオサマライズ など
  9. 9. 3次元解析 –  物体検出 –  属性推定 –  セマンティック解析 –  ポイントクラウド など
  10. 10. 人物解析 –  顔認識 –  検出 –  追跡 –  姿勢推定 –  再同定 –  属性推定 –  行動認識 など
  11. 11. 自動運転への取り組み –  セッションは特別なかったが,アプリケーションとして自動運転へ 向けた取り組みが見られた •  歩行者検出 •  物体検出 •  環境認識 •  セマンティックセグメンテーション •  (セマンティック)オプティカルフロー •  ステレオ視 •  トラッキング •  属性解析 など
  12. 12. 根強く残る研究 –  デバイスや光,センシングを用いる研究枠は変わらず残る –  ComputaMonal Photography
  13. 13. データセット –  相変わらず巨大化する傾向にある –  面白いデータセットを提供するグループも
  14. 14. 新しい問題 –  最近の問題のフォロー含む –  物理量の変換 –  地図検索 –  UAV –  その他,個別分野で提案
  15. 15. 今後の方針?(1) •  やはり問題設定を作ることが重要 –  CNNはツールとして用いる –  一時期のHOGやSIFTなどと同様
  16. 16. 今後の方針?(2) •  データセットを作る –  問題と同時にデータセットを自分で作る –  覚悟する! –  データの作成が新規性のひとつとして論文に書ける
  17. 17. 今後の方針?(3) •  新規性をうまくアプリケーションとして見せる –  昔のBuilding Rome in a Day (ICCV2009)のようなイメージ –  今回のCVPRだとFace2Faceなど –  少しの差分でもその違いで見える未来を(分かりやすく)説明 –  分かりやすく,というところが重要
  18. 18. 今後の方針?(4) •  ロストアイディアを復活できないか –  Deep Learningにより(一時的に)消されたアイディアを復活 –  もちろん,今風にアレンジ –  可能性があるにも関わらず,消えたアイディアという意味

×