Submit Search
Upload
関西CVPRML勉強会 2011.9.23
•
2 likes
•
1,169 views
Akisato Kimura
Follow
これが最終版です(2011.9.23) → ”L(f)の呪い”他,不備・不足分を修正追記して,本当に最終版にしました (2011.9.24)
Read less
Read more
Technology
Business
Report
Share
Report
Share
1 of 26
Recommended
KantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object Recognition
belltailjp
20130925.deeplearning
20130925.deeplearning
Hayaru SHOUNO
20150803.山口大学講演
20150803.山口大学講演
Hayaru SHOUNO
20160825 IEICE SIP研究会 講演
20160825 IEICE SIP研究会 講演
Hayaru SHOUNO
20141008物体検出器
20141008物体検出器
Takuya Minagawa
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine
Takuya Minagawa
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
Toshinori Hanya
20141208.名大セミナー
20141208.名大セミナー
Hayaru SHOUNO
Recommended
KantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object Recognition
belltailjp
20130925.deeplearning
20130925.deeplearning
Hayaru SHOUNO
20150803.山口大学講演
20150803.山口大学講演
Hayaru SHOUNO
20160825 IEICE SIP研究会 講演
20160825 IEICE SIP研究会 講演
Hayaru SHOUNO
20141008物体検出器
20141008物体検出器
Takuya Minagawa
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine
Takuya Minagawa
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
Toshinori Hanya
20141208.名大セミナー
20141208.名大セミナー
Hayaru SHOUNO
関西CVPRML 2011.8.27
関西CVPRML 2011.8.27
Akisato Kimura
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
The University of Tokyo
大規模画像認識とその周辺
大規模画像認識とその周辺
n_hidekey
CVPR2011祭り 発表スライド
CVPR2011祭り 発表スライド
Akisato Kimura
CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)
MasanoriSuganuma
Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~
nlab_utokyo
Jokyokai
Jokyokai
Taiji Suzuki
SSII2014 詳細画像識別 (FGVC) @OS2
SSII2014 詳細画像識別 (FGVC) @OS2
nlab_utokyo
Data assim r
Data assim r
Xiangze
Online moving camera_background_subtraction
Online moving camera_background_subtraction
Daichi Suzuo
CVPR 2011 ImageNet Challenge 文献紹介
CVPR 2011 ImageNet Challenge 文献紹介
Narihira Takuya
PredCNN: Predictive Learning with Cascade Convolutions
PredCNN: Predictive Learning with Cascade Convolutions
harmonylab
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Akisato Kimura
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Akisato Kimura
多変量解析の一般化
多変量解析の一般化
Akisato Kimura
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
Akisato Kimura
NIPS2015 reading - Learning visual biases from human imagination
NIPS2015 reading - Learning visual biases from human imagination
Akisato Kimura
CVPR2015 reading "Global refinement of random forest"
CVPR2015 reading "Global refinement of random forest"
Akisato Kimura
CVPR2015 reading "Understainding image virality" (in Japanese)
CVPR2015 reading "Understainding image virality" (in Japanese)
Akisato Kimura
Computational models of human visual attention driven by auditory cues
Computational models of human visual attention driven by auditory cues
Akisato Kimura
NIPS2014 reading - Top rank optimization in linear time
NIPS2014 reading - Top rank optimization in linear time
Akisato Kimura
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
Akisato Kimura
More Related Content
Similar to 関西CVPRML勉強会 2011.9.23
関西CVPRML 2011.8.27
関西CVPRML 2011.8.27
Akisato Kimura
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
The University of Tokyo
大規模画像認識とその周辺
大規模画像認識とその周辺
n_hidekey
CVPR2011祭り 発表スライド
CVPR2011祭り 発表スライド
Akisato Kimura
CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)
MasanoriSuganuma
Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~
nlab_utokyo
Jokyokai
Jokyokai
Taiji Suzuki
SSII2014 詳細画像識別 (FGVC) @OS2
SSII2014 詳細画像識別 (FGVC) @OS2
nlab_utokyo
Data assim r
Data assim r
Xiangze
Online moving camera_background_subtraction
Online moving camera_background_subtraction
Daichi Suzuo
CVPR 2011 ImageNet Challenge 文献紹介
CVPR 2011 ImageNet Challenge 文献紹介
Narihira Takuya
PredCNN: Predictive Learning with Cascade Convolutions
PredCNN: Predictive Learning with Cascade Convolutions
harmonylab
Similar to 関西CVPRML勉強会 2011.9.23
(12)
関西CVPRML 2011.8.27
関西CVPRML 2011.8.27
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
大規模画像認識とその周辺
大規模画像認識とその周辺
CVPR2011祭り 発表スライド
CVPR2011祭り 発表スライド
CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)
Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~
Jokyokai
Jokyokai
SSII2014 詳細画像識別 (FGVC) @OS2
SSII2014 詳細画像識別 (FGVC) @OS2
Data assim r
Data assim r
Online moving camera_background_subtraction
Online moving camera_background_subtraction
CVPR 2011 ImageNet Challenge 文献紹介
CVPR 2011 ImageNet Challenge 文献紹介
PredCNN: Predictive Learning with Cascade Convolutions
PredCNN: Predictive Learning with Cascade Convolutions
More from Akisato Kimura
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Akisato Kimura
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Akisato Kimura
多変量解析の一般化
多変量解析の一般化
Akisato Kimura
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
Akisato Kimura
NIPS2015 reading - Learning visual biases from human imagination
NIPS2015 reading - Learning visual biases from human imagination
Akisato Kimura
CVPR2015 reading "Global refinement of random forest"
CVPR2015 reading "Global refinement of random forest"
Akisato Kimura
CVPR2015 reading "Understainding image virality" (in Japanese)
CVPR2015 reading "Understainding image virality" (in Japanese)
Akisato Kimura
Computational models of human visual attention driven by auditory cues
Computational models of human visual attention driven by auditory cues
Akisato Kimura
NIPS2014 reading - Top rank optimization in linear time
NIPS2014 reading - Top rank optimization in linear time
Akisato Kimura
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
Akisato Kimura
ICCV2013 reading: Learning to rank using privileged information
ICCV2013 reading: Learning to rank using privileged information
Akisato Kimura
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
Akisato Kimura
IJCAI13 Paper review: Large-scale spectral clustering on graphs
IJCAI13 Paper review: Large-scale spectral clustering on graphs
Akisato Kimura
関西CVPR勉強会 2012.10.28
関西CVPR勉強会 2012.10.28
Akisato Kimura
関西CVPR勉強会 2012.7.29
関西CVPR勉強会 2012.7.29
Akisato Kimura
ICWSM12 Brief Review
ICWSM12 Brief Review
Akisato Kimura
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
Akisato Kimura
関西CVPRML勉強会(特定物体認識) 2012.1.14
関西CVPRML勉強会(特定物体認識) 2012.1.14
Akisato Kimura
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
Akisato Kimura
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
Akisato Kimura
More from Akisato Kimura
(20)
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
多変量解析の一般化
多変量解析の一般化
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
NIPS2015 reading - Learning visual biases from human imagination
NIPS2015 reading - Learning visual biases from human imagination
CVPR2015 reading "Global refinement of random forest"
CVPR2015 reading "Global refinement of random forest"
CVPR2015 reading "Understainding image virality" (in Japanese)
CVPR2015 reading "Understainding image virality" (in Japanese)
Computational models of human visual attention driven by auditory cues
Computational models of human visual attention driven by auditory cues
NIPS2014 reading - Top rank optimization in linear time
NIPS2014 reading - Top rank optimization in linear time
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
ICCV2013 reading: Learning to rank using privileged information
ICCV2013 reading: Learning to rank using privileged information
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
IJCAI13 Paper review: Large-scale spectral clustering on graphs
IJCAI13 Paper review: Large-scale spectral clustering on graphs
関西CVPR勉強会 2012.10.28
関西CVPR勉強会 2012.10.28
関西CVPR勉強会 2012.7.29
関西CVPR勉強会 2012.7.29
ICWSM12 Brief Review
ICWSM12 Brief Review
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
関西CVPRML勉強会(特定物体認識) 2012.1.14
関西CVPRML勉強会(特定物体認識) 2012.1.14
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
Recently uploaded
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
Recently uploaded
(9)
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
関西CVPRML勉強会 2011.9.23
1.
ICCV2011 Paper Digest
Learning a Category Independent Object Detection Cascade Akisato Kimura @ NTT Communication Science Labs Twitter ID: @_akisato
2.
いまさら物体検出? もうできてない?
どんな物体検出ができているのか? 顔検出・人物検出・文字検出: 商用水準 特定種類物体検出: 研究水準 一般物体検出: 研究水準すらおぼつかない 2 関西CVPRML (September 22, 2011)
3.
一般物体検出の事例
顕著性算出 Spectral residual [Hou+ CVPR2007] Spectral residual 3 関西CVPRML (September 22, 2011)
4.
一般物体検出の事例
顕著性に基づく検出 2-D FFT + thresholding [Achanta+ CVPR2009] 4 関西CVPRML (September 22, 2011)
5.
一般物体検出の事例
顕著性に基づく物体検出 Saliency graph cuts [福地+ ICME2009→信学論2010] 5 関西CVPRML (September 22, 2011)
6.
一般物体検出の事例
Superpixelをぎりぎり覆う 新しい特徴の追加 bounding boxが望ましい Superpixels Straddling [Alexe+ CVPR2010] 6 関西CVPRML (September 22, 2011)
7.
CVPR2008 Best Student
Paper Award ECCV2008 Best Paper Award Learning a category independent object detection cascade E. Rahtu & J. Kannala @ Univ. Oulu M. Blaschko @ Univ. Oxford
8.
やりたいこと
一般物体検出 特定種類物体検出・認識の候補を絞るために使う。 だから、とっても速く動かしたい。 Alexe+@CVPR2010 Proposed 8 関西CVPRML (September 22, 2011)
9.
アプローチ
複数の新しい特徴の提案 陽に顕著性を用いない点が、大きな違い。 ここでの計算はできるだけサボりたい。 教師付き識別学習の導入 「物体らしさ」の定義は機械学習に任せてしまう。 9 関西CVPRML (September 22, 2011)
10.
全体の構成 初期候補抽出
特徴抽出 最終候補決定 Superpixel boundary Structured learning integral Superpixel with ranking clustering constraints Boundary edge distribution Position/size prior Window symmetry Non-maxima filtering 10 関西CVPRML (September 22, 2011)
11.
初期候補抽出(1)
Superpixel window generation ここで取れるboxの数は高々数100程度 Superpixel 隣接/3隣接 segmentation [Felzenschwalb+ superpixelの 入力画像 IJCV2004] bounding box 11 関西CVPRML (September 22, 2011)
12.
初期候補抽出(2)
Position / size prior 学習データから,サイズと位置との関係を学習 Random samplingでサイズと位置を決定(10万) 幅,高さは 横位置は 縦位置は そのまま学習 幅のみに依存 高さのみに依存 12 関西CVPRML (September 22, 2011)
13.
全体の構成 初期候補抽出
特徴抽出 最終候補決定 Superpixel boundary Structured learning integral Superpixel with ranking clustering constraints Boundary edge distribution Position/size prior Window symmetry Non-maxima filtering 13 関西CVPRML (September 22, 2011)
14.
特徴抽出(1)
Superpixel boundary integral (BI) Superpixels straddling (SS)の高速版として Bounding box yの 境界ピクセルの集合 Bounding box内 superpixel画像の 全長 Gaussian smoothing 14 関西CVPRML (September 22, 2011)
15.
特徴抽出(2)
Boundary edge distribution (BE) 入力画像 エッジ強調gradient Canny edge detector Gradient Gaussian smoothing 候補領域を6x6分割 部分領域で注目する 方向と重みを変更 15 関西CVPRML (September 22, 2011)
16.
特徴抽出(3)
Window symmetry (WS) エッジ強調gradient 2x2領域でヒストグラムを統合 画像を4x4分割 (各領域16次元ヒストグラム) Histogram intersection 方向ヒストグラムを計算 (各領域4次元ヒストグラム) 16 関西CVPRML (September 22, 2011)
17.
全体の構成 初期候補抽出
特徴抽出 最終候補決定 Superpixel boundary Structured learning integral Superpixel with ranking clustering constraints Boundary edge distribution Position/size prior Window symmetry Non-maxima filtering 17 関西CVPRML (September 22, 2011)
18.
最終候補決定(1)
Structured output ranking Pseudo-codeは本文Algorithm 1を参照 損失関数 採用する領域 採用しない領域 (のindex) (のindex) 特徴量の重み i番目の画像の j番目の窓の特徴量 18 関西CVPRML (September 22, 2011)
19.
最終候補決定(2)
Non-maxima suppression & filtering スコア極大箇所検出 最終候補決定 幅・高さ・横位置・縦位置の4次元 抽出した所定数(=1万)のwindow 空間 を規則的に分割 をスコアの高い順に並べる 分割領域内の候補window(4次元 これまでに採用したwindowと 空間中の1点に対応)から,最も 重なりが一定以下であれば採用 スコア の良いwindow を抽出 所定数(=1万)のwindowを取るまで 所定数(=100 or 1000)のwindow 分割と抽出を繰り返す を取るまで抽出を繰り返す 19 関西CVPRML (September 22, 2011)
20.
データセット
PASCAL VOC 2007 http://pascallin.ecs.soton.ac.uk/challenges/VOC/voc2007/ Total ≒ 10000 images (2501 for training, 2510 for validation, 4952 for testing) 20 関西CVPRML (September 22, 2011)
21.
検出結果の例
Red = detection result, green = ground truth もっと見たい方は http://www.cse.oulu.fi/MVG/Downloads/ObjectDetection 21 関西CVPRML (September 22, 2011)
22.
初期候補選択の効果
頑張れば randomや規則的抽出よりも 良くなります…(ぇ 22 関西CVPRML (September 22, 2011)
23.
各特徴量の効果
単独特徴で考えると、 superpixels straddlingと superpixel boundary integralが だいたい互角 点線=100個出力 実線=1000個出力 23 関西CVPRML (September 22, 2011)
24.
特徴量を組み合わせた効果
提案した特徴(WS+BE+BI) だけだと、従来法と互角。 (ただし、高速に動作) 従来法での主要特徴(SS)を 用いると、従来法を上回る。 Structured learning (SRK)の効果もまずまず 点線=100個出力 実線=1000個出力 24 関西CVPRML (September 22, 2011)
25.
雑感
やっぱり一般物体検出は難しい. 20カテゴリでも50%.多様性が増えると…(゜Д゜) この論文でも,実際にいくつの物体が存在するか, を特定することはできていない. 「物体」に共通する特徴が本当に存在するの? それでも一般物体検出は必要. 未知カテゴリ物体を検出できることは, 特定種類物体検出/認識をする上で不可欠. 25 関西CVPRML (September 22, 2011)
26.
Thank you for
your kind attention. Any questions/comments/discussions ? Corresponding author Akisato Kimura, Ph.D @ NTT CS Labs. [E-mail] akisato <at> ieee.org [Twitter] _akisato [web] Please search by “Akisato Kimura” 26 関西CVPRML (September 22, 2011)