SlideShare a Scribd company logo
1 of 12
Download to read offline
Bag-of-Featuresに基づく物体認識 (1)
                - 特定物体認識 -

          Akisato Kimura @ NTT CS Labs.
                    Twitter ID: @_akisato
特定物体認識とは?
       教科書によると
           画像内にある個別物体(=インスタンス)を認識する処理
           物体の「見え」から物体IDへの変換を意味する

                …いや,これでは全然わかりません…


       要するに ↓↓↓ と見なすタスクが特定物体認識


                        =


    2                       関西CVPRML勉強会 2012.1.14
一般物体認識と何が違うの?
       一般物体認識: 物体のクラスを認識する処理


             =                           =

       特定物体認識: インスタンスを認識する処理


             =                           ≠

    3            関西CVPRML勉強会 2012.1.14
でも,区別は簡単ではない
       一般的には,どんな変動を吸収するか?で区別
           特定物体認識:
            アフィン変換(回転・拡大縮小)・オクルージョン・
            照明変動(に伴う見た目の色の変化) などを吸収
           一般物体認識:
            物体インスタンスの多様性を吸収
       とすると,これらはどっち?




    4                 関西CVPRML勉強会 2012.1.14
何の役に立つのか?
       特殊なマーカを使わずに実世界とwebとをつなぐ




    5             関西CVPRML勉強会 2012.1.14
ある程度は既にできています
       Google goggle
           http://www.google.com/mobile/goggles/
                   Landmark                             Book




                    Artwork                              Logo




    6                           関西CVPRML勉強会 2012.1.14
一般的な実現方法

クエリ画像                                 照合・検証       出力



                              特
         特                    徴
         徴                    量
         量   Visual words     表            画像DB
         抽   (量子化テーブル)        現     (構造化索引集合)
         出                    記
                              述



  DB画像       Visual word
 DB画像
DB画像                                   索引付け
                設計
             (特徴量量子化)

7                  関西CVPRML勉強会 2012.1.14
実現における課題
1. 大規模データに対する高速処理                  2. 各種変動に対する頑健処理
クエリ画像
   → 索引付け・照合で工夫                       → 特徴抽出・特徴量表現で工夫 出力
                                            照合・検証



                 10K~ words              特
             特                           徴
回転・拡大縮小・     徴                           量                        ~1sec
 隠れ・色変化      量       Visual words        表            画像DB
             抽       (量子化テーブル)           現     (構造化索引集合)
             出                           記
                                         述               ~100G Bytes



   DB画像              Visual word
  DB画像
 DB画像                                             索引付け
                        設計
                     (特徴量量子化)
1M~ images
 8                            関西CVPRML勉強会 2012.1.14
特徴量抽出
       どんな変動が起きても値が不変な特徴量が理想
       大域特徴量 or 局所特徴量
           大域特徴量: 計算簡単,でも各種変動に弱い
           局所特徴量: 計算大変,でも各種変動に強い
             特定物体認識における主流は,局所特徴量.


                         大域特徴量
                        (ex. 紫が多い)


                         局所特徴量
                         (ex. 特徴的な
                           黄色数字)


    9                 関西CVPRML勉強会 2012.1.14
局所特徴量
    多くは (特徴点)検出+(特徴量)記述 で構成される
        局所特徴量の提案の多くは,検出と記述がセット
        実際に使われる際には,別々に検討することも多い
    再現性も識別性も高い方が望ましい
        再現性: 各種変動が加わっても同じものを同じと見なせる
        識別性: 異なるものを異なると見なせる

               特徴点検出                        特徴量記述
               各種変動に対して                     抽出した特徴点で
               安定した特徴量が                     各種変動に対して
               取れそうな箇所を                     安定した特徴量を
               特定                           算出


    10              関西CVPRML勉強会 2012.1.14
局所特徴量の具体例
    原点
        [Schmid+ 1997], [Lowe 1999]
    検出の高精度化
        Harris-Laplace [Mikolajczyk+ 2001], MSER [Matas+ 2002],
         Harris-Affine [Mikolajczyk+ 2004]
    大ブレイク
        SIFT [Lowe 2004], PCA-SIFT [Ke+ 2004]
    処理高速化
        SURF [Bay+ 2006], CARD [Ambai+ 2011] etc.
    色情報の考慮
        C-SIFT [Abdel-Hakim+ 2006] etc.

    11                        関西CVPRML勉強会 2012.1.14
参考資料
    黄瀬,岩村 “3日で作る特定物体認識”,情報処理
     学会誌,Vol.49,No.9,pp.1082-1089,2008
     http://imlab.jp/IPSJ_3days/
    人工知能に関する断想録
     http://d.hatena.ne.jp/aidiary/20091018/1255862734
    藤吉,安倍 “局所勾配特徴抽出技術”,精密工学会
     誌,Vol.77, No.12, pp.1109-1116, 2011




    12                   関西CVPRML勉強会 2012.1.14

More Related Content

Similar to 関西CVPRML勉強会(特定物体認識) 2012.1.14

大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺
n_hidekey
 
20120623 cv勉強会 shirasy
20120623 cv勉強会 shirasy20120623 cv勉強会 shirasy
20120623 cv勉強会 shirasy
Yoichi Shirasawa
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネス
Mie Mori
 
Jubatusにおける大規模分散オンライン機械学習
Jubatusにおける大規模分散オンライン機械学習Jubatusにおける大規模分散オンライン機械学習
Jubatusにおける大規模分散オンライン機械学習
Preferred Networks
 
Jubatusの特徴変換と線形分類器の仕組み
Jubatusの特徴変換と線形分類器の仕組みJubatusの特徴変換と線形分類器の仕組み
Jubatusの特徴変換と線形分類器の仕組み
JubatusOfficial
 
45分で理解する SQL Serverでできることできないこと
45分で理解する SQL Serverでできることできないこと45分で理解する SQL Serverでできることできないこと
45分で理解する SQL Serverでできることできないこと
Insight Technology, Inc.
 
[INSIGHT OUT 2011] C12 50分で理解する SQL Serverでできることできないこと(uchiyama)
[INSIGHT OUT 2011] C12 50分で理解する SQL Serverでできることできないこと(uchiyama)[INSIGHT OUT 2011] C12 50分で理解する SQL Serverでできることできないこと(uchiyama)
[INSIGHT OUT 2011] C12 50分で理解する SQL Serverでできることできないこと(uchiyama)
Insight Technology, Inc.
 

Similar to 関西CVPRML勉強会(特定物体認識) 2012.1.14 (20)

Sift特徴量について
Sift特徴量についてSift特徴量について
Sift特徴量について
 
大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺
 
20120623 cv勉強会 shirasy
20120623 cv勉強会 shirasy20120623 cv勉強会 shirasy
20120623 cv勉強会 shirasy
 
Tesseract ocr
Tesseract ocrTesseract ocr
Tesseract ocr
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネス
 
Jubatusにおける大規模分散オンライン機械学習
Jubatusにおける大規模分散オンライン機械学習Jubatusにおける大規模分散オンライン機械学習
Jubatusにおける大規模分散オンライン機械学習
 
CVPR2018 参加報告(速報版)2日目
CVPR2018 参加報告(速報版)2日目CVPR2018 参加報告(速報版)2日目
CVPR2018 参加報告(速報版)2日目
 
Jubatusの特徴変換と線形分類器の仕組み
Jubatusの特徴変換と線形分類器の仕組みJubatusの特徴変換と線形分類器の仕組み
Jubatusの特徴変換と線形分類器の仕組み
 
文献紹介:Elaborative Rehearsal for Zero-Shot Action Recognition
文献紹介:Elaborative Rehearsal for Zero-Shot Action Recognition文献紹介:Elaborative Rehearsal for Zero-Shot Action Recognition
文献紹介:Elaborative Rehearsal for Zero-Shot Action Recognition
 
20201010 personreid
20201010 personreid20201010 personreid
20201010 personreid
 
Agile Overview In Ono
Agile Overview In OnoAgile Overview In Ono
Agile Overview In Ono
 
Interop2017
Interop2017Interop2017
Interop2017
 
Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...
Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...
Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...
 
45分で理解する SQL Serverでできることできないこと
45分で理解する SQL Serverでできることできないこと45分で理解する SQL Serverでできることできないこと
45分で理解する SQL Serverでできることできないこと
 
Creating and Using Links between Data Objects
Creating and Using Links between Data ObjectsCreating and Using Links between Data Objects
Creating and Using Links between Data Objects
 
[INSIGHT OUT 2011] C12 50分で理解する SQL Serverでできることできないこと(uchiyama)
[INSIGHT OUT 2011] C12 50分で理解する SQL Serverでできることできないこと(uchiyama)[INSIGHT OUT 2011] C12 50分で理解する SQL Serverでできることできないこと(uchiyama)
[INSIGHT OUT 2011] C12 50分で理解する SQL Serverでできることできないこと(uchiyama)
 
Proxy War
Proxy WarProxy War
Proxy War
 
ビジネスインテリジェンス入門~OSSでBIを始めよう~
ビジネスインテリジェンス入門~OSSでBIを始めよう~ビジネスインテリジェンス入門~OSSでBIを始めよう~
ビジネスインテリジェンス入門~OSSでBIを始めよう~
 
Object-oriented Programming / Exception handling
Object-oriented Programming / Exception handlingObject-oriented Programming / Exception handling
Object-oriented Programming / Exception handling
 
Active Convolution, Deformable Convolution ―形状・スケールを学習可能なConvolution―
Active Convolution, Deformable Convolution ―形状・スケールを学習可能なConvolution―Active Convolution, Deformable Convolution ―形状・スケールを学習可能なConvolution―
Active Convolution, Deformable Convolution ―形状・スケールを学習可能なConvolution―
 

More from Akisato Kimura

CVPR2015 reading "Understainding image virality" (in Japanese)
CVPR2015 reading "Understainding image virality" (in Japanese)CVPR2015 reading "Understainding image virality" (in Japanese)
CVPR2015 reading "Understainding image virality" (in Japanese)
Akisato Kimura
 

More from Akisato Kimura (20)

Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
 
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
 
多変量解析の一般化
多変量解析の一般化多変量解析の一般化
多変量解析の一般化
 
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移についてCVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
 
NIPS2015 reading - Learning visual biases from human imagination
NIPS2015 reading - Learning visual biases from human imaginationNIPS2015 reading - Learning visual biases from human imagination
NIPS2015 reading - Learning visual biases from human imagination
 
CVPR2015 reading "Global refinement of random forest"
CVPR2015 reading "Global refinement of random forest"CVPR2015 reading "Global refinement of random forest"
CVPR2015 reading "Global refinement of random forest"
 
CVPR2015 reading "Understainding image virality" (in Japanese)
CVPR2015 reading "Understainding image virality" (in Japanese)CVPR2015 reading "Understainding image virality" (in Japanese)
CVPR2015 reading "Understainding image virality" (in Japanese)
 
Computational models of human visual attention driven by auditory cues
Computational models of human visual attention driven by auditory cuesComputational models of human visual attention driven by auditory cues
Computational models of human visual attention driven by auditory cues
 
NIPS2014 reading - Top rank optimization in linear time
NIPS2014 reading - Top rank optimization in linear timeNIPS2014 reading - Top rank optimization in linear time
NIPS2014 reading - Top rank optimization in linear time
 
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
 
ICCV2013 reading: Learning to rank using privileged information
ICCV2013 reading: Learning to rank using privileged informationICCV2013 reading: Learning to rank using privileged information
ICCV2013 reading: Learning to rank using privileged information
 
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
 
IJCAI13 Paper review: Large-scale spectral clustering on graphs
IJCAI13 Paper review: Large-scale spectral clustering on graphsIJCAI13 Paper review: Large-scale spectral clustering on graphs
IJCAI13 Paper review: Large-scale spectral clustering on graphs
 
関西CVPR勉強会 2012.10.28
関西CVPR勉強会 2012.10.28関西CVPR勉強会 2012.10.28
関西CVPR勉強会 2012.10.28
 
関西CVPR勉強会 2012.7.29
関西CVPR勉強会 2012.7.29関西CVPR勉強会 2012.7.29
関西CVPR勉強会 2012.7.29
 
ICWSM12 Brief Review
ICWSM12 Brief ReviewICWSM12 Brief Review
ICWSM12 Brief Review
 
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
 
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
 
立命館大学 AMLコロキウム 2011.10.20
立命館大学 AMLコロキウム 2011.10.20立命館大学 AMLコロキウム 2011.10.20
立命館大学 AMLコロキウム 2011.10.20
 
広島画像情報学セミナ 2011.9.16
広島画像情報学セミナ 2011.9.16広島画像情報学セミナ 2011.9.16
広島画像情報学セミナ 2011.9.16
 

Recently uploaded

Recently uploaded (10)

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 

関西CVPRML勉強会(特定物体認識) 2012.1.14

  • 1. Bag-of-Featuresに基づく物体認識 (1) - 特定物体認識 - Akisato Kimura @ NTT CS Labs. Twitter ID: @_akisato
  • 2. 特定物体認識とは?  教科書によると  画像内にある個別物体(=インスタンス)を認識する処理  物体の「見え」から物体IDへの変換を意味する  …いや,これでは全然わかりません…  要するに ↓↓↓ と見なすタスクが特定物体認識 = 2 関西CVPRML勉強会 2012.1.14
  • 3. 一般物体認識と何が違うの?  一般物体認識: 物体のクラスを認識する処理 = =  特定物体認識: インスタンスを認識する処理 = ≠ 3 関西CVPRML勉強会 2012.1.14
  • 4. でも,区別は簡単ではない  一般的には,どんな変動を吸収するか?で区別  特定物体認識: アフィン変換(回転・拡大縮小)・オクルージョン・ 照明変動(に伴う見た目の色の変化) などを吸収  一般物体認識: 物体インスタンスの多様性を吸収  とすると,これらはどっち? 4 関西CVPRML勉強会 2012.1.14
  • 5. 何の役に立つのか?  特殊なマーカを使わずに実世界とwebとをつなぐ 5 関西CVPRML勉強会 2012.1.14
  • 6. ある程度は既にできています  Google goggle  http://www.google.com/mobile/goggles/ Landmark Book Artwork Logo 6 関西CVPRML勉強会 2012.1.14
  • 7. 一般的な実現方法 クエリ画像 照合・検証 出力 特 特 徴 徴 量 量 Visual words 表 画像DB 抽 (量子化テーブル) 現 (構造化索引集合) 出 記 述 DB画像 Visual word DB画像 DB画像 索引付け 設計 (特徴量量子化) 7 関西CVPRML勉強会 2012.1.14
  • 8. 実現における課題 1. 大規模データに対する高速処理 2. 各種変動に対する頑健処理 クエリ画像 → 索引付け・照合で工夫 → 特徴抽出・特徴量表現で工夫 出力 照合・検証 10K~ words 特 特 徴 回転・拡大縮小・ 徴 量 ~1sec 隠れ・色変化 量 Visual words 表 画像DB 抽 (量子化テーブル) 現 (構造化索引集合) 出 記 述 ~100G Bytes DB画像 Visual word DB画像 DB画像 索引付け 設計 (特徴量量子化) 1M~ images 8 関西CVPRML勉強会 2012.1.14
  • 9. 特徴量抽出  どんな変動が起きても値が不変な特徴量が理想  大域特徴量 or 局所特徴量  大域特徴量: 計算簡単,でも各種変動に弱い  局所特徴量: 計算大変,でも各種変動に強い  特定物体認識における主流は,局所特徴量. 大域特徴量 (ex. 紫が多い) 局所特徴量 (ex. 特徴的な 黄色数字) 9 関西CVPRML勉強会 2012.1.14
  • 10. 局所特徴量  多くは (特徴点)検出+(特徴量)記述 で構成される  局所特徴量の提案の多くは,検出と記述がセット  実際に使われる際には,別々に検討することも多い  再現性も識別性も高い方が望ましい  再現性: 各種変動が加わっても同じものを同じと見なせる  識別性: 異なるものを異なると見なせる 特徴点検出 特徴量記述 各種変動に対して 抽出した特徴点で 安定した特徴量が 各種変動に対して 取れそうな箇所を 安定した特徴量を 特定 算出 10 関西CVPRML勉強会 2012.1.14
  • 11. 局所特徴量の具体例  原点  [Schmid+ 1997], [Lowe 1999]  検出の高精度化  Harris-Laplace [Mikolajczyk+ 2001], MSER [Matas+ 2002], Harris-Affine [Mikolajczyk+ 2004]  大ブレイク  SIFT [Lowe 2004], PCA-SIFT [Ke+ 2004]  処理高速化  SURF [Bay+ 2006], CARD [Ambai+ 2011] etc.  色情報の考慮  C-SIFT [Abdel-Hakim+ 2006] etc. 11 関西CVPRML勉強会 2012.1.14
  • 12. 参考資料  黄瀬,岩村 “3日で作る特定物体認識”,情報処理 学会誌,Vol.49,No.9,pp.1082-1089,2008 http://imlab.jp/IPSJ_3days/  人工知能に関する断想録 http://d.hatena.ne.jp/aidiary/20091018/1255862734  藤吉,安倍 “局所勾配特徴抽出技術”,精密工学会 誌,Vol.77, No.12, pp.1109-1116, 2011 12 関西CVPRML勉強会 2012.1.14