SlideShare a Scribd company logo
1 of 55
Download to read offline
統計的学習手法による物体検出の高精度化と効率化
- 人検出の実用化に向けて -


2013年3月15日
情報処理学会CVIM研究会



藤吉弘亘 (Hironobu Fujiyoshi)
中部大学工学部情報工学科
E-mail : hf@cs.chubu.ac.jp
URL:http://www.vision.cs.chubu.ac.jp/
Facebook: facebook.com/hironobu.fujiyoshi
Twitter: @hf149




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
人検出の実用化に向けて

• 統計的学習手法を用いた物体検出
– 公開画像データベースによる評価
 →必ずしも高い性能を獲得した手法が実用化に適しているとはいえない 




• 実用化という観点から最適な手法
  (1) 検出失敗の理由を明確に把握することが可能
  (2) 少ない学習サンプルでシステムをチューニング可能
  (3) 省メモリで高速な計算アルゴリズム




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
物体検出の高精度化:Joint特徴量による高精度化
- 人検出の実用化に向けて -




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
人の形状特徴
• 頭部から肩にかけてのΩ形状や下半身の連続的なエッジ形状
• 頭, 肩, 胴体, 足などの左右対称性

        第2世代のアプローチ                        第3世代のアプローチ




 →単一のHOG特徴量だけでは人の形状を捉えきれない
統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
特徴量間の共起を捉える特徴量の生成

• どのように特徴量間の共起を表現するか?
– Joint Haar-like [Mita et al., PAMI 08]

– 共起確率特徴 [山内, 山下, 藤吉 MIRU 08]


• どのように特徴量間の関連性を捉えるか?
– Shapelet [G.Mori CVPR 07]
– Joint-HOG [三井, 山内, 藤吉 SSII 08]




            顔                      人           顔/人/車
      Joint Haar-like          Shapelet       Joint HOG

統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
Joint-HOG特徴による人検出                     [三井, 山内, 藤吉 SSII 08]


• 異なる二つの領域のHOG特徴量をAdaBoostにより組み合わせる

                                AdaBoost

                              弱識別器h        重みα


                          h1(   ,   )       α1

                                    +                    判定結果


                          h2(   ,   )       α2        人:   H (x) > λ

                                    +
                                                     非人:    otherwise
                                    ・
                                    ・
                                    ・
未知入力パターン   HOG特徴量   x               +

                          hT(   ,   )       αT


                            H (x) = Σ ht(x)・αt
 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
2段階AdaBoostによるJoint-HOG特徴の自動生成

         セルの                           1段階目のAdaBoostで
       全組み合わせ                            生成した特徴量
                                               H1,2(C1, C2)
       C1とC2のHOG                                                           最終識別器
                                         C1:
       C1[v1, v2, ...v9]    AdaBoost                     ・・・
       C2[v1, v2, ...v9]                 C2:                                弱識別器h

               ・                                     ・
               ・                                     ・                    h1(   ,   )




                                                               AdaBoost
               ・                                     ・
                                          H7,11(C7, C11)
      C7とC11のHOG                                                          h2(   ,   )
                                         C7:
       C7[v1, v2, ...v9]    AdaBoost                     ・・・
       C11[v1, v2, ...v9]               C11:                                  ・
               ・                                     ・                        ・
               ・                                     ・                        ・
               ・                                     ・
                                               Hi,j(Ci, Cj)
       CiとCjのHOG
                                         Ci:
                                                                          hT(   ,   )
       Cj[v1, v2, ...v9]    AdaBoost                     ・・・
       Cj[v1, v2, ...v9]                 Cj:



         Low-level:                           Mid-level:
       HOG特徴POOL                        Joint HOG特徴POOL

→ 局所領域間での勾配方向の対称性、連続性を自動的に捉える
統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
や上半身から下半身
        2段階AdaBoostによる最終識別器
形状
      • 最終識別器による判定
向のエッジ特徴を         図 2 Joint 特徴量による 2 段階 Real AdaBoost.
t 特徴量 [5] が提案
st の弱識別器が複
り,共起性を表現す          多重解像度の HOG 特徴量も利用できる [9].次に,2 つの            化結果
ている.両手法は,          セル {m,n} の HOG 特徴量から共起確率特徴量を生成す             により
 ングにより組み合     る.その際に,共起確率特徴量は HOG 特徴量の全ての組                     徴量を
                      図 4
       2段階目のAdaBoostの出力: Joint 特徴量による物体検出例.
ることができ,高精     み合わせに対して求め,Real AdaBoost により最も良い組                で表現
                  み合わせを弱識別器として自動的に選択する.この処理を                   弱識別
                  H 2nd (v) = h2nd Ht (v, {m, n})
                                    1st
                                                  (2)
いて図 1(b) に示す      T 回繰り返し,1 段階目の Real AdaBoost により次式で表         を表す
                            {m,n}∈F
動的に捉える Joint       される 2 つのセル {m,n} の Joint 特徴量である強識別器
                                    T                           図5
 .本章では,1段階目のAdaBoostの出力: を学習する. ht (v, {m, n})
             H 1st (v, {m, n})
                        =      h2nd                    (3)
                                    1st
       Joint                                                   ても人
                                                               2 段階
                                            t=1
ついて述べる.
                            {m,n}∈F
                                      T

                2 段階目の弱識別器 h2nd () は,2 つのセルの関係を捉えた
                    H 1st (v, {m, n}) = h1st (v, {m, n})
                                         t               (1)   効では
ング              1 段階目の H 1st () の出力となっていることから,異なるセ             る.2
                                      t=1


 築の流れを図 2 に      上記の処理を全てのセルの組み合わせに対して行い,組
                ルの low-level の特徴量から mid-level の特徴量を生成して        徴量は
       統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
評価用データベース

• 人検出用画像データベース
- 学習用画像データ Positive : 2,053枚 Negative : 6,253枚
- 評価用画像データ Positive : 1,023枚 Negative : 1,233枚




• 車両検出用画像データベース
- 学習用画像データ Positive : 2,464枚 Negative : 2,415枚
- 評価用画像データ Positive : 1,899枚 Negative : 2,413枚




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
Joint-HOG特徴による検出性能

• 人検出と車両検出におけるJoint-HOGの効果




        (a) 人検出                          (b) 車両検出



            DET(Detection Error Tradeoff)による評価


統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
ラスタスキャンによるJoint-HOGによる検出例




       (a) 人検出                                (b) 車両検出




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
自動生成されたJoint HOG特徴 (人検出)

• 人の輪郭に沿った勾配方向の特徴量を自動選択
‒ 識別に有効なmid-levelな特徴量を自動生成




                                              最終識別器




     全学習用サンプルの        1段目のAdaBoostにより    2段目のAdaBoostにより
      平均勾配画像            選択されたHOG特徴         選択されたHOG特徴




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
自動生成されたJoint HOG特徴(車両検出)




     全学習用サンプルの        1段目のAdaBoostにより      2段目のAdaBoostにより
      平均勾配画像            選択されたHOG特徴           選択されたHOG特徴




    物体形状の対称性, 連続性, 異なる領域間の関係性を自動生成




  1ラウンド           2ラウンド            3ラウンド             15ラウンド
統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
誤検出の解析

• 検出失敗例における各弱識別器の応答
                 2.0


                 1.0
       弱識別器の応答

                                                                 弱識別器の応答:


                  0


                 -1.0

入力画像
                 -2.0
                     1     10     20          30       40   50
                                       弱識別器




                                                                    ポジティブサンプルの分布
                                                                    ネガティブサンプルの分布




                 ポジティブサンプルの頻度が高い                   ネガティブサンプルの分布が不自然


                         特徴量の限界                    学習サンプルの分布を再構築

統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
解析の容易さ




ピクセル差分特徴を利用した車両検出器を構築した際の弱識別器により選択された特徴

統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
FPGAによるJoint-HOGのハードウェア化
- 人検出の実用化に向けて -




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
ハードウェア化における着目点


• Joint-HOGの高速化
– パイプライン処理により低コストなFPGAで高速化を実現
• 検出対象の柔軟性
– 学習ソフトウェアを連携することで、検出対象を変更可能

                             Cyclone III FPGA

                    USBポート                カメラリンクコネクタ




                                                 カメラ入力
                   USB2.0


                                                      Cyclone III EP3C120F780-8
                                                      Logic cells:119,088  
                                                      Memory bit:3,981,312 bit

    PCアプリ                     画像処理ボード           RAM


統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘                                       17
検出対象をリコンフィグ可能な汎用物体検出ビジョンセンサ
 [矢澤, 藤吉 SSII 11]

• 学習ソフトウェアとFPGAハードウェアの連動
– Joint-HOGによる物体検出

                                     連携
  検出対象:人            ソフトウェアAPI                  物体検出ハードウェア


                                     学習結果
                    ODEN-API ver.2
                                     特徴量
                      による学習
                                     パラメータ



   学習データ




                                          人検出を実現




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
検出対象をリコンフィグ可能な汎用物体検出ビジョンセンサ
 [矢澤, 藤吉 SSII 11]

• 学習ソフトウェアとFPGAハードウェアの連動
– Joint-HOGによる物体検出

                                     連携
  検出対象:車両           ソフトウェアAPI                 物体検出ハードウェア


                                     学習結果
                    ODEN-API ver.2
                                     特徴量
                      による学習
                                     パラメータ



   学習データ




                                        車両検出を実現




             →汎用性の高い物体検出ハードウェアを実現
統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
検出対象をリコンフィグ可能な物体検出ハードウェア

• リアルタイムに任意の物体を検出(20FPS VGA画像)




                                         Cyclone III EP3C120F780-8
                                         Logic cells:119,088  
                                         Memory bit:3,981,312 bit


統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
物体検出の効率化:CGによる学習サンプルの自動生成
- 人検出の実用化に向けて -




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
大量の良質な学習サンプルを必要

• 統計的学習手法による高精度な物体検出を実現するには
– 大量の学習サンプル:10,000枚以上(人の場合)
– 良質な学習サンプル:位置ずれ・誤ラベルなし




         人画像(約3,000枚)                         平均勾配画像


統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
学習サンプルの作成




                                              10 hours later...
統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
学習サンプルと異なる環境での問題

• 学習サンプルと異なるカメラ位置の環境では
– 見えが異なるため検出能力が低下
– 現場での再学習は不可能...




          INRIA評価画像                      特定シーン画像
                             未検出



統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
学習サンプルの自動生成:生成型学習 [草富, 山内, 藤吉 SSII                  11]


• 特定シーンを考慮した生成型学習
– 学習サンプルを自動生成
   – ポジティブサンプル:三次元人体モデルより生成
   – ネガティブサンプル:ランダムに切り出して生成




                    生成モデル
                                         ポジティブサンプル



  撮影した映像



               各フレームからランダムに選択
                                         ネガティブサンプル




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
ポジティブサンプルの生成

• 人体シルエットの生成モデル



                                              カメラパラメータ
                                              ・カメラ位置
                                                 x = 0.0m
                                                 y = 6.2m
                                                 z = 0.0m
                                              ・カメラ角度
                                                 θ = 21.0




                                   ・・




                 人クラスの画像生成


統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
ネガティブサンプルの生成

• 背景画像からランダムで収集
- メリット:特定のシーンを背景として学習
- デメリット:人画像に背景ラベルを与える

                                              背景クラスの画像生成




     →誤ラベルを含んだ状態で学習すると識別器の性能低下を招く

統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
MILBoostの導入 [Viola et al., NIPS 06]

• Multiple Instance LearningをBoostingに導入した学習アルゴリズム
- 誤って付与されたラベルを持つ学習サンプルの影響を抑制

                    ポジティブクラス



                                       ・・

  Pos-­‐Bag1   Pos-­‐Bag2 Pos-­‐Bag3          Pos-­‐BagN


                    ネガティブクラス                               改良型MILBoost
     Neg-­‐Bag1




                                            Neg-­‐BagM
                  Neg-­‐Bag2	
  

統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
実験:学習データセットの組み合わせ

                  ポジティブサンプル               ネガティブサンプル



 INRIA-Pos
 実環境-Neg
                   INRIA-Pos(手動)         実環境-Neg(ランダム)




 実環境-Pos
 実環境-Neg
                   実環境-Pos(手動)           実環境-Neg(ランダム)




  生成-Pos
 INRIA-Neg
                  CG生成-Pos(自動)           実環境-Neg(ランダム)




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
実験結果:学習サンプルの自動生成の効果




                 INRIA-Pos+実環境-Neg
                 実環境-Pos+実環境-Neg

                 CG生成-Pos+実環境-Neg




      →CG生成によるポジティブサンプルは実環境の画像サンプルと同等以上

統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
実験:誤サンプルの影響の評価

• ネガティブサンプルにおける誤ラベルの影響を調査
- Real AdaBoostとMILBoostの比較

                                 ネガティブクラス


 誤ラベルの割合:0%



                                 ネガティブクラス


 誤ラベルの割合:20%



                                    ・
                                    ・
                                 ネガティブクラス


 誤ラベルの割合:40%




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
誤サンプルの影響の評価




                                       Real Adaboost
                                      改良型 MILBoost



                  ポジティブサンプルの含有率 [%]



→ネガティブサンプル中に人画像が含まれていても、識別器の学習に及ぼす悪影響を低減
          含有率0%時においても少数の外れ値の影響を除去
統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
学習サンプルの自動生成とMILBoostを用いた学習




                          従来手法




                提案手法(自動生成+MILBoost)


統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
物体検出の効率化:ハイブリッド型転移学習による学習の効率化
- 人検出の実用化に向けて -




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
現場における再学習のコスト

• カメラの設置位置,人の姿勢,見えが変化
– サンプル採取:CGにより自動生成
– 再学習コスト:自動生成した学習サンプル(2,400枚)をその場で学習




                                              再学習すると
                                               約10時間




                 CG学習サンプル

統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
転移学習(Transfer Learning)

• ある問題を効果的かつ、効率的に解くために、別の関連した問題のデータ
  や学習結果を再利用すること




• CovBoost(共変量シフト) [Pang et al., IP 11]

– 事前学習で得た情報を活かしたBoostingベースの追加学習法
    – 高速な学習:事前学習で既選択の特徴量のみを転移して使用
    – 少量のサンプル:共変量を用いて事前シーンのサンプルも利用




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
CovBoostによる転移学習

• 事前学習の特徴を転移してBoostingにより識別器を構築

           事前シーン                   事前学習結果

                                              強識別器
元データ




                                               Ha
                                      選択された
                                      特徴量
          汎用データベース




                           Feature Shift
                                                     CovBoost
目標データ




                                              共変量
                                                                Ht
                                                            強識別器
          CGにより自動生成
                           転移された特徴量                       転移学習結果
           特定シーン

 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
Feature Shift:特徴の転移

• 事前学習で選択された特徴量の目標シーンへの転移
1. 転移候補特徴の元データにおける確率密度関数と、目標データの周辺における確率密度関数
   を作成

2. 確率密度関数間のBhattacharyya距離を算出し、最大のものを転移特徴とする

3. 事前学習で選択された全ての特徴について、1. 2.より転移特徴プールを作成




                           尤度
                                勾配強度          0.7



                           尤度                 0.9 MAX
                                勾配強度                       転移特徴
  転移候補                                        0.6
                           尤度




                                勾配強度
                           尤度




   元データ        目標データ                     Bhattacharyya距離
                                勾配強度


統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
CovBoostの学習
                         学習ラウンド:1

                                                CovBoost

                                              弱識別器h   重みα
                                    評価値
             共変量             評価      ε
                                              h1(   ), α1
             共変量             評価      ε
  元データ

                                              h2(  ), α2
             共変量             評価      ε MIN

                     ・                                ・
             共変量     ・                                ・
                     ・                                ・


                             評価      ε
                                              hT(  ), αT

  目標データ

                         ・    転移特徴量pool


統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
CovBoostの学習
                         学習ラウンド:2

                                                CovBoost

                                              弱識別器h   重みα
                                    評価値
             共変量             評価      ε MIN
                                              h1(   ), α1
             共変量             評価      ε
  元データ

                                              h2(  ), α2
             共変量             評価      ε

                     ・                                ・
             共変量     ・                                ・
                     ・                                ・


                             評価      ε
                                              hT(  ), αT

  目標データ

                         ・    転移特徴量pool


統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
CovBoostの学習
                         学習ラウンド:T

                                                CovBoost

                                              弱識別器h   重みα
                                    評価値
             共変量             評価      ε
                                              h1(   ), α1
             共変量             評価      ε MIN
  元データ

                                              h2(  ), α2
             共変量             評価      ε

                     ・                                ・
             共変量     ・                                ・
                     ・                                ・


                             評価      ε
                                              hT(  ), αT

  目標データ

                         ・    転移特徴量pool


統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
CovBoost:共変量を用いたBoosting学習

• 学習誤差εが最小となるよう弱識別器を選択

             n
             X                           m
                                         X
                       yi Ht (xi )                    yj Ht (xj )
      ✏t =         e                 +         rj e
             i=1                         j=1
          目標ドメインにおける誤差評価                  元ドメインの誤差評価




                                     元ドメインの識別器



             共変量:

                                     目標ドメインの識別器



          →目標ドメインと適合しない事前サンプルをスポイル


統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
実験:転移学習の効果


              学習手法      学習サンプル数          ポジティブサンプル例




  事前学習       AdaBoost     2014枚

                                      INRIA Person Dataset(俯角0度)




   再学習       AdaBoost     2014枚

                                         CG生成-Pos(俯角20度)




  転移学習       CovBoost      800枚

                                         CG生成-Pos(俯角20度)




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
実験結果:転移学習の効果



       未検出率 [%]




                  事前学習(AdaBoost)
                  再学習 (AdaBoost)
                  転移学習(CovBoost)


                            誤検出率 [%]


      学習時間の比較
        再学習 :60分            →約1/10の時間で同等性能の識別器を構築
        転移学習: 6分

統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
元データと目標データの見えの変化が大きくなると…

• 特徴の転移が不可能なのでは?



元データ




目標データ




                           俯角20度




                           俯角40度

 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
見えの変化が大きくなっても転移可能か?



       未検出率 [%]




  転移学習だけでは適応できない!新たな特徴を探索する必要あり!
         目標ドメインの俯角:
                          50度
                       事前学習(AdaBoost)
                          40度
                       再学習 (AdaBoost)
                          30度
                       転移学習(CovBoost)
                          20度



                                 誤検出率 [%]




                       元データ     目標データ

                  0度                    20度   30度   40度   50度

統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
ハイブリッド型転移学習

• 転移学習と全探索学習を切り替えながら識別器を構築

         事前シーン          事前学習結果

                          強識別器
元データ




                            Ha
                                                      学習効率

                       Feature Shift                            強識別器
                                                        Ht
                                                 ス    h1(   )
                                           共変量
                                                 イ
                                                      h2(   )
                                  転移特徴pool       ッ
目標データ




                                                 チ    h3(   )
                                           共変量   ン       ・
                 全探索                             グ    ht(   )

                                  特徴pool
         特定シーン                                       ハイブリッド型
                                                     転移学習結果

 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
学習誤差の推移

• 学習効率による転移学習と全探索を効果的に切り替える
    学習誤差   転移学習 全探索




                             転移学習(CovBoost)
                             再学習 (AdaBoost)
                             ハイブリッド転移学習




                       学習ラウンド [回]

               →転移学習で上昇する逐次学習誤差を全探索で抑制
統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
実験結果:ハイブリッド型転移学習の効果


             18                                               90

             16     転移学習                                      80
                    再学習
             14     ハイブリッド型転移学習                               70

             12                                               60




                                                                  学習時間 [ 分 ]
                                                              50
    EER[%]




             10

              8                                               40
  未検出率 [%]




              6                                               30

              4                                               20

              2                                               10

              0      事前学習(AdaBoost)                           0
                    20        30
                    再学習 (AdaBoost)          40         50
                     転移学習(CovBoost)



                                 誤検出率 [%]


                  Equal Error Rate(EER):誤検出率と未検出率が同値になった際の値
統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
ハイブリッド型転移学習により選択された特徴量

• 再学習と同等の特徴がハイブリッド型転移学習により獲得
                  転移特徴




   平均勾配画像                       ハイブリッド型        再学習により
   (俯角50 )                        転移学習        選択された特徴



                  全探索
統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
統計的学習手法による物体検出の高精度化と効率化

• 物体検出の高精度化
– 特徴量を自動生成する生成型学習
   – Joint特徴量:識別に有効な特徴量を自動生成
   →新しい生成型学習のアプローチ



• 物体検出の効率化
– 学習サンプルを自動生成する生成型学習
   – 人体三次元モデルからの学習サンプルの自動生成
   – MILBoostによる誤ラベルの影響を抑制
   →特定シーンに特化した生成型学習による高精度化と効率化を実現
– ハイブリッド型転移学習
   – 特徴の転移と全探索のハイブリッドによる学習の高速化
   →現場環境へ適応するための時間的コストを1/4に削減


統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
人検出の実用化に向けて

• 実用化という観点から最適な手法


(1) 検出失敗の理由を明確に把握することが可能
 →弱識別器の応答と選択したJoint特徴量を解析することで可能


(2) 少ない学習サンプルでシステムをチューニング可能
 →CGにより自動生成したサンプルと転移学習の利用


(3) 省メモリで高速な計算アルゴリズム

 →Joint-HOGを安価なFPGAで実現




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
今後の課題

            • HOG(特徴抽出過程)の限界
              – 能動学習によるオンラインチューニング
              – Deep Learningの結果を用いた特徴量の再設計




                                            DPM (state-of-the-art)による誤検出例




                                  (Real-time Pedestrian Detection with Deformable Part Models, IV2012)
edestrian detections in testset. The first and second row shows correct pedestrian detections in Qualitative detection results on the Caltech t
results on the Caltech various scenarios. The third                                   Fig. 6. various scenarios. The third
es.                                                                                   row shows typical false positives.


              統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
参考文献

•    [Mita et al., PAMI 08] T. Mita, T. Kaneko, B. Stenger, and O. Hori: "Discriminative Feature Co-
     occurrence Selection for Object Detection", Pattern Analysis and Machine Intelligence, Vol.30, no.7,
     pp.1257-1269(2008)

•    [山内, 藤吉, 山下 MIRU 08] 山内悠嗣, 藤吉弘亘, 山下隆義: "Boostingに基づく共起表現による人検出", 画像
     の認識・理解シンポジウム(MIRU), pp.180-187(2008)

•    [G.Mori, CVPR 07] P. Sabzmeydani, and G. Mori: "Detecting Pedestrians by Learning Shapelet
     Features",' Computer Vision and Pattern Recognition, pp.1-8(2007)

•    [三井, 山内, 藤吉 SSII 08] 三井相和, 山内悠嗣, 藤吉弘亘: "Joint HOG特徴を用いた2段階AdaBoostによる人
     検出", 画像センシングシンポジウム(SSII)(2008)

•    [矢澤, 藤吉 SSII 11] 矢澤芳文, 吉見勤, 都筑輝泰, 土肥智美, 藤吉弘亘: "検出対象をリコンフィグ可能なJoint-
     HOGによるFPGAハードウェア検出器", 画像センシングシンポジウム(SSII)(2011)

•    [草富, 山内, 藤吉 SSII 11] 草富省吾, 山内悠嗣, 藤吉弘亘: "人検出のための学習サンプルの自動生成と
     MILBoostを用いた人検出", 画像センシングシンポジウム(SSII)(2011)

•    [Viola et al., NIPS 06] P. Viola, J. Platt, C. Zhang: "Multiple instance boosting for object detection",
     Neural Information Processing Systems(2006)

•    [Pang et al., IP 11] J. Pang, Q. Huang, S. Yan, S. Jiang, L. Qin: "Transferring Boosted Detectors
     Towards Viewpoint and Scene Adaptiveness". Image Processing 20(5): pp.1388 -1400 (2011)

•    [土屋, 藤吉 PRMU 13] 土屋成光, 山内悠嗣, 下隆義, 藤吉弘亘: "ハイブリッド型転移学習による物体検出にお
     ける学習の効率化", 電子情報通信学会PRMU研究会技報(2013)


    統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
お問い合わせ先




藤吉研究室              Fujiyoshi Laboratory

藤吉弘亘(Hironobu Fujiyoshi)
中部大学工学部情報工学科
E-Mail: hf@cs.cchubu.ac.jp
URL: http://www.vision.cs.chubu.ac.jp/
TEL:0568-51-9096
FAX:0568-51-1540
〒487-8501 愛知県春日井市松本町1200




統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘

More Related Content

What's hot

はじめてのパターン認識 第8章 サポートベクトルマシン
はじめてのパターン認識 第8章 サポートベクトルマシンはじめてのパターン認識 第8章 サポートベクトルマシン
はじめてのパターン認識 第8章 サポートベクトルマシンMotoya Wakiyama
 
[DL輪読会]Understanding Black-box Predictions via Influence Functions
[DL輪読会]Understanding Black-box Predictions via Influence Functions [DL輪読会]Understanding Black-box Predictions via Influence Functions
[DL輪読会]Understanding Black-box Predictions via Influence Functions Deep Learning JP
 
パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化Miyoshi Yuya
 
PFI Seminar 2012/03/15 カーネルとハッシュの機械学習
PFI Seminar 2012/03/15 カーネルとハッシュの機械学習PFI Seminar 2012/03/15 カーネルとハッシュの機械学習
PFI Seminar 2012/03/15 カーネルとハッシュの機械学習Preferred Networks
 
多目的強凸最適化のパレート集合のトポロジー
多目的強凸最適化のパレート集合のトポロジー多目的強凸最適化のパレート集合のトポロジー
多目的強凸最適化のパレート集合のトポロジーKLab Inc. / Tech
 
よくわかるフリストンの自由エネルギー原理
よくわかるフリストンの自由エネルギー原理よくわかるフリストンの自由エネルギー原理
よくわかるフリストンの自由エネルギー原理Masatoshi Yoshida
 
[DL輪読会]Attention Is All You Need
[DL輪読会]Attention Is All You Need[DL輪読会]Attention Is All You Need
[DL輪読会]Attention Is All You NeedDeep Learning JP
 
様々な全域木問題
様々な全域木問題様々な全域木問題
様々な全域木問題tmaehara
 
ウェーブレット木の世界
ウェーブレット木の世界ウェーブレット木の世界
ウェーブレット木の世界Preferred Networks
 
Tensorflow Liteの量子化アーキテクチャ
Tensorflow Liteの量子化アーキテクチャTensorflow Liteの量子化アーキテクチャ
Tensorflow Liteの量子化アーキテクチャHitoshiSHINABE1
 
画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量takaya imai
 
BERTをブラウザで動かしたい! ―MobileBERTとTensorFlow.js―
BERTをブラウザで動かしたい!―MobileBERTとTensorFlow.js―BERTをブラウザで動かしたい!―MobileBERTとTensorFlow.js―
BERTをブラウザで動かしたい! ―MobileBERTとTensorFlow.js―Shion Honda
 
充足可能性問題のいろいろ
充足可能性問題のいろいろ充足可能性問題のいろいろ
充足可能性問題のいろいろHiroshi Yamashita
 
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたいTakuji Tahara
 
報酬設計と逆強化学習
報酬設計と逆強化学習報酬設計と逆強化学習
報酬設計と逆強化学習Yusuke Nakata
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向Motokawa Tetsuya
 
第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知Chika Inoshita
 
文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜
文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜
文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜Takeshi Arabiki
 

What's hot (20)

はじめてのパターン認識 第8章 サポートベクトルマシン
はじめてのパターン認識 第8章 サポートベクトルマシンはじめてのパターン認識 第8章 サポートベクトルマシン
はじめてのパターン認識 第8章 サポートベクトルマシン
 
主成分分析
主成分分析主成分分析
主成分分析
 
[DL輪読会]Understanding Black-box Predictions via Influence Functions
[DL輪読会]Understanding Black-box Predictions via Influence Functions [DL輪読会]Understanding Black-box Predictions via Influence Functions
[DL輪読会]Understanding Black-box Predictions via Influence Functions
 
Prml07
Prml07Prml07
Prml07
 
パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化
 
PFI Seminar 2012/03/15 カーネルとハッシュの機械学習
PFI Seminar 2012/03/15 カーネルとハッシュの機械学習PFI Seminar 2012/03/15 カーネルとハッシュの機械学習
PFI Seminar 2012/03/15 カーネルとハッシュの機械学習
 
多目的強凸最適化のパレート集合のトポロジー
多目的強凸最適化のパレート集合のトポロジー多目的強凸最適化のパレート集合のトポロジー
多目的強凸最適化のパレート集合のトポロジー
 
よくわかるフリストンの自由エネルギー原理
よくわかるフリストンの自由エネルギー原理よくわかるフリストンの自由エネルギー原理
よくわかるフリストンの自由エネルギー原理
 
[DL輪読会]Attention Is All You Need
[DL輪読会]Attention Is All You Need[DL輪読会]Attention Is All You Need
[DL輪読会]Attention Is All You Need
 
様々な全域木問題
様々な全域木問題様々な全域木問題
様々な全域木問題
 
ウェーブレット木の世界
ウェーブレット木の世界ウェーブレット木の世界
ウェーブレット木の世界
 
Tensorflow Liteの量子化アーキテクチャ
Tensorflow Liteの量子化アーキテクチャTensorflow Liteの量子化アーキテクチャ
Tensorflow Liteの量子化アーキテクチャ
 
画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量
 
BERTをブラウザで動かしたい! ―MobileBERTとTensorFlow.js―
BERTをブラウザで動かしたい!―MobileBERTとTensorFlow.js―BERTをブラウザで動かしたい!―MobileBERTとTensorFlow.js―
BERTをブラウザで動かしたい! ―MobileBERTとTensorFlow.js―
 
充足可能性問題のいろいろ
充足可能性問題のいろいろ充足可能性問題のいろいろ
充足可能性問題のいろいろ
 
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
 
報酬設計と逆強化学習
報酬設計と逆強化学習報酬設計と逆強化学習
報酬設計と逆強化学習
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向
 
第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知
 
文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜
文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜
文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜
 

Viewers also liked

-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識Hironobu Fujiyoshi
 
統計的学習手法よる人検出
統計的学習手法よる人検出統計的学習手法よる人検出
統計的学習手法よる人検出Hironobu Fujiyoshi
 
Problem Based Learning with LEGO Mindstorms
Problem Based Learning with LEGO MindstormsProblem Based Learning with LEGO Mindstorms
Problem Based Learning with LEGO MindstormsHironobu Fujiyoshi
 
VIEW2013 Binarycode-based Object Recognition
VIEW2013 Binarycode-based Object RecognitionVIEW2013 Binarycode-based Object Recognition
VIEW2013 Binarycode-based Object RecognitionHironobu Fujiyoshi
 
チュートリアルのススメ -チュートリアルのためのチュートリアル-
チュートリアルのススメ -チュートリアルのためのチュートリアル-チュートリアルのススメ -チュートリアルのためのチュートリアル-
チュートリアルのススメ -チュートリアルのためのチュートリアル-Hironobu Fujiyoshi
 
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -Hironobu Fujiyoshi
 
ROSを核としたロボティクス教育(中部大学ロボット理工学科の紹介)
ROSを核としたロボティクス教育(中部大学ロボット理工学科の紹介)ROSを核としたロボティクス教育(中部大学ロボット理工学科の紹介)
ROSを核としたロボティクス教育(中部大学ロボット理工学科の紹介)Hironobu Fujiyoshi
 
Tutorial for robot programming with LEGO mindstorms EV3
Tutorial for robot programming with LEGO mindstorms EV3 Tutorial for robot programming with LEGO mindstorms EV3
Tutorial for robot programming with LEGO mindstorms EV3 Hironobu Fujiyoshi
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)Takanori Ogata
 
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチMIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチHironobu Fujiyoshi
 
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元Hironobu Fujiyoshi
 
2016/4/16 名古屋CVPRML 発表資料
2016/4/16 名古屋CVPRML 発表資料2016/4/16 名古屋CVPRML 発表資料
2016/4/16 名古屋CVPRML 発表資料Hiroshi Fukui
 
藤吉研究室10周年記念「これまで10年,ここから10年」
藤吉研究室10周年記念「これまで10年,ここから10年」藤吉研究室10周年記念「これまで10年,ここから10年」
藤吉研究室10周年記念「これまで10年,ここから10年」Hironobu Fujiyoshi
 
クラシックな機械学習の入門  11.評価方法
クラシックな機械学習の入門  11.評価方法クラシックな機械学習の入門  11.評価方法
クラシックな機械学習の入門  11.評価方法Hiroshi Nakagawa
 
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向Hiroshi Fukui
 
CVPR2016を自分なりにまとめてみた
CVPR2016を自分なりにまとめてみたCVPR2016を自分なりにまとめてみた
CVPR2016を自分なりにまとめてみたHiroshi Fukui
 
Opencv object detection_takmin
Opencv object detection_takminOpencv object detection_takmin
Opencv object detection_takminTakuya Minagawa
 

Viewers also liked (20)

-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
 
統計的学習手法よる人検出
統計的学習手法よる人検出統計的学習手法よる人検出
統計的学習手法よる人検出
 
Problem Based Learning with LEGO Mindstorms
Problem Based Learning with LEGO MindstormsProblem Based Learning with LEGO Mindstorms
Problem Based Learning with LEGO Mindstorms
 
VIEW2013 Binarycode-based Object Recognition
VIEW2013 Binarycode-based Object RecognitionVIEW2013 Binarycode-based Object Recognition
VIEW2013 Binarycode-based Object Recognition
 
チュートリアルのススメ -チュートリアルのためのチュートリアル-
チュートリアルのススメ -チュートリアルのためのチュートリアル-チュートリアルのススメ -チュートリアルのためのチュートリアル-
チュートリアルのススメ -チュートリアルのためのチュートリアル-
 
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -
 
Random Forests
Random ForestsRandom Forests
Random Forests
 
ROSを核としたロボティクス教育(中部大学ロボット理工学科の紹介)
ROSを核としたロボティクス教育(中部大学ロボット理工学科の紹介)ROSを核としたロボティクス教育(中部大学ロボット理工学科の紹介)
ROSを核としたロボティクス教育(中部大学ロボット理工学科の紹介)
 
Tutorial for robot programming with LEGO mindstorms EV3
Tutorial for robot programming with LEGO mindstorms EV3 Tutorial for robot programming with LEGO mindstorms EV3
Tutorial for robot programming with LEGO mindstorms EV3
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
 
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチMIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
 
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
 
ICCV2011 report
ICCV2011 reportICCV2011 report
ICCV2011 report
 
2016/4/16 名古屋CVPRML 発表資料
2016/4/16 名古屋CVPRML 発表資料2016/4/16 名古屋CVPRML 発表資料
2016/4/16 名古屋CVPRML 発表資料
 
藤吉研究室10周年記念「これまで10年,ここから10年」
藤吉研究室10周年記念「これまで10年,ここから10年」藤吉研究室10周年記念「これまで10年,ここから10年」
藤吉研究室10周年記念「これまで10年,ここから10年」
 
クラシックな機械学習の入門  11.評価方法
クラシックな機械学習の入門  11.評価方法クラシックな機械学習の入門  11.評価方法
クラシックな機械学習の入門  11.評価方法
 
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
 
20141008物体検出器
20141008物体検出器20141008物体検出器
20141008物体検出器
 
CVPR2016を自分なりにまとめてみた
CVPR2016を自分なりにまとめてみたCVPR2016を自分なりにまとめてみた
CVPR2016を自分なりにまとめてみた
 
Opencv object detection_takmin
Opencv object detection_takminOpencv object detection_takmin
Opencv object detection_takmin
 

Similar to 統計的学習手法による物体検出の高精度化と効率化 -人検出の実用化に向けて-

Deep Learning 勉強会 (Chapter 7-12)
Deep Learning 勉強会 (Chapter 7-12)Deep Learning 勉強会 (Chapter 7-12)
Deep Learning 勉強会 (Chapter 7-12)Ohsawa Goodfellow
 
ディジタル信号処理の課題解説 その2
ディジタル信号処理の課題解説 その2ディジタル信号処理の課題解説 その2
ディジタル信号処理の課題解説 その2noname409
 
Hive/Pigを使ったKDD'12 track2の広告クリック率予測
Hive/Pigを使ったKDD'12 track2の広告クリック率予測Hive/Pigを使ったKDD'12 track2の広告クリック率予測
Hive/Pigを使ったKDD'12 track2の広告クリック率予測Makoto Yui
 
ElGamal型暗号文に対する任意関数演算・再暗号化の二者間秘密計算プロトコルとその応用
ElGamal型暗号文に対する任意関数演算・再暗号化の二者間秘密計算プロトコルとその応用ElGamal型暗号文に対する任意関数演算・再暗号化の二者間秘密計算プロトコルとその応用
ElGamal型暗号文に対する任意関数演算・再暗号化の二者間秘密計算プロトコルとその応用MITSUNARI Shigeo
 
Building High-level Features Using Large Scale Unsupervised Learning
Building High-level Features Using Large Scale Unsupervised LearningBuilding High-level Features Using Large Scale Unsupervised Learning
Building High-level Features Using Large Scale Unsupervised LearningTakuya Minagawa
 
Hough forestを用いた物体検出
Hough forestを用いた物体検出Hough forestを用いた物体検出
Hough forestを用いた物体検出MPRG_Chubu_University
 
Deep Learning を実装する
Deep Learning を実装するDeep Learning を実装する
Deep Learning を実装するShuhei Iitsuka
 
kagami_comput2016_08
kagami_comput2016_08kagami_comput2016_08
kagami_comput2016_08swkagami
 
kagami_comput2015_8
kagami_comput2015_8kagami_comput2015_8
kagami_comput2015_8swkagami
 
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術Yoshihiro Mizoguchi
 
kagamicomput201808
kagamicomput201808kagamicomput201808
kagamicomput201808swkagami
 
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9Yuya Unno
 
Android上での3D(OpenGL)描画の基礎とNDKによる実践的高速化手法
Android上での3D(OpenGL)描画の基礎とNDKによる実践的高速化手法Android上での3D(OpenGL)描画の基礎とNDKによる実践的高速化手法
Android上での3D(OpenGL)描画の基礎とNDKによる実践的高速化手法Hiroshi Yoshida
 
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17Yuya Unno
 

Similar to 統計的学習手法による物体検出の高精度化と効率化 -人検出の実用化に向けて- (16)

Deep Learning 勉強会 (Chapter 7-12)
Deep Learning 勉強会 (Chapter 7-12)Deep Learning 勉強会 (Chapter 7-12)
Deep Learning 勉強会 (Chapter 7-12)
 
ディジタル信号処理の課題解説 その2
ディジタル信号処理の課題解説 その2ディジタル信号処理の課題解説 その2
ディジタル信号処理の課題解説 その2
 
Hive/Pigを使ったKDD'12 track2の広告クリック率予測
Hive/Pigを使ったKDD'12 track2の広告クリック率予測Hive/Pigを使ったKDD'12 track2の広告クリック率予測
Hive/Pigを使ったKDD'12 track2の広告クリック率予測
 
ElGamal型暗号文に対する任意関数演算・再暗号化の二者間秘密計算プロトコルとその応用
ElGamal型暗号文に対する任意関数演算・再暗号化の二者間秘密計算プロトコルとその応用ElGamal型暗号文に対する任意関数演算・再暗号化の二者間秘密計算プロトコルとその応用
ElGamal型暗号文に対する任意関数演算・再暗号化の二者間秘密計算プロトコルとその応用
 
Building High-level Features Using Large Scale Unsupervised Learning
Building High-level Features Using Large Scale Unsupervised LearningBuilding High-level Features Using Large Scale Unsupervised Learning
Building High-level Features Using Large Scale Unsupervised Learning
 
Hough forestを用いた物体検出
Hough forestを用いた物体検出Hough forestを用いた物体検出
Hough forestを用いた物体検出
 
Deep Learning を実装する
Deep Learning を実装するDeep Learning を実装する
Deep Learning を実装する
 
CMSI計算科学技術特論B(12) 大規模量子化学計算(1)
CMSI計算科学技術特論B(12) 大規模量子化学計算(1)CMSI計算科学技術特論B(12) 大規模量子化学計算(1)
CMSI計算科学技術特論B(12) 大規模量子化学計算(1)
 
kagami_comput2016_08
kagami_comput2016_08kagami_comput2016_08
kagami_comput2016_08
 
kagami_comput2015_8
kagami_comput2015_8kagami_comput2015_8
kagami_comput2015_8
 
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
 
5 Info Theory
5 Info Theory5 Info Theory
5 Info Theory
 
kagamicomput201808
kagamicomput201808kagamicomput201808
kagamicomput201808
 
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
 
Android上での3D(OpenGL)描画の基礎とNDKによる実践的高速化手法
Android上での3D(OpenGL)描画の基礎とNDKによる実践的高速化手法Android上での3D(OpenGL)描画の基礎とNDKによる実践的高速化手法
Android上での3D(OpenGL)描画の基礎とNDKによる実践的高速化手法
 
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
 

More from Hironobu Fujiyoshi

MIRU2020長尾賞受賞論文解説:Attention Branch Networkの展開
MIRU2020長尾賞受賞論文解説:Attention Branch Networkの展開MIRU2020長尾賞受賞論文解説:Attention Branch Networkの展開
MIRU2020長尾賞受賞論文解説:Attention Branch Networkの展開Hironobu Fujiyoshi
 
知識転移グラフによる複数ネットワークの 共同学習
知識転移グラフによる複数ネットワークの 共同学習知識転移グラフによる複数ネットワークの 共同学習
知識転移グラフによる複数ネットワークの 共同学習Hironobu Fujiyoshi
 
【第40回AIセミナー】「説明できるAI 〜AIはブラックボックスなのか?〜」
【第40回AIセミナー】「説明できるAI 〜AIはブラックボックスなのか?〜」【第40回AIセミナー】「説明できるAI 〜AIはブラックボックスなのか?〜」
【第40回AIセミナー】「説明できるAI 〜AIはブラックボックスなのか?〜」Hironobu Fujiyoshi
 
第6回 京都大学-稲盛財団合同京都賞シンポジウム
第6回 京都大学-稲盛財団合同京都賞シンポジウム第6回 京都大学-稲盛財団合同京都賞シンポジウム
第6回 京都大学-稲盛財団合同京都賞シンポジウムHironobu Fujiyoshi
 
エッジにおける深層学習の推論処理の効率化
エッジにおける深層学習の推論処理の効率化エッジにおける深層学習の推論処理の効率化
エッジにおける深層学習の推論処理の効率化Hironobu Fujiyoshi
 
画像認識における特徴表現 -SSII技術マップの再考-
画像認識における特徴表現 -SSII技術マップの再考-画像認識における特徴表現 -SSII技術マップの再考-
画像認識における特徴表現 -SSII技術マップの再考-Hironobu Fujiyoshi
 

More from Hironobu Fujiyoshi (6)

MIRU2020長尾賞受賞論文解説:Attention Branch Networkの展開
MIRU2020長尾賞受賞論文解説:Attention Branch Networkの展開MIRU2020長尾賞受賞論文解説:Attention Branch Networkの展開
MIRU2020長尾賞受賞論文解説:Attention Branch Networkの展開
 
知識転移グラフによる複数ネットワークの 共同学習
知識転移グラフによる複数ネットワークの 共同学習知識転移グラフによる複数ネットワークの 共同学習
知識転移グラフによる複数ネットワークの 共同学習
 
【第40回AIセミナー】「説明できるAI 〜AIはブラックボックスなのか?〜」
【第40回AIセミナー】「説明できるAI 〜AIはブラックボックスなのか?〜」【第40回AIセミナー】「説明できるAI 〜AIはブラックボックスなのか?〜」
【第40回AIセミナー】「説明できるAI 〜AIはブラックボックスなのか?〜」
 
第6回 京都大学-稲盛財団合同京都賞シンポジウム
第6回 京都大学-稲盛財団合同京都賞シンポジウム第6回 京都大学-稲盛財団合同京都賞シンポジウム
第6回 京都大学-稲盛財団合同京都賞シンポジウム
 
エッジにおける深層学習の推論処理の効率化
エッジにおける深層学習の推論処理の効率化エッジにおける深層学習の推論処理の効率化
エッジにおける深層学習の推論処理の効率化
 
画像認識における特徴表現 -SSII技術マップの再考-
画像認識における特徴表現 -SSII技術マップの再考-画像認識における特徴表現 -SSII技術マップの再考-
画像認識における特徴表現 -SSII技術マップの再考-
 

Recently uploaded

業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 

Recently uploaded (8)

業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 

統計的学習手法による物体検出の高精度化と効率化 -人検出の実用化に向けて-

  • 1. 統計的学習手法による物体検出の高精度化と効率化 - 人検出の実用化に向けて - 2013年3月15日 情報処理学会CVIM研究会 藤吉弘亘 (Hironobu Fujiyoshi) 中部大学工学部情報工学科 E-mail : hf@cs.chubu.ac.jp URL:http://www.vision.cs.chubu.ac.jp/ Facebook: facebook.com/hironobu.fujiyoshi Twitter: @hf149 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 2. 人検出の実用化に向けて • 統計的学習手法を用いた物体検出 – 公開画像データベースによる評価  →必ずしも高い性能を獲得した手法が実用化に適しているとはいえない  • 実用化という観点から最適な手法 (1) 検出失敗の理由を明確に把握することが可能 (2) 少ない学習サンプルでシステムをチューニング可能 (3) 省メモリで高速な計算アルゴリズム 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 4. 人の形状特徴 • 頭部から肩にかけてのΩ形状や下半身の連続的なエッジ形状 • 頭, 肩, 胴体, 足などの左右対称性 第2世代のアプローチ 第3世代のアプローチ →単一のHOG特徴量だけでは人の形状を捉えきれない 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 5. 特徴量間の共起を捉える特徴量の生成 • どのように特徴量間の共起を表現するか? – Joint Haar-like [Mita et al., PAMI 08] – 共起確率特徴 [山内, 山下, 藤吉 MIRU 08] • どのように特徴量間の関連性を捉えるか? – Shapelet [G.Mori CVPR 07] – Joint-HOG [三井, 山内, 藤吉 SSII 08] 顔 人 顔/人/車 Joint Haar-like Shapelet Joint HOG 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 6. Joint-HOG特徴による人検出 [三井, 山内, 藤吉 SSII 08] • 異なる二つの領域のHOG特徴量をAdaBoostにより組み合わせる AdaBoost 弱識別器h 重みα h1(   ,   ) α1 + 判定結果 h2(   ,   ) α2 人: H (x) > λ + 非人: otherwise ・ ・ ・ 未知入力パターン HOG特徴量 x + hT(   ,   ) αT H (x) = Σ ht(x)・αt 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 7. 2段階AdaBoostによるJoint-HOG特徴の自動生成 セルの 1段階目のAdaBoostで 全組み合わせ 生成した特徴量 H1,2(C1, C2) C1とC2のHOG 最終識別器 C1: C1[v1, v2, ...v9] AdaBoost ・・・ C2[v1, v2, ...v9] C2: 弱識別器h ・ ・ ・ ・ h1(   ,   ) AdaBoost ・ ・ H7,11(C7, C11) C7とC11のHOG h2(   ,   ) C7: C7[v1, v2, ...v9] AdaBoost ・・・ C11[v1, v2, ...v9] C11: ・ ・ ・ ・ ・ ・ ・ ・ ・ Hi,j(Ci, Cj) CiとCjのHOG Ci: hT(   ,   ) Cj[v1, v2, ...v9] AdaBoost ・・・ Cj[v1, v2, ...v9] Cj: Low-level: Mid-level: HOG特徴POOL Joint HOG特徴POOL → 局所領域間での勾配方向の対称性、連続性を自動的に捉える 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 8. や上半身から下半身 2段階AdaBoostによる最終識別器 形状 • 最終識別器による判定 向のエッジ特徴を 図 2 Joint 特徴量による 2 段階 Real AdaBoost. t 特徴量 [5] が提案 st の弱識別器が複 り,共起性を表現す 多重解像度の HOG 特徴量も利用できる [9].次に,2 つの 化結果 ている.両手法は, セル {m,n} の HOG 特徴量から共起確率特徴量を生成す により ングにより組み合 る.その際に,共起確率特徴量は HOG 特徴量の全ての組 徴量を 図 4 2段階目のAdaBoostの出力: Joint 特徴量による物体検出例. ることができ,高精 み合わせに対して求め,Real AdaBoost により最も良い組 で表現 み合わせを弱識別器として自動的に選択する.この処理を 弱識別 H 2nd (v) = h2nd Ht (v, {m, n}) 1st (2) いて図 1(b) に示す T 回繰り返し,1 段階目の Real AdaBoost により次式で表 を表す {m,n}∈F 動的に捉える Joint される 2 つのセル {m,n} の Joint 特徴量である強識別器 T 図5 .本章では,1段階目のAdaBoostの出力: を学習する. ht (v, {m, n}) H 1st (v, {m, n}) = h2nd (3) 1st Joint ても人 2 段階 t=1 ついて述べる. {m,n}∈F T 2 段階目の弱識別器 h2nd () は,2 つのセルの関係を捉えた H 1st (v, {m, n}) = h1st (v, {m, n}) t (1) 効では ング 1 段階目の H 1st () の出力となっていることから,異なるセ る.2 t=1 築の流れを図 2 に 上記の処理を全てのセルの組み合わせに対して行い,組 ルの low-level の特徴量から mid-level の特徴量を生成して 徴量は 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 9. 評価用データベース • 人検出用画像データベース - 学習用画像データ Positive : 2,053枚 Negative : 6,253枚 - 評価用画像データ Positive : 1,023枚 Negative : 1,233枚 • 車両検出用画像データベース - 学習用画像データ Positive : 2,464枚 Negative : 2,415枚 - 評価用画像データ Positive : 1,899枚 Negative : 2,413枚 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 10. Joint-HOG特徴による検出性能 • 人検出と車両検出におけるJoint-HOGの効果 (a) 人検出 (b) 車両検出 DET(Detection Error Tradeoff)による評価 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 11. ラスタスキャンによるJoint-HOGによる検出例 (a) 人検出 (b) 車両検出 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 12. 自動生成されたJoint HOG特徴 (人検出) • 人の輪郭に沿った勾配方向の特徴量を自動選択 ‒ 識別に有効なmid-levelな特徴量を自動生成 最終識別器 全学習用サンプルの 1段目のAdaBoostにより 2段目のAdaBoostにより 平均勾配画像 選択されたHOG特徴 選択されたHOG特徴 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 13. 自動生成されたJoint HOG特徴(車両検出) 全学習用サンプルの 1段目のAdaBoostにより 2段目のAdaBoostにより 平均勾配画像 選択されたHOG特徴 選択されたHOG特徴 物体形状の対称性, 連続性, 異なる領域間の関係性を自動生成 1ラウンド 2ラウンド 3ラウンド 15ラウンド 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 14. 誤検出の解析 • 検出失敗例における各弱識別器の応答 2.0 1.0 弱識別器の応答 弱識別器の応答: 0 -1.0 入力画像 -2.0 1 10 20 30 40 50 弱識別器 ポジティブサンプルの分布 ネガティブサンプルの分布 ポジティブサンプルの頻度が高い ネガティブサンプルの分布が不自然 特徴量の限界 学習サンプルの分布を再構築 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 17. ハードウェア化における着目点 • Joint-HOGの高速化 – パイプライン処理により低コストなFPGAで高速化を実現 • 検出対象の柔軟性 – 学習ソフトウェアを連携することで、検出対象を変更可能 Cyclone III FPGA USBポート カメラリンクコネクタ カメラ入力 USB2.0 Cyclone III EP3C120F780-8 Logic cells:119,088   Memory bit:3,981,312 bit PCアプリ 画像処理ボード RAM 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘 17
  • 18. 検出対象をリコンフィグ可能な汎用物体検出ビジョンセンサ [矢澤, 藤吉 SSII 11] • 学習ソフトウェアとFPGAハードウェアの連動 – Joint-HOGによる物体検出 連携 検出対象:人  ソフトウェアAPI 物体検出ハードウェア 学習結果 ODEN-API ver.2 特徴量 による学習 パラメータ 学習データ 人検出を実現 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 19. 検出対象をリコンフィグ可能な汎用物体検出ビジョンセンサ [矢澤, 藤吉 SSII 11] • 学習ソフトウェアとFPGAハードウェアの連動 – Joint-HOGによる物体検出 連携 検出対象:車両 ソフトウェアAPI 物体検出ハードウェア 学習結果 ODEN-API ver.2 特徴量 による学習 パラメータ 学習データ 車両検出を実現 →汎用性の高い物体検出ハードウェアを実現 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 20. 検出対象をリコンフィグ可能な物体検出ハードウェア • リアルタイムに任意の物体を検出(20FPS VGA画像) Cyclone III EP3C120F780-8 Logic cells:119,088   Memory bit:3,981,312 bit 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 22. 大量の良質な学習サンプルを必要 • 統計的学習手法による高精度な物体検出を実現するには – 大量の学習サンプル:10,000枚以上(人の場合) – 良質な学習サンプル:位置ずれ・誤ラベルなし 人画像(約3,000枚) 平均勾配画像 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 23. 学習サンプルの作成 10 hours later... 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 24. 学習サンプルと異なる環境での問題 • 学習サンプルと異なるカメラ位置の環境では – 見えが異なるため検出能力が低下 – 現場での再学習は不可能... INRIA評価画像 特定シーン画像 未検出 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 25. 学習サンプルの自動生成:生成型学習 [草富, 山内, 藤吉 SSII 11] • 特定シーンを考慮した生成型学習 – 学習サンプルを自動生成 – ポジティブサンプル:三次元人体モデルより生成 – ネガティブサンプル:ランダムに切り出して生成 生成モデル ポジティブサンプル 撮影した映像 各フレームからランダムに選択 ネガティブサンプル 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 26. ポジティブサンプルの生成 • 人体シルエットの生成モデル カメラパラメータ ・カメラ位置    x = 0.0m    y = 6.2m    z = 0.0m ・カメラ角度    θ = 21.0 ・・ 人クラスの画像生成 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 27. ネガティブサンプルの生成 • 背景画像からランダムで収集 - メリット:特定のシーンを背景として学習 - デメリット:人画像に背景ラベルを与える 背景クラスの画像生成 →誤ラベルを含んだ状態で学習すると識別器の性能低下を招く 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 28. MILBoostの導入 [Viola et al., NIPS 06] • Multiple Instance LearningをBoostingに導入した学習アルゴリズム - 誤って付与されたラベルを持つ学習サンプルの影響を抑制 ポジティブクラス ・・ Pos-­‐Bag1 Pos-­‐Bag2 Pos-­‐Bag3 Pos-­‐BagN ネガティブクラス 改良型MILBoost Neg-­‐Bag1 Neg-­‐BagM Neg-­‐Bag2   統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 29. 実験:学習データセットの組み合わせ ポジティブサンプル ネガティブサンプル INRIA-Pos 実環境-Neg INRIA-Pos(手動) 実環境-Neg(ランダム) 実環境-Pos 実環境-Neg 実環境-Pos(手動) 実環境-Neg(ランダム) 生成-Pos INRIA-Neg CG生成-Pos(自動) 実環境-Neg(ランダム) 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 30. 実験結果:学習サンプルの自動生成の効果 INRIA-Pos+実環境-Neg 実環境-Pos+実環境-Neg CG生成-Pos+実環境-Neg →CG生成によるポジティブサンプルは実環境の画像サンプルと同等以上 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 31. 実験:誤サンプルの影響の評価 • ネガティブサンプルにおける誤ラベルの影響を調査 - Real AdaBoostとMILBoostの比較 ネガティブクラス 誤ラベルの割合:0% ネガティブクラス 誤ラベルの割合:20% ・ ・ ネガティブクラス 誤ラベルの割合:40% 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 32. 誤サンプルの影響の評価 Real Adaboost 改良型 MILBoost ポジティブサンプルの含有率 [%] →ネガティブサンプル中に人画像が含まれていても、識別器の学習に及ぼす悪影響を低減 含有率0%時においても少数の外れ値の影響を除去 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 33. 学習サンプルの自動生成とMILBoostを用いた学習 従来手法 提案手法(自動生成+MILBoost) 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 35. 現場における再学習のコスト • カメラの設置位置,人の姿勢,見えが変化 – サンプル採取:CGにより自動生成 – 再学習コスト:自動生成した学習サンプル(2,400枚)をその場で学習 再学習すると 約10時間 CG学習サンプル 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 36. 転移学習(Transfer Learning) • ある問題を効果的かつ、効率的に解くために、別の関連した問題のデータ や学習結果を再利用すること • CovBoost(共変量シフト) [Pang et al., IP 11] – 事前学習で得た情報を活かしたBoostingベースの追加学習法 – 高速な学習:事前学習で既選択の特徴量のみを転移して使用 – 少量のサンプル:共変量を用いて事前シーンのサンプルも利用 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 37. CovBoostによる転移学習 • 事前学習の特徴を転移してBoostingにより識別器を構築 事前シーン 事前学習結果 強識別器 元データ Ha 選択された 特徴量 汎用データベース Feature Shift CovBoost 目標データ 共変量 Ht 強識別器 CGにより自動生成 転移された特徴量 転移学習結果 特定シーン 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 38. Feature Shift:特徴の転移 • 事前学習で選択された特徴量の目標シーンへの転移 1. 転移候補特徴の元データにおける確率密度関数と、目標データの周辺における確率密度関数 を作成 2. 確率密度関数間のBhattacharyya距離を算出し、最大のものを転移特徴とする 3. 事前学習で選択された全ての特徴について、1. 2.より転移特徴プールを作成 尤度 勾配強度 0.7 尤度 0.9 MAX 勾配強度 転移特徴 転移候補 0.6 尤度 勾配強度 尤度 元データ 目標データ Bhattacharyya距離 勾配強度 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 39. CovBoostの学習 学習ラウンド:1 CovBoost 弱識別器h 重みα 評価値 共変量 評価 ε h1( ), α1 共変量 評価 ε 元データ h2(  ), α2 共変量 評価 ε MIN ・ ・ 共変量 ・ ・ ・ ・ 評価 ε hT(  ), αT 目標データ ・ 転移特徴量pool 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 40. CovBoostの学習 学習ラウンド:2 CovBoost 弱識別器h 重みα 評価値 共変量 評価 ε MIN h1( ), α1 共変量 評価 ε 元データ h2(  ), α2 共変量 評価 ε ・ ・ 共変量 ・ ・ ・ ・ 評価 ε hT(  ), αT 目標データ ・ 転移特徴量pool 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 41. CovBoostの学習 学習ラウンド:T CovBoost 弱識別器h 重みα 評価値 共変量 評価 ε h1( ), α1 共変量 評価 ε MIN 元データ h2(  ), α2 共変量 評価 ε ・ ・ 共変量 ・ ・ ・ ・ 評価 ε hT(  ), αT 目標データ ・ 転移特徴量pool 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 42. CovBoost:共変量を用いたBoosting学習 • 学習誤差εが最小となるよう弱識別器を選択 n X m X yi Ht (xi ) yj Ht (xj ) ✏t = e + rj e i=1 j=1 目標ドメインにおける誤差評価 元ドメインの誤差評価 元ドメインの識別器 共変量: 目標ドメインの識別器 →目標ドメインと適合しない事前サンプルをスポイル 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 43. 実験:転移学習の効果 学習手法 学習サンプル数 ポジティブサンプル例 事前学習 AdaBoost 2014枚 INRIA Person Dataset(俯角0度) 再学習 AdaBoost 2014枚 CG生成-Pos(俯角20度) 転移学習 CovBoost 800枚 CG生成-Pos(俯角20度) 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 44. 実験結果:転移学習の効果 未検出率 [%] 事前学習(AdaBoost) 再学習 (AdaBoost) 転移学習(CovBoost) 誤検出率 [%] 学習時間の比較   再学習 :60分 →約1/10の時間で同等性能の識別器を構築   転移学習: 6分 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 45. 元データと目標データの見えの変化が大きくなると… • 特徴の転移が不可能なのでは? 元データ 目標データ 俯角20度 俯角40度 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 46. 見えの変化が大きくなっても転移可能か? 未検出率 [%] 転移学習だけでは適応できない!新たな特徴を探索する必要あり! 目標ドメインの俯角: 50度 事前学習(AdaBoost) 40度 再学習 (AdaBoost) 30度 転移学習(CovBoost) 20度 誤検出率 [%] 元データ 目標データ 0度 20度 30度 40度 50度 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 47. ハイブリッド型転移学習 • 転移学習と全探索学習を切り替えながら識別器を構築 事前シーン 事前学習結果 強識別器 元データ Ha 学習効率 Feature Shift 強識別器 Ht ス h1(   ) 共変量 イ h2(   ) 転移特徴pool ッ 目標データ チ h3(   ) 共変量 ン ・ 全探索 グ ht(   ) 特徴pool 特定シーン ハイブリッド型 転移学習結果 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 48. 学習誤差の推移 • 学習効率による転移学習と全探索を効果的に切り替える 学習誤差 転移学習 全探索 転移学習(CovBoost) 再学習 (AdaBoost) ハイブリッド転移学習 学習ラウンド [回] →転移学習で上昇する逐次学習誤差を全探索で抑制 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 49. 実験結果:ハイブリッド型転移学習の効果 18 90 16 転移学習 80 再学習 14 ハイブリッド型転移学習 70 12 60 学習時間 [ 分 ] 50 EER[%] 10 8 40 未検出率 [%] 6 30 4 20 2 10 0 事前学習(AdaBoost) 0 20 30 再学習 (AdaBoost) 40 50 転移学習(CovBoost) 誤検出率 [%] Equal Error Rate(EER):誤検出率と未検出率が同値になった際の値 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 50. ハイブリッド型転移学習により選択された特徴量 • 再学習と同等の特徴がハイブリッド型転移学習により獲得 転移特徴 平均勾配画像 ハイブリッド型 再学習により (俯角50 ) 転移学習 選択された特徴 全探索 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 51. 統計的学習手法による物体検出の高精度化と効率化 • 物体検出の高精度化 – 特徴量を自動生成する生成型学習 – Joint特徴量:識別に有効な特徴量を自動生成    →新しい生成型学習のアプローチ • 物体検出の効率化 – 学習サンプルを自動生成する生成型学習 – 人体三次元モデルからの学習サンプルの自動生成 – MILBoostによる誤ラベルの影響を抑制    →特定シーンに特化した生成型学習による高精度化と効率化を実現 – ハイブリッド型転移学習 – 特徴の転移と全探索のハイブリッドによる学習の高速化    →現場環境へ適応するための時間的コストを1/4に削減 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 52. 人検出の実用化に向けて • 実用化という観点から最適な手法 (1) 検出失敗の理由を明確に把握することが可能  →弱識別器の応答と選択したJoint特徴量を解析することで可能 (2) 少ない学習サンプルでシステムをチューニング可能  →CGにより自動生成したサンプルと転移学習の利用 (3) 省メモリで高速な計算アルゴリズム  →Joint-HOGを安価なFPGAで実現 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 53. 今後の課題 • HOG(特徴抽出過程)の限界 – 能動学習によるオンラインチューニング – Deep Learningの結果を用いた特徴量の再設計 DPM (state-of-the-art)による誤検出例 (Real-time Pedestrian Detection with Deformable Part Models, IV2012) edestrian detections in testset. The first and second row shows correct pedestrian detections in Qualitative detection results on the Caltech t results on the Caltech various scenarios. The third Fig. 6. various scenarios. The third es. row shows typical false positives. 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 54. 参考文献 • [Mita et al., PAMI 08] T. Mita, T. Kaneko, B. Stenger, and O. Hori: "Discriminative Feature Co- occurrence Selection for Object Detection", Pattern Analysis and Machine Intelligence, Vol.30, no.7, pp.1257-1269(2008) • [山内, 藤吉, 山下 MIRU 08] 山内悠嗣, 藤吉弘亘, 山下隆義: "Boostingに基づく共起表現による人検出", 画像 の認識・理解シンポジウム(MIRU), pp.180-187(2008) • [G.Mori, CVPR 07] P. Sabzmeydani, and G. Mori: "Detecting Pedestrians by Learning Shapelet Features",' Computer Vision and Pattern Recognition, pp.1-8(2007) • [三井, 山内, 藤吉 SSII 08] 三井相和, 山内悠嗣, 藤吉弘亘: "Joint HOG特徴を用いた2段階AdaBoostによる人 検出", 画像センシングシンポジウム(SSII)(2008) • [矢澤, 藤吉 SSII 11] 矢澤芳文, 吉見勤, 都筑輝泰, 土肥智美, 藤吉弘亘: "検出対象をリコンフィグ可能なJoint- HOGによるFPGAハードウェア検出器", 画像センシングシンポジウム(SSII)(2011) • [草富, 山内, 藤吉 SSII 11] 草富省吾, 山内悠嗣, 藤吉弘亘: "人検出のための学習サンプルの自動生成と MILBoostを用いた人検出", 画像センシングシンポジウム(SSII)(2011) • [Viola et al., NIPS 06] P. Viola, J. Platt, C. Zhang: "Multiple instance boosting for object detection", Neural Information Processing Systems(2006) • [Pang et al., IP 11] J. Pang, Q. Huang, S. Yan, S. Jiang, L. Qin: "Transferring Boosted Detectors Towards Viewpoint and Scene Adaptiveness". Image Processing 20(5): pp.1388 -1400 (2011) • [土屋, 藤吉 PRMU 13] 土屋成光, 山内悠嗣, 下隆義, 藤吉弘亘: "ハイブリッド型転移学習による物体検出にお ける学習の効率化", 電子情報通信学会PRMU研究会技報(2013) 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘
  • 55. お問い合わせ先 藤吉研究室 Fujiyoshi Laboratory 藤吉弘亘(Hironobu Fujiyoshi) 中部大学工学部情報工学科 E-Mail: hf@cs.cchubu.ac.jp URL: http://www.vision.cs.chubu.ac.jp/ TEL:0568-51-9096 FAX:0568-51-1540 〒487-8501 愛知県春日井市松本町1200 統計的学習手法による物体認識の高精度化と効率化 / 中部大学工学部情報工学科 藤吉弘亘