1. Deep Residual Learning for
Image Recognition
2018/11/12
1
[1] He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep residual learning for image recognition.
In Proceedings of the IEEE conference on computer vision and pattern recognition
(pp. 770-778).
10. 残差表現Ⅰ
Bag of Visual Words (BoVW) による情報抽出/次元削減
10
画像から特徴を抽出
(ex. 色,エッジなど)
各特徴点をクラスタリング
(クラスタ数に確証なし)
各クラスタをベクトルの要素とし
各画像をベクトルで表現
[8] Yang, J., Jiang, Y. G., Hauptmann, A. G., & Ngo, C. W. (2007, September). Evaluating bag-of-visual-words representations in scene
classification. In Proceedings of the international workshop on Workshop on multimedia information retrieval(pp. 197-206). ACM.
図5. BoVW の流れ[8]
11. 残差表現Ⅱ
フィルター間の差により,画像から特徴量を抽出(SIFT)
11
[9] Lowe, D. G. (2004). Distinctive image features from scale-invariant
keypoints. International journal of computer vision, 60(2), 91-110.
元画像
DoG フィルタを
画像に使用
局所的極値を
探索
特徴量を抽出
※図6. 元画像,Difference of Gausiann (DoG)の適用,
各スケール間の比較,特徴量抽出結果(左から)[9]
差分が最大となる点
15. Residual Learning
多重非線形関数が漸近的に複雑な関数を近似できる時
ℱ x ∶= ℋ x − x (1)
ℱ x : residual function, x: ブロックへの入力層
ℋ x : 2層以上の非線形関数,元々の関数
ℋ x について解くと,
ℋ x = ℱ x + x (2)
(2)について学習しても,パラメータは変わらず計算も容易
15
Residual Learning では ℋ x = ℱ x + x について学習