Recommended
PDF
PDF
Tutorial-DeepLearning-PCSJ-IMPS2016
PDF
【2017.04】cvpaper.challenge 2017
PDF
PDF
PPTX
PPTX
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
PDF
PDF
PDF
PDF
PDF
DeepLearningDay2016Spring
PDF
PPTX
MIRU2014 tutorial deeplearning
PPTX
Cvim saisentan-6-4-tomoaki
PDF
PDF
PDF
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
PDF
Deep Learningと画像認識 ~歴史・理論・実践~
PDF
NVIDIA Seminar ディープラーニングによる画像認識と応用事例
PDF
PPTX
PDF
PDF
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
PDF
Introduction to Deep Compression
PPTX
多層NNの教師なし学習 コンピュータビジョン勉強会@関東 2014/5/26
PDF
PDF
最近のSingle Shot系の物体検出のアーキテクチャまとめ
PDF
PPTX
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
More Related Content
PDF
PDF
Tutorial-DeepLearning-PCSJ-IMPS2016
PDF
【2017.04】cvpaper.challenge 2017
PDF
PDF
PPTX
PPTX
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
PDF
What's hot
PDF
PDF
PDF
PDF
DeepLearningDay2016Spring
PDF
PPTX
MIRU2014 tutorial deeplearning
PPTX
Cvim saisentan-6-4-tomoaki
PDF
PDF
PDF
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
PDF
Deep Learningと画像認識 ~歴史・理論・実践~
PDF
NVIDIA Seminar ディープラーニングによる画像認識と応用事例
PDF
PPTX
PDF
PDF
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
PDF
Introduction to Deep Compression
PPTX
多層NNの教師なし学習 コンピュータビジョン勉強会@関東 2014/5/26
PDF
PDF
最近のSingle Shot系の物体検出のアーキテクチャまとめ
Similar to DeepLearningDay2016Summer
PDF
PPTX
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
PPTX
Image net classification with Deep Convolutional Neural Networks
PDF
PDF
SAS Viyaのディープラーニングを用いた物体検出
PDF
PDF
PDF
PDF
PPTX
[DL輪読会]End-to-End Object Detection with Transformers
PDF
【2015.07】(2/2)cvpaper.challenge@CVPR2015
PDF
cvpaper.challenge in CVPR2015 (PRMU2015年12月)
PDF
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
PPTX
[DL輪読会]Deep Face Recognition: A Survey
PDF
エヌビディアが加速するディープラーニング ~進化するニューラルネットワークとその開発方法について~
PDF
PPTX
Densely Connected Convolutional Networks
PDF
Learning Spatial Common Sense with Geometry-Aware Recurrent Networks
PDF
PDF
DeepLearningDay2016Summer 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. ディープラーニングによる物体認識
Team year Error
(top-‐5)
SuperVision 2012 15.3%
Clarifai 2013 11.2%
VGG – Oxford
(16 layers) 2014 7.32%
3x3のフィルタを2層積層すると
5x5のフィルタと等価になる
AlexNetとほぼ等価の構成
VGG16
ILSVRC2014で2位 16層と深い構造
K. Simonyan, Very Deep Convolutional Networks for Large-Scale Image Recognition, ICLR2015 20
21. ディープラーニングによる物体認識
Convolution
Pooling
Softmax
Other
Inception module
Team year Error
(top-‐5)
SuperVision 2012 15.3%
Clarifai 2013 11.2%
VGG – Oxford
(16 layers) 2014 7.32%
GoogLeNet (22layers) 2014 6.67%
3x3
convolutions
5x5
convolutions
Filter
concatenation
Previous layer
3x3 max
pooling
1x1
convolutions
1x1
convolutions
1x1
convolutions
1x1
convolutions
C. Szegedy, Going Deeper with Convolutions, CVPR2015
GoogLeNet
Inception モジュールを9つ積層
途中の層の誤差を求め,下位層まで誤差を伝播
21
22. ディープラーニングによる物体認識
Team year Error
(top-‐5)
SuperVision 2012 15.3%
Clarifai 2013 11.2%
VGG – Oxford
(16 layers) 2014 7.32%
GoogLeNet (22layers) 2014 6.67%
Residual
Net. 2015 3.57%
human expert 5.1%
K. He, Deep Residual Learning for Image Recognition, CVPR2016
Residual Network
特定層への入力をバイパスして上位層へ与える
逆伝播時に誤差を下位層に直接与えることができる
22
23. 24. 標識認識
German Traffic Sign Recognition Benchmarkで人を上回る性能
Multi-Column Deep Neural Network for Traffic Sign Classification,IJCNN2011
METHODS ACCURACY
Multi-Column Deep Neural Network 99.46%
Human Performance 98.84%
Multi-Scale CNN 98.31%
Random Forest 96.14%
LDA on HOG 95.68%
0.71
0.17
0.03
0.09
0.89
0.03
0.01
0.07
0.85
0.09
0.02
0.04
複数のCNNを利用して精度向上
学習の手間:大
メモリサイズ:大
処理時間:大
24
25. 標識認識
一つのネットワークを仮想的に複数のネットワークにする
Ensemble Median Inference
Fukui, Pedestrian Detection Based on Deep Convolutional Neural Network with Ensemble Inference Network, IV2015
METHODS ACCURACY
Multi-Column Deep Neural Network 99.46%
Human Performance 98.84%
Multi-Scale CNN 98.31%
Random Forest 96.14%
LDA on HOG 95.68%
0.71
0.17
0.03
0.09
25
26. 標識認識
METHODS ACCURACY
Random Droput+Dn’MI 99.22%
Multi-Column Deep Neural Network 99.46%
Human Performance 98.84%
Multi-Scale CNN 98.31%
Random Forest 96.14%
LDA on HOG 95.68%
0.89
0.03
0.01
0.07
0.71
0.17
0.03
0.09
0.85
0.09
0.02
0.04
複数ネットワーク利用時と同等性能
学習の手間:小
メモリサイズ:小
処理時間:中
一つのネットワークを仮想的に複数のネットワークにする
Ensemble Median Inference
STEP1:全結合層のネットワークを複数生成
STEP2:各クラスの確率を累積する
Fukui, Pedestrian Detection Based on Deep Convolutional Neural Network with Ensemble Inference Network, IV2015 26
27. 標識認識
人の目でも分かりにくい標識でも認識可能
Dropout Random Dropout + EIN
0 20 40 60 80 100
0 20 40 60 80 100
0 20 40 60 80 100
0 20 40 60 80 100
0 20 40 60 80 100
0 20 40 60 80 100
0 20 40 60 80 100
0 20 40 60 80 100
Input imageFukui, Pedestrian Detection Based on Deep Convolutional Neural Network with Ensemble Inference Network, IV2015 27
28. 29. 30. 31. 32. ディープラーニングを利用した歩行者検出
Caltech Pedestrian Detection Benchmarkにおける性能
10
-3
10
-2
10
-1
10
0
10
1
.05
.10
.20
.30
.40
.50
.64
.80
1
false positives per image
missrate
95% VJ
68% HOG
31% DeepCascade
30% ACF-Caltech+
26% DeepCascade+
25% LDCF
21% TA-CNN
19% CCF
18% Checkerboards
17% CCF+CF
17% Checkerboards+
12% DeepParts
12% CompACT-Deep
10% SA-FastRCNN
32
33. S. Zhang , How Far are We from Solving Pedestrian Detection?, CVPR2016
ディープラーニングを利用した歩行者検出
人と機械学習手法との比較
36
34. 一般物体検出
• Selective Searchにより物体候補を検出
• CNNで抽出した特徴量をSVMでクラス識別
R−CNN
4つのステップから構成
1)局所領域の切り出し
2)領域の変形
3)CNNによる特徴抽出
4)SVMによる識別
R. Girshick, Rich feature hierarchies for accurate object detection and semantic segmentation, CVPR2014
37
35. R-CNNの課題
処理時間がかかる
• 1画像あたり:47秒 (VGGネットを使用時)
学習・検出プロセスが複雑
• 処理ごとに個別の学習とデータの準備が必要
特徴抽出
(CNN)
特徴抽出
(CNN)
特徴抽出
(CNN)
物体識別
(SVM)
物体識別(
SVM)
物体識別
(SVM)
入力画像
領域切り出し
領域変形
背景
人
馬
領域ごとに実行
座標補正 (
回帰)
座標補正 (
回帰)
R. Girshick, Rich feature hierarchies for accurate object detection and semantic segmentation, CVPR2014
38
36. Fast R-CNN
特徴抽出処理をまとめて行うことで高速化
• R-CNNと比べて10-100倍高速
学習・検出プロセスをシンプルに
• 領域切り出しの処理をCNNの構成で行う(SVMなし)
特徴抽出
(CNN)
特徴座標 識別層・回帰層
(CNN)
入力画像
領域切り出し
領域変形
物体:背景
座標情報
(-1,-1,-1,-1)
物体:人
座標情報
(10,3,40,100)
物体:馬
座標情報
(5,100,80,20)
領域ごとに実行
識別層・回帰層
(CNN)
識別層・回帰層
(CNN)
R. Girshick,, Fast RCNN, ICCV2015
39
37. Fast R-CNN
特徴抽出処理をまとめて行うことで高速化
• R-CNNと比べて10-100倍高速
学習・検出プロセスをシンプルに
• 領域切り出しの処理をCNNの構成で行う(SVMなし)
特徴抽出
(CNN)
特徴座標 識別層・回帰層
(CNN)
入力画像
領域切り出し
領域変形
物体:背景
座標情報
(-1,-1,-1,-1)
物体:人
座標情報
(10,3,40,100)
物体:馬
座標情報
(5,100,80,20)
領域ごとに実行
識別層・回帰層
(CNN)
識別層・回帰層
(CNN)
R. Girshick,, Fast RCNN, ICCV2015
Selective Searchによる切り出し
=>この処理が時間かかる
40
38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. ヘテロジニアスラーニング(4)
ヘテロジニアスラーニングによる歩行者検出と部位推定
1
0.0001 0.001 0.01 0.1 1 10
MissRate
False Positive per Image
回帰型DCNN 31.77%
単体のDCNN 38.38%
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
Daimler
Mono-‐Pedestrian
Benchmark
Dataset
の評価結果
距離[m] 距離推定結果[m] 誤差[%]
5 4.89 2.2
10 9.26 5.3
15 14.12 5.8
回帰型Deep Convolutional Neural Networkによる人検出と部位の位置推定, 2015 58
53. 54. 55. 56. 57. 58. 59. 60. 61. 62.