Deep layer aggregation. Cvpr2018

•

1 like•1,196 views

Shinichiro Murakami

Technology

Deep Layer Aggregation
Shinichiro MURAKAMI
2018/07/07

Your Date Here Your Footer Here
2
〜2013.3 東京工業大学
- 運動野の情報解析
- 内部モデルの不確かさを考慮した学習モデル
2013.4〜アイシン精機（トヨタ系自動車部品会社）
- トイレ設計
- ドライバ画像解析（顔向き、視線、年齢、性別...）
2017.4〜 IMRA Europe
- ドライバ画像解析、歩行者行動解析
2018.4〜アイシン精機（台場）
- 視線解析、周辺認識

What is skip connection?
ResNeXt
For classification
ResNet
deeper
wider(cardinality)
deeper
wider

Residual Networks Behave Like Ensembles of Relatively Shallow Networks
認識性能が高くなる理由は、並列パスの
アンサンブル学習とみなせるため。
Visualizing the Loss Landscape of Neural Nets
高次元のnon-convex lossをフラットにし、
学習を簡単にする。
Effects of residual connections
1. Calculate residual
2. Skip connection
⇛勾配を伝えやすくし、勾配消失を軽減

For semantic segmentation
U-Net
Downsamplingした後に、詳細な空間情報の再現に使える

Effects of skip connections
1. CNN前半の粗い特徴と、CNN後半の詳細な特徴を組
み合わせて、性能向上
2. 勾配を伝えやすくし、勾配消失問題に対処
3. Downsamplingした後に、詳細な空間情報の再現に使
える（e.g. semantic segmentation)
4. 収束時間の低減

Question:
Which skip connection is
better?
12

Deep Layer Aggregation
Fisher Yu, Dequan Wang, Evan Shelhamer,Trevor Darrell
UC Berkeley
- 従来のネットワーク(ResNet, DenseNet, FCN, U-Net等)のskip connection
” ” ” ”は，浅い結合しか適用されていなかった。この論文では、より深い結合を
ネットワークに取り入れ、少パラメータかつ高精度なネットワークモデルを構築。
- skip connectionをtree構造に見立てて、どのようにaggregate(まとめる)すれば
よいかを検討。General viewから検討されているので、頭の整理になる。

Existing model Stage : 同じサイズのconvolutionをまとめたもの。
　　　 pooling等でactivation mapの大きさが変わると、変わる。

Deep Layer Aggregation (DLA)
Conv2d(in=3, out=16, kernel=7)
Batch Normalization(BN)
Relu
Conv2d(in=16, out=16, kernel=3)
BN
Relu
Conv2d(in=16, out=32, kernel=3)
BN
Relu
Conv2d(in=32, out=64, kernel=3)
BN
Relu
Conv2d(in=64, out=64, kernel=3)
BN
Relu
Conv2d(in=64, out=64, kernel=3)
BN
Relu
Conv2d(in=64, out=64, kernel=3)
BN
Relu
Conv2d(in=128, out=64, kernel=1)
BN
Relu

Deep Layer Aggregation - semantic
segmentation

Results (ImageNet classification)
軽量化モデルであるSqueezeNetと比較しても、DLAのCompactモデルでは、少ないパラメータにも
関らず、認識性能は良い。

Results (Semantic segmentation)
Validation dataで
ストライドの比較
Test dataで他モデル
の性能比較

Conclusion
- Skip connectionに対して深い結合(Deep layer aggregation)をネットワークに
取り入れた。
- Tree構造に見立てたモジュール構造にすることで、一般的な観点からネット
ワーク構造の検討を行っている。（ただ、論文上でその比較が無いのが残念）
- Classification, semantic segmentation等の複数の画像認識タスクにおいて
sotaの性能を達成した。

BDD-100K
- 今回紹介した論文のFirst author, Fisher Yu, が担当者

Similar to Deep layer aggregation. Cvpr2018

2017-05-30_deepleaning-and-chainerKeisuke Umezawa

[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual SignalsDeep Learning JP

実社会・実環境におけるロボットの機械学習 ver. 2Kuniyuki Takahashi

inet-lab introductionIsmail Arai

スマートエスイーセミナー：機外学習応用システムパターンの例HironoriTAKEUCHI1

実社会・実環境におけるロボットの機械学習Kuniyuki Takahashi

ディープラーニングの車載応用に向けてIkuro Sato

Agile and Modeling in embedded systems safety and securityKenji Hiranabe

ドライブレコーダの動画を使った道路情報の自動差分抽出Tetsutaro Watanabe

ICRA 2019 速報cvpaper. challenge

ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]DeNA

東北大学先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太Preferred Networks

Generative Adversarial Networks (GAN) @ NIPS2017Koichi Hamada

Visual slamTakuya Minagawa

20190131 lidar-camera fusion semantic segmentation surveyTakuya Minagawa

Struggling with BIGDATA　－リクルートおけるデータサイエンス/エンジニアリング－Recruit Technologies

NIPS2015概要資料Shohei Hido

Inside-Outカメラからの3次元Scan Pathとシーン構造の復元Hironobu Fujiyoshi

サルでもわかるディープラーニング入門 (2017年)　(In Japanese)Toshihiko Yamakami

ポストAiを見据えた日本企業の経営戦略加藤整 20171020_v1.2Sei Kato (加藤　整)

Similar to Deep layer aggregation. Cvpr2018 (20)

2017-05-30_deepleaning-and-chainer

[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals

実社会・実環境におけるロボットの機械学習 ver. 2

inet-lab introduction

スマートエスイーセミナー：機外学習応用システムパターンの例

実社会・実環境におけるロボットの機械学習

ディープラーニングの車載応用に向けて

Agile and Modeling in embedded systems safety and security

ドライブレコーダの動画を使った道路情報の自動差分抽出

ICRA 2019 速報

ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]

東北大学先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太

Generative Adversarial Networks (GAN) @ NIPS2017

Visual slam

20190131 lidar-camera fusion semantic segmentation survey

Struggling with BIGDATA　－リクルートおけるデータサイエンス/エンジニアリング－

NIPS2015概要資料

Inside-Outカメラからの3次元Scan Pathとシーン構造の復元

サルでもわかるディープラーニング入門 (2017年)　(In Japanese)

ポストAiを見据えた日本企業の経営戦略加藤整 20171020_v1.2

Recently uploaded

【早稲田AI研究会　講義資料】3DスキャンとTextTo3Dのツールを知ろう！(Vol.1)Hiroki Ichikura

モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察～Text-to-MusicとText-To-ImageかつImage-to-Music...博三太田

自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi

CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か？akihisamiyanaga1

デジタル・フォレンジックの最新動向（2024年4月27日情洛会総会特別講演スライド）UEHARA, Tetsutaro

AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama

クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama

SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.

TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab

Recently uploaded (9)

【早稲田AI研究会　講義資料】3DスキャンとTextTo3Dのツールを知ろう！(Vol.1)

モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察～Text-to-MusicとText-To-ImageかつImage-to-Music...

自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer

CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か？

デジタル・フォレンジックの最新動向（2024年4月27日情洛会総会特別講演スライド）

AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf

クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf

SOPを理解する 2024/04/19 の勉強会で発表されたものです

TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案

Deep layer aggregation. Cvpr2018

1. Deep Layer Aggregation Shinichiro MURAKAMI 2018/07/07

2. Your Date Here Your Footer Here 2 〜2013.3 東京工業大学 - 運動野の情報解析 - 内部モデルの不確かさを考慮した学習モデル 2013.4〜アイシン精機（トヨタ系自動車部品会社） - トイレ設計 - ドライバ画像解析（顔向き、視線、年齢、性別...） 2017.4〜 IMRA Europe - ドライバ画像解析、歩行者行動解析 2018.4〜アイシン精機（台場） - 視線解析、周辺認識

3. CVPR2018 3

6. Today’s Paper Deep Layer Aggregation 6

7. What is skip connection? ResNeXt For classification ResNet deeper wider(cardinality) deeper wider

8. Residual Networks Behave Like Ensembles of Relatively Shallow Networks 認識性能が高くなる理由は、並列パスのアンサンブル学習とみなせるため。 Visualizing the Loss Landscape of Neural Nets 高次元のnon-convex lossをフラットにし、学習を簡単にする。 Effects of residual connections 1. Calculate residual 2. Skip connection ⇛勾配を伝えやすくし、勾配消失を軽減

9. For semantic segmentation U-Net Downsamplingした後に、詳細な空間情報の再現に使える

10. Effects of skip connections 1. CNN前半の粗い特徴と、CNN後半の詳細な特徴を組み合わせて、性能向上 2. 勾配を伝えやすくし、勾配消失問題に対処 3. Downsamplingした後に、詳細な空間情報の再現に使える（e.g. semantic segmentation) 4. 収束時間の低減

11. CVPR 2018

12. Question: Which skip connection is better? 12

13. Deep Layer Aggregation Fisher Yu, Dequan Wang, Evan Shelhamer,Trevor Darrell UC Berkeley - 従来のネットワーク(ResNet, DenseNet, FCN, U-Net等)のskip connection ” ” ” ”は，浅い結合しか適用されていなかった。この論文では、より深い結合をネットワークに取り入れ、少パラメータかつ高精度なネットワークモデルを構築。 - skip connectionをtree構造に見立てて、どのようにaggregate(まとめる)すればよいかを検討。General viewから検討されているので、頭の整理になる。

14. Approaches to aggregation

15. Existing model Stage : 同じサイズのconvolutionをまとめたもの。　　　 pooling等でactivation mapの大きさが変わると、変わる。

16. Deep Layer Aggregation (DLA) + =

17. Deep Layer Aggregation (DLA) Conv2d(in=3, out=16, kernel=7) Batch Normalization(BN) Relu Conv2d(in=16, out=16, kernel=3) BN Relu Conv2d(in=16, out=32, kernel=3) BN Relu Conv2d(in=32, out=64, kernel=3) BN Relu Conv2d(in=64, out=64, kernel=3) BN Relu Conv2d(in=64, out=64, kernel=3) BN Relu Conv2d(in=64, out=64, kernel=3) BN Relu Conv2d(in=128, out=64, kernel=1) BN Relu

18. Deep Layer Aggregation - semantic segmentation

19.

20. Results (ImageNet classification)

21. Results (ImageNet classification) 軽量化モデルであるSqueezeNetと比較しても、DLAのCompactモデルでは、少ないパラメータにも関らず、認識性能は良い。

22. Results (Fine-grained dataset)

23. Results (Semantic segmentation) Validation dataでストライドの比較 Test dataで他モデルの性能比較

24. Visualization (Semantic segmentation)

25. Conclusion - Skip connectionに対して深い結合(Deep layer aggregation)をネットワークに取り入れた。 - Tree構造に見立てたモジュール構造にすることで、一般的な観点からネットワーク構造の検討を行っている。（ただ、論文上でその比較が無いのが残念） - Classification, semantic segmentation等の複数の画像認識タスクにおいて sotaの性能を達成した。

26. BDD-100K - 今回紹介した論文のFirst author, Fisher Yu, が担当者

27. Made with by THANK YOU !

Deep layer aggregation. Cvpr2018

Recommended

Recommended

More Related Content

Similar to Deep layer aggregation. Cvpr2018

Similar to Deep layer aggregation. Cvpr2018 (20)

Recently uploaded

Recently uploaded (9)

Deep layer aggregation. Cvpr2018