Submit Search
Upload
Deep layer aggregation. Cvpr2018
•
1 like
•
1,196 views
S
Shinichiro Murakami
Follow
Deep layer aggregation. Cvpr2018
Read less
Read more
Technology
Report
Share
Report
Share
1 of 27
Download now
Download to read offline
Recommended
neural architecture search with reinforcement learning
neural architecture search with reinforcement learning
Yamato OKAMOTO
ICDM'18 速報
ICDM'18 速報
Yamato OKAMOTO
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Yamato OKAMOTO
(Ja) A unified feature disentangler for multi domain image translation and ma...
(Ja) A unified feature disentangler for multi domain image translation and ma...
Yamato OKAMOTO
NeurIPS2018読み会@PFN a unified feature disentangler for multi domain image tran...
NeurIPS2018読み会@PFN a unified feature disentangler for multi domain image tran...
Yamato OKAMOTO
Unsupervised image to-image translation networks
Unsupervised image to-image translation networks
Yamato OKAMOTO
[ICML2019読み会in京都] Agnostic Federated Learning
[ICML2019読み会in京都] Agnostic Federated Learning
Yamato OKAMOTO
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
Yamato OKAMOTO
Recommended
neural architecture search with reinforcement learning
neural architecture search with reinforcement learning
Yamato OKAMOTO
ICDM'18 速報
ICDM'18 速報
Yamato OKAMOTO
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Yamato OKAMOTO
(Ja) A unified feature disentangler for multi domain image translation and ma...
(Ja) A unified feature disentangler for multi domain image translation and ma...
Yamato OKAMOTO
NeurIPS2018読み会@PFN a unified feature disentangler for multi domain image tran...
NeurIPS2018読み会@PFN a unified feature disentangler for multi domain image tran...
Yamato OKAMOTO
Unsupervised image to-image translation networks
Unsupervised image to-image translation networks
Yamato OKAMOTO
[ICML2019読み会in京都] Agnostic Federated Learning
[ICML2019読み会in京都] Agnostic Federated Learning
Yamato OKAMOTO
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
Yamato OKAMOTO
2017-05-30_deepleaning-and-chainer
2017-05-30_deepleaning-and-chainer
Keisuke Umezawa
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
Deep Learning JP
実社会・実環境におけるロボットの機械学習 ver. 2
実社会・実環境におけるロボットの機械学習 ver. 2
Kuniyuki Takahashi
inet-lab introduction
inet-lab introduction
Ismail Arai
スマートエスイーセミナー:機外学習応用システムパターンの例
スマートエスイーセミナー:機外学習応用システムパターンの例
HironoriTAKEUCHI1
実社会・実環境におけるロボットの機械学習
実社会・実環境におけるロボットの機械学習
Kuniyuki Takahashi
ディープラーニングの車載応用に向けて
ディープラーニングの車載応用に向けて
Ikuro Sato
Agile and Modeling in embedded systems safety and security
Agile and Modeling in embedded systems safety and security
Kenji Hiranabe
ドライブレコーダの動画を使った道路情報の自動差分抽出
ドライブレコーダの動画を使った道路情報の自動差分抽出
Tetsutaro Watanabe
ICRA 2019 速報
ICRA 2019 速報
cvpaper. challenge
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]
DeNA
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Preferred Networks
Generative Adversarial Networks (GAN) @ NIPS2017
Generative Adversarial Networks (GAN) @ NIPS2017
Koichi Hamada
Visual slam
Visual slam
Takuya Minagawa
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey
Takuya Minagawa
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Recruit Technologies
NIPS2015概要資料
NIPS2015概要資料
Shohei Hido
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
Hironobu Fujiyoshi
サルでもわかるディープラーニング入門 (2017年) (In Japanese)
サルでもわかるディープラーニング入門 (2017年) (In Japanese)
Toshihiko Yamakami
ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2
ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2
Sei Kato (加藤 整)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
More Related Content
Similar to Deep layer aggregation. Cvpr2018
2017-05-30_deepleaning-and-chainer
2017-05-30_deepleaning-and-chainer
Keisuke Umezawa
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
Deep Learning JP
実社会・実環境におけるロボットの機械学習 ver. 2
実社会・実環境におけるロボットの機械学習 ver. 2
Kuniyuki Takahashi
inet-lab introduction
inet-lab introduction
Ismail Arai
スマートエスイーセミナー:機外学習応用システムパターンの例
スマートエスイーセミナー:機外学習応用システムパターンの例
HironoriTAKEUCHI1
実社会・実環境におけるロボットの機械学習
実社会・実環境におけるロボットの機械学習
Kuniyuki Takahashi
ディープラーニングの車載応用に向けて
ディープラーニングの車載応用に向けて
Ikuro Sato
Agile and Modeling in embedded systems safety and security
Agile and Modeling in embedded systems safety and security
Kenji Hiranabe
ドライブレコーダの動画を使った道路情報の自動差分抽出
ドライブレコーダの動画を使った道路情報の自動差分抽出
Tetsutaro Watanabe
ICRA 2019 速報
ICRA 2019 速報
cvpaper. challenge
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]
DeNA
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Preferred Networks
Generative Adversarial Networks (GAN) @ NIPS2017
Generative Adversarial Networks (GAN) @ NIPS2017
Koichi Hamada
Visual slam
Visual slam
Takuya Minagawa
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey
Takuya Minagawa
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Recruit Technologies
NIPS2015概要資料
NIPS2015概要資料
Shohei Hido
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
Hironobu Fujiyoshi
サルでもわかるディープラーニング入門 (2017年) (In Japanese)
サルでもわかるディープラーニング入門 (2017年) (In Japanese)
Toshihiko Yamakami
ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2
ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2
Sei Kato (加藤 整)
Similar to Deep layer aggregation. Cvpr2018
(20)
2017-05-30_deepleaning-and-chainer
2017-05-30_deepleaning-and-chainer
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
実社会・実環境におけるロボットの機械学習 ver. 2
実社会・実環境におけるロボットの機械学習 ver. 2
inet-lab introduction
inet-lab introduction
スマートエスイーセミナー:機外学習応用システムパターンの例
スマートエスイーセミナー:機外学習応用システムパターンの例
実社会・実環境におけるロボットの機械学習
実社会・実環境におけるロボットの機械学習
ディープラーニングの車載応用に向けて
ディープラーニングの車載応用に向けて
Agile and Modeling in embedded systems safety and security
Agile and Modeling in embedded systems safety and security
ドライブレコーダの動画を使った道路情報の自動差分抽出
ドライブレコーダの動画を使った道路情報の自動差分抽出
ICRA 2019 速報
ICRA 2019 速報
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Generative Adversarial Networks (GAN) @ NIPS2017
Generative Adversarial Networks (GAN) @ NIPS2017
Visual slam
Visual slam
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
NIPS2015概要資料
NIPS2015概要資料
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
サルでもわかるディープラーニング入門 (2017年) (In Japanese)
サルでもわかるディープラーニング入門 (2017年) (In Japanese)
ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2
ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2
Recently uploaded
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
Recently uploaded
(9)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
Deep layer aggregation. Cvpr2018
1.
Deep Layer Aggregation Shinichiro
MURAKAMI 2018/07/07
2.
Your Date Here
Your Footer Here 2 〜2013.3 東京工業大学 - 運動野の情報解析 - 内部モデルの不確かさを考慮した学習モデル 2013.4〜 アイシン精機(トヨタ系自動車部品会社) - トイレ設計 - ドライバ画像解析(顔向き、視線、年齢、性別...) 2017.4〜 IMRA Europe - ドライバ画像解析、歩行者行動解析 2018.4〜 アイシン精機(台場) - 視線解析、周辺認識
3.
CVPR2018 3
4.
5.
6.
Today’s Paper Deep Layer
Aggregation 6
7.
What is skip
connection? ResNeXt For classification ResNet deeper wider(cardinality) deeper wider
8.
Residual Networks Behave
Like Ensembles of Relatively Shallow Networks 認識性能が高くなる理由は、並列パスの アンサンブル学習とみなせるため。 Visualizing the Loss Landscape of Neural Nets 高次元のnon-convex lossをフラットにし、 学習を簡単にする。 Effects of residual connections 1. Calculate residual 2. Skip connection ⇛勾配を伝えやすくし、勾配消失を軽減
9.
For semantic segmentation U-Net Downsamplingした後に、詳細な空間情報の再現に使える
10.
Effects of skip
connections 1. CNN前半の粗い特徴と、CNN後半の詳細な特徴を組 み合わせて、性能向上 2. 勾配を伝えやすくし、勾配消失問題に対処 3. Downsamplingした後に、詳細な空間情報の再現に使 える(e.g. semantic segmentation) 4. 収束時間の低減
11.
CVPR 2018
12.
Question: Which skip connection
is better? 12
13.
Deep Layer Aggregation Fisher
Yu, Dequan Wang, Evan Shelhamer,Trevor Darrell UC Berkeley - 従来のネットワーク(ResNet, DenseNet, FCN, U-Net等)のskip connection ” ” ” ”は, 浅い 結合しか適用されていなかった。この論文では、より 深い 結合を ネットワークに取り入れ、少パラメータかつ高精度なネットワークモデルを構築。 - skip connectionをtree構造に見立てて、どのようにaggregate(まとめる)すれば よいかを検討。General viewから検討されているので、頭の整理になる。
14.
Approaches to aggregation
15.
Existing model Stage
: 同じサイズのconvolutionをまとめたもの。 pooling等でactivation mapの大きさが変わると、変わる。
16.
Deep Layer Aggregation
(DLA) + =
17.
Deep Layer Aggregation
(DLA) Conv2d(in=3, out=16, kernel=7) Batch Normalization(BN) Relu Conv2d(in=16, out=16, kernel=3) BN Relu Conv2d(in=16, out=32, kernel=3) BN Relu Conv2d(in=32, out=64, kernel=3) BN Relu Conv2d(in=64, out=64, kernel=3) BN Relu Conv2d(in=64, out=64, kernel=3) BN Relu Conv2d(in=64, out=64, kernel=3) BN Relu Conv2d(in=128, out=64, kernel=1) BN Relu
18.
Deep Layer Aggregation
- semantic segmentation
19.
20.
Results (ImageNet classification)
21.
Results (ImageNet classification) 軽量化モデルであるSqueezeNetと比較しても、DLAのCompactモデルでは、少ないパラメータにも 関らず、認識性能は良い。
22.
Results (Fine-grained dataset)
23.
Results (Semantic segmentation) Validation
dataで ストライドの比較 Test dataで他モデル の性能比較
24.
Visualization (Semantic segmentation)
25.
Conclusion - Skip connectionに対して深い結合(Deep
layer aggregation)をネットワークに 取り入れた。 - Tree構造に見立てたモジュール構造にすることで、一般的な観点からネット ワーク構造の検討を行っている。(ただ、論文上でその比較が無いのが残念) - Classification, semantic segmentation等の複数の画像認識タスクにおいて sotaの性能を達成した。
26.
BDD-100K - 今回紹介した論文のFirst author,
Fisher Yu, が担当者
27.
Made with by THANK
YOU !
Download now