Submit Search
Upload
画像認識 6.3-6.6 畳込みニューラルネットワーク
•
Download as PPTX, PDF
•
9 likes
•
2,583 views
S
Shion Honda
Follow
NLPaper Challenge 2019/03/09
Read less
Read more
Data & Analytics
Report
Share
Report
Share
1 of 31
Download now
Recommended
深層学習による自然言語処理 第2章 ニューラルネットの基礎
深層学習による自然言語処理 第2章 ニューラルネットの基礎
Shion Honda
画像認識と深層学習
画像認識と深層学習
Yusuke Uchida
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
Yusuke Uchida
Masked Autoencoders Are Scalable Vision Learners
Masked Autoencoders Are Scalable Vision Learners
GuoqingLiu9
MIRU2018 tutorial
MIRU2018 tutorial
Takayoshi Yamashita
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門まで
AGIRobots
Convolutional Neural Netwoks で自然言語処理をする
Convolutional Neural Netwoks で自然言語処理をする
Daiki Shimada
MIRU_Preview_JSAI2019
MIRU_Preview_JSAI2019
Takayoshi Yamashita
Recommended
深層学習による自然言語処理 第2章 ニューラルネットの基礎
深層学習による自然言語処理 第2章 ニューラルネットの基礎
Shion Honda
画像認識と深層学習
画像認識と深層学習
Yusuke Uchida
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
Yusuke Uchida
Masked Autoencoders Are Scalable Vision Learners
Masked Autoencoders Are Scalable Vision Learners
GuoqingLiu9
MIRU2018 tutorial
MIRU2018 tutorial
Takayoshi Yamashita
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門まで
AGIRobots
Convolutional Neural Netwoks で自然言語処理をする
Convolutional Neural Netwoks で自然言語処理をする
Daiki Shimada
MIRU_Preview_JSAI2019
MIRU_Preview_JSAI2019
Takayoshi Yamashita
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
S_aiueo32
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Daiki Shimada
IEEE ITSS Nagoya Chapter
IEEE ITSS Nagoya Chapter
Takayoshi Yamashita
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
メタスタディ (Vision and Language)
メタスタディ (Vision and Language)
Shintaro Yamamoto
Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3
Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3
Daiki Shimada
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Kazuyuki Miyazawa
DLフレームワークChainerの紹介と分散深層強化学習によるロボット制御
DLフレームワークChainerの紹介と分散深層強化学習によるロボット制御
Ryosuke Okuta
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
株式会社メタップスホールディングス
20190804_icml_kyoto
20190804_icml_kyoto
Takayoshi Yamashita
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
Deep Learning JP
DeepLearningDay2016Spring
DeepLearningDay2016Spring
Takayoshi Yamashita
Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)
Hirokatsu Kataoka
Deep learningの概要とドメインモデルの変遷
Deep learningの概要とドメインモデルの変遷
Taiga Nomi
CNNチュートリアル
CNNチュートリアル
Ikuro Sato
深層学習とTensorFlow入門
深層学習とTensorFlow入門
tak9029
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
Akisato Kimura
20150930
20150930
nlab_utokyo
20160601画像電子学会
20160601画像電子学会
nlab_utokyo
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
Hiroshi Fukui
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Takumi Ohkuma
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Deep Learning JP
More Related Content
What's hot
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
S_aiueo32
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Daiki Shimada
IEEE ITSS Nagoya Chapter
IEEE ITSS Nagoya Chapter
Takayoshi Yamashita
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
メタスタディ (Vision and Language)
メタスタディ (Vision and Language)
Shintaro Yamamoto
Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3
Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3
Daiki Shimada
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Kazuyuki Miyazawa
DLフレームワークChainerの紹介と分散深層強化学習によるロボット制御
DLフレームワークChainerの紹介と分散深層強化学習によるロボット制御
Ryosuke Okuta
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
株式会社メタップスホールディングス
20190804_icml_kyoto
20190804_icml_kyoto
Takayoshi Yamashita
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
Deep Learning JP
DeepLearningDay2016Spring
DeepLearningDay2016Spring
Takayoshi Yamashita
Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)
Hirokatsu Kataoka
Deep learningの概要とドメインモデルの変遷
Deep learningの概要とドメインモデルの変遷
Taiga Nomi
CNNチュートリアル
CNNチュートリアル
Ikuro Sato
深層学習とTensorFlow入門
深層学習とTensorFlow入門
tak9029
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
Akisato Kimura
20150930
20150930
nlab_utokyo
20160601画像電子学会
20160601画像電子学会
nlab_utokyo
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
Hiroshi Fukui
What's hot
(20)
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
IEEE ITSS Nagoya Chapter
IEEE ITSS Nagoya Chapter
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
メタスタディ (Vision and Language)
メタスタディ (Vision and Language)
Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3
Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
DLフレームワークChainerの紹介と分散深層強化学習によるロボット制御
DLフレームワークChainerの紹介と分散深層強化学習によるロボット制御
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
20190804_icml_kyoto
20190804_icml_kyoto
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
DeepLearningDay2016Spring
DeepLearningDay2016Spring
Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)
Deep learningの概要とドメインモデルの変遷
Deep learningの概要とドメインモデルの変遷
CNNチュートリアル
CNNチュートリアル
深層学習とTensorFlow入門
深層学習とTensorFlow入門
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
20150930
20150930
20160601画像電子学会
20160601画像電子学会
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
Similar to 画像認識 6.3-6.6 畳込みニューラルネットワーク
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Takumi Ohkuma
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Deep Learning JP
コンピュータビジョンの研究開発状況
コンピュータビジョンの研究開発状況
cvpaper. challenge
論文輪読資料「Multi-view Face Detection Using Deep Convolutional Neural Networks」
論文輪読資料「Multi-view Face Detection Using Deep Convolutional Neural Networks」
Kaoru Nasuno
データサイエンスの全体像とデータサイエンティスト
データサイエンスの全体像とデータサイエンティスト
The Japan DataScientist Society
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
cvpaper. challenge
【初学者向け】10分でつかむ!CNNの構造
【初学者向け】10分でつかむ!CNNの構造
marika_hotani
Survey of Scientific Publication Analysis by NLP and CV
Survey of Scientific Publication Analysis by NLP and CV
Shintaro Yamamoto
CVPR 2018 速報
CVPR 2018 速報
cvpaper. challenge
NIPS2015概要資料
NIPS2015概要資料
Shohei Hido
Graph U-Nets
Graph U-Nets
Shion Honda
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Yoshitaka Ushiku
関西Cvprml勉強会2017.9資料
関西Cvprml勉強会2017.9資料
Atsushi Hashimoto
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Preferred Networks
2017-05-30_deepleaning-and-chainer
2017-05-30_deepleaning-and-chainer
Keisuke Umezawa
Convolutional Neural Network @ CV勉強会関東
Convolutional Neural Network @ CV勉強会関東
Hokuto Kagaya
CVPR2017 参加報告 速報版 本会議 2日目
CVPR2017 参加報告 速報版 本会議 2日目
Atsushi Hashimoto
Menoh-Rubyで始めるお手軽簡単なDNN推論アプリ
Menoh-Rubyで始めるお手軽簡単なDNN推論アプリ
Preferred Networks
ICLR2018出張報告
ICLR2018出張報告
Yu Nishimura
ICLR2019参加報告前半@テキストアナリティクスシンポジウム
ICLR2019参加報告前半@テキストアナリティクスシンポジウム
Tomoya Mizumoto
Similar to 画像認識 6.3-6.6 畳込みニューラルネットワーク
(20)
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
コンピュータビジョンの研究開発状況
コンピュータビジョンの研究開発状況
論文輪読資料「Multi-view Face Detection Using Deep Convolutional Neural Networks」
論文輪読資料「Multi-view Face Detection Using Deep Convolutional Neural Networks」
データサイエンスの全体像とデータサイエンティスト
データサイエンスの全体像とデータサイエンティスト
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
【初学者向け】10分でつかむ!CNNの構造
【初学者向け】10分でつかむ!CNNの構造
Survey of Scientific Publication Analysis by NLP and CV
Survey of Scientific Publication Analysis by NLP and CV
CVPR 2018 速報
CVPR 2018 速報
NIPS2015概要資料
NIPS2015概要資料
Graph U-Nets
Graph U-Nets
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
関西Cvprml勉強会2017.9資料
関西Cvprml勉強会2017.9資料
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
2017-05-30_deepleaning-and-chainer
2017-05-30_deepleaning-and-chainer
Convolutional Neural Network @ CV勉強会関東
Convolutional Neural Network @ CV勉強会関東
CVPR2017 参加報告 速報版 本会議 2日目
CVPR2017 参加報告 速報版 本会議 2日目
Menoh-Rubyで始めるお手軽簡単なDNN推論アプリ
Menoh-Rubyで始めるお手軽簡単なDNN推論アプリ
ICLR2018出張報告
ICLR2018出張報告
ICLR2019参加報告前半@テキストアナリティクスシンポジウム
ICLR2019参加報告前半@テキストアナリティクスシンポジウム
More from Shion Honda
BERTをブラウザで動かしたい!―MobileBERTとTensorFlow.js―
BERTをブラウザで動かしたい!―MobileBERTとTensorFlow.js―
Shion Honda
Bridging between Vision and Language
Bridging between Vision and Language
Shion Honda
Deep Learning Chap. 12: Applications
Deep Learning Chap. 12: Applications
Shion Honda
Deep Learning Chap. 6: Deep Feedforward Networks
Deep Learning Chap. 6: Deep Feedforward Networks
Shion Honda
画像認識 第9章 さらなる話題
画像認識 第9章 さらなる話題
Shion Honda
Towards Predicting Molecular Property by Graph Neural Networks
Towards Predicting Molecular Property by Graph Neural Networks
Shion Honda
BERT: Pre-training of Deep Bidirectional Transformers for Language Understand...
BERT: Pre-training of Deep Bidirectional Transformers for Language Understand...
Shion Honda
IaGo: an Othello AI inspired by AlphaGo
IaGo: an Othello AI inspired by AlphaGo
Shion Honda
Planning chemical syntheses with deep neural networks and symbolic AI
Planning chemical syntheses with deep neural networks and symbolic AI
Shion Honda
More from Shion Honda
(9)
BERTをブラウザで動かしたい!―MobileBERTとTensorFlow.js―
BERTをブラウザで動かしたい!―MobileBERTとTensorFlow.js―
Bridging between Vision and Language
Bridging between Vision and Language
Deep Learning Chap. 12: Applications
Deep Learning Chap. 12: Applications
Deep Learning Chap. 6: Deep Feedforward Networks
Deep Learning Chap. 6: Deep Feedforward Networks
画像認識 第9章 さらなる話題
画像認識 第9章 さらなる話題
Towards Predicting Molecular Property by Graph Neural Networks
Towards Predicting Molecular Property by Graph Neural Networks
BERT: Pre-training of Deep Bidirectional Transformers for Language Understand...
BERT: Pre-training of Deep Bidirectional Transformers for Language Understand...
IaGo: an Othello AI inspired by AlphaGo
IaGo: an Othello AI inspired by AlphaGo
Planning chemical syntheses with deep neural networks and symbolic AI
Planning chemical syntheses with deep neural networks and symbolic AI
画像認識 6.3-6.6 畳込みニューラルネットワーク
1.
画像認識 6.3-6.6 畳込みニューラル ネットワーク 東京大学大学院 情報理工学系研究科 M1 本田志温 @shion_honda @shionhonda @shionhonda
2.
概要 • CNNの基礎 • 実装におけるテクニック •
最適化アルゴリズム • CNNの例 2019/3/9 NLP/CV 本田志温 2
3.
自己紹介 • 医学系の研究室でAI創薬をしています • NLP/CVも勉強中 •
勉強したことを発信しています! • 趣味: 音楽鑑賞, 料理, 旅行, サッカー, 水泳など • SFと神経科学も好き 2019/3/9 NLP/CV 本田志温 3
4.
CNNの基礎 2019/3/9 NLP/CV 本田志温
4
5.
画像の畳込み 2019/3/9 NLP/CV 本田志温
5 • 画像処理におけるフィルタの畳 込みと同じ • フィルタ(カーネル)の係数を学 習する →重み共有によるパラメータ数 の大幅な削減 kernel size 3, stride 1, padding 0 全結合: パラメータ35個 CNN: パラメータ3個 特徴マップ (feature map)
6.
CNN • 入力チャンネル数× 出力チャンネル数の カーネルを用意 • 6*6*3→6*6*5の変換 ならパラメータ数は どのくらい? •
全結合なら 6*6*3*6*6*5 =19440 • CNNなら 3*3*3*5=135 • これにバイアスも加 わる 2019/3/9 NLP/CV 本田志温 6 Convolutional Neural Networks in iOS and macOS
7.
プーリング層 • 局所領域から最大値/平均値を代表させる • 汎化性能に貢献 •
サイズは小さくなる • 最大値と平均値の和を利用すると良い 2019/3/9 NLP/CV 本田志温 7 [6] チャンネル方向にかけ るglobal poolingもある
8.
正規化 • 局所応答正規化(local response
normalization; LRN) • 同じ位置における近傍の特徴マップ間で正規化 • 局所コントラスト正規化(local contrast normalization; LCN) • 同じ特徴マップにおける局所領域で正規化 2019/3/9 NLP/CV 本田志温 8 LRN LCN [7]
9.
実装におけるテクニッ ク 活性化関数, データ拡張, バッチ正規化,
正則化など 2019/3/9 NLP/CV 本田志温 9
10.
活性化関数 • 各層で微分可能かつ非線形な関数をかける • ReLUは入力が正であれば勾配が減衰しない •
LReLUは入力が負のときも勾配を伝えられる 2019/3/9 NLP/CV 本田志温 10
11.
データ拡張 2019/3/9 NLP/CV 本田志温
11 • imgaug, Augmentor, albumentationsなど のライブラリが有名 • 一般に有効
12.
バッチ正規化 • テンソル(特徴マップをまとめたもの)をバッチ 方向に正規化する • 入力データの分布をおおまかに統一する(白色 化は計算コストが大きいのでその代わり) •
正規化の後のスケール・シフトに関するパラ メータは学習される →テスト時のため 2019/3/9 NLP/CV 本田志温 12 ChainerでもFunctionでは なくLinearに入っている
13.
正則化 • 過学習の防止や学習の安定化が目的 • 重み減衰 •
重みが大き過ぎると損失が大きくなるような罰則項 • 勾配クリッピング • 勾配に上界と下界を与える • ドロップアウト • ユニットの出力を一定確率で無効化 • アンサンブル学習のような効果 • ドロップコネクト • ユニット間の結合を一定確率で無効化(重み=0) 2019/3/9 NLP/CV 本田志温 13
14.
その他 • network in
network (NIN) • 畳込み+小規模MLP • 1×1畳込み • チャンネル方向の次元削減 • 空間ピラミッドプーリング(spatial pyramid pooling; SPP) • 画像を複数パターンの グリッドに分割 • 各領域でプーリング • 異なるサイズの画像を 入力できる 2019/3/9 NLP/CV 本田志温 14 NIN
15.
最適化アルゴリズム MomentumSGD, AdaGrad, RMSProp,
AdaDelta, Adam, AdaBound, RMSBound 2019/3/9 NLP/CV 本田志温 15
16.
MomentumSGD 2019/3/9 NLP/CV 本田志温
16 • 鞍点やプラトーでは SGDによる重み更新 が遅い • 慣性項(momentum) • 前iterationの勾配を引 き継ぐ
17.
AdaGrad • 状況に応じて学習率を適応的(adaptive)に調節 する • 次元ごとに異なる学習率を使う •
これまでの勾配が大きければ学習率↓ • これまでの勾配が小さければ学習率キープ • 急な勾配からプラトーや鞍点に達すると抜け出せな い 2019/3/9 NLP/CV 本田志温 17
18.
RMSProp • 過去の勾配を減衰率𝜌で忘却する →勾配の小さなところに留まっていると学習率 が増加する • RNNでよく使われる 2019/3/9
NLP/CV 本田志温 18
19.
AdaDelta 2019/3/9 NLP/CV 本田志温
19 • RMSPropと似ている • Δ𝒘と𝒘の単位を揃える
20.
Adam • adaptive moment
estimation • 勾配と勾配の2乗の指数移動平均を使って重み 更新(更新方向で過去の勾配を引き継ぐ) 2019/3/9 NLP/CV 本田志温 20 不安定な学習率
21.
AdaBound & AMSBound 2019/3/9
NLP/CV 本田志温 21 • Adam/AMSGradの学習率に動的な上界と下界 を定め, SGDMに徐々に近づけていく • Adam/AMSGrad • 学習が速いが汎化性能が低い • SGD • 学習が遅いが汎化性能が高い
22.
CNNの例 LeNet, AlexNet, VGGNet,
GoogLeNet, ResNet 2019/3/9 NLP/CV 本田志温 22
23.
ILSVRC • ImageNet large
scale visual recognition challenge 2019/3/9 NLP/CV 本田志温 23 http://image- net.org/challenges/talks_2017/ILSVRC2017_overview.pdf
24.
LeNet • Gradient-Based Learning
Applied to Document Recognition • LeCun+, IEEE, 1998 • 誤差逆伝播を利用した元祖CNN 2019/3/9 NLP/CV 本田志温 24 output channel inputchannel Sparse convolution: 各カーネルを一部チャンネ ルのみに畳み込む
25.
AlexNet • ImageNet Classification
with Deep Convolutional Neural Networks • Krizhevsky+, NIPS, 2012 • Hintonを含むトロント大学のチームによる • ILSVRC 2012優勝→深層学習ブームの始まり • 畳み込み, 最大値プーリング層, LRNからなる14層 のネットワーク • ReLU, Dropout, データ拡張 2019/3/9 NLP/CV 本田志温 25
26.
VGGNet • Very Deep
Convolutional Networks For Large-scale Image Recognition • Simonyan+, ICLR, 2015 • ILSVRC 2014準優勝 • 畳み込みと最大値プーリング層からなる16/19層の ネットワーク • 畳み込みを2-4回かけてからプーリングでサイズを 半分にするという操作を繰り返す 2019/3/9 NLP/CV 本田志温 26
27.
GoogLeNet • Rethinking the
Inception Architecture for Computer Vision • Szegedy+, CVPR, 2016 • ILSVRC 2014優勝 • Inceptionモジュール • Sparse convolution • 1x1畳込みによる次元削減 • Auxiliary loss • 22層だがパラ メータ数は AlexNetの1/12 2019/3/9 NLP/CV 本田志温 27
28.
ResNet • Deep Residual
Learning for Image Recognition • He+, CVPR, 2016 • ILSVRC 2015優勝 • 残差ブロックにより勾配消失を防ぐ • 152層 2019/3/9 NLP/CV 本田志温 28 連鎖律で掛け られる項 0になることは ほぼない
29.
SENet • Squeeze-and-Excitation Networks •
Hu+, CVPR, 2018 • ILSVRC 2018優勝 • SE Blockを残差ブロックや Inceptionに組み込む • Attentionで特徴マップをチャンネ ルごとに重み付け • GAPで画像の全体的な特徴を抽出 (squeeze) • 1×1の畳み込みで特徴マップの チャネル間の依存関係を抽出(excitation) 2019/3/9 NLP/CV 本田志温 29
30.
まとめ • CNNはカーネルの利用によりパラメータ数を 大幅に削減できる • データ拡張,
バッチ正規化, 様々な正則化が性 能向上に役立つ • 最適化アルゴリズムとしてはAdamやSGDがよ く使われてきたが, これからはAdaBoundや AMSBoundも人気になりそう • CVではVGGNetやResNetが基本アーキテク チャとしてよく使われる →perceptual loss 2019/3/9 NLP/CV 本田志温 30
31.
参考文献 2019/3/9 NLP/CV 本田志温
31 [1] 原田, 画像認識, 講談社, 2017. [2] 斎藤 他, ゼロから作るDeep Learning 2 自然言語処理編, O’Reilly, 2018. [3] 内田 他 , 物体認識のための畳み込みニューラルネットワークの研究動 向, 電子情報通信学会論文誌D, 2018. 近年のCNNの発展をILSVRCとともに振り返った日本語のサーベイ. [1]と合 わせて読むと良い. 元となったスライドSlideShareにある. [4] 代表的なCNNのアーキテクチャについて - Not Yet [5] An overview of gradient descent optimization algorithms [6] Yu et al., Mixed Pooling for Convolutional Neural Networks, 2014. [7] Visualizing Different Normalization Techniques – Dibya Prakash Das – Medium
Editor's Notes
飯田さんが説明してくれたとおり、1章の最後でも少しだけ創薬に触れられている 詳しくはQiita参照
Download now