Recommended
PDF
PPTX
MIRU2014 tutorial deeplearning
PPTX
PPTX
PDF
Introduction to Deep Compression
PDF
PPTX
PDF
PDF
PDF
PDF
Tutorial-DeepLearning-PCSJ-IMPS2016
PPTX
PDF
再帰型ニューラルネット in 機械学習プロフェッショナルシリーズ輪読会
PDF
モデルアーキテクチャ観点からのDeep Neural Network高速化
PDF
semantic segmentation サーベイ
PPTX
U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
PPTX
PPTX
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
PDF
LSTM (Long short-term memory) 概要
PPTX
Cvim saisentan-6-4-tomoaki
PDF
PPTX
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
PDF
「ゼロから作るDeep learning」の畳み込みニューラルネットワークのハードウェア化
PPTX
[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions
PDF
PDF
PPT
PDF
Convolutional Neural Network @ CV勉強会関東
PDF
Faster R-CNN: Towards real-time object detection with region proposal network...
PDF
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
More Related Content
PDF
PPTX
MIRU2014 tutorial deeplearning
PPTX
PPTX
PDF
Introduction to Deep Compression
PDF
PPTX
PDF
What's hot
PDF
PDF
PDF
Tutorial-DeepLearning-PCSJ-IMPS2016
PPTX
PDF
再帰型ニューラルネット in 機械学習プロフェッショナルシリーズ輪読会
PDF
モデルアーキテクチャ観点からのDeep Neural Network高速化
PDF
semantic segmentation サーベイ
PPTX
U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
PPTX
PPTX
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
PDF
LSTM (Long short-term memory) 概要
PPTX
Cvim saisentan-6-4-tomoaki
PDF
PPTX
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
PDF
「ゼロから作るDeep learning」の畳み込みニューラルネットワークのハードウェア化
PPTX
[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions
PDF
PDF
PPT
PDF
Convolutional Neural Network @ CV勉強会関東
Viewers also liked
PDF
Faster R-CNN: Towards real-time object detection with region proposal network...
PDF
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
PDF
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
PDF
Improving neural networks by preventing co adaptation of feature detectors
PDF
An Introduction to Metric Learning for Clustering
PDF
Metric learning ICML2010 tutorial
PDF
PDF
Information-Theoretic Metric Learning
PPTX
論文紹介: Fast R-CNN&Faster R-CNN
PDF
Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3
PDF
Deep Residual Learning (ILSVRC2015 winner)
PDF
PDF
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
Similar to Image net classification with Deep Convolutional Neural Networks
PPTX
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
PDF
Building High-level Features Using Large Scale Unsupervised Learning
PDF
PDF
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
PDF
SPADE :Semantic Image Synthesis with Spatially-Adaptive Normalization
PPTX
PRML 5.5.6-5.6 畳み込みネットワーク(CNN)・ソフト重み共有・混合密度ネットワーク
PDF
PDF
Deep learningの概要とドメインモデルの変遷
PDF
NVIDIA Seminar ディープラーニングによる画像認識と応用事例
PPTX
令和元年度 実践セミナー - Deep Learning 概論 -
PDF
PPTX
機械学習 / Deep Learning 大全 (2) Deep Learning 基礎編
PDF
SSII2022 [TS3] コンテンツ制作を支援する機械学習技術〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜
PDF
Deep Learningと画像認識 ~歴史・理論・実践~
PDF
DeepLearningDay2016Summer
PDF
[論文紹介] Convolutional Neural Network(CNN)による超解像
PDF
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
PPTX
[DL輪読会]High-Fidelity Image Generation with Fewer Labels
PDF
Deep residual learning for image recognition
PDF
SSII2019TS: Shall We GANs? ~GANの基礎から最近の研究まで~
Image net classification with Deep Convolutional Neural Networks 1. 2. 3. Object Recognition
応用例:
• カメラの顔認識
• 自動レジ
• ロボットの目
• etc…
近年の傾向:
• クラス数
• 訓練画像数
• 特徴量の複雑化
Cat?
Leopard?
4. ILSVRC2012
IM GENET Large Scale Visual Recognition Challenge
• 世界最大規模の画像認識コンテスト
カテゴリ数 訓練画像 検査画像 テスト画像
1000 120万枚 50000枚 150000枚
※ ↑をダウンロードするだけで一週間かかる
Difficulty:
– データサイズの問題
– 訓練画像の数の多さの問題
– 識別の複雑さの問題
5. 6. Proposal Approach
訓練画像
Deep クラスラベル
Conventional
Neural
クラスラベル
テスト画像 Networks
• 内部で自動で特徴抽出
• 各層の間に荷重付き枝を持つようなNeural
Network
7. Result of ILSVRC 2012
Error Rate
0.4
34%
0.3 29%
27% 27% 26%
0.2
16%
0.1
0
わけが
わからない
よ
8. Agenda
• Overview
• ImageNet
• Architecture
– Deep Learning
– Convolutional NNs
– Acceleration
– Reducing Overfitting
• Learning
• Result and Evaluation
9. 10. Overview
why? 実世界におけるクラス分類に耐える識別機を作
る
史上最大規模のNeural Network
how?
それを動かせるGPU
what? Reasonableな時間で圧倒的な性能を出した
Reasonableな時間で圧倒的な性能を出した
contrib.
GPU用のコードを公開した
11. 12. 13. 14. Deep Learning
Output
Traditional Approach Greedy Layer-wise Training[1]
• まとめて学習 識別機 • 一層ずつ学習
• 多層autoencoder • 一層のautoencoder
× 時間 時間
× 効率 効率
× Vanishing Gradient × Overfitting
Problem
Input
15. 16. Convolutional NNs[2]
• NNsの問題
各ユニットへの入力を制限
• 前の層の一部のユニットの出力だけを受け取る
フィルタのようなもの
• 提案1 → 入力の誤差を全体に伝搬させない
• 入力範囲はオーバーラップするように選ぶ
• 提案2 データの欠損に対応するため
• 提案3
17. Convolutional NNs[2]
• NNsの問題
重みを共有
• 入力範囲の同じ入力座標は同じ重みをもつ
• 提案1 • 同じフィルタを使って圧縮するイメージ
→ フィルタに対する入力の傾向を学習
→ 入力のズレ,ノイズに対応
• 提案2
問題: 1つのフィルタについてしか学習できない
• 提案3
18. 19. Architecture of CNNs
5層のCNNs + 3層のNNs
• 入力:150,528次元
• ニューロン:約66万個,GPU2台に配置
253,440 – 186,624 – 64,896 – 64,896 – 43,264 –
4096 – 4096
• 出力:1000次元
20. 21. Acceleration
ReLU Local Response Overlapping
GPU2台の学習 Pooling
非線形変換 正規化
ニューロンのモデ
ル 入力 x : 前の層の出力を各枝ごとに重み付けしたも
の
出力 f(x): 入力に非線形な変形を加えたもの
ex.) f(x) = tanh(x), (1 + e-x)-1
f(x)
問題点 : 莫大な回数行うとなると遅すぎる
-> もっと単純な変形で出力を決定したい
ReLU 非線形変換
f(x) = max(0, x)
予備実験において6倍速くネットワークを収束
22. Acceleration
ReLU Local Response Overlapping
GPU2台の学習 Pooling
非線形変換 正規化
GPU間のデータのやり取りを制限
- 2,3層間,5,6層間,6,7層間だけ
23. Acceleration
ReLU Local Response Overlapping
GPU2台の学習 Pooling
非線形変換 正規化
• ReLU非線形変換の入力は全部負だとダメ
→ 近傍のフィルタの同じ座標の重みで正規
化
予備実験では約2%の性能向上
厚み:N
この範囲で正規化す
24. Acceleration
ReLU Local Response Overlapping
GPU2台の学習 Pooling
非線形変換 正規化
• 近傍の出力をまとめる
出力: 平均,最大値,etc…
• 一般的には範囲を分ける
図:Poolingのイメージ
→Overlapさせることでズレを
吸収
図:3×3, Overlap 1の例 0.3~0.4%の性能向上
25. 26. Reducing Overfitting
データの拡張
バリエーションを増やす
Dropout
ラベルを保存するような変換
1. トリミング+鏡像
訓練時:ランダムに切り取る
テスト時:中央+4隅
2. 輝度の変更
主成分分析を利用
ガウス分布から固有値を抽出
固有値と乱数で輝度を変更
約1%の性能向上
27. Reducing Overfitting
Dropoutなし
データの拡張
バリエーションを増やす
Dropout[3]
ラベルを保存するような変換
• 出力の半分を0にする
1. トリミング+鏡像
CNNsなので重みは共有
訓練時:ランダムに切り取る
→ 他の部分で学習は可能
テスト時:中央+4隅
Dropoutあり
2. 輝度の変更
• 他ニューロン任せをやめる
主成分分析を利用
ガウス分布から固有値を抽出
NNsは影響度の高いニューロン
に 固有値と乱数で輝度を変更
学習をまかせてしまうことがあ
約1%の性能向上
る
図:手書き数字画像から得た特徴
28. 29. 30. 31. Result
error rate
図:ILSVRCの結果 圧倒的なエラー率の低さ
32. 33. 34. 35. 36. 37. Refference
[1]Deep Learning:
A fast learning algorithm for deep belief nets, GE Hinton, S Osindero, YW Teh -
Neural computation, 2006.
[2]CNNs:
Face recognition: A convolutional neural-network approach, S Lawrence, CL
Giles,et al. Neural Networks, IEEE Transactions on 1997
参考http://ceromondo.blogspot.jp/2012/09/convolutional-neural-network.html
[3]Dropout:
Improving neural networks by preventing co-adaptation of feature detectors, GE
Hinton, N Srivastava, A Krizhevsky, et al. 2012