卒業研究角島康太郎

深層学習における層削除と
再学習による高速化
Speeding up for Deep Learning via
Layer Erasure and Re-tranig
日本大学生産工学部
数理情報工学科メディアデザインコース
計算知能研究室 77035 角島康太郎

目次
1.研究背景
2.従来研究
3.提案手法
4.実験環境
5.実験結果
6.実行画面
7.考察
8.まとめ

研究背景
ビックデータコンピュータの
爆発的発達
深層学習
第3次AIブーム

研究背景
画像認識分野において、畳み込みニューラル
ネットワーク（CNN）が使われている
2012年の画像の認識精度を競う大会で
1位を取った深層学習モデルAlexNet[2]
2位と圧倒的精度差！
1位83.5% 2位73.8%
[2]Krizhevsky,A.,Sutskever,I.,and Hinton,G.E.:Im-ageNet
Classificationwith Deep Convolutional Neural Networks,in
NeurIPS,pp.1097—1105(2012)

研究背景
畳み込みニューラルネットワーク
・画像認識分野において高い精度
・層を深くすることによって精度の改善
0.28
0.26
0.16
0.12
0.07
0.036
0.03
0.023
2010 2011 2012 2013 2014 2015 2016 2017
AlexNet
VGGNet
GoogleN
et
ResNet
19層
22層
152層
8層

研究背景
問題点
・計算コストの増加
・学習と予測の時間が増加
・近年のIoT時代の到来に伴い、少ない計算リ
ソースでの機械が増えてきている。
・以上の点から計算コストの削減が必要！！

従来研究
全結合層
・順伝番型ネットワーク
・入力層、隠れ層、出力層で構成

従来研究
畳み込みニューラルネットワーク（CNN）[1]
・入力信号の特徴の抽出、圧縮をする層を追加
[1] LeCun, Y.Bottou, L., Bengio, Y., and Haffner, P
.: Gradient-based Learning Applied t
Document Recognition, Pro-ceedings of the IEEE, vol.86, No11, pp.2278-
2324(1998)．

従来研究
ResNet[4]
2015年優勝モデル
畳み込み後の処理F(X)＋入力Xを次の層に渡す
ResidualUnitを重ねることで深い構造を実現
[4]Szegedy,C.,Liu,W.,Jia,y.,Sermanet,P.,Reed,S,E.,Anguelov,D.,Erhan,D.,Vanhou
cke,V.,and Rebinovich,A.: Going Deeper with Convolutions,in CVPR,pp.1-
9(2015)

従来研究
井田らのレイヤー数を削除する手法[5]
ResNetからResidual Unitを
削除するResidual Unitを特定する
Residual Unitの重要度を表す変数を導入
Residual Unit削減による計算時間の削減
再学習による認識精度低下の抑制
全結合層の層削除がない
削除される重みが使われない
[5]井田安俊、藤原靖宏層の削除と再学習によるResNetのモデル圧縮
人工知能学会論文誌 35巻(2020)3号

提案手法
全結合層の層削除
層の削除により、
計算時間の削減
重み融合による、
再学習時の精度低化
の抑制

提案手法：重要度計算
Important[]:層ごとの重要度
各層のノードの出力値を合計しノード数で割る
Important[lay]＝
1
𝑛𝑜𝑑𝑒
𝑛=0
𝑛𝑜𝑑𝑒
𝑂𝑢𝑡𝑛
𝑙𝑎𝑦

提案手法：重み融合
𝑤𝑘𝑖 = 𝑤𝑗𝑖 + 𝛼(1/𝑗𝑛𝑜𝑑𝑒
𝑗=0
𝑗𝑛𝑜𝑑𝑒
𝑤𝑘𝑗)
𝛼：重み学習率

実験環境
訓練データとテストデータ両方の正解率を測定
20エポック学習
5エポック目で層削除
20回平均
層削除し重み融合なし、層削除し提案手法によ
る重み融合、層削除なしで比較実験
重み融合学習率は0.1に設定

実験環境1
画像データセット：MNIST[6]
MNISTは10の分類クラスを持つ画像データ
画像サイズは28 × 28 × 1
訓練データ2000個
テストデータ500個
深層学習モデル全8層の全結合層
[6]THE MNIST DATABASE of handwritten digits URL:
http://yann.lecun.com/exdb/mnist/ 最終更新日2021/02/11

実験結果
提案手法の重み融合により精度の上昇
再学習からの精度の低下を抑えられている。
学習時精度テスト時精度
重み融合無 0.9322 0.8282
重み融合有 0.9406 0.8356

実験環境2
画像データセット：CIFAR-10[7]
10種類の物体カラー写真の画像データセット
画像サイズは32 × 32 × 3
訓練データ10000個
テストデータ4000個
深層学習モデル CNN
[7] The CIFAR-10 dataset
URL:https://www.cs.toronto.edu/~kriz/cifar.html 最終
更新日2021/02/11

実験結果
提案手法では、テスト時精度が向上
過学習を抑え、汎化学習が向上
層削除行っ
たため
認識精度が
低下
している
学習時精度テスト時精度
層削除なし 0.43321 0.3329
層削除あり 0.40664 0.3466

実験結果
時間の短縮
層削除することで
学習、推論の計算時間の短縮が確認
経過時間
層削除なし 7403.2
層削除あり 7122.8

考察
重み融合により削除される重みを有効活用する
ことにより再学習の認識精度低下の抑制
過学習が抑制され汎化学習精度が向上
層削除することによる計算コストが削減され
学習・推論の高速化

まとめ
層削除と重み融合を提案
認識精度低下の抑制
学習・推論の高速化
汎化学習の向上

卒業研究角島康太郎

Recommended

Recommended

More Related Content

What's hot

What's hot (19)

Similar to 卒業研究角島康太郎

Similar to 卒業研究角島康太郎 (20)

Recently uploaded

Recently uploaded (20)