SlideShare a Scribd company logo
1 of 14
Download to read offline
By Yamato OKAMOTO
NEURAL ARCHITECTURE SEARCH WITH
REINFORCEMENT LEARNING
Neural Networkの
自動生成の手法!!
はじめに
自己紹介 岡本大和(おかもとやまと)
 2013 京都大学 情報学研究科 修士課程修了(美濃研究室所属)
 画像処理やパターン認識の研究に着手
 卒業後、オムロンに入社(京都企業!!)
 R&D担当、機械学習・IoT・データ分析を扱う(バズワードばかり……)
twitter.com/RoadRoller_DESU
イラストレーターの友人が
描いてくれた似顔絵キャラ
(※お気に入り)
今回紹介する論文
Neural Architecture Search
with Reinforcement Learning
ICLR ‘2017
Barret Zoph, Quoc V. Le (Google Brain)
https://arxiv.org/abs/1611.01578
https://www.youtube.com/watch?v=sROrvtXnT7Q
http://rll.berkeley.edu/deeprlcoursesp17/docs/quoc_barret.pdf
論文詳細
Neural Architecture Search
with Reinforcement Learning
背景と課題
深層学習の登場前後で人が担う役割が変化
• 登場前:Feature Design
• 登場後:Architecture Design
Architecture Designには専門知識と時間が必要
• モデルアーキテクチャに関わるパラメータは膨大
• 最適化するために試行錯誤を繰り返している状況
・Filter Size
・Output Dim
・Stride Size
etc…
提案手法
Neural Networkを生成するNeural Networkを提案
Controller
• RNN構造のNeural Network
• CNNパラメータを生成
(Filter Width & Height. Output Dimension. Stride.)
Child Network
• CNN構造のNeural Network
• Controllerの生成パラメータに基づいて複数構築される
ControllerはConv層のパラメータを出力
提案手法
Neural Networkを生成するNeural Networkを提案
Controller
• RNN構造のNeural Network
• CNNパラメータを生成
(Filter Width & Height. Output Dimension. Stride.)
Child Network
• CNN構造のNeural Network
• Controllerの生成パラメータに基づいて複数構築される
パラメータ候補に対して、
最適値をsoftmaxで出力する
(例) Filter Height
候補値 [1.0, 3.0, 5.0, 7.0]
出力例 [0.0, 0.1, 0.7, 0.2]
Child NetworkのAccuracy ‘R’ を最大化するように、
Controllerのパラメータ ‘θc’ を最適化する
提案手法
Neural Networkを生成するNeural Networkを提案
Controller
• RNN構造のNeural Network
• CNNパラメータを生成
(Filter Width & Height. Output Dimension. Stride.)
Child Network
• CNN構造のNeural Network
• Controllerの生成パラメータに基づいて複数構築される
課題と工夫①
R が θc で微分不可のため最適勾配法が適用できない
強化学習の枠組みを適用
• 報酬:Child NetworkのAccuracy(R)
• 行動:T個のパラメータを1~Tの連続したAction(a1:T)とみなす
Child Networkの個数mだけActionが繰り返されたとみなす
• 方策:Controllerのパラメータθc
Policy Gradient Methodによって方策 θc を最適化
• 報酬の期待値を微分した値 ∇θc J(θc) が近似的に求まる
報酬が高いChild Networkほど、
生成される確率が高くなるようΘcを更新
課題と工夫②
全てのChild Networkで学習と評価するため計算量膨大
並行かつ非同期な学習によって高速化
• Controllerを複製してk個のReplicaを用意
• ReplicaはChild Networkをm個構築して∇θcJ(θc)を算出
• つまり合計でk*mのネットワークが同時に学習される
• ∇θcJ(θc) を上位に送信してパラメータθcを更新
課題と工夫③
ResNetなどで用いられたSkip Connectionに対応したい
手前のLayerと接続するかどうかSigmoidで算出
• N番目のLayerでは1~N番目のLayerと接続するか否かそれぞれ計算
• それぞれの隠れ層状態hとパラメータWを元に計算する
課題と工夫④
recurrent cellを含むネットワーク構造にも対応したい
Tree構造を前提に、cellの構成要素をControllerで出力
• cellの入力はxtとht-1、cellの出力はht
• この計算ルートを3つのnodeからなるTree構造だと仮定(図左)
• 各ノードの加算と活性化関数をControllerで出力(図中央)
• 加算『add, Elem-Mult』、活性化関数『Identity, tanh, sigmoid, relu』
• さらにはcellを接続するnodeもControllerで出力(図右)
評価
生成したモデルでState-of-the-Artに近い性能を達成
• CIFAR-10やImageNetなど様々なタスクで評価している
• 下図はCIFAR-10の評価結果(他は省略)

More Related Content

What's hot

What's hot (14)

ICLR'19 読み会 in 京都 [LT枠] AIプロダクト品質保証ガイドラインの紹介
ICLR'19 読み会 in 京都 [LT枠] AIプロダクト品質保証ガイドラインの紹介ICLR'19 読み会 in 京都 [LT枠] AIプロダクト品質保証ガイドラインの紹介
ICLR'19 読み会 in 京都 [LT枠] AIプロダクト品質保証ガイドラインの紹介
 
Domain Generalization via Model-Agnostic Learning of Semantic Features
Domain Generalization via Model-Agnostic Learning of Semantic FeaturesDomain Generalization via Model-Agnostic Learning of Semantic Features
Domain Generalization via Model-Agnostic Learning of Semantic Features
 
CVPR2019@ロングビーチ参加速報(後編 ~本会議~)
CVPR2019@ロングビーチ参加速報(後編 ~本会議~)CVPR2019@ロングビーチ参加速報(後編 ~本会議~)
CVPR2019@ロングビーチ参加速報(後編 ~本会議~)
 
Deep layer aggregation. Cvpr2018
Deep layer aggregation. Cvpr2018Deep layer aggregation. Cvpr2018
Deep layer aggregation. Cvpr2018
 
ヒューマノイドロボット頂上決戦と人工知能:実践と理論のギャップを探る
ヒューマノイドロボット頂上決戦と人工知能:実践と理論のギャップを探るヒューマノイドロボット頂上決戦と人工知能:実践と理論のギャップを探る
ヒューマノイドロボット頂上決戦と人工知能:実践と理論のギャップを探る
 
実社会・実環境におけるロボットの機械学習 ver. 2
実社会・実環境におけるロボットの機械学習 ver. 2実社会・実環境におけるロボットの機械学習 ver. 2
実社会・実環境におけるロボットの機械学習 ver. 2
 
MoveItの新機能、 pilz industrial motion を試してみた
MoveItの新機能、 pilz industrial motion を試してみたMoveItの新機能、 pilz industrial motion を試してみた
MoveItの新機能、 pilz industrial motion を試してみた
 
東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也
東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也
東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也
 
ARとUnity-Robotics-Hubの連携
ARとUnity-Robotics-Hubの連携ARとUnity-Robotics-Hubの連携
ARとUnity-Robotics-Hubの連携
 
TensorFlow Object Detection API を使った取り組み@つくばチャレンジ2017
TensorFlow Object Detection API を使った取り組み@つくばチャレンジ2017TensorFlow Object Detection API を使った取り組み@つくばチャレンジ2017
TensorFlow Object Detection API を使った取り組み@つくばチャレンジ2017
 
Unity道場 ロボティクス 秋のLT祭り 2021
Unity道場 ロボティクス 秋のLT祭り 2021Unity道場 ロボティクス 秋のLT祭り 2021
Unity道場 ロボティクス 秋のLT祭り 2021
 
実践コンピュータビジョン 9章 画像の領域分割
実践コンピュータビジョン 9章 画像の領域分割実践コンピュータビジョン 9章 画像の領域分割
実践コンピュータビジョン 9章 画像の領域分割
 
Playgram開発秘話_2022年1月プログラミングシンポジウム招待講演_西澤勇輝、岡本雄太
Playgram開発秘話_2022年1月プログラミングシンポジウム招待講演_西澤勇輝、岡本雄太Playgram開発秘話_2022年1月プログラミングシンポジウム招待講演_西澤勇輝、岡本雄太
Playgram開発秘話_2022年1月プログラミングシンポジウム招待講演_西澤勇輝、岡本雄太
 
ROSのロボットモデルでバーチャルロボット受肉する
ROSのロボットモデルでバーチャルロボット受肉するROSのロボットモデルでバーチャルロボット受肉する
ROSのロボットモデルでバーチャルロボット受肉する
 

Similar to neural architecture search with reinforcement learning

Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォームAutoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Takuya Azumi
 
超AIが倫理的であれば 共存できるのか? ー進化倫理学を参考に ー
超AIが倫理的であれば共存できるのか?ー進化倫理学を参考に ー超AIが倫理的であれば共存できるのか?ー進化倫理学を参考に ー
超AIが倫理的であれば 共存できるのか? ー進化倫理学を参考に ー
The Whole Brain Architecture Initiative
 

Similar to neural architecture search with reinforcement learning (20)

Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォームAutoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
 
高橋_全脳アーキテクチャ若手の会 トーク資料(抜粋)
高橋_全脳アーキテクチャ若手の会 トーク資料(抜粋)高橋_全脳アーキテクチャ若手の会 トーク資料(抜粋)
高橋_全脳アーキテクチャ若手の会 トーク資料(抜粋)
 
ニューラルネットワーク.pptx
ニューラルネットワーク.pptxニューラルネットワーク.pptx
ニューラルネットワーク.pptx
 
ロボットアームをPythonで動かす
ロボットアームをPythonで動かすロボットアームをPythonで動かす
ロボットアームをPythonで動かす
 
IoTは怖くない
IoTは怖くないIoTは怖くない
IoTは怖くない
 
Deep Learningを用いたロボット制御
Deep Learningを用いたロボット制御Deep Learningを用いたロボット制御
Deep Learningを用いたロボット制御
 
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみたJupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
 
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
 
ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知
 
超AIが倫理的であれば 共存できるのか? ー進化倫理学を参考に ー
超AIが倫理的であれば共存できるのか?ー進化倫理学を参考に ー超AIが倫理的であれば共存できるのか?ー進化倫理学を参考に ー
超AIが倫理的であれば 共存できるのか? ー進化倫理学を参考に ー
 
ニコニコ学会 Ubi camera-edit_umt_03
ニコニコ学会 Ubi camera-edit_umt_03ニコニコ学会 Ubi camera-edit_umt_03
ニコニコ学会 Ubi camera-edit_umt_03
 
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
 
2020年10月29日 プロフェッショナルAI×Roboticsエンジニアへのロードマップ
2020年10月29日 プロフェッショナルAI×Roboticsエンジニアへのロードマップ2020年10月29日 プロフェッショナルAI×Roboticsエンジニアへのロードマップ
2020年10月29日 プロフェッショナルAI×Roboticsエンジニアへのロードマップ
 
ロボットを作って動かしてみよう
ロボットを作って動かしてみようロボットを作って動かしてみよう
ロボットを作って動かしてみよう
 
軸が異なる3つの組み合わせの考え方
軸が異なる3つの組み合わせの考え方軸が異なる3つの組み合わせの考え方
軸が異なる3つの組み合わせの考え方
 
第7回WBAシンポジウム:全脳確率的生成モデル(WB-PGM)〜世界モデルと推論に基づく汎用人工知能に向けて
第7回WBAシンポジウム:全脳確率的生成モデル(WB-PGM)〜世界モデルと推論に基づく汎用人工知能に向けて第7回WBAシンポジウム:全脳確率的生成モデル(WB-PGM)〜世界モデルと推論に基づく汎用人工知能に向けて
第7回WBAシンポジウム:全脳確率的生成モデル(WB-PGM)〜世界モデルと推論に基づく汎用人工知能に向けて
 
人工知能研究のための視覚情報処理
人工知能研究のための視覚情報処理人工知能研究のための視覚情報処理
人工知能研究のための視覚情報処理
 
2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)
2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)
2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)
 
Os 12 記号創発ロボティクス / OS趣旨説明@JSAI2015
Os 12 記号創発ロボティクス / OS趣旨説明@JSAI2015 Os 12 記号創発ロボティクス / OS趣旨説明@JSAI2015
Os 12 記号創発ロボティクス / OS趣旨説明@JSAI2015
 
Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised L...
Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised L...Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised L...
Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised L...
 

More from Yamato OKAMOTO

More from Yamato OKAMOTO (20)

第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR
第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR
第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR
 
部下のマネジメントはAI開発に学べ
部下のマネジメントはAI開発に学べ部下のマネジメントはAI開発に学べ
部下のマネジメントはAI開発に学べ
 
ICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly Detection
ICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly DetectionICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly Detection
ICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly Detection
 
ICLR'2020 参加速報
ICLR'2020 参加速報ICLR'2020 参加速報
ICLR'2020 参加速報
 
(SURVEY) Active Learning
(SURVEY) Active Learning(SURVEY) Active Learning
(SURVEY) Active Learning
 
(SURVEY) Semi Supervised Learning
(SURVEY) Semi Supervised Learning(SURVEY) Semi Supervised Learning
(SURVEY) Semi Supervised Learning
 
[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...
[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...
[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...
 
CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)
CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)
CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)
 
ICML2019@Long Beach 参加速報(5~6日目 Workshop)
ICML2019@Long Beach 参加速報(5~6日目 Workshop)ICML2019@Long Beach 参加速報(5~6日目 Workshop)
ICML2019@Long Beach 参加速報(5~6日目 Workshop)
 
ICML2019@Long Beach 参加速報(最終日 Workshop)
ICML2019@Long Beach 参加速報(最終日 Workshop)ICML2019@Long Beach 参加速報(最終日 Workshop)
ICML2019@Long Beach 参加速報(最終日 Workshop)
 
ICML2019@Long Beach 参加速報(4日目)
ICML2019@Long Beach 参加速報(4日目)ICML2019@Long Beach 参加速報(4日目)
ICML2019@Long Beach 参加速報(4日目)
 
ICML2019@Long Beach 参加速報(3日目)
ICML2019@Long Beach 参加速報(3日目)ICML2019@Long Beach 参加速報(3日目)
ICML2019@Long Beach 参加速報(3日目)
 
ICML2019@Long Beach 参加速報(2日目)
ICML2019@Long Beach 参加速報(2日目) ICML2019@Long Beach 参加速報(2日目)
ICML2019@Long Beach 参加速報(2日目)
 
ICML2019@Long Beach 参加速報(1日目)
ICML2019@Long Beach 参加速報(1日目)ICML2019@Long Beach 参加速報(1日目)
ICML2019@Long Beach 参加速報(1日目)
 
ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向
ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向
ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向
 
CVPR2019 survey Domain Adaptation on Semantic Segmentation
CVPR2019 survey Domain Adaptation on Semantic SegmentationCVPR2019 survey Domain Adaptation on Semantic Segmentation
CVPR2019 survey Domain Adaptation on Semantic Segmentation
 
ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』
ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』
ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』
 
IntelliLight: A Reinforcement Learning Approach for Intelligent Traffic Light...
IntelliLight: A Reinforcement Learning Approach for Intelligent Traffic Light...IntelliLight: A Reinforcement Learning Approach for Intelligent Traffic Light...
IntelliLight: A Reinforcement Learning Approach for Intelligent Traffic Light...
 
A unified feature disentangler for multi domain image translation and manipul...
A unified feature disentangler for multi domain image translation and manipul...A unified feature disentangler for multi domain image translation and manipul...
A unified feature disentangler for multi domain image translation and manipul...
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)
 

Recently uploaded

Recently uploaded (10)

論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 

neural architecture search with reinforcement learning