Submit Search
Upload
【DLL3】20170904_ChainerMN_PFN福田圭祐
•
2 likes
•
3,352 views
Preferred Networks
Follow
9月1日にリリースした分散深層学習パッケージChainerMNの正式版(v1.0.0)を紹介
Read less
Read more
Presentations & Public Speaking
Report
Share
Report
Share
1 of 24
Download now
Download to read offline
Recommended
20171024 DLLab#04_PFN_Hiroshi Maruyama
20171024 DLLab#04_PFN_Hiroshi Maruyama
Preferred Networks
【DLL3】20170904_AIガイドライン_PFN丸山宏
【DLL3】20170904_AIガイドライン_PFN丸山宏
Preferred Networks
Lecture univ.tokyo 2017_okanohara
Lecture univ.tokyo 2017_okanohara
Preferred Networks
ディープラーニングアプリの可能性 -自動着色アプリPaintsChainer開発の経験から
ディープラーニングアプリの可能性 -自動着色アプリPaintsChainer開発の経験から
Preferred Networks
Deep Learning Practice and Theory
Deep Learning Practice and Theory
Preferred Networks
深層学習による機械とのコミュニケーション
深層学習による機械とのコミュニケーション
Yuya Unno
実世界の人工知能@DeNA TechCon 2017
実世界の人工知能@DeNA TechCon 2017
Preferred Networks
文法圧縮入門:超高速テキスト処理のためのデータ圧縮(NLP2014チュートリアル)
文法圧縮入門:超高速テキスト処理のためのデータ圧縮(NLP2014チュートリアル)
Shirou Maruyama
Recommended
20171024 DLLab#04_PFN_Hiroshi Maruyama
20171024 DLLab#04_PFN_Hiroshi Maruyama
Preferred Networks
【DLL3】20170904_AIガイドライン_PFN丸山宏
【DLL3】20170904_AIガイドライン_PFN丸山宏
Preferred Networks
Lecture univ.tokyo 2017_okanohara
Lecture univ.tokyo 2017_okanohara
Preferred Networks
ディープラーニングアプリの可能性 -自動着色アプリPaintsChainer開発の経験から
ディープラーニングアプリの可能性 -自動着色アプリPaintsChainer開発の経験から
Preferred Networks
Deep Learning Practice and Theory
Deep Learning Practice and Theory
Preferred Networks
深層学習による機械とのコミュニケーション
深層学習による機械とのコミュニケーション
Yuya Unno
実世界の人工知能@DeNA TechCon 2017
実世界の人工知能@DeNA TechCon 2017
Preferred Networks
文法圧縮入門:超高速テキスト処理のためのデータ圧縮(NLP2014チュートリアル)
文法圧縮入門:超高速テキスト処理のためのデータ圧縮(NLP2014チュートリアル)
Shirou Maruyama
20170419PFNオープンハウス リサーチャーの仕事_公開用
20170419PFNオープンハウス リサーチャーの仕事_公開用
Preferred Networks
Gatsby kaken-2017-pfn okanohara
Gatsby kaken-2017-pfn okanohara
Preferred Networks
comp_pfiseminar
comp_pfiseminar
Preferred Networks
Chainer OpenPOWER developer congress HandsON 20170522_ota
Chainer OpenPOWER developer congress HandsON 20170522_ota
Preferred Networks
Deep Learning Lab: DIMo & Chainer
Deep Learning Lab: DIMo & Chainer
Preferred Networks
Introduction to Chainer
Introduction to Chainer
Preferred Networks
20170419PFNオープンハウス インターンと採用 公開用
20170419PFNオープンハウス インターンと採用 公開用
Preferred Networks
Semantic segmentation
Semantic segmentation
Takuya Minagawa
IPAB2017 深層学習を使った新薬の探索から創造へ
IPAB2017 深層学習を使った新薬の探索から創造へ
Preferred Networks
Deep parking
Deep parking
Shintaro Shiba
PodSecurityPolicy からGatekeeper に移行しました / Kubernetes Meetup Tokyo #57
PodSecurityPolicy からGatekeeper に移行しました / Kubernetes Meetup Tokyo #57
Preferred Networks
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
Preferred Networks
Kubernetes + containerd で cgroup v2 に移行したら "failed to create fsnotify watcher...
Kubernetes + containerd で cgroup v2 に移行したら "failed to create fsnotify watcher...
Preferred Networks
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
Preferred Networks
Kubernetes ControllerをScale-Outさせる方法 / Kubernetes Meetup Tokyo #55
Kubernetes ControllerをScale-Outさせる方法 / Kubernetes Meetup Tokyo #55
Preferred Networks
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Preferred Networks
最新リリース:Optuna V3の全て - 2022/12/10 Optuna Meetup #2
最新リリース:Optuna V3の全て - 2022/12/10 Optuna Meetup #2
Preferred Networks
Optuna Dashboardの紹介と設計解説 - 2022/12/10 Optuna Meetup #2
Optuna Dashboardの紹介と設計解説 - 2022/12/10 Optuna Meetup #2
Preferred Networks
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
Preferred Networks
Deep Learningのための専用プロセッサ「MN-Core」の開発と活用(2022/10/19東大大学院「 融合情報学特別講義Ⅲ」)
Deep Learningのための専用プロセッサ「MN-Core」の開発と活用(2022/10/19東大大学院「 融合情報学特別講義Ⅲ」)
Preferred Networks
PFNにおける研究開発(2022/10/19 東大大学院「融合情報学特別講義Ⅲ」)
PFNにおける研究開発(2022/10/19 東大大学院「融合情報学特別講義Ⅲ」)
Preferred Networks
自然言語処理を 役立てるのはなぜ難しいのか(2022/10/25東大大学院「自然言語処理応用」)
自然言語処理を 役立てるのはなぜ難しいのか(2022/10/25東大大学院「自然言語処理応用」)
Preferred Networks
More Related Content
Viewers also liked
20170419PFNオープンハウス リサーチャーの仕事_公開用
20170419PFNオープンハウス リサーチャーの仕事_公開用
Preferred Networks
Gatsby kaken-2017-pfn okanohara
Gatsby kaken-2017-pfn okanohara
Preferred Networks
comp_pfiseminar
comp_pfiseminar
Preferred Networks
Chainer OpenPOWER developer congress HandsON 20170522_ota
Chainer OpenPOWER developer congress HandsON 20170522_ota
Preferred Networks
Deep Learning Lab: DIMo & Chainer
Deep Learning Lab: DIMo & Chainer
Preferred Networks
Introduction to Chainer
Introduction to Chainer
Preferred Networks
20170419PFNオープンハウス インターンと採用 公開用
20170419PFNオープンハウス インターンと採用 公開用
Preferred Networks
Semantic segmentation
Semantic segmentation
Takuya Minagawa
IPAB2017 深層学習を使った新薬の探索から創造へ
IPAB2017 深層学習を使った新薬の探索から創造へ
Preferred Networks
Deep parking
Deep parking
Shintaro Shiba
Viewers also liked
(10)
20170419PFNオープンハウス リサーチャーの仕事_公開用
20170419PFNオープンハウス リサーチャーの仕事_公開用
Gatsby kaken-2017-pfn okanohara
Gatsby kaken-2017-pfn okanohara
comp_pfiseminar
comp_pfiseminar
Chainer OpenPOWER developer congress HandsON 20170522_ota
Chainer OpenPOWER developer congress HandsON 20170522_ota
Deep Learning Lab: DIMo & Chainer
Deep Learning Lab: DIMo & Chainer
Introduction to Chainer
Introduction to Chainer
20170419PFNオープンハウス インターンと採用 公開用
20170419PFNオープンハウス インターンと採用 公開用
Semantic segmentation
Semantic segmentation
IPAB2017 深層学習を使った新薬の探索から創造へ
IPAB2017 深層学習を使った新薬の探索から創造へ
Deep parking
Deep parking
More from Preferred Networks
PodSecurityPolicy からGatekeeper に移行しました / Kubernetes Meetup Tokyo #57
PodSecurityPolicy からGatekeeper に移行しました / Kubernetes Meetup Tokyo #57
Preferred Networks
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
Preferred Networks
Kubernetes + containerd で cgroup v2 に移行したら "failed to create fsnotify watcher...
Kubernetes + containerd で cgroup v2 に移行したら "failed to create fsnotify watcher...
Preferred Networks
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
Preferred Networks
Kubernetes ControllerをScale-Outさせる方法 / Kubernetes Meetup Tokyo #55
Kubernetes ControllerをScale-Outさせる方法 / Kubernetes Meetup Tokyo #55
Preferred Networks
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Preferred Networks
最新リリース:Optuna V3の全て - 2022/12/10 Optuna Meetup #2
最新リリース:Optuna V3の全て - 2022/12/10 Optuna Meetup #2
Preferred Networks
Optuna Dashboardの紹介と設計解説 - 2022/12/10 Optuna Meetup #2
Optuna Dashboardの紹介と設計解説 - 2022/12/10 Optuna Meetup #2
Preferred Networks
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
Preferred Networks
Deep Learningのための専用プロセッサ「MN-Core」の開発と活用(2022/10/19東大大学院「 融合情報学特別講義Ⅲ」)
Deep Learningのための専用プロセッサ「MN-Core」の開発と活用(2022/10/19東大大学院「 融合情報学特別講義Ⅲ」)
Preferred Networks
PFNにおける研究開発(2022/10/19 東大大学院「融合情報学特別講義Ⅲ」)
PFNにおける研究開発(2022/10/19 東大大学院「融合情報学特別講義Ⅲ」)
Preferred Networks
自然言語処理を 役立てるのはなぜ難しいのか(2022/10/25東大大学院「自然言語処理応用」)
自然言語処理を 役立てるのはなぜ難しいのか(2022/10/25東大大学院「自然言語処理応用」)
Preferred Networks
Kubernetes にこれから入るかもしれない注目機能!(2022年11月版) / TechFeed Experts Night #7 〜 コンテナ技術を語る
Kubernetes にこれから入るかもしれない注目機能!(2022年11月版) / TechFeed Experts Night #7 〜 コンテナ技術を語る
Preferred Networks
Matlantis™のニューラルネットワークポテンシャルPFPの適用範囲拡張
Matlantis™のニューラルネットワークポテンシャルPFPの適用範囲拡張
Preferred Networks
PFNのオンプレ計算機クラスタの取り組み_第55回情報科学若手の会
PFNのオンプレ計算機クラスタの取り組み_第55回情報科学若手の会
Preferred Networks
続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2
続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2
Preferred Networks
Kubernetes Service Account As Multi-Cloud Identity / Cloud Native Security Co...
Kubernetes Service Account As Multi-Cloud Identity / Cloud Native Security Co...
Preferred Networks
KubeCon + CloudNativeCon Europe 2022 Recap / Kubernetes Meetup Tokyo #51 / #k...
KubeCon + CloudNativeCon Europe 2022 Recap / Kubernetes Meetup Tokyo #51 / #k...
Preferred Networks
KubeCon + CloudNativeCon Europe 2022 Recap - Batch/HPCの潮流とScheduler拡張事例 / Kub...
KubeCon + CloudNativeCon Europe 2022 Recap - Batch/HPCの潮流とScheduler拡張事例 / Kub...
Preferred Networks
独断と偏見で選んだ Kubernetes 1.24 の注目機能と今後! / Kubernetes Meetup Tokyo 50
独断と偏見で選んだ Kubernetes 1.24 の注目機能と今後! / Kubernetes Meetup Tokyo 50
Preferred Networks
More from Preferred Networks
(20)
PodSecurityPolicy からGatekeeper に移行しました / Kubernetes Meetup Tokyo #57
PodSecurityPolicy からGatekeeper に移行しました / Kubernetes Meetup Tokyo #57
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
Kubernetes + containerd で cgroup v2 に移行したら "failed to create fsnotify watcher...
Kubernetes + containerd で cgroup v2 に移行したら "failed to create fsnotify watcher...
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
Kubernetes ControllerをScale-Outさせる方法 / Kubernetes Meetup Tokyo #55
Kubernetes ControllerをScale-Outさせる方法 / Kubernetes Meetup Tokyo #55
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
最新リリース:Optuna V3の全て - 2022/12/10 Optuna Meetup #2
最新リリース:Optuna V3の全て - 2022/12/10 Optuna Meetup #2
Optuna Dashboardの紹介と設計解説 - 2022/12/10 Optuna Meetup #2
Optuna Dashboardの紹介と設計解説 - 2022/12/10 Optuna Meetup #2
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
Deep Learningのための専用プロセッサ「MN-Core」の開発と活用(2022/10/19東大大学院「 融合情報学特別講義Ⅲ」)
Deep Learningのための専用プロセッサ「MN-Core」の開発と活用(2022/10/19東大大学院「 融合情報学特別講義Ⅲ」)
PFNにおける研究開発(2022/10/19 東大大学院「融合情報学特別講義Ⅲ」)
PFNにおける研究開発(2022/10/19 東大大学院「融合情報学特別講義Ⅲ」)
自然言語処理を 役立てるのはなぜ難しいのか(2022/10/25東大大学院「自然言語処理応用」)
自然言語処理を 役立てるのはなぜ難しいのか(2022/10/25東大大学院「自然言語処理応用」)
Kubernetes にこれから入るかもしれない注目機能!(2022年11月版) / TechFeed Experts Night #7 〜 コンテナ技術を語る
Kubernetes にこれから入るかもしれない注目機能!(2022年11月版) / TechFeed Experts Night #7 〜 コンテナ技術を語る
Matlantis™のニューラルネットワークポテンシャルPFPの適用範囲拡張
Matlantis™のニューラルネットワークポテンシャルPFPの適用範囲拡張
PFNのオンプレ計算機クラスタの取り組み_第55回情報科学若手の会
PFNのオンプレ計算機クラスタの取り組み_第55回情報科学若手の会
続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2
続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2
Kubernetes Service Account As Multi-Cloud Identity / Cloud Native Security Co...
Kubernetes Service Account As Multi-Cloud Identity / Cloud Native Security Co...
KubeCon + CloudNativeCon Europe 2022 Recap / Kubernetes Meetup Tokyo #51 / #k...
KubeCon + CloudNativeCon Europe 2022 Recap / Kubernetes Meetup Tokyo #51 / #k...
KubeCon + CloudNativeCon Europe 2022 Recap - Batch/HPCの潮流とScheduler拡張事例 / Kub...
KubeCon + CloudNativeCon Europe 2022 Recap - Batch/HPCの潮流とScheduler拡張事例 / Kub...
独断と偏見で選んだ Kubernetes 1.24 の注目機能と今後! / Kubernetes Meetup Tokyo 50
独断と偏見で選んだ Kubernetes 1.24 の注目機能と今後! / Kubernetes Meetup Tokyo 50
【DLL3】20170904_ChainerMN_PFN福田圭祐
1.
正式版 リリース 福田 圭祐 Preferred
Networks, Inc.
2.
今日のお話 分散深層学習とは? ChainerMNとは?
ChainerMNの仕組み 1.0.0リリースの中身 誰が・いつChainerMNを使うべき? 2
3.
分散深層学習とは?
4.
分散深層学習とは 長時間を要する深層学習計算を、 多数のGPUを並列に用いることによって短時間で終わらせる 深層学習業界は、計算パワーの戦いになりつつある – メリット: 研究開発のターンアラウンドタイムの短縮
= より多くの試行錯誤 お金で時間を買う – デメリット: 多数のGPU・高速なネットワーク・(+電力⚡)が必要 – 特にネットワークが重要 並列化の限界:並列化しすぎるとモデルの精度が劣化(Sharp minima) 4
5.
モデルの精度劣化? GPUを増やす=バッチサイズ増加 – 普通のバッチサイズ
× GPU数 バッチサイズを増やしすぎると、得られるモデルが劣化する(場合がある) – 1エポック内のイテレーション数の減少 = 探索の不足 – 勾配の分散の減少 = 悪い局所解にハマりやすくなる – 精度に言及していない高速化の報告は意味なし! バッチサイズ、どれくらいまで大丈夫なの? – PFN社内の実験:ResNet-50 = 32*128GPU = 4096 までは大丈夫(ほぼ精度劣化なく時間短縮) – ”Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour” = 8192 – “Scaling SGD Batch Size to 32K for ImageNet Training” = 32768 5 ※学習率の調整等のノウハウは必要
6.
ChainerMNとは?
7.
ChainerMNとは? Chainerによる学習を、分散処理によって高速化するための追加パッケージ 特徴 – Scalable NVIDIA
NCCLやCUDA-Aware MPIなどの最新技術により高い並列性能 を実現 – Flexible Chainerの特徴の一つである、動的なネットワークも分散学習可能 – Easy 既存のChainerのコードに少し変更を加えれば利用可能 GitHubリポジトリ – https://github.com/chainer/chainermn 7
8.
ChainerMNの仕組み
9.
分散学習の手法 データ並列 – データを分割して、複数のワーカーが並列に学習
モデル並列 – モデルを分割して、複数のワーカーが並列に学習 9 データ並列 モデル並列 ChainerMNはこちら
10.
学習イテレーション 10 通常のChainerによる学習 Forward Backward Optimize All-Reduce Forward Forward Forward Backward Backward Backward Optimize Optimize Optimize ChainerMNによる分散学習
11.
All-Reduce 各ワーカーが持つ値を集計し、集計した結果を全ワーカーに配る処理 ChainerMNでは各ワーカーが持つ勾配𝑔𝑖から平均
𝑔を計算して配る – 厳密に言うと、AllreduceでSumを計算 11 All-Reduce 𝑔0 = 1 𝑔1 = 2 𝑔2 = 3 𝑔 = 2 𝑔 = 2 𝑔 = 2
12.
12 詳細: https://chainer.org/general/2017/02/08/Performance-of-Distributed-Deep- Learning-Using-ChainerMN.html
13.
NLPモデル(seq2seq) 13 Better
14.
ChainerMN 1.0.0リリースの中身
15.
1.0.0リリース(9/1)の中身 簡単に言うと…(1.0.0b2からの変更) – 安定性向上 いろいろ細かいBugfix – 速度向上(NCCL2.0サポート) NVIDIAの社の通信ライブラリのサポートにより通信がさらに高速になった –
サンプルの充実 seq2seq(自然言語処理・翻訳) DCGAN(生成系) – 将来への布石 モデル並列の実験的サポート 15
16.
誰が・いつChainerMNを使うべき?
17.
誰が・いつChainerMNを使うべき? 身も蓋もないことを言うと… お金と知識がある人 – お金: GPUをたくさん 高速なネットワーク(Infinibandがおすすめ) –
知識: 並列・分散環境の構築・設定は罠が多し💀 トラブルシューティングが自分でできる方 結果の妥当性評価 17
18.
有効性がわからないのに初期投資にそんなにかけられないよ… クラスタの構築・維持管理なんてできないよ… 18 誰が・いつChainerMNを使うべき?
19.
19
20.
20 https://xd-lab.net/xd2017-0008/
21.
ChainerMNのこれから
22.
ChainerMNのこれから – データ並列だけではこの先生きのこれない – 高速化とチューニング 22 –
強化学習を含むより多くの応用 – 非MPI環境への対応 – スパコンへの対応強化 – クラウド環境への対応を強化 with Microsoft & XD Faster, larger deep learning ChainerMN everywhere
23.
まとめ ChainerMNとは – Chainerによる学習を、分散処理によって高速化するための追加パッケージ –
1.0.0正式版リリース! – GitHubリポジトリ https://github.com/chainer/chainermn 大規模・分散深層学習は日進月歩で研究が進んでいます! Microsoft Azureで手軽にChainerMN! ChainerMN everywhere & faster, larger deep learning 23
24.
ありがとうございました 24
Download now