Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
Yuya Unno
31,397 views
GPU上でのNLP向け深層学習の実装について
GPU向けにNLPの深層学習を実行する場合の工夫について
Technology
◦
Read more
25
Save
Share
Embed
Embed presentation
Download
Downloaded 74 times
1
/ 24
2
/ 24
3
/ 24
4
/ 24
5
/ 24
6
/ 24
7
/ 24
8
/ 24
9
/ 24
10
/ 24
11
/ 24
12
/ 24
13
/ 24
14
/ 24
15
/ 24
16
/ 24
17
/ 24
18
/ 24
19
/ 24
20
/ 24
21
/ 24
22
/ 24
23
/ 24
24
/ 24
More Related Content
PPTX
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
by
Deep Learning JP
PDF
はじめてのパターン認識 第1章
by
Prunus 1350
PDF
PRML輪読#1
by
matsuolab
PDF
全力解説!Transformer
by
Arithmer Inc.
PDF
Mean Teacher
by
harmonylab
PPTX
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
by
Deep Learning JP
PDF
KDD Cup 2021 時系列異常検知コンペ 参加報告
by
GentaYoshimura
PDF
[DL輪読会]GANとエネルギーベースモデル
by
Deep Learning JP
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
by
Deep Learning JP
はじめてのパターン認識 第1章
by
Prunus 1350
PRML輪読#1
by
matsuolab
全力解説!Transformer
by
Arithmer Inc.
Mean Teacher
by
harmonylab
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
by
Deep Learning JP
KDD Cup 2021 時系列異常検知コンペ 参加報告
by
GentaYoshimura
[DL輪読会]GANとエネルギーベースモデル
by
Deep Learning JP
What's hot
PDF
「統計的学習理論」第1章
by
Kota Matsui
PDF
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
by
Ken'ichi Matsui
PDF
分散学習のあれこれ~データパラレルからモデルパラレルまで~
by
Hideki Tsunashima
PDF
強化学習その2
by
nishio
PPTX
【DL輪読会】時系列予測 Transfomers の精度向上手法
by
Deep Learning JP
PPTX
数理最適化と機械学習の融合アプローチ-分類と新しい枠組み-
by
MIKIOKUBO3
PDF
Bayesian Neural Networks : Survey
by
tmtm otm
PDF
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
by
Deep Learning JP
PDF
Fisher線形判別分析とFisher Weight Maps
by
Takao Yamanaka
PDF
【メタサーベイ】基盤モデル / Foundation Models
by
cvpaper. challenge
PPTX
深層学習の数理
by
Taiji Suzuki
PPTX
3Dマップを活用したVisual Localization
by
Hajime Taira
PDF
大規模な組合せ最適化問題に対する発見的解法
by
Shunji Umetani
PPTX
【DL輪読会】ViT + Self Supervised Learningまとめ
by
Deep Learning JP
PDF
[DL輪読会]近年のエネルギーベースモデルの進展
by
Deep Learning JP
PDF
[DL輪読会]Deep Learning 第15章 表現学習
by
Deep Learning JP
PPTX
【DL輪読会】Language Conditioned Imitation Learning over Unstructured Data
by
Deep Learning JP
PDF
“機械学習の説明”の信頼性
by
Satoshi Hara
PPTX
How Much Position Information Do Convolutional Neural Networks Encode?
by
Kazuyuki Miyazawa
PDF
ベイジアンディープニューラルネット
by
Yuta Kashino
「統計的学習理論」第1章
by
Kota Matsui
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
by
Ken'ichi Matsui
分散学習のあれこれ~データパラレルからモデルパラレルまで~
by
Hideki Tsunashima
強化学習その2
by
nishio
【DL輪読会】時系列予測 Transfomers の精度向上手法
by
Deep Learning JP
数理最適化と機械学習の融合アプローチ-分類と新しい枠組み-
by
MIKIOKUBO3
Bayesian Neural Networks : Survey
by
tmtm otm
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
by
Deep Learning JP
Fisher線形判別分析とFisher Weight Maps
by
Takao Yamanaka
【メタサーベイ】基盤モデル / Foundation Models
by
cvpaper. challenge
深層学習の数理
by
Taiji Suzuki
3Dマップを活用したVisual Localization
by
Hajime Taira
大規模な組合せ最適化問題に対する発見的解法
by
Shunji Umetani
【DL輪読会】ViT + Self Supervised Learningまとめ
by
Deep Learning JP
[DL輪読会]近年のエネルギーベースモデルの進展
by
Deep Learning JP
[DL輪読会]Deep Learning 第15章 表現学習
by
Deep Learning JP
【DL輪読会】Language Conditioned Imitation Learning over Unstructured Data
by
Deep Learning JP
“機械学習の説明”の信頼性
by
Satoshi Hara
How Much Position Information Do Convolutional Neural Networks Encode?
by
Kazuyuki Miyazawa
ベイジアンディープニューラルネット
by
Yuta Kashino
Viewers also liked
PDF
CuPy解説
by
Ryosuke Okuta
PDF
Chainerの使い方と自然言語処理への応用
by
Yuya Unno
KEY
PyOpenCLによるGPGPU入門
by
Yosuke Onoue
PDF
More modern gpu
by
Preferred Networks
PDF
Chainerの使い方と自然言語処理への応用
by
Seiya Tokui
PDF
最近のDeep Learning (NLP) 界隈におけるAttention事情
by
Yuta Kikuchi
CuPy解説
by
Ryosuke Okuta
Chainerの使い方と自然言語処理への応用
by
Yuya Unno
PyOpenCLによるGPGPU入門
by
Yosuke Onoue
More modern gpu
by
Preferred Networks
Chainerの使い方と自然言語処理への応用
by
Seiya Tokui
最近のDeep Learning (NLP) 界隈におけるAttention事情
by
Yuta Kikuchi
Similar to GPU上でのNLP向け深層学習の実装について
PPTX
深層学習 第4章 大規模深層学習の実現技術
by
孝昌 田中
PDF
Recurrent Neural Networks
by
Seiya Tokui
PDF
Deep Learningの基礎と応用
by
Seiya Tokui
PDF
深層学習(岡本孝之 著) - Deep Learning chap.3_1
by
Masayoshi Kondo
PPT
Deep Learningの技術と未来
by
Seiya Tokui
PPTX
論文紹介:「End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF」
by
Naonori Nagano
PDF
Deep learning実装の基礎と実践
by
Seiya Tokui
PPTX
[PaperReading]Unsupervised Discrete Sentence Representation Learning for Inte...
by
Kazutoshi Shinoda
PPTX
[Paper Reading] Variational Sequential Labelers for Semi-Supervised Learning
by
Kazutoshi Shinoda
PPTX
Deep Learning Chap. 12: Applications
by
Shion Honda
PPTX
「機械学習とは?」から始める Deep learning実践入門
by
Hideto Masuoka
PDF
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
by
SSII
PDF
Deep Learning技術の今
by
Seiya Tokui
PDF
深層学習(岡本孝之 著) - Deep Learning chap.1 and 2
by
Masayoshi Kondo
PDF
ニューラルネットワークを用いた自然言語処理
by
Sho Takase
PDF
[DL輪読会]Convolutional Sequence to Sequence Learning
by
Deep Learning JP
PDF
Non-autoregressive text generation
by
nlab_utokyo
PDF
DEEP LEARNING、トレーニング・インファレンスのGPUによる高速化
by
RCCSRENKEI
PDF
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
by
Yuki Arase
PDF
attention_is_all_you_need_nips17_論文紹介
by
Masayoshi Kondo
深層学習 第4章 大規模深層学習の実現技術
by
孝昌 田中
Recurrent Neural Networks
by
Seiya Tokui
Deep Learningの基礎と応用
by
Seiya Tokui
深層学習(岡本孝之 著) - Deep Learning chap.3_1
by
Masayoshi Kondo
Deep Learningの技術と未来
by
Seiya Tokui
論文紹介:「End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF」
by
Naonori Nagano
Deep learning実装の基礎と実践
by
Seiya Tokui
[PaperReading]Unsupervised Discrete Sentence Representation Learning for Inte...
by
Kazutoshi Shinoda
[Paper Reading] Variational Sequential Labelers for Semi-Supervised Learning
by
Kazutoshi Shinoda
Deep Learning Chap. 12: Applications
by
Shion Honda
「機械学習とは?」から始める Deep learning実践入門
by
Hideto Masuoka
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
by
SSII
Deep Learning技術の今
by
Seiya Tokui
深層学習(岡本孝之 著) - Deep Learning chap.1 and 2
by
Masayoshi Kondo
ニューラルネットワークを用いた自然言語処理
by
Sho Takase
[DL輪読会]Convolutional Sequence to Sequence Learning
by
Deep Learning JP
Non-autoregressive text generation
by
nlab_utokyo
DEEP LEARNING、トレーニング・インファレンスのGPUによる高速化
by
RCCSRENKEI
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
by
Yuki Arase
attention_is_all_you_need_nips17_論文紹介
by
Masayoshi Kondo
More from Yuya Unno
PDF
深層学習で切り拓くパーソナルロボットの未来
by
Yuya Unno
PDF
深層学習時代の自然言語処理ビジネス
by
Yuya Unno
PDF
ベンチャー企業で言葉を扱うロボットの研究開発をする
by
Yuya Unno
PDF
PFNにおけるセミナー活動
by
Yuya Unno
PDF
深層学習フレームワークChainerとその進化
by
Yuya Unno
PDF
進化するChainer
by
Yuya Unno
PDF
予測型戦略を知るための機械学習チュートリアル
by
Yuya Unno
PDF
深層学習による機械とのコミュニケーション
by
Yuya Unno
PDF
最先端NLP勉強会“Learning Language Games through Interaction”Sida I. Wang, Percy L...
by
Yuya Unno
PDF
Chainer, Cupy入門
by
Yuya Unno
PDF
Chainerのテスト環境とDockerでのCUDAの利用
by
Yuya Unno
PDF
深層学習フレームワークChainerの特徴
by
Yuya Unno
PDF
子供の言語獲得と機械の言語獲得
by
Yuya Unno
PDF
NIP2015読み会「End-To-End Memory Networks」
by
Yuya Unno
PDF
Chainer入門と最近の機能
by
Yuya Unno
PDF
言語と知識の深層学習@認知科学会サマースクール
by
Yuya Unno
PDF
企業における自然言語処理技術利用の最先端
by
Yuya Unno
PDF
「知識」のDeep Learning
by
Yuya Unno
PDF
自然言語処理@春の情報処理祭
by
Yuya Unno
PDF
ピーFIの研究開発現場
by
Yuya Unno
深層学習で切り拓くパーソナルロボットの未来
by
Yuya Unno
深層学習時代の自然言語処理ビジネス
by
Yuya Unno
ベンチャー企業で言葉を扱うロボットの研究開発をする
by
Yuya Unno
PFNにおけるセミナー活動
by
Yuya Unno
深層学習フレームワークChainerとその進化
by
Yuya Unno
進化するChainer
by
Yuya Unno
予測型戦略を知るための機械学習チュートリアル
by
Yuya Unno
深層学習による機械とのコミュニケーション
by
Yuya Unno
最先端NLP勉強会“Learning Language Games through Interaction”Sida I. Wang, Percy L...
by
Yuya Unno
Chainer, Cupy入門
by
Yuya Unno
Chainerのテスト環境とDockerでのCUDAの利用
by
Yuya Unno
深層学習フレームワークChainerの特徴
by
Yuya Unno
子供の言語獲得と機械の言語獲得
by
Yuya Unno
NIP2015読み会「End-To-End Memory Networks」
by
Yuya Unno
Chainer入門と最近の機能
by
Yuya Unno
言語と知識の深層学習@認知科学会サマースクール
by
Yuya Unno
企業における自然言語処理技術利用の最先端
by
Yuya Unno
「知識」のDeep Learning
by
Yuya Unno
自然言語処理@春の情報処理祭
by
Yuya Unno
ピーFIの研究開発現場
by
Yuya Unno
GPU上でのNLP向け深層学習の実装について
1.
GPU上でのNLP向け深層学習 の実装について (株)Preferred Infrastructure 海野 裕也
2.
概要 l データごとに構造の異異なる⾃自然⾔言語処理理の様な 分野で、効率率率的な学習をするにはどうすればよ いか? l 論論⽂文ベースで幾つかの⼯工夫を紹介 2
3.
確率率率的勾配降降下法 until converge: for x,
y in trianing data: grad = calc_grad(x, y) update(w, grad) 3 こちらの並列列化は限度度がある こちらの並列列度度を上げる
4.
ミニバッチ並列列化 until converge: for {x,
y} in trianing data: grad = calc_grad({x, y}) update(w, grad) 4 ⼀一度度にたくさん計算する 並列列に計算できる
5.
ミニバッチの勾配計算の例例(SVM) Lhinge(yxTw) l W ∈
RD l x ∈ RD l y ∈ {-1, 1} l Lhinge: R à R 5 ∑ Lhinge(y⦿(xTw)) l W ∈ RD l x ∈ R{B, D} l y ∈ {-1, 1}B l Lhinge: RB à RB Bはミニバッチサイズ ⾏行行列列計算ライブラリに並列列化を押し込む
6.
⾔言語処理理でのミニバッチ並列列化の問題 l = 0 for
x, y in sentence: l = l + dot(softmax(dot(W, h)), y) c, h = LSTM(c, h, x) 6 ループ回数がデータ依存
7.
ミニバッチ並列列(Bunch training) l 複数⽂文をいっぺんに学習 l
⽂文⻑⾧長の差分はNULL(特別な記号)で埋めてごまかす 7
8.
NULL埋めによる無駄 8 l ⽂文⻑⾧長はガンマ分布に従うとして[古橋12]、複数サンプリ ングした中で最⼤大⻑⾧長に合わせた時の計算効率率率をプロット 0 0.2 0.4 0.6 0.8 1 1.2 1 2
4 8 16 32 64 128 256
9.
Sentence splicing [Chen+14] l
NULLで埋めずに、次々に⽂文を処理理する l 実装は単純ではない気がするが 9
10.
Splicingの効果 l Splicingしないと、50並列列程度度で性能は頭打ち 10
11.
Pipeline [Chen+15] l 層ごとにGPUが担当して、層が深くなるごとに別GPUが 計算を⾏行行う 11
12.
短いチャンクに切切る[Doetsch+14] l 単に短いチャンクに切切って並列列度度を上げる l NULLの量量も減る l
本当に⻑⾧長い依存は学習できなくなる 12
13.
計算グラフを解析 [Hwang+15] l 計算グラフを強連結成分分解 l
Recurrentの部分は1つの強連結成分に押し込める l 各強連結成分ごとに並列列計算する 13
14.
⾃自動並列列化の効果 l 単⼀一ストリームでもスループット向上 l ストリーム数が増えると性能は変わらない 14
15.
おまけ:Bucketing l 予め幾つかの⽂文⻑⾧長⽤用のネットワークを⽤用意して、 処理理データが収まる最⼩小のネットワークを利利⽤用 する l TensorFlowで使われている 15
16.
並列列化の⼯工夫まとめ l ゼロ埋め l ⽂文⻑⾧長の違うデータに0を埋めて、無理理やり計算 l
スプライシング l ストリームごとに次々データを流流す l パイプライン l 層ごとに別GPUを割り当ててスループットを稼ぐ l チャンク l ⽂文を無理理やり切切って⽂文⻑⾧長の差を緩和 l グラフ解析 l 計算系列列中の独⽴立立部分を抽出して⾃自動割当 16
17.
この辺から本題 l 今までみたのは全てシンプルなRecurrentだった ので、基本的に⽂文⻑⾧長(EOSのタイミング)しか 違いがない l より複雑なネットワークの並列列処理理には更更に⼯工 夫が必要 l
Encoder-decoderモデル l Recursive neural network l Attentionモデル系 l Memory networks系 17
18.
並列列化のレベル l GPUデバイス内 l SIMD,
メモリ, スレッド, カーネル l メモリ帯域: ~1TB/sec l GPUデバイス間(マルチGPU) l PCI-ex (~100GB/sec) l マシン間 l InfiniBand (~50GB/sec), Ethernet (~1GB/sec) 18
19.
バッチ vs オンライン l
ミニバッチサイズを増やしても実時間での精度度 向上が早くなってないように感じる l バッチ学習とオンライン学習と同じ議論論 l 更更新頻度度をあげようとすると、CPUの⽅方が有利利 な可能性は無いか? 19
20.
実装レベルで⽐比較
21.
⽬目についた実装を調査 l Embedding l Recurrent l
Recursive 21
22.
Embedding l word2vec l CPU実装、スレッドで並列列化、ロックしないで更更新(ミニバッ チにはしていない)、勾配を陽に持たない l
gensim l Python実装、Cythonで⾼高速化 l Polyglot2 l Python実装、Cythonとblasで⾼高速化 l Chainer (word2vec example) l Python実装、cupyでGPUサポート、ミニバッチ 22
23.
Recurrent l theano-rnn l Python実装、theanoでGPU、batchsizeでchunkを作る l
Passage l Python実装、theanoでGPU、iteratorでミニバッチを作り、 余ったところはゼロ埋め l DL4J (rnn example) l Java実装、ND4JでGPU、iteratorでミニバッチを作り、 batchsizeでchunkを作る l Chainer (ptb example) l Python実装、CuPyでGPU、batchsizeでchunkを作る 23
24.
Recursive l Stanford core
nlp l Java実装、再帰関数で実装、ミニバッチしていない l deep-recursive l C++実装、Eigen利利⽤用、データ単位で処理理(ミニバッチしていな い) l RecursiveNeuralTensorNetwork l Python実装、theano利利⽤用、Treeをstack操作に変換してから学 習しているがミニバッチしていなさそう l Chainer (sentiment example) l Python実装、CuPyでGPU、再帰関数で実装、ミニバッチして いない 24
Download