Submit Search
Upload
SC18 NVIDIA NEWS
•
0 likes
•
138 views
Kuninobu SaSaki
Follow
2018年11月に開催されたスーパーコンピューティングに関する国際会議・展示会「SC18」でのGPU関連ニュースをまとめました。
Read less
Read more
Technology
Report
Share
Report
Share
1 of 3
Download now
Download to read offline
Recommended
PCクラスタコンソーシアムの開催する PCCC21「『PCクラスタ』これからの10年」(設立20周年記念PCクラスタシンポジウム)会員展示として公開中のスライドです。 詳細は下記のWebサイトへお越しください。 ▽PCCC21「『PCクラスタ』これからの10年」(2021年12月8日~9日) https://www.pccluster.org/ja/event/pccc21/
PCCC21:東京大学情報基盤センター 「『計算・データ・学習』融合によるスーパーコンピューティングの革新、そして東大センターのこれから」
PCCC21:東京大学情報基盤センター 「『計算・データ・学習』融合によるスーパーコンピューティングの革新、そして東大センターのこれから」
PC Cluster Consortium
エヌビディア合同会社 エンタープライズマーケティング 佐々木邦暢 (@_ksasaki)
NVIDIA ディープラーニング最新情報
NVIDIA ディープラーニング最新情報
Hirono Jumpei
2016Nov22 Sc16 nvidia
2016Nov22 Sc16 nvidia
2016Nov22 Sc16 nvidia
Tomokazu Kanazawa
SC16 での GPU 関連発表のまとめ
SC16 NVIDIA NEWS
SC16 NVIDIA NEWS
Kuninobu SaSaki
本プレゼンテーションは 2017 年 9 月 18 日に開催された、夏のトップカンファレンス論文読み会 (CVPR/ICML/KDD etc.) にて、NVIDIA のディープラーニングソリューションアーキテクト山崎和博がお話したものです。
NVIDIA 最近の動向
NVIDIA 最近の動向
NVIDIA Japan
2017 年 6 月版 TOP/Green500 NVIDIA 関連情報のまとめ
ISC17 NVIDIA NEWS 日本版
ISC17 NVIDIA NEWS 日本版
Kuninobu SaSaki
PCクラスタコンソーシアムの開催するPCCC23(第23回PCクラスタシンポジウム)「HPC基盤技術と生成AI」会員展示として公開中のスライドです。 詳細は下記のWebサイトへお越しください。 ▽PCCC23 「HPC基盤技術と生成AI」 (2023年12月7日~8日) https://www.pccluster.org/ja/event/pccc23/
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PC Cluster Consortium
GPUコンピューティング研究会 これから始める方のためのディープラーニング入門 ニューラルネットワークの学習過程がわかりやすく説明されています。 特に畳み込みニューラルネットワーク(CNN)の説明がとても丁寧で、わかりやすいです。
NVIDIA ディープラーニング入門
NVIDIA ディープラーニング入門
Seong-Hun Choe
Recommended
PCクラスタコンソーシアムの開催する PCCC21「『PCクラスタ』これからの10年」(設立20周年記念PCクラスタシンポジウム)会員展示として公開中のスライドです。 詳細は下記のWebサイトへお越しください。 ▽PCCC21「『PCクラスタ』これからの10年」(2021年12月8日~9日) https://www.pccluster.org/ja/event/pccc21/
PCCC21:東京大学情報基盤センター 「『計算・データ・学習』融合によるスーパーコンピューティングの革新、そして東大センターのこれから」
PCCC21:東京大学情報基盤センター 「『計算・データ・学習』融合によるスーパーコンピューティングの革新、そして東大センターのこれから」
PC Cluster Consortium
エヌビディア合同会社 エンタープライズマーケティング 佐々木邦暢 (@_ksasaki)
NVIDIA ディープラーニング最新情報
NVIDIA ディープラーニング最新情報
Hirono Jumpei
2016Nov22 Sc16 nvidia
2016Nov22 Sc16 nvidia
2016Nov22 Sc16 nvidia
Tomokazu Kanazawa
SC16 での GPU 関連発表のまとめ
SC16 NVIDIA NEWS
SC16 NVIDIA NEWS
Kuninobu SaSaki
本プレゼンテーションは 2017 年 9 月 18 日に開催された、夏のトップカンファレンス論文読み会 (CVPR/ICML/KDD etc.) にて、NVIDIA のディープラーニングソリューションアーキテクト山崎和博がお話したものです。
NVIDIA 最近の動向
NVIDIA 最近の動向
NVIDIA Japan
2017 年 6 月版 TOP/Green500 NVIDIA 関連情報のまとめ
ISC17 NVIDIA NEWS 日本版
ISC17 NVIDIA NEWS 日本版
Kuninobu SaSaki
PCクラスタコンソーシアムの開催するPCCC23(第23回PCクラスタシンポジウム)「HPC基盤技術と生成AI」会員展示として公開中のスライドです。 詳細は下記のWebサイトへお越しください。 ▽PCCC23 「HPC基盤技術と生成AI」 (2023年12月7日~8日) https://www.pccluster.org/ja/event/pccc23/
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PC Cluster Consortium
GPUコンピューティング研究会 これから始める方のためのディープラーニング入門 ニューラルネットワークの学習過程がわかりやすく説明されています。 特に畳み込みニューラルネットワーク(CNN)の説明がとても丁寧で、わかりやすいです。
NVIDIA ディープラーニング入門
NVIDIA ディープラーニング入門
Seong-Hun Choe
沖縄市Startup Cafe Kozaで行ったセミナー資料
NVIDIA deep learning最新情報in沖縄
NVIDIA deep learning最新情報in沖縄
Tak Izaki
GPUの演算能力を汎用的に活用する「GPUコンピューティング」が誕生してはや10年。多くのスーパーコンピューターに採用されるなど科学技術計算の領域で実績を積み重ねたこの技術は、近年のAIムーブメントを支える重要な存在になっています。高度な画像認識、自然言語処理、そして自動運転などますます複雑になる問題のために登場した Volta 世代の新型GPUをはじめ、GPUコンピューティングの最新情報をお伝えします。
[db analytics showcase Sapporo 2017] B14: GPU コンピューティング最前線 by エヌビディア 佐々木邦暢
[db analytics showcase Sapporo 2017] B14: GPU コンピューティング最前線 by エヌビディア 佐々木邦暢
Insight Technology, Inc.
2019年1月17日に開催された GPU Deep Learning Community #10でのエヌビディア古家の発表資料です。
GPU スパコン最新情報
GPU スパコン最新情報
NVIDIA Japan
PCクラスタコンソーシアムの開催する PCCC22(第22回PCクラスタシンポジウム)「HPCシステム技術の最前線」 会員展示として公開中のスライドです。 詳細は下記のWebサイトへお越しください。 ▽PCCC22 「HPCシステム技術の最前線」 (2022年12月5日~6日) https://www.pccluster.org/ja/event/pccc22/
PCCC22:東京大学情報基盤センター 「Society5.0の実現を目指す「計算・データ・学習」の融合による革新的スーパーコンピューティング」
PCCC22:東京大学情報基盤センター 「Society5.0の実現を目指す「計算・データ・学習」の融合による革新的スーパーコンピューティング」
PC Cluster Consortium
45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄
Yukio Saito
Developers Summit 2018 Summer【A-1】佐々木様の講演資料です。
【A-1】AIを支えるGPUコンピューティングの今
【A-1】AIを支えるGPUコンピューティングの今
Developers Summit
Google Cloud Platform (GCP) の上で、効率的に機械学習モデルを開発する方法、機械学習プロジェクトを運用する方法について説明します
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
Yaboo Oyabu
医用画像情報学会 平成28年度春季177回大会での講演で使用した資料です。
MII conference177 nvidia
MII conference177 nvidia
Tak Izaki
講演タイトル:GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス (Red Hat Forum 2017 発表資料) 講演者:玉置 伸行 アジェンダ: - GPUインフラについての整理 - GPU on OpenStackとは - 環境構築のステップ
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
VirtualTech Japan Inc.
2016Sep13 gdlc01 nvidia
Gpu deep learning community設立について0913
Gpu deep learning community設立について0913
Tomokazu Kanazawa
長岡技術科学大学 2015年度GPGPU実践基礎工学(全15回,学部3年対象講義) 第14回GPGPU組込開発環境 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 ・第2回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu2 ・第3回 GPUクラスタ上でのプログラミング(CUDA) http://www.slideshare.net/ssuserf87701/2015gpgpu3 ・第4回 CPUのアーキテクチャ http://www.slideshare.net/ssuserf87701/2015gpgpu4 ・第5回 ハードウェアによるCPUの高速化技術 http://www.slideshare.net/ssuserf87701/2015gpgpu5 ・第6回 ソフトウェアによるCPUの高速化技術 http://www.slideshare.net/ssuserf87701/2015gpgpu6 ・第7回 シングルコアとマルチコア http://www.slideshare.net/ssuserf87701/2015gpgpu7 ・第8回 並列計算の概念(プロセスとスレッド) http://www.slideshare.net/ssuserf87701/2015gpgpu8 ・第9回 GPUのアーキテクチャ http://www.slideshare.net/ssuserf87701/2015gpgpu9 ・第9回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu9-59160061 ・第10回 GPGPUのプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu10 ・第11回 GPUでの並列プログラミング(ベクトル和) http://www.slideshare.net/ssuserf87701/2015gpgpu11 ・第12回 GPUによる画像処理 http://w ww.slideshare.net/ssuserf87701/2015gpgpu12 ・第13回GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu13 ・第14回 GPGPU組込開発環境 http://www.slideshare.net/ssuserf87701/2015gpgpu14 ・第15回 GPGPUの開発環境(OpenCL) http://www.slideshare.net/ssuserf87701/2015gpgpu15 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
智啓 出川
このスライドは、2018 年 4 月 24 日 (火) にベルサール高田馬場にて開催の NVIDIA Deep Learning Seminar 2018 における、エヌビディア日本代表兼米国本社副社長 大崎真孝による「GTC 2018 の基調講演から」の資料です。
GTC 2018 の基調講演から
GTC 2018 の基調講演から
NVIDIA Japan
近年数値シミュレーション研究において、本来グラフィック処理用のGPU(Graphics Processing Unit)を演算用途に用いることが進んでいる。GPUは、CPUに比べて高い演算性能、プロセッサ-メモリ間での高いデータ転送速度に加えて高い電力効率といった特徴を持つことから、米国オークリッジ国立研究所のTitan(2012年11月に世界最高演算性能を記録)、東京工業大学のTSUBAME2.0などGPUを用いた大規模スーパーコンピュータ(以下スパコン)の割合が増加している。 気象・気候モデルへのGPUの適用では、先進的な事例としてShimokawabe et al. (2010)による気象モデルASUCAのGPUへの移植とTSUBAME2.0での大規模実行がある。しかしながら、気象・気候学からの研究成果を創出するほどにはGPUは普及していない状況である。考えられる理由としては、GPUはCPUに比べてコア数が多く超並列でのプログラミングが求められること、CPUとGPUの複合アーキテクチャとなること、GPU用言語(CUDA)の利用、コードのポータビリティの問題に加え先行事例が少ないために知見の蓄積が不十分であることが挙げられる。 その一方国外では NIM(NOAA)またはCAM-SE(NCAR)など、気象・気候モデルのGPUへの移植が進行中であり、GPUの高い性能を生かした気象・気候学としての成果がTitan等の大規模GPUスパコンを用いて得られることが見込まれている。今後国内でも気象・気候モデルのGPUへの適用を検討する重要性は高い。 また、2018 年頃を目標 に京コンピュータの100倍の性能を目指して開発が進むエクサスケール規模のスパコンでは、数百の計算コアを持つプロセッサの採用が見込まれている。GPUにて気象・気候モデルの超並列計算を研究することは、エクサスケール規模のスパコンで必須となる超並列計算に向けた基礎研究としての意味を持つ。 以上を踏まえ、気象・気候モデルのGPUへの適用性の検討と適用に必要な知見の蓄積を目標に、気候モデル放射カーネルのGPUへの移植とその高速化を試みた。
気候モデル放射カーネルのGPUへの移植と高速化
気候モデル放射カーネルのGPUへの移植と高速化
Takateru Yamagishi
NVIDIA Latest information on Deep Learning, use case and studies
IEEE ITSS Nagoya Chapter NVIDIA
IEEE ITSS Nagoya Chapter NVIDIA
Tak Izaki
GTC Japan 2018でのエヌビディアの発表内容をまとめました。
GTC Japan 2018 NVIDIA NEWS
GTC Japan 2018 NVIDIA NEWS
Kuninobu SaSaki
2016年7月22日(金)名古屋にて開催の、NVIDIA のイベント Deep Learning Day #NVDLD 2016 Summer の資料です。 以下4つのことについて述べます。 ●ディープラーニングの現在 ●ディープラーニングSDK ●NVIDIA DIGITS ●ディープラーニング・フレームワーク / ディープラーニングの基礎
エヌビディアが加速するディープラーニング ~進化するニューラルネットワークとその開発方法について~
エヌビディアが加速するディープラーニング ~進化するニューラルネットワークとその開発方法について~
NVIDIA Japan
https://www.r-ccs.riken.jp/library/event/tokuronB_2020.html
200625material naruse
200625material naruse
RCCSRENKEI
Presentation at Chainer Meetup #5 (2016/06/10)
産総研AIクラウドでChainerMN
産総研AIクラウドでChainerMN
Hitoshi Sato
2020年1月22日の Slurm User Group Meetup Tokyo #1で発表した資料です。
EnrootとPyxisで快適コンテナ生活
EnrootとPyxisで快適コンテナ生活
Kuninobu SaSaki
20210830 GPU Optimization with PyTorch fixed DLProfとNsight Systemsの紹介(pip installの部分一部修正)
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
ManaMurakami1
2020年12月24日のイベント「AWSの最新GPUインスタンス Amazon EC2 P4d」での資料です。
A100 GPU 搭載! P4d インスタンス使いこなしのコツ
A100 GPU 搭載! P4d インスタンス使いこなしのコツ
Kuninobu SaSaki
2019年5月16日のGPU Deep Learning Community #11での発表資料です。Volta世代以降のGPUが持つTensorコアを活用する混合精度演算を自動的に適用するAutomatic Mixed Precision機能を簡単に紹介しています。
Automatic Mixed Precision の紹介
Automatic Mixed Precision の紹介
Kuninobu SaSaki
More Related Content
Similar to SC18 NVIDIA NEWS
沖縄市Startup Cafe Kozaで行ったセミナー資料
NVIDIA deep learning最新情報in沖縄
NVIDIA deep learning最新情報in沖縄
Tak Izaki
GPUの演算能力を汎用的に活用する「GPUコンピューティング」が誕生してはや10年。多くのスーパーコンピューターに採用されるなど科学技術計算の領域で実績を積み重ねたこの技術は、近年のAIムーブメントを支える重要な存在になっています。高度な画像認識、自然言語処理、そして自動運転などますます複雑になる問題のために登場した Volta 世代の新型GPUをはじめ、GPUコンピューティングの最新情報をお伝えします。
[db analytics showcase Sapporo 2017] B14: GPU コンピューティング最前線 by エヌビディア 佐々木邦暢
[db analytics showcase Sapporo 2017] B14: GPU コンピューティング最前線 by エヌビディア 佐々木邦暢
Insight Technology, Inc.
2019年1月17日に開催された GPU Deep Learning Community #10でのエヌビディア古家の発表資料です。
GPU スパコン最新情報
GPU スパコン最新情報
NVIDIA Japan
PCクラスタコンソーシアムの開催する PCCC22(第22回PCクラスタシンポジウム)「HPCシステム技術の最前線」 会員展示として公開中のスライドです。 詳細は下記のWebサイトへお越しください。 ▽PCCC22 「HPCシステム技術の最前線」 (2022年12月5日~6日) https://www.pccluster.org/ja/event/pccc22/
PCCC22:東京大学情報基盤センター 「Society5.0の実現を目指す「計算・データ・学習」の融合による革新的スーパーコンピューティング」
PCCC22:東京大学情報基盤センター 「Society5.0の実現を目指す「計算・データ・学習」の融合による革新的スーパーコンピューティング」
PC Cluster Consortium
45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄
Yukio Saito
Developers Summit 2018 Summer【A-1】佐々木様の講演資料です。
【A-1】AIを支えるGPUコンピューティングの今
【A-1】AIを支えるGPUコンピューティングの今
Developers Summit
Google Cloud Platform (GCP) の上で、効率的に機械学習モデルを開発する方法、機械学習プロジェクトを運用する方法について説明します
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
Yaboo Oyabu
医用画像情報学会 平成28年度春季177回大会での講演で使用した資料です。
MII conference177 nvidia
MII conference177 nvidia
Tak Izaki
講演タイトル:GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス (Red Hat Forum 2017 発表資料) 講演者:玉置 伸行 アジェンダ: - GPUインフラについての整理 - GPU on OpenStackとは - 環境構築のステップ
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
VirtualTech Japan Inc.
2016Sep13 gdlc01 nvidia
Gpu deep learning community設立について0913
Gpu deep learning community設立について0913
Tomokazu Kanazawa
長岡技術科学大学 2015年度GPGPU実践基礎工学(全15回,学部3年対象講義) 第14回GPGPU組込開発環境 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 ・第2回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu2 ・第3回 GPUクラスタ上でのプログラミング(CUDA) http://www.slideshare.net/ssuserf87701/2015gpgpu3 ・第4回 CPUのアーキテクチャ http://www.slideshare.net/ssuserf87701/2015gpgpu4 ・第5回 ハードウェアによるCPUの高速化技術 http://www.slideshare.net/ssuserf87701/2015gpgpu5 ・第6回 ソフトウェアによるCPUの高速化技術 http://www.slideshare.net/ssuserf87701/2015gpgpu6 ・第7回 シングルコアとマルチコア http://www.slideshare.net/ssuserf87701/2015gpgpu7 ・第8回 並列計算の概念(プロセスとスレッド) http://www.slideshare.net/ssuserf87701/2015gpgpu8 ・第9回 GPUのアーキテクチャ http://www.slideshare.net/ssuserf87701/2015gpgpu9 ・第9回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu9-59160061 ・第10回 GPGPUのプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu10 ・第11回 GPUでの並列プログラミング(ベクトル和) http://www.slideshare.net/ssuserf87701/2015gpgpu11 ・第12回 GPUによる画像処理 http://w ww.slideshare.net/ssuserf87701/2015gpgpu12 ・第13回GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu13 ・第14回 GPGPU組込開発環境 http://www.slideshare.net/ssuserf87701/2015gpgpu14 ・第15回 GPGPUの開発環境(OpenCL) http://www.slideshare.net/ssuserf87701/2015gpgpu15 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
智啓 出川
このスライドは、2018 年 4 月 24 日 (火) にベルサール高田馬場にて開催の NVIDIA Deep Learning Seminar 2018 における、エヌビディア日本代表兼米国本社副社長 大崎真孝による「GTC 2018 の基調講演から」の資料です。
GTC 2018 の基調講演から
GTC 2018 の基調講演から
NVIDIA Japan
近年数値シミュレーション研究において、本来グラフィック処理用のGPU(Graphics Processing Unit)を演算用途に用いることが進んでいる。GPUは、CPUに比べて高い演算性能、プロセッサ-メモリ間での高いデータ転送速度に加えて高い電力効率といった特徴を持つことから、米国オークリッジ国立研究所のTitan(2012年11月に世界最高演算性能を記録)、東京工業大学のTSUBAME2.0などGPUを用いた大規模スーパーコンピュータ(以下スパコン)の割合が増加している。 気象・気候モデルへのGPUの適用では、先進的な事例としてShimokawabe et al. (2010)による気象モデルASUCAのGPUへの移植とTSUBAME2.0での大規模実行がある。しかしながら、気象・気候学からの研究成果を創出するほどにはGPUは普及していない状況である。考えられる理由としては、GPUはCPUに比べてコア数が多く超並列でのプログラミングが求められること、CPUとGPUの複合アーキテクチャとなること、GPU用言語(CUDA)の利用、コードのポータビリティの問題に加え先行事例が少ないために知見の蓄積が不十分であることが挙げられる。 その一方国外では NIM(NOAA)またはCAM-SE(NCAR)など、気象・気候モデルのGPUへの移植が進行中であり、GPUの高い性能を生かした気象・気候学としての成果がTitan等の大規模GPUスパコンを用いて得られることが見込まれている。今後国内でも気象・気候モデルのGPUへの適用を検討する重要性は高い。 また、2018 年頃を目標 に京コンピュータの100倍の性能を目指して開発が進むエクサスケール規模のスパコンでは、数百の計算コアを持つプロセッサの採用が見込まれている。GPUにて気象・気候モデルの超並列計算を研究することは、エクサスケール規模のスパコンで必須となる超並列計算に向けた基礎研究としての意味を持つ。 以上を踏まえ、気象・気候モデルのGPUへの適用性の検討と適用に必要な知見の蓄積を目標に、気候モデル放射カーネルのGPUへの移植とその高速化を試みた。
気候モデル放射カーネルのGPUへの移植と高速化
気候モデル放射カーネルのGPUへの移植と高速化
Takateru Yamagishi
NVIDIA Latest information on Deep Learning, use case and studies
IEEE ITSS Nagoya Chapter NVIDIA
IEEE ITSS Nagoya Chapter NVIDIA
Tak Izaki
GTC Japan 2018でのエヌビディアの発表内容をまとめました。
GTC Japan 2018 NVIDIA NEWS
GTC Japan 2018 NVIDIA NEWS
Kuninobu SaSaki
2016年7月22日(金)名古屋にて開催の、NVIDIA のイベント Deep Learning Day #NVDLD 2016 Summer の資料です。 以下4つのことについて述べます。 ●ディープラーニングの現在 ●ディープラーニングSDK ●NVIDIA DIGITS ●ディープラーニング・フレームワーク / ディープラーニングの基礎
エヌビディアが加速するディープラーニング ~進化するニューラルネットワークとその開発方法について~
エヌビディアが加速するディープラーニング ~進化するニューラルネットワークとその開発方法について~
NVIDIA Japan
https://www.r-ccs.riken.jp/library/event/tokuronB_2020.html
200625material naruse
200625material naruse
RCCSRENKEI
Presentation at Chainer Meetup #5 (2016/06/10)
産総研AIクラウドでChainerMN
産総研AIクラウドでChainerMN
Hitoshi Sato
2020年1月22日の Slurm User Group Meetup Tokyo #1で発表した資料です。
EnrootとPyxisで快適コンテナ生活
EnrootとPyxisで快適コンテナ生活
Kuninobu SaSaki
20210830 GPU Optimization with PyTorch fixed DLProfとNsight Systemsの紹介(pip installの部分一部修正)
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
ManaMurakami1
Similar to SC18 NVIDIA NEWS
(20)
NVIDIA deep learning最新情報in沖縄
NVIDIA deep learning最新情報in沖縄
[db analytics showcase Sapporo 2017] B14: GPU コンピューティング最前線 by エヌビディア 佐々木邦暢
[db analytics showcase Sapporo 2017] B14: GPU コンピューティング最前線 by エヌビディア 佐々木邦暢
GPU スパコン最新情報
GPU スパコン最新情報
PCCC22:東京大学情報基盤センター 「Society5.0の実現を目指す「計算・データ・学習」の融合による革新的スーパーコンピューティング」
PCCC22:東京大学情報基盤センター 「Society5.0の実現を目指す「計算・データ・学習」の融合による革新的スーパーコンピューティング」
45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄
【A-1】AIを支えるGPUコンピューティングの今
【A-1】AIを支えるGPUコンピューティングの今
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
MII conference177 nvidia
MII conference177 nvidia
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
Gpu deep learning community設立について0913
Gpu deep learning community設立について0913
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
GTC 2018 の基調講演から
GTC 2018 の基調講演から
気候モデル放射カーネルのGPUへの移植と高速化
気候モデル放射カーネルのGPUへの移植と高速化
IEEE ITSS Nagoya Chapter NVIDIA
IEEE ITSS Nagoya Chapter NVIDIA
GTC Japan 2018 NVIDIA NEWS
GTC Japan 2018 NVIDIA NEWS
エヌビディアが加速するディープラーニング ~進化するニューラルネットワークとその開発方法について~
エヌビディアが加速するディープラーニング ~進化するニューラルネットワークとその開発方法について~
200625material naruse
200625material naruse
産総研AIクラウドでChainerMN
産総研AIクラウドでChainerMN
EnrootとPyxisで快適コンテナ生活
EnrootとPyxisで快適コンテナ生活
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
More from Kuninobu SaSaki
2020年12月24日のイベント「AWSの最新GPUインスタンス Amazon EC2 P4d」での資料です。
A100 GPU 搭載! P4d インスタンス使いこなしのコツ
A100 GPU 搭載! P4d インスタンス使いこなしのコツ
Kuninobu SaSaki
2019年5月16日のGPU Deep Learning Community #11での発表資料です。Volta世代以降のGPUが持つTensorコアを活用する混合精度演算を自動的に適用するAutomatic Mixed Precision機能を簡単に紹介しています。
Automatic Mixed Precision の紹介
Automatic Mixed Precision の紹介
Kuninobu SaSaki
2019年3月に米国カリフォルニア州サンノゼで開催された世界最大のGPU技術イベント「GTC 2019」基調講演の発表内容をまとめました。
GTC 2019 NVIDIA NEWS
GTC 2019 NVIDIA NEWS
Kuninobu SaSaki
GTC 2017のAI・ディープラーニング系情報のまとめです。
GTC17 NVIDIA News
GTC17 NVIDIA News
Kuninobu SaSaki
2015年8月21日のイベント 「Linux/Mac ユーザーのための Microsoft Azure 仮想マシン 入門」 で使った、Azure IaaS紹介資料です。既存の「Microsoft Azure 仮想マシンと仮想ネットワーク」はこれの一部を抽出したものです。 PowerPointファイルは docs.com に置いてありますのでよろしければどうぞ! https://doc.co/wHTwd5
20150821 Azure 仮想マシンと仮想ネットワーク
20150821 Azure 仮想マシンと仮想ネットワーク
Kuninobu SaSaki
Azure仮想マシンと仮想ネットワーク
Azure仮想マシンと仮想ネットワーク
Kuninobu SaSaki
2015年1月23日に実施したオンラインセミナー 「もっとわかる Microsoft Azure最新技術アップデート編 」 で使った資料です。
もっとわかる Microsoft Azure最新技術アップデート編 - 20150123
もっとわかる Microsoft Azure最新技術アップデート編 - 20150123
Kuninobu SaSaki
Cloudera World Tokyo 2014のライトニングトークセッション資料です。
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
Kuninobu SaSaki
2014年8月18日、ビットアイルさんで行われた 「真夏の夜のクラウド白熱ミートアップ(オープン白熱塾)」 でのLT資料です。 https://www.facebook.com/events/258977324299232/?ref_dashboard_filter=calendar&source=1
20140818 オープン白熱塾 ksasakims
20140818 オープン白熱塾 ksasakims
Kuninobu SaSaki
YAPC::Asia Tokyo 2013 のランチセッションで使った資料に、当日口頭で話した内容や、話そうと思って話せなかった内容を追加したものです。
YAPC::Asia Tokyo 2013 ランチセッション
YAPC::Asia Tokyo 2013 ランチセッション
Kuninobu SaSaki
2013年8月27,28日のイベント "Microsoft Partner Technical Days" で使用したスライドを自前のテンプレートで再構築したものです。
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
Kuninobu SaSaki
2012年12月1日の"System Center User Group Japan 第5回勉強会 (http://atnd.org/events/33503)"で使用した資料です。 Hyper-V 2012 におけるNUMAの扱いやCSV (Cluster Shared Volumes) の改良点を説明したものです。
Effective Hyper-V - 久しぶりエディション
Effective Hyper-V - 久しぶりエディション
Kuninobu SaSaki
HPC Azure TOP500 2012-11
HPC Azure TOP500 2012-11
Kuninobu SaSaki
Windows Developer Daysで使ったHadoop on Windows (Server|Azure)紹介資料です。「設計・実装・活用法」というタイトルとは裏腹にただの概要紹介になってしまったので、もう少しましなものを作りたいと思っています・・・
WDD2012_SC-004
WDD2012_SC-004
Kuninobu SaSaki
TechEd2010_T2-401_EffectiveHyper-V
TechEd2010_T2-401_EffectiveHyper-V
Kuninobu SaSaki
2009年のTechEd Yokohama T1-402セッションで使った資料です。R2の新機能Live Migrationとそれを支えるCSVのご紹介。
TechEd2009_T1-402_EffectiveHyper-V
TechEd2009_T1-402_EffectiveHyper-V
Kuninobu SaSaki
TechEd2008_T1-407_EffectiveHyper-V
TechEd2008_T1-407_EffectiveHyper-V
Kuninobu SaSaki
More from Kuninobu SaSaki
(17)
A100 GPU 搭載! P4d インスタンス使いこなしのコツ
A100 GPU 搭載! P4d インスタンス使いこなしのコツ
Automatic Mixed Precision の紹介
Automatic Mixed Precision の紹介
GTC 2019 NVIDIA NEWS
GTC 2019 NVIDIA NEWS
GTC17 NVIDIA News
GTC17 NVIDIA News
20150821 Azure 仮想マシンと仮想ネットワーク
20150821 Azure 仮想マシンと仮想ネットワーク
Azure仮想マシンと仮想ネットワーク
Azure仮想マシンと仮想ネットワーク
もっとわかる Microsoft Azure最新技術アップデート編 - 20150123
もっとわかる Microsoft Azure最新技術アップデート編 - 20150123
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
20140818 オープン白熱塾 ksasakims
20140818 オープン白熱塾 ksasakims
YAPC::Asia Tokyo 2013 ランチセッション
YAPC::Asia Tokyo 2013 ランチセッション
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
Effective Hyper-V - 久しぶりエディション
Effective Hyper-V - 久しぶりエディション
HPC Azure TOP500 2012-11
HPC Azure TOP500 2012-11
WDD2012_SC-004
WDD2012_SC-004
TechEd2010_T2-401_EffectiveHyper-V
TechEd2010_T2-401_EffectiveHyper-V
TechEd2009_T1-402_EffectiveHyper-V
TechEd2009_T1-402_EffectiveHyper-V
TechEd2008_T1-407_EffectiveHyper-V
TechEd2008_T1-407_EffectiveHyper-V
Recently uploaded
サイバーエージェントAI事業部の新卒研修で利用したスライドを公開します。
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
yassun7010
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料) 2024年4月24日(水) 株式会社NTTデータグループ 技術開発本部 笠原 辰仁
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
NTT DATA Technology & Innovation
https://iotlt.connpass.com/event/318403/
20240523_IoTLT_vol111_kitazaki_v1___.pdf
20240523_IoTLT_vol111_kitazaki_v1___.pdf
Ayachika Kitazaki
This presentation introduces a paper about offline reinforcement learning.
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
atsushi061452
YouTube nnabla channelの次の動画で利用したスライドです。 【AI論文解説】Consistency ModelとRectified Flow https://youtu.be/3IKCrAPe55k Consistency ModelとRectified Flowに関連する以下の論文を紹介しています。 Consistency models(解説編Part1で紹介) - “Consistency Models,” ICML 2023. - “Improved Techniques for Training Consistency Models,” ICLR 2024. - “Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion,” ICLR 2024. Rectified flow(解説編Part2で紹介) - “Flow Straight and Fast: Learning to Generate and Transfer Data with Rectified Flow,” ICLR 2023. - “InstaFlow: One Step is Enough for High-Quality Diffusion-Based Text-to-Image Generation,” ICLR 2024.
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
Sony - Neural Network Libraries
Security-JAWS【第33回】 勉強会 https://s-jaws.doorkeeper.jp/events/173294
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
keikoitakurag
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
2024/05/25 serverless Meetup osaka
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
ssuserbefd24
2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
iPride Co., Ltd.
This presentation introduces a paper about offline reinforcement learning.
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
atsushi061452
Recently uploaded
(10)
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
20240523_IoTLT_vol111_kitazaki_v1___.pdf
20240523_IoTLT_vol111_kitazaki_v1___.pdf
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
SC18 NVIDIA NEWS
1.
日本の GPU 搭載システムとしては、4,352
基の Tesla V100 を備え、全体でも 7 位 に入った産総研の ABCI、 GPU スパコンの草分けである東工大の TSUBAME 2.5 お よび 3.0、ResNet-50 の ImageNet データセット学習を 15 分で完了させた Preferred Networks の MN-1、 NVIDIA DGX-1 のクラスタである理研の RAIDEN な ど、7 システムがランク入りしています。 TOP500 リスト発表 – Tesla V100 搭載システムが 1、2 位を獲得 SC18 NVIDIA 関連情報のまとめ ダラスで開催中のスーパーコンピューティングに関する学会・展示会 SC18 で、スーパーコンピューターの世 界ランキングである TOP500 リストの 2018 年 11 月版が発表されました。 米国エネルギー省 オークリッジ国立研究所 (ORNL) の Summit が 143.5 PFLOPS を記録して首位を 維持。2 位にはローレンス リバモア国立研究所の Sierra が入り、POWER9 と Tesla V100 を搭載する システムが 1 位と 2 位を占めた他、5 位にスイス国立スーパーコンピューティング センター(CSCS)の Piz Daint、7 位に産総研の ABCI、9 位に ORNL の Titan と、トップ 10 の半数が GPU 搭載システムで、 全体では 500 中 127 システムが GPU 搭載スーパーコンピューターとなりました。 NEWS # システム名称 組織 Rmax [TFlop/s] GPU 7 ABCI 産業技術総合研究所 19,880 Tesla V100 22 TSUBAME 3.0 東京工業大学 8,125 Tesla P100 69 TSUBAME 2.5 東京工業大学 2,785 Tesla K20x 227 MN-1 NTT Com (PFN) 1,391 Tesla P100 279 RAIDEN GPU subsystem 理研 AIP 1,213 Tesla V100 408 QUARTETTO 九州大学 1,018 Tesla K20x 444 AIST AI Cloud 産業技術総合研究所 961 Tesla P100 v1.3 日本版 Tesla P100 Tesla V100 Tesla K20x Tesla K40 Tesla K80 Tesla 2050 Tesla P40 Tesla 2070 日本の GPU スパコンは 7 システムがランクインPascal と Volta 世代が全体の 8 割以上 127 ある GPU 搭載システムの内訳を見ると、 首位の Summit や日本の ABCI が搭載する Volta 世代の Tesla V100 が 46 システム、ヨーロッパ最速の Piz Daint や日本の TSUBAME 3.0 が搭載する Pascal 世代の Tesla P100 が 63 システムで利用され、GPU 搭載シス テム全体の 86% を占めています。 Green 500 リストの上位に GPU システムが多数ランクイン TOP500 にランクインしたシステムの電力性能比を競うのが Green500 です。今回も理研の Shoubu (菖蒲)system B が 首位となり、日本のスーパーコンピューターが 3 連覇を成し遂げました。2 位以降は GPU スパコンのパレードで、エヌビディアの DGX SATURNV、TOP500 首位の Summit、産総研の ABCI、東工大の TSUBAME 3.0 等がずらりと並んでいます。上位 25 システムの内、実に 22 システムが GPU で加速したスーパーコンピューターで、Tesla P100 および Tesla V100 のいずれかを 搭載するシステムです。これは GPU が効率の高いアクセラレーターであることを端的に示しています。 Green500 リスト: https://www.top500.org/green500/lists/2018/11/ エヌビディアの創業者兼 CEO であるジェンスン フアンは 12 日、SC18 参加者を招待した特別講演の中で、データセンター 向け GPU である Tesla T4 の採用が記録的な速度で進んでいると発表しました。 Turing 世代 GPU の Tesla T4 は、2,560 個の CUDA コアと、320 個の Tensor コアを備え、 70W という低消費電力で、 単精度で 8.1 TFLOPS、新たに導入された INT4 演算では 260 TOPS という高い性能を発揮します。 Tesla T4 はすでに 57 機種のサーバーに採用されただけでなく、Google Cloud Platform でも利用可能となりました。 ニュースリリース: NVIDIA Announces Record Adoption of New Turing T4 Cloud GPU Google Cloud の発表: Google Cloud first to offer NVIDIA Tesla T4 GPUs Turing 世代のデータセンター向け GPU Tesla T4 の採用が急拡大 これは 1 年前の 86 システムから大幅に増加しており、新たにランクインしたシステムには、Tesla V100 をノードあたり 16 基搭載 する最新型サーバー、NVIDIA DGX-2H の 36 ノードクラスタ「Circe」も含まれています。 TOP500 リスト: https://www.top500.org/lists/2018/11/ NGC が Singularity をサポートするなど HPC 対応を加速 SC18 に合わせて、エヌビディアのコンテナイメージレジストリである NGC の HPC 対応をさらに強化する発表が行われました。 一つは、 Singularity のサポートです。Singularity は Docker のイメージを利用可能なコンテナ ランタイムですが、多数の ユーザーが共同利用する計算機センターなどで利用しやすく設計されており、HPC 領域で広く使われています。今回、 Docker に加えて Singularity をサポートしたことで、 NGC の GPU 対応コンテナイメージをスーパーコンピューティングセン ターなどでも活用しやすくなります。 また、新しいマルチノード対応イメージが追加され、 MPI を使ったマルチノード ジョブを簡単に実行できるようにもなりました。 エヌビディア ブログ: NGC Containers Now Available for More Users, More Apps, More Platforms
2.
Facebook: https://www.facebook.com/NVIDIAAI.JP Twitter: @NVIDIAAIJP
/ @NVIDIAJapan この資料: bit.ly/sc18nvnews ゴードン ベル賞はコンピュータ サイエンス分野の国際学会である ACM から、科学、工学、大 規模データ分析分野の課題に HPC を適用する優れた業績に対して贈られる賞です。 今年はオークリッジ国立研究所の “Attacking the Opioid Epidemic: Determining the Epistatic and Pleiotropic Genetic Architectures for Chronic Pain and Opioid Addiction” とローレンス バークレー国立研究所の “Exascale Deep Learning for Climate Analytics” を発表した研究チームが、この栄えある賞を受け取りました。 最終選考に残った 6 チームのうち 5 チームが NVIDIA の Tesla V100 GPU を活用しており、 そのうち 3 チームの論文に NVIDIA の社員が共著者として関わっています。 GPU スーパーコンピューターを活用した研究がゴードン ベル賞を受賞 ACM による発表: Two Teams Honored for Work in Combating Opioid Addiction, Understanding Climate Change エヌビディア ブログ: Twice as Nice: NVIDIA Powers Not One, But Two, Gordon Bell Prizes 以下、2 件の研究の概要を簡単に紹介します。 Attacking the Opioid Epidemic: Determining the Epistatic and Pleiotropic Genetic Architectures for Chronic Pain and Opioid Addiction オピオイド鎮痛剤 (医療用麻薬) は、がんなどの手術後の痛みを抑えるために有効ですが、同時にその過剰摂取が大き な問題になっています。処方された患者の約 30% がこれを乱用し 10% がオピオイド使用障害を発症しているとの研究も あります。また退役軍人の 50% 以上が慢性疼痛 (Chronic Pain) を患っており、22.7% がオピオイドを持続的に使用し ています。CDC (アメリカ疾病管理予防センター) は米国内におけるオピオイド依存症による経済的損失を年間 785 億 ドルと推定しています。 鎮痛剤に対する感受性には大きな個人差があり、同じ薬物を同量摂取しても、依存症に陥る人とそうでない人がいます。 オークリッジ国立研究所 (ORNL) のチームは、この個人差に影響する遺伝的情報を解析するために、大規模な GAWS – ゲノムワイド関連解析を実行する CoMet というアプリケーションを開発しました。これはゲノムデータにおける関連を見つ ける網羅的な探索を行う、極めて計算負荷の高い処理です。その環境は、ORNL の二つのスーパーコンピューター、 Titan と Summit です。Titan は、2012 年 11 月の TOP500 ランキングで首位を獲得したシステムで、18,688 ノード のそれぞれに Tesla K20x GPU を 1 基ずつ搭載しています。そして、Summit は最新の TOP500 リストの首位に輝いた システムで、ノード毎に 6 基、4608 ノード全体では 27,648 基の Tesla V100 Tensor コア GPU を備えます。 本研究では、CoMet の GPU に最適化されたベクトル比較処理が、Titan および Summit の全系での実行までスケー ルし、また Summit においては Tesla V100 の Tensor コアを活用することで毎秒 3 ペタ要素の比較を処理し、2.3 ExaOps の計算スループットを達成しました。この性能は、これまでの最先端手法の 1 万倍以上に相当します。 詳細はこちら: Attacking the Opioid Epidemic: Determining the Epistatic and Pleiotropic Genetic Architectures for Chronic Pain and Opioid Addiction Titan Summit Exascale Deep Learning for Climate Analytics ローレンス・バークレー国立研究所、オークリッジ国立研究所とエヌビディアの研究者は、台風やハリケーンなどの熱帯性 低気圧 (TC) や、豪雨の元になる大気河川 (AR) といった、我々の生活や経済に大きな影響を与える気象状況を検 出するために、GPU スーパーコンピューターの計算能力と、ディープラーニングを活用しました。 使用された環境は、ORNL の Summit と、CSCS の Piz Daint (ノード毎に 1 基の Tesla P100、全体で 5704 ノード) です。Tiramisu と DeepLabv3+ という二つのセマンティック セグメンテーション ネットワークの改良版を、TensorFlow と Horovod で実装し、CAM5 シミュレーション データセットで分散トレーニングしました。結果的に、 Piz Daint での改良 版 Tiramisu ネットワークの学習は、5,300 GPU までスケーラブルで、並列化効率は 79.0%、演算スループットは 21.0 PFLOPS となりました。また、 Summit での DeepLabv3+ は 27,368 GPU までスケールし、並列化効率は単精度で 90.8%、スループットは 325.8 PFLOPS を達成しました。さらに、Tesla V100 の Tensor コアを使うように改良した DeepLabv3 では、1.13 ExaFLOPS のピーク スループットを記録しました。 このレベルの性能とスケーラビリティを得るために、GPFS からの高速ファイルステージング、Horovod での階層型 All- Reduce、重み付き損失計算や LARC (Layer-wise Adaptive Rate Control) 等、様々な工夫が行われています。 詳細はこちら: Exascale Deep Learning for Climate Analytics Piz Daint 東京大学地震研究所、ORNL、CSCS、エヌビディアによる研究もファイナリストに 惜しくも受賞は逃しましたが、東京大学地震研究所、ORNL、CSCS のチームによる研究も、 ゴードン ベル賞の最終選考にノミネートされました。本研究は、都市部における地震の影響 をシミュレートするための陰解法・非構造格子有限要素法ソルバーを、AI と変動精度演算 を活用して高速化したものです。AI によって演算回数を 1/5.56 に削減し、FP16-FP21- FP32-FP64 の変動精度演算を適用した疎行列ベクトル積カーネルは Summit の FP64 性能の 71.4 % を発揮しました。これは、標準的なソルバーの 25.3 倍、また SC14 のゴード ン ベル賞ファイナリストの GAMERA と比較しても 4 倍弱高速です。 また、本研究には NVIDIA Japan のシニア デベロッパー テクノロジ エンジニアである成瀬 彰 も参加しているほか、SC18 のエヌビディアブースでは本研究によるシミュレーション結果の可 視化デモンストレーションを行いました。 詳細はこちら: A Fast Scalable Implicit Solver for Nonlinear Time-Evolution Earthquake City Problem on Low-Ordered Unstructured Finite Elements with Artificial Intelligence and Transprecision Computing 市村先生はじめ関係者の皆様
3.
Facebook: https://www.facebook.com/NVIDIAAI.JP Twitter: @NVIDIAAIJP
/ @NVIDIAJapan この資料: bit.ly/sc18nvnews Student Cluster Competition では全チームが Tesla V100 GPU を活用 世界の学生がスーパーコンピューティングの技能を競う Student Cluster Competition が SC18 でも開催されました。こ れは学生達がチームを組み、スポンサーを募って機材を集め、自分たちの手で SC18 の会場にクラスタを構築して性能測 定に挑むものです。対象となるのは、Linpack と HPCG という 2 種類の定番ベンチマークに加えて、Horovod を使った 分散ディープラーニング、OpenMC によるモンテカルロ粒子輸送計算、SeisSol 地震シミュレーション コードをつかった論文 の再現、そして SC18 初日に発表される「謎のアプリケーション」です。これは事前に対策を練ることができないため、現地 での即応力が試されます。 各チームは様々な制約条件の中でベストを尽くします。まず、利用できる電力が 3KW に制限されているため、大きなクラ スターを使って力任せに問題を解くという手段はとれません。電力性能比の高いクラスターを構築し、ハードウェアの性能を 最大限に引き出すチューニングを施す必要があります。この点において、全てのチームが Tesla V100 GPU を採用したこ とは賢明な判断と言えるでしょう! また、実際の計算機クラスター運用における障害を想定し、競技期間中に「停電」が発生するようにもなっています。停 電による計算の中断に対処し、電源復旧後に正しく再開できる仕組みも構築しなければなりません。さらに、「スケジュー ラーを導入してジョブ実行を自動化し、SC18 の他のイベントも楽しむこと」が推奨されています。48 時間あまりの短い競 技ですが、間に合わせのシステムに人を貼り付けてジョブを手投げするような運用は避けなければなりません。 各ベンチマークとアプリケーションのスコアや面接を含めた審査の結果、中国の精華大学のチームが見事総合優勝を勝ち 取りました。精華大学は、HPCG ベンチマーク性能でも 1,985.97 GFlops で優勝しています。また、Linpack 性能では シンガポールの南洋理工大学が 56.51 TFlops で SC17 に続き 2 連覇を達成しました。おめでとうございます! エヌビディア ブログ: Dazzling in Dallas: Tsinghua University Wins Student Cluster Competition at SC18 精華大学のポスター: Tsinghua University Team in SC18 Student Cluster Competition 南洋理工大学のポスター: TEAMSUPERNOVA Nanyang Technological University, Singapore ソニーが ABCI を使い ResNet-50 の ImageNet 学習で新記録を樹立 スーパーコンピューターのベンチマークとして長年の定番といえば Linpack ですが、ディープラーニング界隈では「ImagNet-1K データセットで ResNet-50 ネットワークを訓練し、90 エポックで Accuracy 75% を達成する時間を競う」という競技(?)が盛ん です。Preferred Networks のチームが 1024 基の Tesla P100 で 15 分という記録を打ち立てたのは 1 年前のことですが、 今年の 7 月には Tencent の研究者が Tesla P40 を 2048 基使って 6.6 分という驚異的な記録を作りました。 そして今回、ソニーのチームが産総研のスーパーコンピューター ABCI で 2176 基の Tesla V100 により 224 秒で学習を完了 させ、見事記録を更新しました。使用されたソフトウェアはソニー自製の Neural Network Libraries (NNL) と、その CUDA 拡張。ノード間通信のオーバヘッドを削減するために、エヌビディアの集合通信ライブラリ NCCL も活用されたとのことです。 エヌビディア ブログ: ソニー、NVIDIA V100 Tensor コア GPU を使い、ResNet-50 でのトレーニングの新記録を樹立 ソニーの発表: ディープラーニングの分散学習で世界最高速を達成 産総研の発表: AI向けクラウド型計算システム「ABCI」が深層学習の学習速度で世界最速に Tesla V100 の展示にご協力頂いたブースのご紹介 東工大 (427) NAIST (439) JAMSTEC (505) AIST (2409) 東京大学 (939) 富士通 (1226) 東北大学 (1416) 大阪大学 (1825) 九州大学 (805) HPC SYSTEMS (4241) 今年も多くの皆様に GPU 展示のご協力をいただきました。厚く御礼申し上げます。カッコ内の数字はブースの番号です。どのブー スも特色のある展示が目白押しです。
Download now