Your SlideShare is downloading. ×
Japan's MEXT (Ministry of Education, Culture, Sports, Science & Technology) HPCI Committee June 25, 2013 meeting notes
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Japan's MEXT (Ministry of Education, Culture, Sports, Science & Technology) HPCI Committee June 25, 2013 meeting notes

392

Published on

Japan's MEXT (Ministry of Education, Culture, Sports, Science & Technology) HPCI Committee June 25, 2013 meeting notes on the latest development of HPC

Japan's MEXT (Ministry of Education, Culture, Sports, Science & Technology) HPCI Committee June 25, 2013 meeting notes on the latest development of HPC

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
392
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. RoadRunner 1.0PF 「京」 10.5PF Tianhe-1A 2.5PF BlueGene/L 70.7TF 世界で初めて 10ペタフロップスの 壁を突破 日本 アメリカ 中国 ヨーロッパ TOP500の各国1位の推移 Titan 17.5PF Tianhe-2 33.8PF 地球シミュレータ 35.8TF 10ペタ 1ペタ 100テラ 10テラ 1テラ 100ギガ LINPACK性能 [FLOPS] スーパーコンピュータ性能ランキングの変遷 2 ○今回1位となった中国・国防科学技術大学(NUDT)のTianhe-2(天河2号)は、LINPACK実効性能33.86ペタFLOPS、 実行効率61.6%。中国のスパコンが世界1位となるのは、2010年11月のTianhe-1A(天河1A号)以来、2回目。 ○TOP10ランクイン状況としては、米国(5システム)が1位、中国及びドイツ(2システム)が2位、日本が1システム。 TOP100ランクインでは、米国が47システムと圧倒的優位な状況となっている。次いで、日本(10システム)が2位、 英国(8システム)が3位、中国及びフランス(6システム)が4位、ドイツ及びインド(4システム)が6位と続いている。 平成24年6月 平成24年11月 順位 システム名称 サイト ベンダ 国名 Linpack 演算性能 (テラFLOPS) 1 Sequoia ローレンスリバモア研 IBM 米 16,325 2 「京」 (Kcomputer) 理研 計算科学研究機構(AICS) 富士通 日 10,510 3 Mira アルゴンヌ研 IBM 米 8,162 4 SuperMUC ライプニッツスーパーコンピューティングセンタ(LRZ)IBM 独 2,897 5 Tianhe-1A(天河1A号) 天津スパコンセンタ NUDT 中 2,566 6 Jaguar オークリッジ研 Cray 米 1,941 7 Fermi Cinecaコンピューティングセンター IBM 伊 1,725 8 JuQUEEN ユーリヒ総合研究機構(FZJ) IBM 独 1,380 9 Curiethinnodes フランス原子力庁 BullSA 仏 1,359 10 Nebulae(星雲) 深圳スパコンセンタ Dawning 中 1,271 12 Helios 国際核融合エネルギー研究センタ BullSA 日 1,237 14 TSUBAME2.0 東工大学術国際情報センタ(GSIC) NEC/HP 日 1,192 18 Oakleaf-FX 東大情報基盤センタ 富士通 日 1,043 36 BlueGene/Q 高エネルギー加速器研究機構 IBM 日 518 41 HA-PACS 筑波大計算科学研究センタ Appro/Cray 日 422 70 HitachiSR16000 東北大学金属材料研究所 日立 日 244 73 Camphor 京都大学 Cray 日 239 84 BX900 日本原子力研究開発機構(JAEA) 富士通 日 191 順位 システム名称 サイト ベンダ 国名 Linpack 演算性能 (テラFLOPS) 1 Titan オークリッジ研 Cray 米 17,590 2 Sequoia ローレンスリバモア研 IBM 米 16,325 3 「京」 (Kcomputer) 理研 計算科学研究機構(AICS) 富士通 日 10,510 4 Mira アルゴンヌ研 IBM 米 8,162 5 JuQUEEN ユーリヒ総合研究機構(FZJ) IBM 独 4,141 6 SuperMUC ライプニッツスーパーコンピューティングセンタ(LRZ)IBM 独 2,897 7 Stampede テキサス大学 Dell 米 2,660 8 Tianhe-1A(天河1A号) 天津スパコンセンタ NUDT 中 2,566 9 Fermi Cinecaコンピューティングセンター IBM 伊 1,725 10 DARPATrialSubset DOD国防高等研究計画局IBM開発センタIBM 米 1,515 15 Helios 国際核融合エネルギー研究センタ BullSA 日 1,237 17 TSUBAME2.0 東工大学術国際情報センタ(GSIC) NEC/HP 日 1,192 21 Oakleaf-FX 東大情報基盤センタ 富士通 日 1,043 39 SGIAltixX 電力中央研究所 SGI 日 582 41 HIMAWARI 高エネルギー加速器研究機構 IBM 日 518 42 SAKURA 高エネルギー加速器研究機構 IBM 日 518 45 PRIMERGYCX400 九州大学 富士通 日 460 51 HA-PACS 筑波大計算科学研究センタ Appro/Cray 日 422 95 HitachiSR16000 核融合科学研究所 日立 日 253 97 Camphor 京都大学 Cray 日 251.7 100 HitachiSR16000 東北大学金属材料研究所 日立 日 243.9 平成25年6月 順位 システム名称 サイト ベンダ 国名 Linpack 演算性能 (テラFLOPS) 1 Tianhe-2(天河2号) 国防科学技術大学 NUDT 中 33,863 2 Titan オークリッジ研 Cray 米 17,590 3 Sequoia ローレンスリバモア研 IBM 米 17,173 4 「京」 (Kcomputer) 理研 計算科学研究機構(AICS) 富士通 日 10,510 5 Mira アルゴンヌ研 IBM 米 8,587 6 Stampede テキサス大学 Dell 米 5,168 7 JuQUEEN ユーリヒ総合研究機構(FZJ) IBM 独 5,009 8 Vulcan ローレンスリバモア研 IBM 米 4,293 9 SuperMUC ライプニッツスーパーコンピューティングセンタ(LRZ)IBM 独 2,897 10 Tianhe-1A(天河1A号) 天津スパコンセンタ NUDT 中 2,566 20 Helios 国際核融合エネルギー研究センタ BullSA 日 1,237 21 TSUBAME2.0 東工大学術国際情報センタ(GSIC) NEC/HP 日 1,192 26 Oakleaf-FX 東大情報基盤センタ 富士通 日 1,043 43 PRIMERGY CX400 九州大学 富士通 日 621 47 SGIAltix X 電力中央研究所 SGI 日 582 50 SAKURA 高エネルギー加速器研究機構 IBM 日 537 51 HIMAWARI 高エネルギー加速器研究機構 IBM 日 537 62 HA-PACS 筑波大計算科学研究センタ Appro/Cray 日 422 63 Cray XC30 国立天文台 Cray 日 420
  • 2. Tianhe-2※ 「京」 ノード数 16000 (CPU:32000+Phi:48000) 88128 (88128CPU) 1ノードあたりの演算性能 (GFLOPS) 3431.4 (CPU:422.4+Phi:3009) 128.0 理論ピーク性能(PFLOPS) 54.9 (CPU:6.75+Phi:48.14) 11.28 リンパック性能(PFLOPS) 33.86 10.51 リンパック実行効率(%) 61.6 93.2 メモリ容量(PB) 1.4 (CPU:1.0+Phi:0.3) 1.3 演算性能あたりのメモリ容 量(TB/PFLOPS) 25.6 (CPU:151.5、Phi:7.9) 122.1 演算性能あたりのメモリ帯 域(B/FLOP) CPU:0.28 Phi:0.31 0.5 演算性能あたりのインター コネクト帯域(B/FLOP) 0.018 0.39 設置面積(㎡) 約720 約1500 消費電力(MW) 17.8 12.7 「京」との性能比較 Tianhe-2の外観 (TOP500ホームページより引用) ※ Tianhe-2の性能については現在調査中のもの(今後変更もあり得る)。 Tianhe-2(天河2号)について 概要 ■中国が進める科学技術第12次5ヵ年計画の一環として、 研究や教育に対するオープンプラットフォームとして、南 中国におけるハイパフォーマンスコンピューティングサー ビスとしての活用を目的として開発されたスーパーコン ピュータ。 ■中国湖南省長沙に設置(将来的には広州に移転予 定)され、国防科学技術大学(NUDT:National University of Defense Technology)と、中国Inspur社が中心に開発。 ピーク性能は54ペタフロップス(「京」の約4.8倍)。 ■米国製の汎用CPU(Intel)とアクセラレータチップ(Intel Xeon Phi)を組み合わせた構成。ネットワークは自国製 (中国製)。 ■乱流解析シミュレーションや核融合プラズマシミュレー ション等での利用を想定し、アプリケーションを移植中。 ■Tianhe-2号ではアクセラレータ部分が総演算性能の 87%を担うことで、対性能比での省スペースと省電力を 実現。 概要 ■米国エネルギー省が進めるAdvanced Simulation and Computing (ASC) プログラムの一環として、自然科学の幅広 い分野での活用を目的として開発されたスーパーコンピュー タ。 ■米国オークリッジ国立研究所に設置され、CRAYが中心 に開発。目標性能は27ペタフロップス(「京」の約2.4倍)。 ■汎用CPUにGPU※1 と呼ばれるチップを搭載した構成。 (日本国内では、東工大TSUBAME2.0などが同じアーキテク チャを既に採用。) ■TITANではGPU部分が総演算性能の90%を担うことで、 対性能比での低コストと省電力等を実現。一方、性能を引き 出すためには専用の言語でのプログラミングが必要となるた め、ソフトウェアの開発や既存のソフトウェアの継承が難しい。 また、一般的に実効性能がCPUだけのシステムに比べて劣 る。 TITAN ※2 「京」 ノード数 18688 (CPU+GPU:18688) 88128 (88128CPU) 1ノードあたりの演算性能 (GFLOPS) 1452.8 (CPU:140.8+GPU:1310) 128.0 理論ピーク性能(PFLOPS) 27.11 (CPU:2.63+GPU:24.48) 11.28 リンパック性能(PFLOPS) 17.59 10.51 リンパック実行効率(%) 64.8 93.2 メモリ容量(PB) 0.67 (CPU:0.57+GPU:0.10) 1.3 演算性能あたりのメモリ容 量(TB/PFLOPS) 25.7 (CPU:221.9、GPU:4.4) 122.1 演算性能あたりのメモリ帯 域(B/FLOP) CPU:0.36 GPU:0.19 0.5 演算性能あたりのインター コネクト帯域(B/FLOP) CPU部分のみ:0.19 全体(GPU含む):0.019 0.39 設置面積(㎡) 約400 約1500 消費電力(MW) 8.2 12.7 「京」との性能比較 TITANの外観 (米国オークリッジ国立研究所ホームページより引用) ※1 GPUとは Graphics Processing Unit(画像処理装置)の略。画像処理に必要な 計算処理を行う半導体チップ。 ※2 TITANの性能については現在調査中のもの(今後変更もあり得る) TITAN(タイタン)について 3
  • 3. 概要 ■米国エネルギー省のAdvanced Simulation and Computing (ASC) プログラムの一環として、国家核安全保障局が主導 的に進めている核兵器の性能、安全性、信頼性を解析・予 測することを主たる目的として開発されたスーパーコン ピュータ。 ■米国ローレンス・リバモア国立研究所に設置され、IBMが 開発。目標性能は20ペタフロップス(「京」の約2倍)。 「京」とセコイアの比較 ■アプリケーションプログラムの実効性能や使いやすさに関 係する演算性能あたりのメモリ容量、CPU・メモリ間のデー タ転送性能やCPU間のデータ転送性能では、「京」が優位 となっており、幅広い分野での活用が可能と考えられる。 ■一方、Sequoiaは理論ピーク性能で「京」の約2倍となって いるほか、消費電力性能や設置面積で「京」よりも優位と なっている。 Sequoia 「京」 ノード数(CPU数) 98304 88128 1ノードあたりの演算性能 (GFLOPS) 204.8 128.0 理論ピーク性能(PFLOPS) 20.13 11.28 リンパック性能(PFLOPS) 16.32 10.51 リンパック実行効率(%) 81.1 93.2 メモリ容量(PB) 1.5 1.3 演算性能あたりのメモリ容量 (TB/PFLOPS) 76.3 122.1 演算性能あたりのメモリ帯域 (B/FLOP) 0.20 0.5 演算性能あたりのインターコ ネクト帯域(B/FLOP) 0.10 0.39 設置面積(㎡) 約300 約1500 消費電力(MW) 7.9 12.7 「京」との性能比較 Sequoiaの外観 (TOP500ホームページより引用) Sequoia(セコイア)について 世界のスパコン性能推移 TOP500内全ての スパコンの総性能 世界TOPの スパコン性能 100ペタ 10ペタ 1ペタ 100テラ 10テラ [FLOPS] LINPACK性能 1エクサ 1テラ 100ギガ 10ギガ 4
  • 4. TOP500 国別性能推移 1ペタ 100テラ 10テラ 1テラ 100ギガ [FLOPS] LINPACK性能 1エクサ 100ペタ 10ペタ TOP500 国別性能割合推移 5
  • 5. 米国 ・HPC法(High-Performance Computing Act)を1991年に制定 → DOD/DARPA,DOEを中心にHPCC計画, CIC計画, NITRD計画等を継続的に実施 → DOE/NNSAの核兵器応用を目的としたASCI計画,ASC計画で開発されたスパコンが1997~2001年と 2004~2009年の期間TOP500の1位を堅持 ・超並列スーパーコンピュータ利用促進プログラムINCITE(DOE:2003年~)を実施中 → 2012年は,60課題にJaguarとIntrepid(BlueGene/P)を合わせて1.7Bコア時間(60%に相当)を配分との報告 → 2013年は, 61課題にTitan,MiraとIntrepidを合わせて4.7Bコア時間の配分を予定との報告 ・2012年, LLNLのSequoia(20ペタ) , ORNLのTitan(27ペタ)など10ペタ超級コンピュータが続々と稼働 → 2013年6月現在, 10ペタ超コンピュータを4システム,1ペタ超コンピュータを14システム保有 ・当初の計画より遅れているが, 2018年までに2~3台のプロトタイプを開発, 2020~2022年頃には1~3台の エクサ級コンピュータの稼働を目指して準備を推進 → NITRD計画のスパコン関連予算は2012~2013年度は約1.4B$/年で推移しているが, エクサへの取り組み を唯一行っているDOEは2014年度予算増額を要求 → FastForward(DOE:2012~2014年)でIBM等5社とエクサのハード要素技術開発に着手(62M$) → エクサ向け超並列対応ソフトウエア研究開発では,燃焼を含む3課題がDOEのCo-Designで実施 → ソフト開発プロジェクトXstack(DOE:2012~2015年) が新たに開始 → DOEは2015年に2台の10ペタ超コンピュータ(NERSC-8,Trinity)をNERSC,LANLに導入予定 → DOEは2016~2017年までに100ペタ超級コンピュータをORNL,ANL,LLNLに導入予定 世界各国のハイパフォーマンス・コンピューティング(HPC)への取組(1/2) ○スーパーコンピュータの活用が経済成長,国家安全保障,産業競争力・科学技術力強化に必須であることが,米国,欧 州を中心に国際的な共通認識となり,各国においてはHPC技術の強化等を目的とした法律を制定するなど,HPC関 連の技術開発を重要政策と位置づけ,活発に研究開発が実施されている。 ○また,米国,欧州に加えて中国の台頭が目覚ましく,いずれも国家存立の基盤技術と位置づけ,国主導で研究開発が 進められている。 ○さらに,エクサスケール(1エクサ=1000ペタ=100京)コンピューティングの2020年頃の実現を見据えて,技術開発 プロジェクトが世界各国において活発に実施されている。 EU ・FP8-Horizon計画(2014~2020年)でHPC関連予算を1.2Bユーロに倍増と報道 ・欧州25か国の参加を得た超並列スーパーコンピュータ利用促進プログラムPRACE(2008年~)を実施中 → 仏,独, 西, 伊から400Mユーロの資金を獲得し, 超ペタ級コンピュータ整備が実施中 → JUQUEEN(独FZJ:5.87PFLOPS) , HERMIT(独HLRS:5PFLOPS) , CURIE(仏CEA:2PFLOPS) , FERMI(伊CINECA:2PFLOPS)他計6機のオーバーペタ級コンピュータのリソースを公募で配分 → 2010~2012年に4.2Bコア時間を159プロジェクトに配分したと報告 ・EESI2(European Exascale Software Initiative)で, 引き続きエクサ実現の課題抽出とロードマップ作成を継続 ・エクサ関連プロジェクトMont-Blanc,DEEP,CRESTA(総額42Mユーロ)で, ハードとソフトの研究開発を実施中 ・Human Brain Project(2013~2022年,総額1Bユーロ)が承認され, 段階的にエクサ級コンピュータを整備予定 ・ETP4HPC(European Technology Platform for HPC)は, 欧州を中心とした主要ハード・ソフトベンダ及びスパコンセン ターの総意として, 欧州におけるHPCへの取り組みに対する提言や取り組むべき戦略的研究課題を取りまとめ 中国 ・国家科学技術重大プロジェクト(第12&13次5か年計画:2011~2020年)の枠組みに基づき,MOST-863(国家ハイテク 研究発展計画)やMOST-973(国家重点基礎研究発展計画)などを通じてHPC関連に重点投資 → CPU,ネットワーク及びソフトの自国生産を重視して国主導で研究開発促進 → 天河2号(54.9PFLOPS)が,2013年6月のTOP500の1位を獲得。2015年までに100ペタ級コンピュータ, 2020年までにエクサコンピュータの開発を計画とも報道 ・2013年6月のTOP500では,総LINPACK性能47.3PFLOPS(計65システム)で米国に次いで2位 世界各国のハイパフォーマンス・コンピューティング(HPC)への取組(2/2) ロシア ・モスクワ州立大学がT-Platformと2013年稼働の10ペタ級コンピュータを開発中と報道 → 2020年のエクサコンピュータの開発も視野にいれており,1.5B$を想定との報道もある → 米国商務省がT-Platformに対し禁輸措置をとったとの報道もされており,先行き不透明な状況 ・2013年6月のTOP500では,総LINPACK性能2.0PFLOPS(計8システム)で10位の実績 インド ・インド政府が第12次5か年計画(2012~2017年)で350M$を投じ,ペタ級コンピュータ及びエクサ向け要素技術を開発中 ・2013年6月のTOP500では,総LINPACK性能2.7PFLOPS(計11システム)で7位の実績 韓国 ・1995年,韓国情報基盤イニシアティブ(KII; Korea Information Infrastructure Initiative) を開始 ・HPC法(National Supercomputing Promotion Act)を2011年に制定 ・超高性能コンピュータを国家レベルで重点育成するための中長期計画(第1次国家最高性能コンピュータ育成基本計画(2013~ 2017))を策定 ・2013年6月のTOP500では,総LINPACK性能1.0PFLOPS(計4システム)で16位の実績 6

×