SlideShare a Scribd company logo
1 of 27
遺伝研スパコンの
『ここが困った!』事例集と
今後への提言
@2014/7/31DDBJスパコンユーザーズミーティング
笠原 雅弘
東京大学大学院
新領域創成科学研究科
情報生命科学専攻
はじめに
「『ここが困った!』事例集」と銘打ってはいますが、
DDBJスパコンはゲノム解析向けの日本一スパコンです。
他の(ゲノム解析研究者にとって酷い)スパコンには
提言しに行く気も起きない。
従来型HPCと
ゲノム解析HPCの違い
従来型HPC ゲノム解析HPC
計算力と使いやすさ 計算力が大事。 計算より計算できるまでの
お膳立てが大変。使いや
すさもとても重要。
アクセラレータ 当たり前に使う。
GPGPU/Phi/…
使いにくい。
ただし今後は必要に。
メモリー 小〜中規模。 大きく必要。
ソフトウェア互換性 なくても良い応用も多い。 とても必要。
通信バンド幅 かなり必要。 あまり要らない。
ファイルシステム バルクアクセスが多い。 細かいアクセス
+バルクアクセス
+超大容量
資源管理 主にCPU 主にメモリ/ストレージ
耐故障性 チェックポイント等 大事
スパコンあれこれ
スパコン名称・設置サイト 不満点
遺伝研 DDBJ この中では一番よい。
東大医科学研究所 HGC 大規模メモリノードが(事実上)無い。
東工大 Tsubame2-KFC 大規模メモリノードが無い。
ストレージ容量・帯域・単価が良くない。
Amazon EC2 ネットワーク単価が高すぎてウェブサーバー以外の
大規模運用は今のところ非実用的。
東大情報基盤センター
Oakleaf
SPARCアーキテクチャであり、x86_64 が動かないた
め、あらゆるソフトの移植を自分で行う必要がある。
従って我々にはゴミ同然。
京コンピューター 同上
FOCUS 産業向け。
京大・筑波大など 小規模。ストレージ容量・帯域・単価が良くない。
統数研 ストレージ容量・帯域が良くない。
私の使用(活用)例:
PacBio RS を用いたゲノム解読
 PacBio RS
 世界初の商用1分子リアルタイム
DNAシークエンサー
 Continuous Long Read (CLR) は
Sanger リードを大きく超える
リード長(N50 read len: 8 kb)
 塩基エラー率~15%に対処する特別
なアルゴリズムが必要に
[http://files.pacb.com/pdf/PacBio_RS_II_Brochure.pdf]
 Sprai: PacBio エラー訂正ソフト
 ゲノム 10x 以上の PacBio リード
からシークエンシングエラーを取
り除く
 エラー除去したリードを Celera
Assembler 等でアセンブリ
PacBio & Google による
ヒトゲノムの de novo アセンブリ
405,000 CPU hours! Amazon EC2 で 800万円
Sprai
・http://zombie.cb.k.u-tokyo.ac.jp/sprai より公開中
・10以上の機関、15以上の研究室で既に稼働している
・真核生物ゲノムのアセンブリでは HGAP より高性能
(原核だと大差ない・・・)
・ゲノムサイズ <1Gbp のレンジで N50 contig 500kb ぐらいは
ルーチンになってきた。
DDBJスパコンで困った事例1c
 Univa Grid Engine (UGE) の仕様がダメで
困っている。
 200CPU core を使う並列プログラム(実際には違
うが仮にMPIジョブとします。)をジョブに投げる。
 200CPU 空いていればすぐに実行される。
 100CPU しか空いていないと待たされる。
 待っている間に 1 CPU とか 8 CPU のジョブがどんどん
実行されていく→永遠に出番が回ってこない。
 X10, Chapel 等の先進的な並列言語の恩恵が受
けられない。
DDBJスパコンで困った事例1c
 Univa Grid Engine (UGE) の仕様がダメで
困っている。
 200CPU core を使う並列プログラム(実際には違
うが仮にMPIジョブとします。)をジョブに投げる。
 200CPU 空いていればすぐに実行される。
 100CPU しか空いていないと待たされる。
 待っている間に 1 CPU とか 8 CPU のジョブがどんどん
実行されていく→永遠に出番が回ってこない。
 X10, Chapel 等の先進的な並列言語の恩恵が受
けられない。
本当に困っている。
ギャングスケジューリングや
バックフィルなど、対方法は
既に知られている。
UGE を投げ捨てるべき。
編注: DDBJスパコン+UGE の組み合わせでも
管理者が予約コマンドを発行すれば一応OK.
一般ユーザー権限だけでできるべき、というのが趣旨。
DDBJスパコンで困った事例1d
 Univa Grid Engine (UGE) の仕様がダメで
困っている。
 常駐するデーモン類を立てることができない。
 Hadoop や Spark をはじめとする並列分散計算ミドル
ウェアは CPU 負荷がほとんどないデーモンプロセスを
要求する→DDBJスパコンでは立てられない
 PacBio SMRT Portal は mysqld サーバーを立てる必要
があるが、ログインノードに立てると落とされる、計算
ノードに立てると時間制限がある。
 子のジョブから mysql をはじめとしたデーモンのアドレ
スを指定する場面があるが、qsub で mysqld を立てる
と子のジョブからアドレスを安全に取る手段がない。
 Lustre のロックが locallock に設定されている。
DDBJスパコンで困った事例2
 Lustre が高負荷時にエラーを吐く
 stat(2) などのファイル操作命令がたまに失敗する
 エラーを想定しているソフトウェアなどは(自分のソフト
ウェアも含めて)ほとんど無いので、エラーメッセージ
が出ないが、解析結果がおかしい、という場合が結構
ある。
 ファイルシステムの負荷で、プログラムが実行さ
れないことがある。酷いとログインすらできない。
Heterogeneous cluster
Big memory
Small memory
Small memory
Small memory
Small memory
File server
for production
pipelines
File server
for pipeline
development
File server
for home
directory
(configuration file,
program sources)
・
・
・
Web server
I/O server
Big memory
Offline HDDs
Small memory
Small memory
Gigabit Ethernet Switches
1 or 2
as many as possible
a few
1 or 2
The internet
2008年分子生物学会での笠原の講演
「Computer system design for efficient data-driven discovery using next-generation sequencers」
より。
Heterogeneous cluster
Big memory
Small memory
Small memory
Small memory
Small memory
File server
for production
pipelines
File server
for pipeline
development
File server
for home
directory
(configuration file,
program sources)
・
・
・
Web server
I/O server
Big memory
Offline HDDs
Small memory
Small memory
Gigabit Ethernet Switches
1 or 2
as many as possible
a few
1 or 2
The internet
2008年分子生物学会での笠原の講演
「Computer system design for efficient data-driven discovery using next-generation sequencers」
より。
プログラムを格納し、バックアップも付く
ユーザーあたり 20GB ぐらいの quota の
小規模ファイルサーバー(/home)
パイプライン開発をする人のための
200TB 規模のファイルサーバー
(/debug)
既存のソフトウェアを流す人のための
PB級のファイルサーバー
(/data)
DDBJスパコンで困った事例3
 インストールされているソフトウェアが勝手に
バージョンアップする
 科学論文では再現性(reproducilibity)が重要
 bowtie2, TopHat, Cufflinks など、バージョンアップでア
ルゴリズムの挙動が変わるソフトウェアはバージョンを
固定したい。少なくとも論文に使ったバージョンを記載。
 バイオインフォマティクスをよく知らないSEは
「最新バージョン」=「一番良いソフトウェア」
 我々
「最新バージョン」=「検証されていなくて怖い」
=「過去の計算もやり直し」
望ましい解決策
 Docker のような軽量コンテナベースの
仮想環境
 カーネルモジュールが必要なのと UGE と連携し
ないので、今入れると多分地獄。
 次に入れるシステムには必ず入れるべき。
 アメリカではもう20カ所以上の研究機関で使わ
れている。BCM と DNA Nexus の例など超大規
模な実用例も既にある。
 14,000 サンプルの WES/WGS,
 仮想マシンはダメ
 理由は時間が無いので割愛。
望ましい解決策
 Docker のような軽量コンテナベースの
仮想環境
 カーネルモジュールが必要なのと UGE と連携し
ないので、今入れると多分地獄。
 次に入れるシステムには必ず入れるべき。
 アメリカではもう20カ所以上の研究機関で使わ
れている。BCM と DNA Nexus の例など超大規
模な実用例も既にある。
 14,000 サンプルの WES/WGS,
 仮想マシンはダメ
 理由は時間が無いので割愛。
編注:他人が作ったVMイメージをそのまま使い、
自分では全くいじらない、という前提ならVMは
大変便利。ただし、開発者やアーリーアダプターは
一部だけのアップデート(セキュリティアップデート含む)
や他のコンポーネントとの組み合わせを試すので
VMイメージ単位で扱うと手間と時間のロスが大きく、
イメージの中身をいじり始めると手間が減らない。
正直なところ Docker コンテナでもまだ面倒。
(しかしよりよい方法も今のところない)
LPM: Local Package Manager
 バイオインフォマティクス系の解析ソフトを
1コマンドでインストールするソフトウェア。
Linux 専用。
http://www.kasahara.ws/lpm/
メジャーなソフトやライブラリを1コマンドで
インストールできる。
例)
lpm install samtools
lpm install velvet
lpm install allpathlg
lpm install soapdenovo127
lpm install trans-abyss
lpm install bwa
編注:今は Mac もサポートされている。
LPM でできること
 プロジェクト別に異なるバージョンの同じソフト
ウェアを(ワンタッチで切り替えて)共存できる
 RNA-seq のプロジェクトでは
bowtie ver X, tophat ver Y, cufflinks ver Z
 ゲノムアセンブリでは
bowtie ver A, sprai ver B, Celera assembler ver C
 などなど
DDBJスパコンで困った事例4
 運用側のセキュリティの意識が低い。
 ユーザーが root 権限を奪取できるバグが放置。
 私が指摘した後は迅速な対応を頂きました。
 bugtraq とまでは言わないが RHEL Security
Advisory ぐらいはさすがに毎日目を通して。
翌月だったか翌々月に発生していた
事件。
(1) ユーザーのアカウント乗っ取り
(2) 正規アカウントから root 奪取
(3) やりたい放題
(4) ユーザーのデータも盗み放題
不具合ではないが要望1
 各種公共データベースのミラーが欲しい
 1000genomes や UCSC/Ensembl など、頻繁に使
われるデータベースは daily mirror があってもよ
いと思う(東大HGCではNCBIの一部DBなどでミ
ラーを提供)。
 昼間にネットワーク帯域が混雑するのを防ぐ。
 同じデータベースへの複数ユーザーからの爆撃防止。
 GenBank/DRA は実質的にミラーがあるのであま
り問題ではない(か?)
編注:その後のDDBJスタッフからの説明で、既に
意外にいろいろカバーされていることが分かった。
不具合ではないが要望2
 Web サーバーが欲しい。
 ユーザーの ~/public_html など。
編注:ゲノムブラウザーなど、データが大量で
手元にコピーする時間は無いが一部の閲覧を
高速に行いたい、というようなケースで
スパコンに Web サーバーが欲しい。
また、Jupyter (iPython Notebook) のような
インタラクティブノート上でスパコンに演算を
させて結果表示(可視化)できると
研究のスピードが大きく上がる。
Heterogeneous cluster
Big memory
Small memory
Small memory
Small memory
Small memory
File server
for production
pipelines
File server
for pipeline
development
File server
for home
directory
(configuration file,
program sources)
・
・
・
Web server
I/O server
Big memory
Offline HDDs
Small memory
Small memory
Gigabit Ethernet Switches
1 or 2
as many as possible
a few
1 or 2
The internet
2008年分子生物学会での笠原の講演
「Computer system design for efficient data-driven discovery using next-generation sequencers」
より。
ゲノム解析では
ヘテロジーニアスクラスターが必要
 大メモリーノード
 ゲノムアセンブリーなど大容量メモリーの要求に応える。
高いので必然的に台数は少なめ。
 CPUノード
 コストパフォーマンスに優れた構成でCPUコア数とノード数を稼ぐ。メモリー
容量も実はそこそこ必要。
 ファイルサーバー
 大規模解析パイプラインが走っているときにファイルサーバー過負荷でログ
インすらできないのではストレスフル。
 (A) プログラムや設定ファイル用ファイルサーバー(小容量・バックアップ有)
(B) デバッグ用ファイルサーバー(中容量・バックアップ無) (C) プロダクション
用ファイルサーバー(大容量・バックアップ無)の3つに分けるのを推奨。
 使用頻度の低い保存データはオフラインHDD(電源を入れないハードディス
ク)に移して保管する。テープはトータルで高いのでたいてい得しない。
 Web サーバー
 解析結果の可視化のために Web サーバーが必須。
 その他(ログインノードなど)
2008年分子生物学会での笠原の講演を1枚スライドで要約
Visualization
 Wiki / Genome browser
2008年分子生物学会での笠原の講演
「Computer system design for efficient data-driven discovery using next-generation sequencers」
より。
まとめと次期システムへの提言
 ゲノム情報解析に必要な要件が従来のHPC
と大きく異なってしまっている。
 「すでにある」ソフトウェアの組み合わせでは
ゲノム研究の需要を満たすことはできない。
 ゲノム研究のニーズにあわせて攻めの姿勢で、
従来型のHPC研究をしている人達に頼るのでは
なく、HPCハードウェア・ソフトウェアのシステムを
「これから作る」ことを目指してほしい。
懺悔
 アンケート集計結果を読みました。
 「GPUキューにGPUを使わない不埒な奴が居る」
 「fatノードに大規模メモリを使わないジョブを投げている不
埒な奴が居る」
 すみません、配慮したつもりですが一部は私です。
 (1)通常のキューにジョブをたくさん投げる
 (2)他人の Job は全部、資源要求も含めて丸見えなので、
キューに溜まっている Job を調べる。
 (3)GPUを要求する Job が溜まっていない、あるいは fat
ノードに溜まっている Job はメモリ要求量が高すぎて当分
走りそうに無いときに、qalter コマンドで投入キューを変更
し、短時間の Job を振り替えていた。
 ↑一応迷惑を掛けないようにしたつもりだが、運用上よろし
くないならやめます・・・。
まとめ(事後編集済)
 DDBJスパコンはゲノム屋にとって神
 ユーザビリティの改善点
 スケジューリング
 複数コアを使うジョブの処理が管理者頼み。
 UGEで共有ファイルシステムを使わないで欲しい→scalable でない。
 バイオインフォでメモリー使用量を事前に見積もるのは大変難しい→
チェックポインティングでなんとかしてはどうか?
 デーモンやサーバー
 Spark (を使いたいわけでは無いが) 的な、デーモンを1カ所必要とす
るソフトウェアが使えない→実行時間制限の無いノードが欲しい
 可視化で Web サーバーが欲しい。安全はP制限で対処?
 仮想化
 Docker でも Xen でも、何か仮想環境が無いと辛い時代に。
 セキュリティ
 ユーザーが多ければユーザーも信用できないので Local exploit を
放置は論外。

More Related Content

What's hot

FPGA+SoC+Linux実践勉強会資料
FPGA+SoC+Linux実践勉強会資料FPGA+SoC+Linux実践勉強会資料
FPGA+SoC+Linux実践勉強会資料一路 川染
 
Linux女子部 systemd徹底入門
Linux女子部 systemd徹底入門Linux女子部 systemd徹底入門
Linux女子部 systemd徹底入門Etsuji Nakai
 
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料Amelieff
 
ネットワークコンフィグ分析ツール Batfish との付き合い方
ネットワークコンフィグ分析ツール Batfish との付き合い方ネットワークコンフィグ分析ツール Batfish との付き合い方
ネットワークコンフィグ分析ツール Batfish との付き合い方akira6592
 
[GTCJ2018]CuPy -NumPy互換GPUライブラリによるPythonでの高速計算- PFN奥田遼介
[GTCJ2018]CuPy -NumPy互換GPUライブラリによるPythonでの高速計算- PFN奥田遼介[GTCJ2018]CuPy -NumPy互換GPUライブラリによるPythonでの高速計算- PFN奥田遼介
[GTCJ2018]CuPy -NumPy互換GPUライブラリによるPythonでの高速計算- PFN奥田遼介Preferred Networks
 
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細 (様々なメモリの利用)
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細(様々なメモリの利用)2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細(様々なメモリの利用)
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細 (様々なメモリの利用) 智啓 出川
 
変分推論と Normalizing Flow
変分推論と Normalizing Flow変分推論と Normalizing Flow
変分推論と Normalizing FlowAkihiro Nitta
 
Verilog-HDL Tutorial (12)
Verilog-HDL Tutorial (12)Verilog-HDL Tutorial (12)
Verilog-HDL Tutorial (12)Hiroki Nakahara
 
CXL_説明_公開用.pdf
CXL_説明_公開用.pdfCXL_説明_公開用.pdf
CXL_説明_公開用.pdfYasunori Goto
 
C/C++プログラマのための開発ツール
C/C++プログラマのための開発ツールC/C++プログラマのための開発ツール
C/C++プログラマのための開発ツールMITSUNARI Shigeo
 
1070: CUDA プログラミング入門
1070: CUDA プログラミング入門1070: CUDA プログラミング入門
1070: CUDA プログラミング入門NVIDIA Japan
 
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021Preferred Networks
 
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介Haruki Yamashita
 
Efficient Neural Architecture Search via Parameters Sharing @ ICML2018読み会
Efficient Neural Architecture Search via Parameters Sharing @ ICML2018読み会Efficient Neural Architecture Search via Parameters Sharing @ ICML2018読み会
Efficient Neural Architecture Search via Parameters Sharing @ ICML2018読み会tomohiro kato
 
Automatically Fusing Functions on CuPy
Automatically Fusing Functions on CuPyAutomatically Fusing Functions on CuPy
Automatically Fusing Functions on CuPyPreferred Networks
 
Sw技術者に送るfpga入門
Sw技術者に送るfpga入門Sw技術者に送るfpga入門
Sw技術者に送るfpga入門直久 住川
 
Pythonでの開発を効率的に進めるためのツール設定
Pythonでの開発を効率的に進めるためのツール設定Pythonでの開発を効率的に進めるためのツール設定
Pythonでの開発を効率的に進めるためのツール設定Atsushi Odagiri
 
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説Takateru Yamagishi
 
Transformerを用いたAutoEncoderの設計と実験
Transformerを用いたAutoEncoderの設計と実験Transformerを用いたAutoEncoderの設計と実験
Transformerを用いたAutoEncoderの設計と実験myxymyxomatosis
 
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...joisino
 

What's hot (20)

FPGA+SoC+Linux実践勉強会資料
FPGA+SoC+Linux実践勉強会資料FPGA+SoC+Linux実践勉強会資料
FPGA+SoC+Linux実践勉強会資料
 
Linux女子部 systemd徹底入門
Linux女子部 systemd徹底入門Linux女子部 systemd徹底入門
Linux女子部 systemd徹底入門
 
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
 
ネットワークコンフィグ分析ツール Batfish との付き合い方
ネットワークコンフィグ分析ツール Batfish との付き合い方ネットワークコンフィグ分析ツール Batfish との付き合い方
ネットワークコンフィグ分析ツール Batfish との付き合い方
 
[GTCJ2018]CuPy -NumPy互換GPUライブラリによるPythonでの高速計算- PFN奥田遼介
[GTCJ2018]CuPy -NumPy互換GPUライブラリによるPythonでの高速計算- PFN奥田遼介[GTCJ2018]CuPy -NumPy互換GPUライブラリによるPythonでの高速計算- PFN奥田遼介
[GTCJ2018]CuPy -NumPy互換GPUライブラリによるPythonでの高速計算- PFN奥田遼介
 
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細 (様々なメモリの利用)
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細(様々なメモリの利用)2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細(様々なメモリの利用)
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細 (様々なメモリの利用)
 
変分推論と Normalizing Flow
変分推論と Normalizing Flow変分推論と Normalizing Flow
変分推論と Normalizing Flow
 
Verilog-HDL Tutorial (12)
Verilog-HDL Tutorial (12)Verilog-HDL Tutorial (12)
Verilog-HDL Tutorial (12)
 
CXL_説明_公開用.pdf
CXL_説明_公開用.pdfCXL_説明_公開用.pdf
CXL_説明_公開用.pdf
 
C/C++プログラマのための開発ツール
C/C++プログラマのための開発ツールC/C++プログラマのための開発ツール
C/C++プログラマのための開発ツール
 
1070: CUDA プログラミング入門
1070: CUDA プログラミング入門1070: CUDA プログラミング入門
1070: CUDA プログラミング入門
 
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
 
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
 
Efficient Neural Architecture Search via Parameters Sharing @ ICML2018読み会
Efficient Neural Architecture Search via Parameters Sharing @ ICML2018読み会Efficient Neural Architecture Search via Parameters Sharing @ ICML2018読み会
Efficient Neural Architecture Search via Parameters Sharing @ ICML2018読み会
 
Automatically Fusing Functions on CuPy
Automatically Fusing Functions on CuPyAutomatically Fusing Functions on CuPy
Automatically Fusing Functions on CuPy
 
Sw技術者に送るfpga入門
Sw技術者に送るfpga入門Sw技術者に送るfpga入門
Sw技術者に送るfpga入門
 
Pythonでの開発を効率的に進めるためのツール設定
Pythonでの開発を効率的に進めるためのツール設定Pythonでの開発を効率的に進めるためのツール設定
Pythonでの開発を効率的に進めるためのツール設定
 
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
 
Transformerを用いたAutoEncoderの設計と実験
Transformerを用いたAutoEncoderの設計と実験Transformerを用いたAutoEncoderの設計と実験
Transformerを用いたAutoEncoderの設計と実験
 
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
 

Viewers also liked

[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境DNA Data Bank of Japan center
 
バイオインフォマティクスで実験ノートを取ろう
バイオインフォマティクスで実験ノートを取ろうバイオインフォマティクスで実験ノートを取ろう
バイオインフォマティクスで実験ノートを取ろうMasahiro Kasahara
 
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...Eli Kaminuma
 
生物成長曲線予測の事例
生物成長曲線予測の事例生物成長曲線予測の事例
生物成長曲線予測の事例yoshi_flt
 
2014春h研最終発表(実験哲学)
2014春h研最終発表(実験哲学)2014春h研最終発表(実験哲学)
2014春h研最終発表(実験哲学)pe pon
 
遺伝研 Rina Aizawa ユーザミーティング
遺伝研 Rina Aizawa ユーザミーティング遺伝研 Rina Aizawa ユーザミーティング
遺伝研 Rina Aizawa ユーザミーティングTazro Ohta
 
MPI で順序の決まっていない通信をするとツラい訳
MPI で順序の決まっていない通信をするとツラい訳MPI で順序の決まっていない通信をするとツラい訳
MPI で順序の決まっていない通信をするとツラい訳Masahiro Kasahara
 
Docker向け軽量os 3製品比較
Docker向け軽量os 3製品比較Docker向け軽量os 3製品比較
Docker向け軽量os 3製品比較cloudconductor
 
知っておくべきCephのIOアクセラレーション技術とその活用方法 - OpenStack最新情報セミナー 2015年9月
知っておくべきCephのIOアクセラレーション技術とその活用方法 - OpenStack最新情報セミナー 2015年9月知っておくべきCephのIOアクセラレーション技術とその活用方法 - OpenStack最新情報セミナー 2015年9月
知っておくべきCephのIOアクセラレーション技術とその活用方法 - OpenStack最新情報セミナー 2015年9月VirtualTech Japan Inc.
 
Ceph アーキテクチャ概説
Ceph アーキテクチャ概説Ceph アーキテクチャ概説
Ceph アーキテクチャ概説Emma Haruka Iwao
 
「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)DNA Data Bank of Japan center
 
Docker on RHEL & Project Atomic 入門 - #Dockerjp 4
Docker on RHEL & Project Atomic 入門 - #Dockerjp 4Docker on RHEL & Project Atomic 入門 - #Dockerjp 4
Docker on RHEL & Project Atomic 入門 - #Dockerjp 4Emma Haruka Iwao
 
流体解析入門者向け超初級講習会@関東 修正版
流体解析入門者向け超初級講習会@関東 修正版流体解析入門者向け超初級講習会@関東 修正版
流体解析入門者向け超初級講習会@関東 修正版Masashi Imano
 

Viewers also liked (15)

[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
 
バイオインフォマティクスで実験ノートを取ろう
バイオインフォマティクスで実験ノートを取ろうバイオインフォマティクスで実験ノートを取ろう
バイオインフォマティクスで実験ノートを取ろう
 
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...
 
生物成長曲線予測の事例
生物成長曲線予測の事例生物成長曲線予測の事例
生物成長曲線予測の事例
 
2014春h研最終発表(実験哲学)
2014春h研最終発表(実験哲学)2014春h研最終発表(実験哲学)
2014春h研最終発表(実験哲学)
 
遺伝研 Rina Aizawa ユーザミーティング
遺伝研 Rina Aizawa ユーザミーティング遺伝研 Rina Aizawa ユーザミーティング
遺伝研 Rina Aizawa ユーザミーティング
 
MPI で順序の決まっていない通信をするとツラい訳
MPI で順序の決まっていない通信をするとツラい訳MPI で順序の決まっていない通信をするとツラい訳
MPI で順序の決まっていない通信をするとツラい訳
 
Docker向け軽量os 3製品比較
Docker向け軽量os 3製品比較Docker向け軽量os 3製品比較
Docker向け軽量os 3製品比較
 
知っておくべきCephのIOアクセラレーション技術とその活用方法 - OpenStack最新情報セミナー 2015年9月
知っておくべきCephのIOアクセラレーション技術とその活用方法 - OpenStack最新情報セミナー 2015年9月知っておくべきCephのIOアクセラレーション技術とその活用方法 - OpenStack最新情報セミナー 2015年9月
知っておくべきCephのIOアクセラレーション技術とその活用方法 - OpenStack最新情報セミナー 2015年9月
 
20161120_HPCでFPGAを使ってみたい_fpgastartup
20161120_HPCでFPGAを使ってみたい_fpgastartup20161120_HPCでFPGAを使ってみたい_fpgastartup
20161120_HPCでFPGAを使ってみたい_fpgastartup
 
Ceph アーキテクチャ概説
Ceph アーキテクチャ概説Ceph アーキテクチャ概説
Ceph アーキテクチャ概説
 
Xeon d
Xeon dXeon d
Xeon d
 
「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)
 
Docker on RHEL & Project Atomic 入門 - #Dockerjp 4
Docker on RHEL & Project Atomic 入門 - #Dockerjp 4Docker on RHEL & Project Atomic 入門 - #Dockerjp 4
Docker on RHEL & Project Atomic 入門 - #Dockerjp 4
 
流体解析入門者向け超初級講習会@関東 修正版
流体解析入門者向け超初級講習会@関東 修正版流体解析入門者向け超初級講習会@関東 修正版
流体解析入門者向け超初級講習会@関東 修正版
 

Similar to 遺伝研スパコンの『ここが困った!』事例集と今後への提言

[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保するDNA Data Bank of Japan center
 
機械学習 / Deep Learning 大全 (6) Library編
機械学習 / Deep Learning 大全 (6) Library編機械学習 / Deep Learning 大全 (6) Library編
機械学習 / Deep Learning 大全 (6) Library編Daiyu Hatakeyama
 
20230105_TITECH_lecture_ishizaki_public.pdf
20230105_TITECH_lecture_ishizaki_public.pdf20230105_TITECH_lecture_ishizaki_public.pdf
20230105_TITECH_lecture_ishizaki_public.pdfKazuaki Ishizaki
 
[D12] NonStop SQLって何? by Susumu Yamamoto
[D12] NonStop SQLって何? by Susumu Yamamoto[D12] NonStop SQLって何? by Susumu Yamamoto
[D12] NonStop SQLって何? by Susumu YamamotoInsight Technology, Inc.
 
Cytoscapeの現状とCyberinfrastructure
Cytoscapeの現状とCyberinfrastructureCytoscapeの現状とCyberinfrastructure
Cytoscapeの現状とCyberinfrastructureKeiichiro Ono
 
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"kazuoishii20
 
45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄Yukio Saito
 
[db tech showcase Tokyo 2014] B31: いまどきのシステムもNonStop SQLで構築できる~オープンシステムへのアプロー...
[db tech showcase Tokyo 2014] B31: いまどきのシステムもNonStop SQLで構築できる~オープンシステムへのアプロー...[db tech showcase Tokyo 2014] B31: いまどきのシステムもNonStop SQLで構築できる~オープンシステムへのアプロー...
[db tech showcase Tokyo 2014] B31: いまどきのシステムもNonStop SQLで構築できる~オープンシステムへのアプロー...Insight Technology, Inc.
 
Ansibleはじめよぉ -Infrastructure as Codeを理解-
Ansibleはじめよぉ -Infrastructure as Codeを理解-Ansibleはじめよぉ -Infrastructure as Codeを理解-
Ansibleはじめよぉ -Infrastructure as Codeを理解-Shingo Kitayama
 
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)Mr. Vengineer
 
kagami_comput2016_14
kagami_comput2016_14kagami_comput2016_14
kagami_comput2016_14swkagami
 

Similar to 遺伝研スパコンの『ここが困った!』事例集と今後への提言 (20)

[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
 
Debian emdebian 20100817
Debian emdebian 20100817Debian emdebian 20100817
Debian emdebian 20100817
 
コンテナーによるIT基盤変革 - IT infrastructure transformation -
コンテナーによるIT基盤変革 - IT infrastructure transformation -コンテナーによるIT基盤変革 - IT infrastructure transformation -
コンテナーによるIT基盤変革 - IT infrastructure transformation -
 
MapReduce/YARNの仕組みを知る
MapReduce/YARNの仕組みを知るMapReduce/YARNの仕組みを知る
MapReduce/YARNの仕組みを知る
 
機械学習 / Deep Learning 大全 (6) Library編
機械学習 / Deep Learning 大全 (6) Library編機械学習 / Deep Learning 大全 (6) Library編
機械学習 / Deep Learning 大全 (6) Library編
 
20230105_TITECH_lecture_ishizaki_public.pdf
20230105_TITECH_lecture_ishizaki_public.pdf20230105_TITECH_lecture_ishizaki_public.pdf
20230105_TITECH_lecture_ishizaki_public.pdf
 
[D12] NonStop SQLって何? by Susumu Yamamoto
[D12] NonStop SQLって何? by Susumu Yamamoto[D12] NonStop SQLって何? by Susumu Yamamoto
[D12] NonStop SQLって何? by Susumu Yamamoto
 
私とOSSの25年
私とOSSの25年私とOSSの25年
私とOSSの25年
 
Hadoop/AI基盤における考慮点、PoCの進め方、基盤構成例
Hadoop/AI基盤における考慮点、PoCの進め方、基盤構成例Hadoop/AI基盤における考慮点、PoCの進め方、基盤構成例
Hadoop/AI基盤における考慮点、PoCの進め方、基盤構成例
 
第4回全脳アーキテクチャハッカソン説明会
第4回全脳アーキテクチャハッカソン説明会第4回全脳アーキテクチャハッカソン説明会
第4回全脳アーキテクチャハッカソン説明会
 
GTC Japan 2017
GTC Japan 2017GTC Japan 2017
GTC Japan 2017
 
Cytoscapeの現状とCyberinfrastructure
Cytoscapeの現状とCyberinfrastructureCytoscapeの現状とCyberinfrastructure
Cytoscapeの現状とCyberinfrastructure
 
20130126 sc12-reading
20130126 sc12-reading20130126 sc12-reading
20130126 sc12-reading
 
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
 
Apache Hadoopを改めて知る
Apache Hadoopを改めて知るApache Hadoopを改めて知る
Apache Hadoopを改めて知る
 
45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄
 
[db tech showcase Tokyo 2014] B31: いまどきのシステムもNonStop SQLで構築できる~オープンシステムへのアプロー...
[db tech showcase Tokyo 2014] B31: いまどきのシステムもNonStop SQLで構築できる~オープンシステムへのアプロー...[db tech showcase Tokyo 2014] B31: いまどきのシステムもNonStop SQLで構築できる~オープンシステムへのアプロー...
[db tech showcase Tokyo 2014] B31: いまどきのシステムもNonStop SQLで構築できる~オープンシステムへのアプロー...
 
Ansibleはじめよぉ -Infrastructure as Codeを理解-
Ansibleはじめよぉ -Infrastructure as Codeを理解-Ansibleはじめよぉ -Infrastructure as Codeを理解-
Ansibleはじめよぉ -Infrastructure as Codeを理解-
 
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
 
kagami_comput2016_14
kagami_comput2016_14kagami_comput2016_14
kagami_comput2016_14
 

Recently uploaded

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成Hiroshi Tomioka
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 

Recently uploaded (9)

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 

遺伝研スパコンの『ここが困った!』事例集と今後への提言

  • 3. 従来型HPCと ゲノム解析HPCの違い 従来型HPC ゲノム解析HPC 計算力と使いやすさ 計算力が大事。 計算より計算できるまでの お膳立てが大変。使いや すさもとても重要。 アクセラレータ 当たり前に使う。 GPGPU/Phi/… 使いにくい。 ただし今後は必要に。 メモリー 小〜中規模。 大きく必要。 ソフトウェア互換性 なくても良い応用も多い。 とても必要。 通信バンド幅 かなり必要。 あまり要らない。 ファイルシステム バルクアクセスが多い。 細かいアクセス +バルクアクセス +超大容量 資源管理 主にCPU 主にメモリ/ストレージ 耐故障性 チェックポイント等 大事
  • 4. スパコンあれこれ スパコン名称・設置サイト 不満点 遺伝研 DDBJ この中では一番よい。 東大医科学研究所 HGC 大規模メモリノードが(事実上)無い。 東工大 Tsubame2-KFC 大規模メモリノードが無い。 ストレージ容量・帯域・単価が良くない。 Amazon EC2 ネットワーク単価が高すぎてウェブサーバー以外の 大規模運用は今のところ非実用的。 東大情報基盤センター Oakleaf SPARCアーキテクチャであり、x86_64 が動かないた め、あらゆるソフトの移植を自分で行う必要がある。 従って我々にはゴミ同然。 京コンピューター 同上 FOCUS 産業向け。 京大・筑波大など 小規模。ストレージ容量・帯域・単価が良くない。 統数研 ストレージ容量・帯域が良くない。
  • 5. 私の使用(活用)例: PacBio RS を用いたゲノム解読  PacBio RS  世界初の商用1分子リアルタイム DNAシークエンサー  Continuous Long Read (CLR) は Sanger リードを大きく超える リード長(N50 read len: 8 kb)  塩基エラー率~15%に対処する特別 なアルゴリズムが必要に [http://files.pacb.com/pdf/PacBio_RS_II_Brochure.pdf]  Sprai: PacBio エラー訂正ソフト  ゲノム 10x 以上の PacBio リード からシークエンシングエラーを取 り除く  エラー除去したリードを Celera Assembler 等でアセンブリ
  • 6. PacBio & Google による ヒトゲノムの de novo アセンブリ 405,000 CPU hours! Amazon EC2 で 800万円
  • 7. Sprai ・http://zombie.cb.k.u-tokyo.ac.jp/sprai より公開中 ・10以上の機関、15以上の研究室で既に稼働している ・真核生物ゲノムのアセンブリでは HGAP より高性能 (原核だと大差ない・・・) ・ゲノムサイズ <1Gbp のレンジで N50 contig 500kb ぐらいは ルーチンになってきた。
  • 8. DDBJスパコンで困った事例1c  Univa Grid Engine (UGE) の仕様がダメで 困っている。  200CPU core を使う並列プログラム(実際には違 うが仮にMPIジョブとします。)をジョブに投げる。  200CPU 空いていればすぐに実行される。  100CPU しか空いていないと待たされる。  待っている間に 1 CPU とか 8 CPU のジョブがどんどん 実行されていく→永遠に出番が回ってこない。  X10, Chapel 等の先進的な並列言語の恩恵が受 けられない。
  • 9. DDBJスパコンで困った事例1c  Univa Grid Engine (UGE) の仕様がダメで 困っている。  200CPU core を使う並列プログラム(実際には違 うが仮にMPIジョブとします。)をジョブに投げる。  200CPU 空いていればすぐに実行される。  100CPU しか空いていないと待たされる。  待っている間に 1 CPU とか 8 CPU のジョブがどんどん 実行されていく→永遠に出番が回ってこない。  X10, Chapel 等の先進的な並列言語の恩恵が受 けられない。 本当に困っている。 ギャングスケジューリングや バックフィルなど、対方法は 既に知られている。 UGE を投げ捨てるべき。 編注: DDBJスパコン+UGE の組み合わせでも 管理者が予約コマンドを発行すれば一応OK. 一般ユーザー権限だけでできるべき、というのが趣旨。
  • 10. DDBJスパコンで困った事例1d  Univa Grid Engine (UGE) の仕様がダメで 困っている。  常駐するデーモン類を立てることができない。  Hadoop や Spark をはじめとする並列分散計算ミドル ウェアは CPU 負荷がほとんどないデーモンプロセスを 要求する→DDBJスパコンでは立てられない  PacBio SMRT Portal は mysqld サーバーを立てる必要 があるが、ログインノードに立てると落とされる、計算 ノードに立てると時間制限がある。  子のジョブから mysql をはじめとしたデーモンのアドレ スを指定する場面があるが、qsub で mysqld を立てる と子のジョブからアドレスを安全に取る手段がない。  Lustre のロックが locallock に設定されている。
  • 11. DDBJスパコンで困った事例2  Lustre が高負荷時にエラーを吐く  stat(2) などのファイル操作命令がたまに失敗する  エラーを想定しているソフトウェアなどは(自分のソフト ウェアも含めて)ほとんど無いので、エラーメッセージ が出ないが、解析結果がおかしい、という場合が結構 ある。  ファイルシステムの負荷で、プログラムが実行さ れないことがある。酷いとログインすらできない。
  • 12. Heterogeneous cluster Big memory Small memory Small memory Small memory Small memory File server for production pipelines File server for pipeline development File server for home directory (configuration file, program sources) ・ ・ ・ Web server I/O server Big memory Offline HDDs Small memory Small memory Gigabit Ethernet Switches 1 or 2 as many as possible a few 1 or 2 The internet 2008年分子生物学会での笠原の講演 「Computer system design for efficient data-driven discovery using next-generation sequencers」 より。
  • 13. Heterogeneous cluster Big memory Small memory Small memory Small memory Small memory File server for production pipelines File server for pipeline development File server for home directory (configuration file, program sources) ・ ・ ・ Web server I/O server Big memory Offline HDDs Small memory Small memory Gigabit Ethernet Switches 1 or 2 as many as possible a few 1 or 2 The internet 2008年分子生物学会での笠原の講演 「Computer system design for efficient data-driven discovery using next-generation sequencers」 より。 プログラムを格納し、バックアップも付く ユーザーあたり 20GB ぐらいの quota の 小規模ファイルサーバー(/home) パイプライン開発をする人のための 200TB 規模のファイルサーバー (/debug) 既存のソフトウェアを流す人のための PB級のファイルサーバー (/data)
  • 14. DDBJスパコンで困った事例3  インストールされているソフトウェアが勝手に バージョンアップする  科学論文では再現性(reproducilibity)が重要  bowtie2, TopHat, Cufflinks など、バージョンアップでア ルゴリズムの挙動が変わるソフトウェアはバージョンを 固定したい。少なくとも論文に使ったバージョンを記載。  バイオインフォマティクスをよく知らないSEは 「最新バージョン」=「一番良いソフトウェア」  我々 「最新バージョン」=「検証されていなくて怖い」 =「過去の計算もやり直し」
  • 15. 望ましい解決策  Docker のような軽量コンテナベースの 仮想環境  カーネルモジュールが必要なのと UGE と連携し ないので、今入れると多分地獄。  次に入れるシステムには必ず入れるべき。  アメリカではもう20カ所以上の研究機関で使わ れている。BCM と DNA Nexus の例など超大規 模な実用例も既にある。  14,000 サンプルの WES/WGS,  仮想マシンはダメ  理由は時間が無いので割愛。
  • 16. 望ましい解決策  Docker のような軽量コンテナベースの 仮想環境  カーネルモジュールが必要なのと UGE と連携し ないので、今入れると多分地獄。  次に入れるシステムには必ず入れるべき。  アメリカではもう20カ所以上の研究機関で使わ れている。BCM と DNA Nexus の例など超大規 模な実用例も既にある。  14,000 サンプルの WES/WGS,  仮想マシンはダメ  理由は時間が無いので割愛。 編注:他人が作ったVMイメージをそのまま使い、 自分では全くいじらない、という前提ならVMは 大変便利。ただし、開発者やアーリーアダプターは 一部だけのアップデート(セキュリティアップデート含む) や他のコンポーネントとの組み合わせを試すので VMイメージ単位で扱うと手間と時間のロスが大きく、 イメージの中身をいじり始めると手間が減らない。 正直なところ Docker コンテナでもまだ面倒。 (しかしよりよい方法も今のところない)
  • 17. LPM: Local Package Manager  バイオインフォマティクス系の解析ソフトを 1コマンドでインストールするソフトウェア。 Linux 専用。 http://www.kasahara.ws/lpm/ メジャーなソフトやライブラリを1コマンドで インストールできる。 例) lpm install samtools lpm install velvet lpm install allpathlg lpm install soapdenovo127 lpm install trans-abyss lpm install bwa 編注:今は Mac もサポートされている。
  • 18. LPM でできること  プロジェクト別に異なるバージョンの同じソフト ウェアを(ワンタッチで切り替えて)共存できる  RNA-seq のプロジェクトでは bowtie ver X, tophat ver Y, cufflinks ver Z  ゲノムアセンブリでは bowtie ver A, sprai ver B, Celera assembler ver C  などなど
  • 19. DDBJスパコンで困った事例4  運用側のセキュリティの意識が低い。  ユーザーが root 権限を奪取できるバグが放置。  私が指摘した後は迅速な対応を頂きました。  bugtraq とまでは言わないが RHEL Security Advisory ぐらいはさすがに毎日目を通して。 翌月だったか翌々月に発生していた 事件。 (1) ユーザーのアカウント乗っ取り (2) 正規アカウントから root 奪取 (3) やりたい放題 (4) ユーザーのデータも盗み放題
  • 20. 不具合ではないが要望1  各種公共データベースのミラーが欲しい  1000genomes や UCSC/Ensembl など、頻繁に使 われるデータベースは daily mirror があってもよ いと思う(東大HGCではNCBIの一部DBなどでミ ラーを提供)。  昼間にネットワーク帯域が混雑するのを防ぐ。  同じデータベースへの複数ユーザーからの爆撃防止。  GenBank/DRA は実質的にミラーがあるのであま り問題ではない(か?) 編注:その後のDDBJスタッフからの説明で、既に 意外にいろいろカバーされていることが分かった。
  • 21. 不具合ではないが要望2  Web サーバーが欲しい。  ユーザーの ~/public_html など。 編注:ゲノムブラウザーなど、データが大量で 手元にコピーする時間は無いが一部の閲覧を 高速に行いたい、というようなケースで スパコンに Web サーバーが欲しい。 また、Jupyter (iPython Notebook) のような インタラクティブノート上でスパコンに演算を させて結果表示(可視化)できると 研究のスピードが大きく上がる。
  • 22. Heterogeneous cluster Big memory Small memory Small memory Small memory Small memory File server for production pipelines File server for pipeline development File server for home directory (configuration file, program sources) ・ ・ ・ Web server I/O server Big memory Offline HDDs Small memory Small memory Gigabit Ethernet Switches 1 or 2 as many as possible a few 1 or 2 The internet 2008年分子生物学会での笠原の講演 「Computer system design for efficient data-driven discovery using next-generation sequencers」 より。
  • 23. ゲノム解析では ヘテロジーニアスクラスターが必要  大メモリーノード  ゲノムアセンブリーなど大容量メモリーの要求に応える。 高いので必然的に台数は少なめ。  CPUノード  コストパフォーマンスに優れた構成でCPUコア数とノード数を稼ぐ。メモリー 容量も実はそこそこ必要。  ファイルサーバー  大規模解析パイプラインが走っているときにファイルサーバー過負荷でログ インすらできないのではストレスフル。  (A) プログラムや設定ファイル用ファイルサーバー(小容量・バックアップ有) (B) デバッグ用ファイルサーバー(中容量・バックアップ無) (C) プロダクション 用ファイルサーバー(大容量・バックアップ無)の3つに分けるのを推奨。  使用頻度の低い保存データはオフラインHDD(電源を入れないハードディス ク)に移して保管する。テープはトータルで高いのでたいてい得しない。  Web サーバー  解析結果の可視化のために Web サーバーが必須。  その他(ログインノードなど) 2008年分子生物学会での笠原の講演を1枚スライドで要約
  • 24. Visualization  Wiki / Genome browser 2008年分子生物学会での笠原の講演 「Computer system design for efficient data-driven discovery using next-generation sequencers」 より。
  • 25. まとめと次期システムへの提言  ゲノム情報解析に必要な要件が従来のHPC と大きく異なってしまっている。  「すでにある」ソフトウェアの組み合わせでは ゲノム研究の需要を満たすことはできない。  ゲノム研究のニーズにあわせて攻めの姿勢で、 従来型のHPC研究をしている人達に頼るのでは なく、HPCハードウェア・ソフトウェアのシステムを 「これから作る」ことを目指してほしい。
  • 26. 懺悔  アンケート集計結果を読みました。  「GPUキューにGPUを使わない不埒な奴が居る」  「fatノードに大規模メモリを使わないジョブを投げている不 埒な奴が居る」  すみません、配慮したつもりですが一部は私です。  (1)通常のキューにジョブをたくさん投げる  (2)他人の Job は全部、資源要求も含めて丸見えなので、 キューに溜まっている Job を調べる。  (3)GPUを要求する Job が溜まっていない、あるいは fat ノードに溜まっている Job はメモリ要求量が高すぎて当分 走りそうに無いときに、qalter コマンドで投入キューを変更 し、短時間の Job を振り替えていた。  ↑一応迷惑を掛けないようにしたつもりだが、運用上よろし くないならやめます・・・。
  • 27. まとめ(事後編集済)  DDBJスパコンはゲノム屋にとって神  ユーザビリティの改善点  スケジューリング  複数コアを使うジョブの処理が管理者頼み。  UGEで共有ファイルシステムを使わないで欲しい→scalable でない。  バイオインフォでメモリー使用量を事前に見積もるのは大変難しい→ チェックポインティングでなんとかしてはどうか?  デーモンやサーバー  Spark (を使いたいわけでは無いが) 的な、デーモンを1カ所必要とす るソフトウェアが使えない→実行時間制限の無いノードが欲しい  可視化で Web サーバーが欲しい。安全はP制限で対処?  仮想化  Docker でも Xen でも、何か仮想環境が無いと辛い時代に。  セキュリティ  ユーザーが多ければユーザーも信用できないので Local exploit を 放置は論外。