遊休リソースを用いた相同性検索処理の並列化とその評価

遊休リソースを用いた相同性検索処理の並列化とその評価慶應義塾大学大学院政策・メディア研究科永安悟史

背景 PC ・ WS のパフォーマンス向上 CPU 、メモリ、ネットワーク、ストレージハイパフォーマンスなハードウェアのコモディティ化個々の PC ・ WS のリソースは余剰気味遊休リソースコンピューティング PC クラスタを用いた HPC PC クラスタのコストパフォーマンス高度 and/or 高価なハードウェア / ソフトウェアの管理コスト

背景バイオインフォマティクスにおける HPC 処理するデータ量が膨大、データ量の増大 PC クラスタによる演算処理（ CPU ）の並列・分散化共有ディスク（ NFS ）を利用した分散処理の限界（-> I/O ネック） Growth of GenBank

モチベーションもっと有効に計算資源を利用できるのでは？遊休リソースコンピューティングユーザーに利用されていない CPU 時間を使う処理 PC クラスタ用 HPC アプリケーションと　　　　　　　　　　遊休リソースコンピューティングのハイブリッド化既存のリソースから処理能力を引き出す CPU 、メモリ、ストレージ、ネットワークどの程度のパフォーマンスを得られるのか？どのような制約があり、何が必要なのか？

目的遊休リソースコンピューティングの HPC アプリケーション　への適用とその実証評価パフォーマンス、スケーラビリティの評価既存の分散技術との比較遊休リソースコンピューティング PC ・ WS などのコモディティハードウェアを用いる既存の遊休資源を用いるバイオインフォマティクスの HPC アプリケーション処理するデータサイズが大きいアプリケーションが比較的シンプル

手法サンプルアプリケーション⇒ BLAST Basic Local Alignment Search Tools 遺伝子データにおける類似配列の検索比較評価できる並列分散の実装（ mpiBLAST ）遊休ワークステーション ( ～ 160 台）を使用評価項目スケーラビリティ（ノード数、データ量）レスポンスタイムスループット

BLAST(Basic Local Alignment Search Tool) 遺伝子配列の相同性を計算する DP 法の代わりに遺伝子配列に特化使用例ヒトゲノムデータ (ncbi/genomes/H_sapiens) 複数のデータベース（ nr 、 nt など） >lcl|AK000001 AK000001.1 LENGTH:4504, CDS:<976..1443 GTGACTTCAGTTTTTCGTCTTTCAACTTCAGTTGCTCATCTGCAGTCACCAGCTGGGATT TGAACCCAGCCAATCTGACTCCTGAGCTCCTCTTTCCTCCCACTTAGTCTTTTCCCCTGA GTCCAACAGCACCTTAGAGCATGTCTAATGCACGTGCTTACTGCCTTCATCTCATTGCAG CCTGTCCCTGCCAGCTGTGTCACCTTCATCCTGCTGCCAGCCCCTGGTGACTCTCCCGTT ACAGATCAGAGACCAGACTCCAGGGGTGGAGAGTAGGGGTTCTGGACCAGCCGCTCTCTG CTCCTAGAGCTCTTGTCTACACAACTGCCTGGTGCTCAGGGGATGACGAGGCGCCTGCCT CTCTCAGTAGGTTGTGTGTCCTGGCAGCAGGGGTGGGACCTGTCCTCTTTCATAGCTCCA GCACATCTGTGCTGGATGTCACCTGGCTCCATCCAGTGACGGATTCATATTCTCTGTTTC Seq.A: atg a tgat t g a c ... ||| |||| | | Seq.B: atg t tgat c g c c ... FASTA DB 3GB formatdb BLAST DB Query sequence blastX Results

BLAST の検索処理 BLAST の処理内容の傾向クエリが長い場合 -> CPU を使うクエリが多い場合 -> I/O を使う

関連研究遊休リソースコンピューティング [email_address] RC5 [email_address] 並列化 BLAST mpiBLAST HyperBLAST Hi-per BLAST TurboBLAST

既存研究との比較超分散遊休リソースコンピューティング並列化 BLAST NFS を利用した PC クラスタ向け並列化利用するネットワーク広域分散＞ LAN 内分散＞ PC クラスタ内分散

アーキテクチャ – コンセプトストレージ共有型ストレージ分散型

アーキテクチャ –ディスク共有型ファイルサーバ中心大容量データを共有 NFS などシステム全体の信頼性ファイルサーバに制約される performance/availability Storage File Server Client nodes file read & write

アーキテクチャ – NFS NFS ベンチマーク NFS のボトルネックの測定（ CPU ノード数と I/O ） archives(fs04) zuxXXX

アーキテクチャ – Requirements I/O 処理の低減ローカルストレージの活用並列化 Process data data data data scan data NFS Process data data scan 並列化

アーキテクチャ – ディスク分散型データ分割各ノードがキャッシュを保持動的に近隣から取得キャッシュの redundancy ファイルサーバへの負荷低減 Storage Client nodes cache expire & copy

アーキテクチャ – コンセプト（まとめ）ストレージ共有型多数の計算ノードから負荷が集中ファイルサーバにボトルネックストレージ分散型 I/O 処理を分散することが可能ファイルサーバのボトルネック、 SPF を解消 ※ SPF=Single Point of Failure

p-BLAST 設計（概要） p-BLAST 構成フロントエンド、マスターノード、クライアントノードフロントエンド：マスターノードへの処理要求マスターノード：処理の分割・統合。クライアントの管理クライアント：ファイルの保持・管理。分割されたタスクの実行フラットなネットワーク Client Nodes Master Node Frontend

p-BLAST 設計（マスターノード）マスターノード機能クライアントノード管理コネクション管理、統計情報管理、ファイル配置管理フロントエンドからのリクエストの処理分割・クライアントへの割り振り・統合 Client Nodes Master Node Frontend タスクの分割と実行リクエスト受付

p-BLAST 設計（クライアントノード）クライアントノード機能クライアント間のファイルの転送処理マスターノードへの統計情報の送信マスターノードから割り振られたタスクの処理 Client Nodes Master Node Frontend システム情報タスクの実行と返却

p-BLAST 設計（ファイル配置）新規配置コピー・（移動） Master Client Frontend (1) 問い合わせ (2) ノード指示 (3) ファイル送信 (4) ファイルリスト更新 Master Client (1) ファイルコピー指示 Client (2) ファイル送信 (3) ファイルリスト更新

p-BLAST 設計（ BLAST 処理） Command Execution Master Node Frontend Clinet Command Execution Command Execution Planner Executor Request Divider Merger Result Application Specific Routines

p-BLAST 設計（メッセージング）ノード間のメッセージには XML を利用 <?xml version="1.0"?> <submitJob> <executeCommand> <executable path="PATH" args="STRING" cwd="PATH"> <input> <stdin>STANDARD INPUT CONTENT</stdin> <file name="FILENAME" size="SIZE">FILE CONTENTS</file> </input> </executable> </executeCommand> </submitJob> <?xml version="1.0"?> <resultJob> <commandResult host="HOSTNAME"> <output> <stdout>STDOUT CONTENT</stdout> <stderr/> <hostname>HOSTNAME</hostname> <execTime>EXEC_TIME</execTime> </output> </commandResult>

評価 p-BLAST と mpiBLAST との比較評価項目単一リクエストの処理時間（レスポンスタイム）多重リクエストの処理能力（スループット） I/O 処理量パラメータノード数クエリサイズクエリ数

mpiBLAST local stoarge local stoarge local stoarge local stoarge shared stoarge (2) slave start (2) slave start (2) slave start (2) slave start (3) job assign (3) job assign (3) job assign (3) job assign (5) search (5) search (5) search (5) search (4) data copy (4) data copy (4) data copy (4) data copy (1) Query (7) Result (6)Results

実験実験内容レスポンスタイム計測スループット性能計測対象データベース nr 、約 1.5GB formatdb による分割（ 2/4/8/16/32/64/128 分割）実験環境（ノード） Pentium4/1.6GHz 、 256MB RAM 、 40GB IDE 、 100BaseTX 、 FreeBSD 4.7

結果レスポンスタイムオーバーヘッドスループット

レスポンスタイム評価方法単一クエリの検索速度を計測クエリサイズ（ 1kbp 、 2kbp 、 4kbp 、 8kbp ） (1) Query (3) Result (2) Process

レスポンスタイムスケーラビリティ

レスポンスタイム p-BLAST / mpiBLAST

オーバーヘッド検索時間 / 実行時間

考察（レスポンスタイム） p-BLAST 32 ノード前後までリニアにスケール 64 ノードにおいてオーバーヘッドと検索時間が拮抗長いクエリの検索ほど並列化メリットが大 mpiBLAST slave プロセスを起動するオーバーヘッドが大きい rsh 経由、ノード数に比例して増大ノード数に比例してエラー発生が増加

スループット評価方法１００個のクエリを連続して検索平均 4464bp 、分散 38087 処理時間とスケーラビリティ CPU 利用状況、 I/O 処理状況の計測 (1) Queries... (3) Results... (2) Process

スループットノード数と処理時間

スループット Standalone / 2-nodes

スループット Disk operations (8-nodes/standalone)

Physical I/O v.s. Memory cache

考察（スループット） p-BLAST 4 、 8 ノード前後から CPU 利用率が向上データの分割によるオンメモリ処理（物理 I/O の低減） Super-linear なスケーラビリティ（ 32 ノード以降は実装に難あり） mpiBLAST 16 ノード前後までリニアにスケールアップ Long-running な処理では MPI に強み（ Super-linear にならない理由を補完）ノード数が増えるとエラーが頻発し実行不可通常のデスクトップ PC という環境が原因

考察（まとめ） mpiBLAST MPI はレスポンスタイムの向上には寄与しないノード増加に比例したオーバーヘッド不安定な環境に弱い遊休リソースコンピューティングには不向き p-BLAST レスポンス・スループット向上に有効十分なスケーラビリティ不安定な環境に強いデータの冗長性、短い接続時間

まとめ遊休リソースコンピューティングと HPC アプリケーションのハイブリッド化は有効であるストレージが大きなボトルネックになっていたことを示し、その解決方法を示したデータ分割による並列度向上とオンメモリ処理化短時間のコネクション細かなノード管理今後、増加を続ける計算需要に適用可能

今後の課題マスターノードの動的なマイグレーションマスターの実行されるノードが動的に移動グループ化とカスケード接続多様なネットワーク形態他のアプリケーションへの適用計算 intensive なアプリケーション分散メモリ機能の提供

関連文献・研究 Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ.; Basic local alignment search tool.; J Mol Biol; 1990 Oct 5; pp.403-10. Aaron E. Darling, Lucas Carey, Wu-chun Feng; The Design, Implementation, and Evaluation of mpiBLAST; ClusterWorld conference 2003 Ian Korf, Mark Yandell, Joseph Bedell; BLAST; O'Reilly & Associates, Inc.; 2003 Growth of GenBank; Feb.2002; http://www.ncbi.nih.gov/Genbank/genbankstats.html Hong-Song Kim, Hae-Jin Kim, and Dong-Soo Han; Hyper-BLAST: A Parallelized BLAST for Speedup of Similarity Search; Akira Naruse, Naoki Nishinomiya, Kouichi Kumon, Masahito Yamaguchi; Hi-per BLAST: High Performance BLAST on PC Cluster System; Genome Informatics 13; pp.254-255; 2002 R.D.Bjornson, A.H.Sherman, S.B.Weston, N.Willard, J.Wing; TurboBLAST: A Parallel Implemetation of BLAST Built on the TurboHub; HiCOMB 2002 IBM; IBM Redbooks; Benchmark and Performance Analysis of TurboBLAST on IBM xSeries Server Cluster; 2002 永松秀人 , 廣安知之 , 三木光範 ; 相同性検索プログラム FASTA と BLAST に関する調査報告 ; ISDL Report No.20030608006; 2003 年 9 月 8 日

遊休リソースを用いた 相同性検索処理の並列化とその評価

More Related Content

What's hot

Viewers also liked

Similar to 遊休リソースを用いた 相同性検索処理の並列化とその評価

More from Satoshi Nagayasu

Recently uploaded