Panasas_idensi
- 2. Panasas導入のきっかけは米国研究所での実績、Panasas導入の鍵は「アプライアンス」であったこと。
理化学研究所の次世代シーケンサーから送られてくる解析データは、1回
で200ギガバイトは超えるだろうという予想をし、それをいったんストレージに保管して
から大規模なPCクラスタで計算処理を行い、結果を他の研究者の方々に公開して
いく。そういった流れの中で、ストレージには図のような3つの目的を持って選択を
行いました。一時保管のためのコストパフォーマンス重視のNAS接続ストレージ、
運用での安定性・信頼性を目的としたFC-SAN接続のストレージ、そしてPCクラスタ
構成で威力を発揮するファイルシステムのパラレルストレージという3タイプです。
それぞれ1ペタバイト、300テラバイト、100テラバイトの容量を想定してシステム
設計が始まりました。そもそも私たち日立製作所がPanasasのことを知るきっかけに
なったのは、五條掘先生が米国のNCBI(National Center for Biotechnology
■Panasas ActiveStor が採用された国立遺伝学研究所内の
セルイノベーション データ解析拠点システム
http://cell-innovation.nig.ac.jp/
Pa na sas
ActiveStor
門間氏 Information)での導入をご存知でして、それをお聞きしたことから始まります。高
性能な分散ファイル共有システムのストレージ製品は数が少なく、競合製品と比べて
も、コストパフォーマンスは同等以上で問題はありませんでした。
こうした大規模な研究システムでは、通常は専任の管理者を何人も置い
て運用するわけですが、可能な限りストレージの設計・設定から障害があったときの
原因の解明やメンテナンスまで管理が容易な製品を選択したいと考えていました。
なぜなら、ハードウェアのメンテナンスや障害対応に時間をとられすぎると、本来行う
べき研究成果に結びつく活動の時間が奪われてしまい課題が増えるからです。その
点、Panasasはアプライアンスですから運用管理の手間がかからず、競合製品には
ないメリットがあり導入を決意しました。
時岡氏
I/Oのボトルネック解消だけでなく、本格運用に向けてサポートのボトルネック解消にも期待。
PCクラスタでの分散ファイルストレージを想定していましたので、Panasasの
1シャーシ当たり600MB/secのバンド幅も重要な要素でした。今回は4つのシャーシで
構成していますので、合計で最大2.4GB/secものバンド幅になります。競合製品で
最後まで検討したGPFSの階層化ストレージはデータに合わせてFCやSATAに振り
分けて使えるので、それはそれで性能は合格していたのですが、データをどう振り
分けるのか?ドライブごとのチューニングはどう最適化するのか?運用が複雑になる
のが問題でした。その点、Panasasはデータの大小でRAID構成を自動で分けて
くれるとか、障害が起きると自動で切り替えてくれるなど使いやすさが際立ってい
ます。ストレージの運用を高度に管理すれば当初の性能がでる製品はありますが、
それでは我々の目的には合致しませんでした。Panasasは、1クライアントからの読み
書き性能がきわめて高速な点も期待しています。今はまだ解析シーケンサーの運用
がピークに達していないため、PCクラスタに届くデータがそれほど大規模ではなく、
Panasasの能力が十分に発揮されているとはいえないかもしれません。今年後半から
来年にかけて解析データが本格的に送られてきたときのPanasasの本領発揮ぶりを
期待しています。また、クラスタシステムの場合、大規模なストレージのファイルを共有
するメリットというのはあります。同じ処理を並列に行った場合、プログラムの特性として
ファイルのI/Oを要求するのは一部分なのですが、同時に並列処理をすると瞬間的に
負荷が上がる状況が生まれます。そういったときには、Panasasのようなパラレルスト
レージは有効だと思います。ですから、共通に参照されるような解析データなどは
Panasasに配置しています。
門間氏 Panasasはパラレルでの処理が間に合わないような本格的な解析状況が
生じたときでも、ストレージのI/Oのボトルネックを気にせずに利用できるのではないか
と思っています。
Lustreなどは、導入後半年ぐらいはチューニングに時間がかかると聞い
てますから、Panasasは本当に手間がかからず、管理画面もどこを見ればいいか
わからないなどということもなく非常にシンプルでいいですね。導入から運用まで2日∼
3日で終えました。また、Panasasはメタデータを管理するディレクターブレードを3枚
装備しているのですが、本格運用になったときに万一障害が発生しても、運用を続け
ながら障害ブレードを外して交換ができるので安心です。現在、3ヶ月くらい運用して
いますが、初期不良によるディスクの故障が1回あったただけで、故障率は低くて満足
できるレベルです。高性能なストレージになればなるほど何かあったときに復旧に手間
と時間がかかるものですが、Panasasは違います。製品だけでなく、CTCSPの
サポート体制にも期待しています。海外製品に多く見られる、「日本のサポート担当
が少ない」「本国のエンジ
ニアが来るのを待つ」「最
新の情報がなかなか入手
できない」など、サポートの
ボトルネックも生じないよう
にがんばってください。
時岡氏
門間氏
開発・製造元
※本カタログに記載の会社名、商品名は、各社の商標または登録商標です。本カタログに記載の仕様については、予告なしに変更することがあります。
本 社:〒154-0012 東京都世田谷区駒沢1-16-7
TEL.03-5712-8070 FAX.03-3419-9679
http://www.ctc-g.co.jp/ ctcsp/
sp-admin@ctc-g.co.jp
国内販売代理店
・霞が関:TEL.03-6203-5190
・大 崎:TEL.03-6417-5950
・名古屋:TEL.052-203-2239
・大 阪:TEL.06-6151-8860
・福 岡:TEL.092-734-6251
High performance
Capacity:164TB
Large capacity
Capacity:1,280TB
Blade Server 10 servers
NAS Storage
株式会社日立製作所様
公共システム事業部 学術情報ソリューション本部
学術情報システム部 生命科学システム第二グループ
課長 理学博士 時岡良 氏 技師 門間則和 氏
国立遺伝学研究所 生命情報・DDBJ研究センター 遺伝情報分析研究室 様 導入事例
High reliability
Capacity:378TB
FC-SAN Storage System
Internet
Web service sys.
Tracking Sys.
Web Sys.
Portable Strage
Normal speed line
(1Gbps)
Internet Backbone
Firewall
Data transfer sys.
Delivery
Blade Server 15 servers
Analysis pipeline sys.
Alignment
Blade Server 15 servers
SMP server
1 server
Large scale analysis sys.
Assemble
Pipeline
10Gbps
Ethernet
4Gbps
FibreChannel
Parallel Storage
国立遺伝学研究所 設置写真