Your SlideShare is downloading. ×
オフィスツールの高性能化とモバイル化、ビッグデータ分析、DR(災害復旧対策)。特に最近では、これらの要因がデータ
量を急増させ、多くの企業を悩ませています。クラウドの IT 技術は、この課題を低予算に解決します。本ホワイトペーパー
では、クラウ...
一般的にクラウドでは、高価なストレージ装置を使うのではなく、
数十万円といった安価な汎用サーバーをハードウェアとし、それ
を、数百台、数千台並べ、分散処理ソフトウェアで統合制御して
います。これにより高い「経済性」を実現しています。
安価なハー...
しかし、この構造の場合、ファイル数が増え、それを格納する物
理的なハードウェアの容量が一杯になると困ったことが起こりま
す。たとえば、別のハードウェアにファイルを移し替えるとなる
と、ファイルのありかを示す情報が完全に変わってしまいます。
東京...
考えてみれば、これらの特徴をもつ「非構造化データ」をストレー
ジするためには、高性能であることは必要ありません。むしろ、
多種多様で膨大なデータを経済的に処理し、拡張性が高いことが
求められます。つまり、「クラウドスケール IT」のオブジェクト...
すでに企業で広く利用されています。つまり、現在企業が利用し
ているアプリケーションを取り換えたり、改修することなく、簡
単に Cloudian にデータを格納することができるのです。
(2)クラウドサービスからエンタプライズ IT まで、広い活...
(1)クラウディアンが考えるプライベートクラウド
プライベートクラウドについては、「仮想サーバー環境を企業内
で作ること」のように語られるケースも多く見かけますが、それ
はクラウド環境の一部を語っているに過ぎません。私たちは不特
定多数が利用す...
【図 3】企業 IT における Cloudian の活用
以下、この図 3 を説明してゆきます。
ログのストレージ:監視カメラの映像、行動履歴、通信履歴、
操作履歴、アクセス履歴等のログは膨大なデータ量になってゆき
ます。また、ログは書き換えた...
まとめ
Google や Amazon といった世界を代表するクラウドは、いま
企業 IT が直面しはじめた膨大な「非構造化データ」に早い時期
から対処してきました。この本物のクラウドが活用する IT 技術、
すなわち「クラウドスケール IT」...
Upcoming SlideShare
Loading in...5
×

ホワイトペーパー:企業が活用するオブジェクトストレージ入門

16,598

Published on

オフィスツールの高性能化とモバイル化、ビッグデータ分析、DR(災害復旧対策)。特に最近では、これらの要因がデータ量を急増させ、多くの企業を悩ませています。クラウドのIT 技術は、この課題を低予算に解決します。本ホワイトペーパーでは、クラウドのストレージ基盤に活用される「オブジェクトストレージ」の概要と、国内外で豊富な商用採用実績をもつソフトウェアベースのオブジェクトストレージ製品「Cloudian(クラウディアン)」について紹介します。

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
16,598
On Slideshare
0
From Embeds
0
Number of Embeds
13
Actions
Shares
0
Downloads
8
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Transcript of "ホワイトペーパー:企業が活用するオブジェクトストレージ入門"

  1. 1. オフィスツールの高性能化とモバイル化、ビッグデータ分析、DR(災害復旧対策)。特に最近では、これらの要因がデータ 量を急増させ、多くの企業を悩ませています。クラウドの IT 技術は、この課題を低予算に解決します。本ホワイトペーパー では、クラウドのストレージ基盤に活用される「オブジェクトストレージ」の概要と、国内外で豊富な商用採用実績をもつソ フトウェアベースのオブジェクトストレージ製品「Cloudian(クラウディアン)」について紹介します。 企業が活用するオブジェクトストレージ入門 急増するデータの悩み、クラウドの IT 技術で低予算に解決 企業が抱える急増するデータの悩み、3 つの要因 急増しているのは「非構造化データ」 大量の「非構造化データ」を扱うのがクラウド には、たとえば今後 10 年間分といったデータを保存する必要性 が生じています。分析スピードがビジネスの差別化につながると も言われ、リアルタイムに分析できることがますます重要になり、 これまでテープで倉庫に保管してきたようなデータもオンライン 活用できる対応が求められています。 (3)DR(災害復旧対策)に対する意識の高まり 東日本大震災以降、複数箇所にデータを保管する重要性が強く認 識されました。一箇所だけでは事業継続性の観点からリスクが高 いという経験を経て、複数地域のデータセンターにデータを複製 しておくことが求められています。これを単純に考えれば保管す るデータ量が倍になるということです。 これらの要因により、企業の IT 部門はひっ迫するストレージ容量、 増え続けるファイル数、長期化するデータ保管期間への対応、デー タ量増加に伴うシステムの性能劣化等に対処しなければなりませ ん。これは、ストレージ装置の増設・置換、データ移行作業や、バッ クアップ、アーカイブといったデータ管理コストの増大につなが ります。データ量が増えれば IT 予算も増えるという時代ではあ りません。従来の延長線にある仕組みとは異なる、新たな低コス トの解決策が求められています。 音楽、ログなど多種多様です。これらの多くが書き換えや更新の 頻度が少ない、若しくは更新されることが無いデータです。写真 が良い例でしょう。デジタルカメラやカメラ内蔵スマートフォン で多くの人が膨大な数の写真を撮りますが、一旦撮影し保存した 写真が更新されることはありません。新しい写真が次々と追加さ れるだけです。 企業活動においてデータが増え続けることから生じる悩みは尽き ることがありません。最近では、次の3つの要因がデータを急増 させていると言えるでしょう。 (1)オフィスツールの高性能化とモバイル化 各種オフィスツールが高性能化し、私たちが日常見かけるオフィ ス資料には、いわゆる「ファイルサイズが重い」写真や画像が当 たり前に使われるようになりました。また、タブレットやスマー トフォンの普及により、移動時間や出張先での作業も可能になり、 作成資料の数や、そのファイルをメールでやり取りする機会が増 えているのではないでしょうか。これを裏付けるように、多くの 専門アナリストが年率 50%以上でデータ量が増加していると述 べています。 (2)ビッグデータ分析に対する認知度の向上 Hadoop を始めとするビッグデータ処理ツールが身近になり、ま たビッグデータが生み出す新たな価値が理解されるにつれ、ビッ グデータ分析が注目を集めています。それに伴い、相関分析のた めに従来は活用されていなかったようなデータも大量に保存され はじめています。さらにライフサイクルにそった経年変化の分析 これらの課題解決にあたり着目するべきは、いま急増している データは、「非構造化データ」であるという点です。 この「非構造化データ」とは、一般的なリレーショナルデータベー スで扱うデータとは異なり、あらかじめデータの構造が定められ ていないデータです。それは、オフィス文書、写真、動画、画像、 この「非構造化データ」を大量に扱っているのがクラウドです。 たとえば、インターネットサービスの SNS は、何十万人、何 百万人という利用者が、文字情報を交換し、写真を共有し、動画 や音楽をアップロードしています。利用者がストレスを感じない よう、速く処理することも求められます。格安であったり無償の 広告モデルで提供されているサービスも多く、サービス運営は低 コストであることが絶対条件となっています。 Google や Amazon といった本物のクラウドでは、多種多様で 膨大なデータを迅速に低コストで処理する IT 技術が活用されて います。これを、本ホワイトペーパーでは「クラウドスケール IT」と呼ぶこととします。 1
  2. 2. 一般的にクラウドでは、高価なストレージ装置を使うのではなく、 数十万円といった安価な汎用サーバーをハードウェアとし、それ を、数百台、数千台並べ、分散処理ソフトウェアで統合制御して います。これにより高い「経済性」を実現しています。 安価なハードウェアの場合、故障する確率が高いとも言われてい ます。故障により、保存しているデータが消失しては困ります。 こういった事態を防ぐため、複数のサーバーにデータの複製をつ くることや、データを分割して配置することでシステム全体とし ての「信頼性」を高めています。 ひとつのサーバーが故障したことでシステム全体が停止してしま うことも困ります。いつでも利用できる「可用性」を維持する仕組みや、 故障したサーバーを取り換えさえすれば、自動的にシステムの一 部として機能しはじめる「弾力性」を備えていることが一般的です。 クラウドのような環境では、データがどのように増加するかを、 あらかじめ予測することは困難です。ある日突然、サービスが人 気を集め、大量のデータが押し寄せるということが起きます。そ のため、「データが一杯になったら高性能・大容量の装置に取り 換える」では間に合わず、「新しい装置を追加する」ことで、シ ステム全体の容量を増やすことができる「拡張性」が重要です。 このような仕組みは、スケールアウトと呼ばれています。 「クラウドスケール IT」で活用されるストレージ基盤がオブジェクトストレージ クラウド環境における階層構造の課題とは 【図 1】クラウドスケール IT この「クラウドスケール IT」のストレージ基盤として活用されて いるのがオブジェクトストレージです。 オブジェクトストレージは、Amazon では「Amazon S3」、ニ フティでは「ニフティクラウドストレージ」、NTT コミュニケー ションズでは「Biz ホスティング クラウド・エヌ オブジェク トストレージ」といったクラウドストレージサービスとして提供 されています。また、写真等のオンラインストレージサービスを 提供する NTT 東日本の「フレッツ・あずけ~る」のような、最 私たちが日常使うファイルシステムは、図 2 の左側に示すように ディレクトリやフォルダーといった階層があります。この構造は、 ある意味、人間の直感に合っています。つまり、地球があり、日 近では「Web スケール」とも呼ばれる大規模なインターネットサー ビスでもオブジェクトストレージが活用されています。 このオブジェクトストレージでは、オフィス文章、写真、動画等 のファイルを「オブジェクト」と呼びます。そして、これらのオ ブジェクト間の関係がフラットであり、階層構造がないという特 長があります。この構造ゆえに、クラウドで求められる可用性や 拡張性といった要件が実現できます。 本があり、東京があり、渋谷があるという流れで目的地に到達で きるため、たいへんにわかりやすいと言えるでしょう。 【図 2】ファイル構造とオブジェクト構造 分散処理ソフトウェアが多数のノードを統合制御 信頼性 経済性 可用性 広域網 拡張性 データを複製 ノード追加で 容量拡張 データセンター1 データセンター2 VolumaA/MyFolder/Favorite/Music http://s3.cloudian.com/abc123def4.... VolumaB/John/Music フラットにファイルを格納 ファイル構造 オブジェクト構造 2
  3. 3. しかし、この構造の場合、ファイル数が増え、それを格納する物 理的なハードウェアの容量が一杯になると困ったことが起こりま す。たとえば、別のハードウェアにファイルを移し替えるとなる と、ファイルのありかを示す情報が完全に変わってしまいます。 東京から埼玉に引っ越せば住所が変わってしまうことと同じで す。そのたびに、住所変更のお知らせをしなければなりません。 クラウドのような環境では、何万人という利用者が使い、急激に データ量が増えるといったことが当たり前におこります。その一 方で、データをストレージする物理的なハードウェアの容量には 制限があります。容量が一杯になるたびに、利用者に住所変更の お知らせをすることは運用者にとって大きな手間がかかります。 利用者にとっても、ある日、ファイルの格納場所がわからなくな り、アクセスできないといったことも起きてしまうかもしれませ ん。 フラットな構造のオブジェクトストレージ 属性情報(メタデータ)の役割 オブジェクトストレージでデータ急増の悩みを解決 オブジェクトストレージは、図 2 の右側に示すように階層構造が ありません。オブジェクト毎に ID(識別子)が与えられますが、 このIDには「東京」といった場所情報が含まれていません。つまり、 データがどのハードウェアに格納されていても、どこに引っ越し をしても ID は同じということです。 ファイル構造を住所情報が必要な手紙にたとえるならば、オブ ジェクト構造は電子メールのようなものです。たとえば、東京か ら埼玉に引っ越しすると、住所情報を含む手紙の場合には宛先不 明になるかもしれません。電子メールであれば住所変更しても、 なんら影響なくメールが届きます。 オブジェクトストレージのもうひとつの大きな特長に、オブジェ クト毎にデータを効率的に管理するための属性情報(メタデータ) をカスタマイズして付けることができるという点があります。 オブジェクトに属性情報を付けることで、一定期間経過後、オブ ジェクトを消去したり、アクセスできる利用者を制限するといっ たことができます。属性情報の活用例のひとつとして、図 3 に Cloudian の自動階層化機能のスクリーンショットを紹介してい ます。これは Cloudian に格納したオブジェクトを一定期間経 過後、Amazon S3 や超低価格のアーカイブサービス Amazon Glacier に移動するという機能です。オブジェクトに属性情報を 付与することで実現しています。 現在、一般的に企業 IT で活用されているストレージは、SAN と 呼ばれるブロックストレージ、NAS と呼ばれるファイルストレー ジです。これらのストレージは、処理性能が高く、迅速な更新処 理が求められるデータベースのデータ等を格納するために活用さ れています。ただし、これらのストレージは企業構内において近 距離の高速なネットワークで接続されることを前提としていま す。インターネット経由や、多地点の複数データセンター間での データのやり取りに適しているとは言えません。オブジェクトス このオブジェクト ID は、一般的にインターネットで使われる URL が付与されることが多く、相手にこの URL を知らせるだけ でオブジェクトを読み出すこともでき、インターネットで便利に 使うことができます。 また、オブジェクト単位で複製し信頼性を高めたり、物理的なサー バーを追加するだけでシステム全体の容量を拡張したり、複数 データセンター間でオブジェクトをやり取りしたりということが 簡単にできるようになります。一方、クラウドのような多数のサー バーが並ぶ環境のなかで、階層構造を維持することの難しさは直 感的に理解していただけると思います。 トレージは、その逆です。性能はこれらのストレージに比べ落ち ますが、更新頻度の少ない「非構造化データ」をクラウドのよう に広域網を経由する環境でやり取りすることに適しています。 さて、いま急増しているのは「非構造化データ」であると説明し ました。この「非構造化データ」のうち、更新の必要のないデー タはコールドデータ、頻度の少ないデータはクールデータとも呼 ばれ、データ全体の 70%を占めるとも言われています。 【図 3】Cloudian における属性情報の活用例 3
  4. 4. 考えてみれば、これらの特徴をもつ「非構造化データ」をストレー ジするためには、高性能であることは必要ありません。むしろ、 多種多様で膨大なデータを経済的に処理し、拡張性が高いことが 求められます。つまり、「クラウドスケール IT」のオブジェクト ストレージが適しているのです。 これまで、オブジェクトストレージは大量データを対象とし、コ ンテンツを膨大に抱えるメディア業界や政府、研究等の専門的な 領域で利用され、一般企業にとって身近な製品とは言えませんで した。そのため、SAN や NAS といった従来型のストレージ装置 しか選択肢がなく、コールドデータやクールデータのストレージ にも高性能の装置を使い続けてきたというのが現実です。しかし、 いまや、これから紹介する Cloudian のように手軽に利用できる オブジェクトストレージ製品が登場してきました。低予算で企業 が抱える急増データの課題を解決できるのです。 オブジェクトストレージの使いどころ オブジェクトストレージの代表的なソフトウェア製品「Cloudian」 (1)オンライン活用するデータ ここまで説明してきたように、更新頻度が少ない、若しくは更新 することが無いものの、オンラインで活用するデータは、オブ ジェクトストレージの使いどころです。典型的な例がバックアッ プデータです。企業 IT システムのデータには必ずバックアップ を用意しますが、必要な際にはオンラインですぐに読み出すこと が求められます。しかし、その一方で、万が一のためのバックアッ プにコストをかけたくないというのが企業の本音です。 また、企業にはオフィス資料、イベントやプロジェクトの記録写 真、機械による画像記録、建築物・機械・装置等の設計図面、各 種実験等の動画記録等々、オンライン活用が求められる膨大な数 のファイルがあります。こういったデータの保管にオブジェクト ストレージを活用することで IT システム全体のコスト低減につ ながります。 特に最近では、モバイル環境やブロードバンド環境が整ったこと により、外出先、自宅、遠隔オフィス等、広域から社内ファイル システムにオンラインでアクセスする機会が増えています。従来 のファイルシステムは広域、分散環境への対応は得意ではありま せん。このようなファイル共有・同期には、オブジェクトストレー ジが適しています。 (2)安全に大量に保管するデータ コンプライアンスの要請や証拠書類として保存が義務付けられて いるデータ量は年々累積し増加してゆきます。これらのデータは テープに移し倉庫で長期間保管されることが一般的です。しかし、 テープ保管は、いざ必要な時には保管倉庫から運搬するといった 人手もかかり、すぐに読み出すことができません。テープ保管に Cloudian は国内外の商用クラウドストレージサービスのスト レージ基盤に活用されている、ソフトウェアベースのオブジェク トストレージ製品です。 汎用的な IA サーバーをハードウェアとし、OS には Linux を使い ます。汎用的なサーバーの価格は、年々高性能化し高集積化しな がら、その値段を下げており、1 台あたり数十万円でも数十テラ といった内蔵ディスクを搭載しています。このようなハードウェ アを使うことで低コストのオブジェクトストレージシステムを構 築することができます。 合わせてオブジェクトストレージを活用することで、これらの データをオンラインで簡単に活用できるようになります。 特に Cloudian であれば、複数データセンターにデータ複製を行 い、自動的に複数地域に分散し保管できるため、遠隔の倉庫にテー プ運搬するような作業も不要です。データを安全に大量に保管し ながらも必要な時にすぐ使えるアクティブなアーカイブにオブ ジェクトストレージは最適です。 (3)ビッグデータ分析のための大量データ ビッグデータ分析は、その名のとおり膨大な量のデータを分析す ることです。Hadoop のようなビッグデータ処理ツールが身近に なったことに加え、センサーの小型化やモバイルネットワークの 普及に伴い、これまで収集することが難しかった人間・装置・車 等機械の移動、ビルや橋梁といった構造物の変化などのログデー タまでもが分析の対象となりはじめています。 この膨大な量のデータ解析には、一時的に多数のコンピューティ ングリソースが必要となるため、パブリッククラウドを活用する 事例も増えています。その一方で、データを外部に預けられない という事情がある企業も多く、その場合にはデータは、自社管理 できる企業構内やデータセンターに保存しておくという対応も増 えてきそうです。 これらのデータは 1 年で捨てられるわけではなく、経年変化をみ るために貯め続けられ、将来に亘りどれだけ増えてゆくのか予測 するのも難しいとも言えます。こういった大量データの保存には、 拡張性高く、経済的なオブジェクトストレージが活用されること になるはずです。 【図 4】IO データ社製 NAS と Cloudian の接続例 IOデータのNAS製品HDL-XRWシリーズ とCloudianの接続例 Cloudianからのアクセスキー・シークレット キーを入力し、エンドポイントをCloudianに 向けるだけで接続 4
  5. 5. すでに企業で広く利用されています。つまり、現在企業が利用し ているアプリケーションを取り換えたり、改修することなく、簡 単に Cloudian にデータを格納することができるのです。 (2)クラウドサービスからエンタプライズ IT まで、広い活用範囲 さらに重要な Cloudian の特長は、非常に活用範囲が広いという 点です。他製品には1PB(ペタバイト)規模のデータ量からの利 用を前提としている製品もありますが、Cloudian は汎用サーバー 2 台規模から利用開始することができます。このように企業 IT の データ規模からスモールスタートできる一方で、すでに多くの国 内外商用クラウドストレージサービスに採用されているように、 サーバー台数を追加するだけで大規模なクラウドサービスにまで 拡張することができます。 統計、課金、利用者、利用量等管理機能もパッケージされており、 これらの管理機能を別途開発したり調達したりという必要無しに ターンキーで利用開始できるという点も強みです。サービスプロ バイダーが短期間でクラウドストレージサービスを開始できるこ とはもちろんですが、企業利用においても部門予算管理等のため に、別途アプリケーションを開発する必要もありません。 (1)Amazon S3 の API に完全準拠 この Cloudian の重要な特長は、クラウドストレージの事実上の 標準となっている、Amazon S3 の API に完全準拠しているとい うことです。 他製品でも S3 API を提供しているという製品はありますが、デー タの読み書きといった基本的な API を提供しているだけです。 Cloudian は、バージョニング、マルチパートアップロードといっ た高度な操作ができる API までも実装しており、質量ともに準拠 しているという点が大きく異なります。 特に質という点では、数多くの Amazon S3 を利用しているア プリケーションや製品との相互接続検証がされ、そのいずれもが Cloudian にデータの保存先を向けるだけで簡単に接続できてい ます。図 4 は最近発表した IO データ社製の S3 対応 NAS との接 続方法です。このように、アクセスキー・シークレットキーを入 力し、エンドポイントというデータの格納先を Cloudian に向け るだけで、NAS から Cloudian にデータをバックアップできます。 このような S3 対応のエンタープライズ向け製品は数多くあり、 パブリッククラウドに採用されている Cloudian Amazon S3 の API に完全準拠する Cloudian は、ニフティや NTT コミュニケーションズ等の日本の代表的なクラウドサービス のストレージ基盤に活用されています。また、米国ではホスティ ングサービスやデータセンターを提供している数多くの事業者 が、地域密着型のクラウドストレージサービスを提供するために 採用し始めています。欧州各国では国外にデータを預けることに 制約があるとのことで、Cloudian を採用したクラウドストレー ジサービスを国内で提供する動きが活発化しています。 この Cloudian は、クラウドコンピューティングサービス基盤を 提供するソフトウェア製品、CloudStack や OpenStack とも連 携しています。たとえば、CloudStack からサインオンすれば自 動的に Cloudian もサインオンできるシングルサインオンや、仮 想サーバーのスナップショット、イメージ、テンプレート等を保 存しておくセカンダリストレージとして利用できます。つまり、 CloudStack や OpenStack でクラウドコンピューティングサー ビスを提供しているクラウドサービスや、これから紹介するプラ イベートクラウドにおいても簡単にオブジェクトストレージをメ ニュー追加できるのです。 Cloudian をプライベートクラウドのストレージ基盤に活用 ストレージ基盤における活用についてから紹介します。Cloudian は国内外のパブリッククラウドだけではなく、図 1 に 示すように幅広く活用できます。まず、プライベートクラウドの Cloudianの適用領域 S3 Cloud Object Storage サービスプロバイダー エンタープライズIT パブリッククラウド プライベートクラウド ハイブリッドクラウド ● Amazon S3と同等の クラウドストレージ サービス ● クラウドコンピューティ ング基盤(CloudStack、 OpenStack)のセカン ダリ・ストレージ ● 写真等オンラインスト レージなどのストレージ 基盤 ● 企業内・グループ内・コ ミュニティのクラウドス トレージ基盤 大量のコールドデータを 低コストで格納 ● データバックアップ ● アーカイブ(E メール等) ● ファイル同期・共有 ● NAS・SAN ストレージの  拡張と階層化 【図 1】Cloudian の適用領域 5
  6. 6. (1)クラウディアンが考えるプライベートクラウド プライベートクラウドについては、「仮想サーバー環境を企業内 で作ること」のように語られるケースも多く見かけますが、それ はクラウド環境の一部を語っているに過ぎません。私たちは不特 定多数が利用するパブリッククラウドとまさに同じ環境を、企業 内、グループ内、コミュニティ内といった特定の利用者専用に提供 するクラウド環境こそがプライベートクラウドだと考えています。 それは、前編で説明したクラウドスケール IT の条件を、プライベー トクラウドが満たしていることです。仮想サーバー環境があった としても、たとえばデータを格納するストレージには拡張性がな かったり、複数データセンターにデータを分散し格納したり、複 製できないような環境を、プライベートとは言えクラウド環境で あると称するのは少し違うと考えているということです。 設備の設置場所だけに着目して、企業構内、つまりオンプレミス に構築することをプライベートクラウドと呼ぶ場合もあります。 これも私たちの考え方とは違います。サービスプロバイダーが、 そのデータセンターに特定のお客様専用に隔離したクラウド環境 を作り、サービスとして提供する場合もプライベートクラウドだ と考えているからです。これらは、マネージドプライベートクラ ウドやホステッドプライベートクラウドとも呼ばれています。 さらに、「Web スケール」と最近総称される、インターネット上 で展開される大規模なサービスのストレージ基盤としての利用も プライベートクラウドに含まれると考えています。そのサービス 利用者専用であり、プライベートともいえるクラウド環境だから です。特に、パブリッククラウドを利用して Web サービスを小 規模にスタートし、規模が大きくなった時点でプライベートクラ ウドに移行してゆくといったケースが今後増えてくると考えてい ます。 ンと Cloudian のオブジェクトストレージを組み合わせ、外部に データを預ける必要のないプライベートクラウドを構築すれば、 企業 IT 部門がデータ管理できる自社専用のファイル管理サービ スを社員に提供できるのです。 パブリッククラウドを利用したクラウドサービスの場合には、官 公庁や大手企業、個人情報を扱うお客様に利用いただけないとの 話は、いくつものサービスプロバイダーから聞こえてきます。ク ラウドサービスの利便性が広く理解されるにつれ、同様の声はま すます増えてくることが考えられます。このようなジレンマは、 お客様の企業構内や専用データセンター内にプライベートクラウ ドを構築することで解決してゆくことになるでしょう。 【図 2】Fileforce のユーザーインターフェース Amazon S3 を利用するサービス、アプリケーション、アプライ アンス等は、数百種類はあると言われています。そのため、利用 者にとっては、Cloudian が Amazon S3 の API に完全準拠して いることで、すでに活用している S3 対応アプリケーションをそ のまま利用できるというメリットがあります。アプリケーション を開発する立場からすると、S3 に対応したアプリケーション開 発の経験者が多いことに加え、開発するための情報や共同開発等 ができるパートナー、相互接続できる仲間が多いというメリット があります。 また、アプリケーションを提供するクラウドサービス、SaaS (Software as a Service)のアプリケーションをプライベート環 境に転用し活用できる可能性が広がります。 図 2 で紹介しているのは、クラウドサービスとして提供されてい るファイルマネジメントサービス「Fileforce(ファイルフォース)」 のユーザーインターフェースです。 Fileforce は Dropbox のようなファイル同期・共有ができるサー ビスですが、不特定多数の利用者(コンシューマ)を対象とする ものではありません。法人向けのサービスであり、高いセキュリ ティを備えています。ファイルのストレージには、Cloudian を 採用するニフティ、NTT コミュニケーションズ等のパブリックク ラウドを利用しています。 最近、大手企業等においては、コンプライアンス等の観点から データを外部に預けられないといった事情があり、パブリックク ラウド利用に踏み切れないというケースを聞くことが増えてい ます。このようなお客様のニーズに対応するため、Cloudian と Fileforce はプライベートクラウド環境での接続試験を実施し、 相互接続性を公式認定しています。Fileforce のアプリケーショ (2)Amazon S3 API に完全準拠する Cloudian プライベートクラウドのメリット クラウド型ファイルマネジメント サービス「Fileforce」 エンタープライズ IT における Cloudian の活用パターン ここまでプライベートクラウドにおける Cloudian の活用につい て説明してきましたが、一般の企業 IT 部門が企業構内(オンプ レミス)のオブジェクトストレージとして Cloudian を活用する パターンを紹介したのが図 3 です。 6
  7. 7. 【図 3】企業 IT における Cloudian の活用 以下、この図 3 を説明してゆきます。 ログのストレージ:監視カメラの映像、行動履歴、通信履歴、 操作履歴、アクセス履歴等のログは膨大なデータ量になってゆき ます。また、ログは書き換えたり更新されたりするものではなく、 大量に貯めておく一方で、必要な際にはオンラインですぐに活用 できることが求められます。こういったデータを高価で高性能な ストレージ装置に保存しておく必要はありません。まさに高い 拡張性と経済性を実現する Cloudian のようなオブジェクトスト レージが適しています。 ビッグデータ分析データ:ビッグデータ分析に利用されるオー プンソースの Hadoop MapReduce( マップリデュース ) は S3 インターフェースを備えています。そのため、Hadoop 専用の 分散ファイルシステムである HDFS(Hadoop Distributed File System)を使わず、Cloudian にデータを直接保存してしまうと いう方法があります。こうすることで、Hadoop MapReduce 以外の目的にデータを使う場合にも、HDFS から他のストレージ に移し替える手間や、別途ストレージを準備する必要もなくなり ます。つまり、ビッグデータ分析のためだけの特別なストレージ 領域が不要となり、企業の IT コスト効率を高めることができます。 ファイル同期・共有:先に紹介した Fileforce のようなファイ ル同期・共有アプリケーションのファイルを格納するストレージ に Cloudian は適しています。ファイル量が増加し、ストレージ 装置の物理的な容量が一杯になり、高性能・大容量の装置に取り 換えたり、そのストレージ装置の障害に備えたバックアップ用シ ステムの心配をする必要もありません。 前編で説明したように、企業構内で利用されることを前提と している SAN や NAS といったストレージ装置とは異なり、 Cloudian のようなオブジェクトストレージは、遅延が生じるモ バイルやインターネットといった広域網経由でファイルにアクセ スすることに適しています。オブジェクト ID が URL であれば、 インターネット経由でファイルをやり取りすることも簡単に行う ことができます。 バックアップ:バックアップとは、ファイルサーバーに障害等 があっても重要なファイルが消失しないよう複製データを別の装 置やテープに保管しておくことです。このバックアップは、企業 で導入検討される際、収入増につながるものではなく、万が一の ためであり、そこにかかるコストは最小限にしたいというのが本 音でしょう。実際のところ、高価なストレージ装置をバックアッ プデータのストレージに使用するケースが多く、ミラーシンク のオプションソフト購入が必要なケースもあります。S3 対応の バックアップ用アプリケーションを使い、バックアップデータを Cloudian に格納すれば、バックアップも含むシステム全体とし てデータ管理コストを適正化できます。 一般的に企業では長期間のバックアップはテープに保存していま す。ただし、そのテープを遠隔地の倉庫等に保管してしまえば、 読み出しに手間と時間がかかってしまい、簡単には活用できない、 いわゆる死蔵データとなってしまいます。そのため、テープ保管 ログ データ メール ビッグデータ分析 ファイル 同期・共有 アーカイブ 階層化 バックアップ ハイブリッドクラウド 地域分散 AWS S3 Glacler ビッグデータ分析ビッグデー 地域分散 しながらも、オンラインで利用する可能性のあるバックアップ データは Cloudian を使い、オンラインで活用できるようにして おくことが望ましいと言えます。 なお、PC データをバックアップする手軽なアプリケーションも S3 対応しています。また、IO データ社製のような小型 NAS も S3 に対応しており Cloudian に自動バックアップ可能です。 アーカイブ:アーカイブとは、データを整理し、かつ改ざんで きないように長期間安全に保存しておくことです。利用例では E メールのアーカイブが代表的です。多くの企業では各社員あたり のメールボックスサイズに制限を設け、その制限サイズになる と、社員が自らローカルの PC や外付けハードディスク等にダウ ンロードし保管しているという話を聞きます。メールボックスは データ量が増えてくると性能が劣化します。その一方でメール ボックス拡張にはコストがかかるため、社員にサイズ制限を強い ることにより対応しているのが現実です。 今後、メール数が減るとは想定しにくく、社員の手元で保管され る過去のメール量は累積し増える一方でしょう。社員にこのよう な手間をかけさせたり、その手元に大量の過去データがあるとい う状況は、企業 IT 部門としても決して好ましい状況とは考えて いないはずです。S3対応のアーカイブ用アプリケーションを使い、 適切なタイミングで自動的に Cloudian にアーカイブしておけば、 社員や企業 IT 部門の手間を軽減できるはずです。 階層化:ストレージにおける階層化とは、データの種類や利用頻 度に応じて複数のストレージ装置に階層を設けることです。つま り、一定期間が経過したり、利用されることが少ないデータは、 高価で高性能ストレージから比較的安価なストレージ装置に移行 するといった具合に、ストレージ装置を使い分けるということです。 クラウドゲートウェイと呼ばれる、SAN や NAS 等、ストレー ジ専用装置に用いられるプロトコルと S3 との変換アプリケー ションを使えば、ストレージ専用装置から自動的にデータを Cloudian に移行することができます。また、S3 対応のスト レージ階層化用アプリケーションを使えば、ストレージの階層に Cloudian を加えることができます。たとえば、大量の「非構造 化データ」は Cloudian に格納することで、ストレージシステム 7
  8. 8. まとめ Google や Amazon といった世界を代表するクラウドは、いま 企業 IT が直面しはじめた膨大な「非構造化データ」に早い時期 から対処してきました。この本物のクラウドが活用する IT 技術、 すなわち「クラウドスケール IT」のストレージ基盤がオブジェク トストレージです。Cloudian は、Amazon S3 API 完全準拠の ソフトウェアベースのオブジェクトストレージ製品です。急増す るデータの課題を解決するために、大規模クラウドからエンター プライズ IT まで幅広いシーンで活用いただけます。特に企業が Cloudian を使えば、企業内、グループ内、コミュニティ内といっ た特定の利用者専用に提供する、パブリッククラウドと同じ環境 のプライベートクラウドを構築運用できます。エンタープライズ IT の分野においては、すでに数多くの S3 対応アプリケーション が存在しています。これらのアプリケーションと Cloudian を組 み合わせて活用することで、データ急増により、企業 IT 部門が 直面するさまざまなシーンにおける課題を解決できるのです。 全体としてのコスト最適化をはかることができます。 地域分散:東日本大震災以降、地域・広域分散した複数データセ ンターにデータを複製し安全に保管する必要性が強く認識されて います。従来型のストレージ装置では、複数データセンターに対 応する場合、同じ装置やシステムを 2 重に用意し、非同期、手動 でデータ複製を行うことが一般的です。そのため、あるタイミン グでは、複数データセンターの一方には、最新データが保存され ているものの、もう一方では、そのデータが保存されていないと いうケースも起こります。Cloudian は複数データセンター間で、 同期・非同期を選択し、データ複製を行うことができます。広域 に Cloudian ノードが分散されてもネットワーク経由で複製デー タを経済的に分散配置しておけます。さらに、次に紹介するパブ リッククラウドもデータの分散保管先としても加えることで、2 重、3 重にデータを保護することができるのです。 ハイブリッドクラウド:Cloudian には、保存したデータを自 動的に Amazon S3 や Amazon Glacier に移動する自動階層化 (AWS Auto Tiering)機能が備わっています。特に Amazon Glacier は超低価格であり、データを経済的にアーカイブしてお くことができます。ただし、パブリッククラウドであるため、外 部に預けることができないデータのアーカイブに使うことに抵抗 があるというケースがあります。また、読み出しに時間がかかる ため、速い処理を求めるデータの保存にも適していません。 そういったデータは、Cloudian で企業構内に構築したプライベー トクラウドやオブジェクトストレージに保管し処理することが望 ましいと言えます。このように、Cloudian であれば、パブリッ クとプライベートクラウドをデータの目的や種類に応じてハイブ リッドに使い分けることも可能となります。 Cloudian は、2011 年 7 月に商用版リリース以降、国内外のクラウドサービスやエンタープ ライズ IT に採用されている、ソフトウェアベースのクラウド・オブジェクトストレージ製品 です。Amazon S3 に完全準拠する API を備えており、数多くの S3 対応アプリケーションや ツールとの接続性が検証済みです。パブリッククラウド、プライベートクラウド、ハイブリッ ドクラウド、エンタープライズ IT と幅広い分野のストレージ基盤として活用できます。 Web: www.cloudian.jp Twitter : www.twitter/Cloudian_KK Facebook: www.facebook.com/cloudian.cloudstorage.S3 Slideshare: www.slideshare.net/geminimobile お問い合わせ 住  所:〒150‐0002 東京都渋谷区渋谷2-11-6 ラウンドクロス6階 電  話:03‐6418‐6466 Eメール:info@cloudian.com クラウディアン株式会社 8

×