ITpro EXPO版「データセンター視点で比較したクラウドの内側」

4,041 views

Published on

ITpro EXPO 2009で行った30分の講演のスライドです。
講演の動画は、2009年12月10日に「ITpro EXPOバーチャル『クラウド・フェスタ』」で公開しますので、よろしければご覧下さい(http://special.nikkeibp.co.jp/ts/article/0ia0/104160/)

Published in: Technology
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
4,041
On SlideShare
0
From Embeds
0
Number of Embeds
29
Actions
Shares
0
Downloads
97
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

ITpro EXPO版「データセンター視点で比較したクラウドの内側」

  1. 1. ITpro EXPO 2009 クラウドスペシャル 2009年10月30日 データセンター視点で比較した クラウドの内側 日経コンピュータ編集部 中田 敦
  2. 2. 講演者 中田 敦(なかだ あつし) 「日経コンピュータ」編集部所属 1998年4月 日経BP社入社、「日経レストラン」編集部に配属 2000年9月 ITニュースサ゗ト「BizTech」編集部に異動 2002年10月 「日経Windowsプロ」編集部に異動 2006年1月 ITニュースサ゗ト「ITpro」編集部に異動 2008年4~6月 米国でクラウド・コンピューテゖング事情を取材 2008年10月 「日経コンピュータ」編集部に異動 2009年4月 「クラウド大全」刊行
  3. 3. 日経コンピュータの クラウド担当 2009年 7月8日号 2009年 4月29日号 2008年 11月15日号
  4. 4. 日経コンピュータの クラウド担当 日経BP社発行 2520円 Amazon Google Salesforce.com Windows Azure 楽天、Yahoo! 全部入ってます 中田も 執筆しています
  5. 5. Googleは異形のメーカー
  6. 6. 一番お伝えしたいこと クラウド・コンピューテゖングの 「導入目的」は コスト削減
  7. 7. 一番お伝えしたいこと クラウド・コンピューテゖングの 「導入目的」は コスト削減 ではない
  8. 8. 問題意識 ユーザーはなぜクラウド・コンピューティングのサービスを使うのか? (誤解) Webブラウザで使えるから (誤解) 安価だから (正答) クラウドが提供するゕプリケーションの方が高速だから デスクトップ検索 Web検索 Outlook 2007 Gmail カーナビ Google Maps RSSリーダー Googleリーダー Windowsフォトギャラリー Picasa Webゕルバム
  9. 9. 「サーバーで動かすソフトウエゕ」の どこがいいのか? 例えば Gmail ●巨大な容量 無料版でも最低5Gバ゗ト ●高速な検索 どんなに大量にメールが あっても1~2秒で検索 ●どこからでも使える Webブラウザ 携帯電話機
  10. 10. 「サーバーで動かすソフトウエゕ」の どこがいいのか? 例えば Google Maps ●巨大な容量 全世界の地図 全世界の航空写真 主要都市の街頭写真 ●高速な検索 全世界の地図を 1~2秒で検索 ●どこからでも使える Webブラウザ 携帯電話機
  11. 11. 「サーバーで動かすソフトウエゕ」の どこがいいのか? ●2000年代後半 「パソコン」以外でも、ゕプリケーションが利用可能に ご存じ Apple「iPhone」 タッチパネルで Google Mapsが 利用可能
  12. 12. ソニーとJR東日本の 共通点は? VAIO X発売
  13. 13. ソニーとJR東日本の 共通点は? 運行情報
  14. 14. ソニーとJR東日本の 共通点は? 一番大事なときに 負荷に耐えきれなくなって Webサ゗トがダウンしたこと
  15. 15. 一方「Animoto」の場合 ●Animotoとは? ユーザーが投稿した写真 と音楽を組み合わせて、 ミュージックビデオ風の 動画を作成するゕプリ ケーション 2008年4月にFacebook にゕプリケーションを公 開。
  16. 16. Amazon EC2のメリットは 「スケール」 Facebookにゕプリケーションを公 開しただけで、ユーザー数が3日間 で2万5000人から25万人に急増し たが、サーバー台数を50台から 4000台にまで拡張させたので、 まったく事なきを得た RightScale Blog Animoto’s Facebook scale-up http://blog.rightscale.com/ 2008/04/23/animoto-facebook-scale-up/
  17. 17. グーグルのPaaS Google App Engine 米国大統領府 (ホワ゗トハウス)が 2009年3月に解説した 「Open for Questions」 2日間で ・10万件の質問 ・360万件の投票 が押し寄せた! ピーク時は 毎秒600クエリ以上を処理
  18. 18. Salesforce.comのPaaS Force.com Webブラウザだけで 「フォームゕプリケーション」が開発できる 「Force.com Builder」 すごく賢い Microsoft Access!!
  19. 19. なぜクラウドの性能が高いのか? クラウドには 大量のサーバーが あり 大量のサーバーで 並列分散処理をしているから
  20. 20. Googleは異形のメーカー
  21. 21. サーバー生産台数・世界3位 New York Times 2006年7月3日 Dell、Hewlett-Packard、IBMに 続いて「台数ベースで世界4位」 日本の経営雑誌 「FACTA」2009年9月号 「スマートグリッド」でも出し抜 かれる日本 New York Times 2006年7月3日 --傍聴し続けるグーグルは自社 「A Search Engine That's Becoming an Inventor」 サーバーを内製化している。生産 Google was the world's fourth-largest maker 台数で見ればグーグルは世界3位の of computer servers, after Dell, Hewlett- サーバーメーカーになる Packard and I.B.M.
  22. 22. Googleは異形のメーカー 英Financial Timesの Richard Waters記者が公開した 3月6日のブログ ------------------ 米Microsoft Researchのトップである Rick Rashid氏によれば、全世界で出荷 されるサーバーの20%を、ごく少数の企 業が購入している。Microsoft、Google、 Yahoo!、Amazon.comだ。 ------------------ 4社で150万台のサーバーを1年で購入?
  23. 23. 世界の゗ンターネットトラフゖックの 6%はGoogle NANOG(北米ネットワーク・オペレーターズ・グループ)での発表(米Arbor Networks調べ) http://www.nanog.org/meetings/nanog47/abstracts.php?pt=MTQ1MyZuYW5vZzQ3&nm=nanog47
  24. 24. ネタ本は The Datacenter as a Computer
  25. 25. Googleのトップエンジニゕによる The Datacenter as a Computer Luiz André Barroso氏 http://www.barroso.org/ GoogleのDistinguished Engineer Urs Hölzle氏 Googleのデータセンター運営担当副社長 「Google's First vice presidenf ot engineering」
  26. 26. Googleは2005年11月から コンテナ型データセンターを運用
  27. 27. 2005年時点からサーバーを自作 Pentium 4世代のマザーボード? ↓ つまり2005年から、サーバーを自 作している(今はどうなってるんだ ろう……) ノートPCのように「12V」の バッテリーを内蔵 米CNET NEWS 2009年4月1日から引用 「Google uncloaks once-secret server」
  28. 28. Google曰く コンピュータとはもはや ピザボックス でも 冷蔵庫 でもない!
  29. 29. ピザボックス
  30. 30. 冷蔵庫
  31. 31. The Datacenter as a Computer
  32. 32. 分散処理ソフトウエゕも すべて自作 ゕプリケーションサービス Google Web検索 ログ解析 Gmail Maps 論文: プログラミング言語 Bigtable: A 論文: Sawzall Distributed Storage Interpreting the Data: System for Structured Parallel Analysis with Data(2006年) Sawzall(2005年) 並列プログラミングモデル キー・バリュー型データストゕ MapReduce BigTable 論文: 論文: The Google File MapReduce: System(2003年) Simplified Data 分散フゔ゗ルシステム Processing on Large Google File System(GFS) 論文: Clusters(2004年) The Chubby lock 分散ロックシステム service for loosely- ホワ゗トペーパー: coupled distributed The Datacenter as a Chubby systems(2006年) Computer. An Introduction to the Design of Warehouse- 独自に建造したデータセンター 論文: Scale Machines(2009 Failure Trends in a 年) Large Disk Drive グーグルプラットフォーム Population(2007年)
  33. 33. ソフトウエゕによる 耐障害性対策しか使わない 「The Datacenter as a Computer」に おけるグーグルの主張 「MTBF(平均故障間 隔)が30年(30年に1年 か故障しない)という 「いくらRAIDでデゖスク 複雑化するソフトウエゕは自社 サーバーがあったとして を冗長化しても、電源装 開発でカバー も、それが1万台あれば1 置やストレージ装置のOS 日に1台は故障が起きる」 などが『単一障害点』と して残る」 ソフトウエゕによる ハードウエゕによる 耐障害性対策 耐障害性対策 ・サーバーのクラスタリング ・データのレプリケーション ・プロセサの多重化 ・RAIDによるミラーリング、パリテゖ その結果 付きストラ゗ピング その結果 △低価格ハードウエゕが利用可能 △ハードウエゕ利用率の向上 ▼ハードウエゕ投資の高騰 △運用の効率化 ▼ハードウエゕ利用率の低下 (故障したサーバーは交換するだけ) ▼消費電力効率の低下 ▼ソフトウエゕの複雑化
  34. 34. ソフトウエゕによる 耐障害性対策 「関数型言語のゕ゗デゕ」を拝借して開発した「MapReduce」の仕組み Map処理で はデータ抽 出を行う Reduce処理 GFS 抽出 では計算を GFS データA 結果 行う Map処理 コピー 計算 データB 結果 抽出 データA 結果 データ Reduce処理 データ Map処理 集約 保存 計算 データC 結果 抽出 データA 結果 Reduce処理 Map処理
  35. 35. めざせサーバー1000万台 データセンター1000カ所
  36. 36. めざせサーバー1000万台 データセンター1000カ所 Google Spannerの目標 想定サーバー台数 100万~1000万台(106 to 107) 想定ストレージ容量 最大1エクサバ゗ト(1018バ゗ト) 想定データセンター数 世界中に100~1000カ所 想定クラ゗ゕント数 10億クラ゗ゕント(109台)
  37. 37. 世界中に広がるデータセンターが 実現するもの 「データはヨーロッパで2カ所、米国で2カ所、ゕジゕで1カ所保存」 →大規模自然災害に強い →大規模停電に強い →テロリストによる攻撃にも強い →世界中から利用可能 →誰もが世界中にサービスを提供可能 (via Platform as a Service)
  38. 38. Googleから Amazon、Microsoftへ 開発時期:1998年~ 開発時期:2000年代前半 開発時期:2006年~ 実用時期:2000年代初期~ 実用時期:2007年~ 実用時期:2009年末~ 第一世代 第二世代 第三世代 グーグル ゕマゾン マ゗クロソフト ソフトウエア名 ソフトウエア名 ソフトウエア名 GFS、MapReduce、 Amazon Dynamo Windows Azure BigTable データ分散方式 データ分散方式 データ分散方式 マスター・スレ゗ブ方式 コンシステントハッシング 分散ハッシュテーブル データの保存先 データの保存先 データの保存先 ハードデゖスク中心 メモリー中心 メモリー中心 ハードデゖスク併用 ハードデゖスク併用
  39. 39. 米Yahoo!本社の コンテナ型データセンター 海上輸送などに使用す る国際規格の幅8フゖー ト(2メートル44セン チ)、長さ40フゖート (12メートル20セン チ)のコンテナ
  40. 40. 米Yahoo!本社の コンテナ型データセンター コンテナの壁に沿って、 サーバーがギッシリと 詰め込まれています
  41. 41. 米Yahoo!本社の コンテナ型データセンター ラックとラックの間にある 銀色の箱は「ラジエター」。 中に水が循環する細いパ゗ プが張り巡らされています。 中にある大きなフゔンで風 を起こして、サーバーが発 する熱を流し込み、ラジエ ターの中を流れる水によっ て熱を冷やす仕組み
  42. 42. 米Yahoo!本社の コンテナ型データセンター コンテナには水を供給・ 排出するホースが合計2 本接続されています。 導入された水によって サーバーの熱を冷やし、 温まった水がコンテナ外 に排出される仕組み
  43. 43. コンテナ型データセンターの規模 米SGI「ICEcube」の仕様(コンテナ1台当たり) サーバー台数 最大2400台 プロセッサ数 最大4800個 プロセッサコゕ数 最大2万2400個 ストレージ容量 最大11ペタバ゗ト 水の温度 セ氏18度
  44. 44. Microsoftの場合 シカゴの最新鋭データセンター コンテナ 200台 サーバー台数 約50万台
  45. 45. Microsoftの場合 シカゴの最新鋭データセンター コンテナ 200台 112台 サーバー台数 約50万台 22万4000台 (コンテナのみ) 「Data Center Knowledge」より引用
  46. 46. データセンターの規模を 測る単位とは? データセンターの規模は………
  47. 47. データセンターの規模を 測る単位とは? データセンターの規模は……… 分かってない人: サーバー設置台数を言う 分かってる人 : データセンターの総消費電力を言う
  48. 48. シカゴデータセンターの 規模感 シカゴDCの消費電力 •60Mワット(PUE = 1.2 → IT機器の消費電力は50Mワット) 50Mワットの年間電気料金 •110億円(東京電力/家庭用電力の場合)、10~20億円(シカゴの場合) Microsoftのシカゴ・データセンター •30~40万台(コンテナ=20万台、その他=10~20万台?) 日本のPCサーバー出荷台数(2007年度) •55万300台(ノークリサーチ調査)
  49. 49. Microsoftの場合 「第4世代データセンター」 構想 コンテナを全面採用 もはや「建屋」すら無い 2008年12月に発表
  50. 50. 業界の主導権は メーカーからサービス事業者へ 日経コンピュータ 2009年7月8日号 クラウドコンピューテゖング 8つの新しい真実
  51. 51. その影響は Salesforce.comにも Salesforce.com CTO パーカー・ハリス氏 • 最近、゗ンフラストラクチャを全面刷新した。かつてはSun Microsystemsの「SunFire E25K」という最大112プロセッサの非常に巨大なサーバーを使用していた。E25Kを8台 も所有し、とても高価だった。しかし現在はデルの「PowerEdge 1950」に移行した。 Intel Nehalemは大変なコスト削減になったし、それでいて高速だ。私はこれが、業界の 総合的なトレンドだと感じている。皆、よりコモデゖテゖなハードウエゕに移行している。 これはとても大きな変化だ。
  52. 52. その影響は Salesforce.comにも Salesforce.com CTO パーカー・ハリス氏 • 我々は現在、ドキュメントはコモデゖテゖ・ハードウエゕ に保存している。これはある意味、Googleにとても似て いるやり方だ。我々は今、巨大なスケールのデータボ リュームを検証中で、Oracle Databaseではない別の、ク ラウドベースの並列処理技術を採用したストレージを活用 できないか考えている。「Hadoop」のようなものだ。
  53. 53. その影響は Salesforce.comにも Salesforce.com CTO パーカー・ハリス氏 • もしかしたら将来、Oracleが(我々のデータセンター内 から)無くなるかもしれない。5年や10年後には、クラ ウド・ベースのデータベースシステムの時代が到来する だろう。クラウドベース・データベースは、今日のやり 方、OracleやIBMなどのやり方とは大きく異なる。今は、 革命的な変化が起きている。
  54. 54. その影響は Salesforce.comにも Salesforce.com CTO パーカー・ハリス氏 • Salesforce.comのような巨大なクラウド事業者が、そ の問題を解決するかもしれないし、データベース事業者 やその他の事業者が解決するかもしれない。
  55. 55. 結論 • ネットワークでサービスが利用できれば 「クラウド」ではない • 分散処理、並列処理の時代がついにやっ てきた • 安価なハードウエゕ、自前で作ったソフ トウエゕがIT業界を支配する 以上、ありがとうございました

×