サーバー生産台数・世界3位
New York Times 2006年7月3日
Dell、Hewlett-Packard、IBMに
続いて「台数ベースで世界4位」
日本の経営雑誌
「FACTA」2009年9月号
「スマートグリッド」でも出し抜
かれる日本
New York Times 2006年7月3日 --傍聴し続けるグーグルは自社
「A Search Engine That's Becoming an
Inventor」
サーバーを内製化している。生産
Google was the world's fourth-largest maker 台数で見ればグーグルは世界3位の
of computer servers, after Dell, Hewlett- サーバーメーカーになる
Packard and I.B.M.
18.
Googleは異形のメーカー
英Financial Timesの
Richard Waters記者が公開した
3月6日のブログ
------------------
米Microsoft Researchのトップである
Rick Rashid氏によれば、全世界で出荷
されるサーバーの20%を、ごく少数の企
業が購入している。Microsoft、Google、
Yahoo!、Amazon.comだ。
------------------
4社で150万台のサーバーを1年で購入?
Googleのトップエンジニゕによる
The Datacenter asa Computer
Luiz André Barroso氏
http://www.barroso.org/
GoogleのDistinguished Engineer
Urs Hölzle氏
Googleのデータセンター運営担当副社長
「Google's First vice presidenf ot
engineering」
21.
Googleは
異形のメーカー
Googleが4月1日に開催した
Efficient Data Center Summit
・2005年11月からコンテナ利用
・コンテナは水冷
・冷却に使った水は、
「冷却塔」(チラー)で再冷却
・2009年4月にベルギーで
「チラーレスデータセンター」
運用開始
・サーバーは自作
・12Vのバッテリー内蔵
・UPS(無停止電源装置)は
使用しない
http://www.google.com/corpor
ate/green/datacenters/summit.
html
クラウドは
Googleが定義した
ゕプリケーションサービス
Google
Web検索 ログ解析 Gmail
Maps
論文:
プログラミング言語 Bigtable: A
論文: Sawzall Distributed Storage
Interpreting the Data: System for Structured
Parallel Analysis with Data(2006年)
Sawzall(2005年) 並列プログラミングモデル キー・バリュー型データストゕ
MapReduce BigTable 論文:
論文: The Google File
MapReduce: System(2003年)
Simplified Data 分散フゔルシステム
Processing on Large Google File System(GFS) 論文:
Clusters(2004年)
The Chubby lock
分散ロックシステム service for loosely-
ホワトペーパー: coupled distributed
The Datacenter as a Chubby systems(2006年)
Computer. An
Introduction to the
Design of Warehouse- 独自に建造したデータセンター 論文:
Scale Machines(2009 Failure Trends in a
年) Large Disk Drive
グーグルプラットフォーム Population(2007年)
Datacenter as aComputer
名言集
自前主義
• OSレヤーがあるとすれば、それは「Cluster-Level
Infrastructure」のことだ
• Datacenter must be a general-purpose computer
system.
• There is substantial risk that by the time a
specialized hardware solution is implemented, it
is no longer a good fit
52.
Datacenter as aComputer
名言集
スケールゕウト
• ProLiant is about four times more cost-
efficient than the Superdome.(ストレージ
も含むと20倍)
• (我々の)ワークロードはあまりに巨大なので、
どんな大きなSMPサーバーでも1台ではまかな
いきれない(レテンシはLANに集約される)
Datacenter as aComputer
名言集
メニーコゕ
• メニーコゕが進めば、サーバーが数十台入る「ラック」に、
現在のデータセンターに匹敵するマシンが収まることにな
る。「Warehouse Scale Computinge(WSC)」は全デー
タセンター運営者の現実となる
WSC
• Computation is moving into the cloud, and thus into
WSCs
Datacenter as aComputer
名言集
ソフトウエゕベースの耐障害性対策
• もっともECC付きDRAMは使っている。2000
年までECCを使っていなくて酷い目にあった
• In summary, near perfect reliability is not
universally required in Internet services.
Datacenter as aComputer
名言集
故障に対する接し方
• 故障予測はコストに合わない。Diskのような小さなサブ
セットに関してのみ故障予測を行っている
• サーバーが故障しても、急いで修理しない。「リペゕ」
バッチでしか行わない。その方が管理コスト抑制になる
結論
• We must treat the datacenter itself as one massive
computer
63.
Googleの中の人曰く
ケン・トンプソン氏
• some sort of – not Cloud
Computing but a Cloud Computer;
something that is always there and
always be accessed and always
store data and always give it back.
64.
Googleの中の人曰く
ケン・トンプソン氏
• I think that is very hard. There is two types
of jobs; one where you want to do something
huge, (略) one job that takes thousands of
computers to do or you want to do thousands
of little jobs and never fail. And those are
almost like two separate problems, like
MapReduce(略)
65.
Googleの中の人曰く
ケン・トンプソン氏
• I am actually more interested in the second, in trying to
get small jobs, the kind of jobs that a user at home will
be restore a file, look at his date book, or pull a video,
little small jobs that are much more reliable than anything
he can do at home.
要約
• スループット指向の処理とレスポンス指向の処理を、両方でき
なくてはならない