ビッグデータはバズワードか?	


                                      2012 年	
  6 ⽉月	
  5 ⽇日
                         Cloudian Summit 2012
             ジェミナイ・モバイル・テクノロジーズ	
  

May 2012	
    Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
   Page 1
はじめに	


             最近、「ビッグデータ」という言葉を見かけることが増えました。



             その一方で、一時期もてはやされたWeb2.0と同じような、
              バズワードだという意見も見かけ始めています。



             ここでは、私たちのビッグデータに対する見方をお話します。	



 May 2012	
       Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
   Page 2
まず、バズワードとは?	



             「バズワード(Buzz Word)とは、
             一見、専門用語のように見えるが、
             具体性がなく明確な合意や定義のな
             い用語のことである (Wikipedia)」	



May 2012	
      Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
   Page 3
「ビッグデータ」は2011年後半から	
2011年後半、各社が「ビッグデータ」をテーマにしたニュースを発
表し始めました	




May 2012	
   Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
   Page 4
Geminiも2010年に連載記事執筆・・・	




             http://businessnetwork.jp/Portals/0/SP/gemini/index.html	
  
May 2012	
            Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
   Page 5
Hadoopは2009年後半から・・・	
2009年後半から、Hadoopが注目を集め始めました	




May 2012	
   Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
   Page 6
Hadoopは分散処理を身近な技術に	

従来は、「速く、大量データを                                                  Hadoopは、複数の汎用的な
処理」するためには、高性能                                                   サーバーを使い、分散、並列処
(=高価な)マシンが必要でし                                                  理するソフトウェア製品として注
た。                                                              目を集めています。	




INPUT	
                       OUTPUT	
                       INPUT	
                                 OUTPUT	
  



                                                             分散並列	
集中処理	
                                                       処理	

    May 2012	
   Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
    Page 7
ビッグデータが「分析」に至るロジック	
「大量データを速く処理」する、高価な技術がHadoopにより身
近に	
                                                                                                  カーナビ
                                                                                                  センサー
                                   Googleはユーザーの利用
                                                                                                  医療分野・・・
                                   行動履歴を分析し、ユー                                                    などにおける分析事例
                                   ザーに最適な広告を掲載	
「大量データ処理」技                                                                                        大量データは、ビジネ
術の利用事例はどこ                                                                                         スインテリジェンスの
                                   Web2.0のビジネスモデル	
に?	
                                                                                              ために必要	
                                   Amazonはユーザーの閲
                                   覧、購買履歴を分析し、
                                   ユーザーに最適な商品を
                                   推薦	



                       「ビッグデータ」=「ビッグデータ分析」	
 May 2012	
   Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
        Page 8
ビッグデータが小さくなった・・・	
ビッグデータが注目を集める一方、
最近聞かれる声は、

        「Hadoopを使うほどの分析データは無い・・・」

        「統計的にサンプリングすれば分析に充分・・・」

        「DWHはシングルマシンで利用・・・」

        「テラバイトはビッグデータ?・・・」
                                                                                                 バズワードかも 	




May 2012	
   Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
    Page 9
ビッグデータは「ビッグ」ウェーブ	
ビッグデータは突如押し寄せるデータの大波に由来	




May 2012	
   Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
   Page 10
ビッグデータ分析の前に・・・	
1日あたり12TBのデータがあると、一般的な性能のマシン1台では、
データを書き込むだけで42時間	

                     Analyzing Big Data at Twitter
              (Web 2.0 Expo NYC Sep 2010) by Kevin Weil	
  




 May 2012	
         Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
   Page 11
駅の自動販売機もビッグデータ	




 May 2012	
   Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
   Page 12
ビッグデータの本当の課題は・・	


サービス	
                     書き	
                                               読み	
アプリケーション	
                                     保存	
                                               加工	
        分析	
アプライアンス	
            込み	
                                               出し	

Volume	
        大量データの塊	

Variety	
       非構造、多種多様	

Velocity	
      リアルタイム処理	
                                                                            バッチ処理	

Low Cost	
      低コストの汎用サーバー、並列・分散	



   May 2012	
     Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
        Page 13
ビッグデータのためのストレージ	
 ビッグデータに最適なストレージに求められるのは・・	

                 可用性(Availability):いつでも利用できる

信頼性(Reliability):                                                                              拡張性(Scalability):
データを紛失しない                                                                                      リアルタイムに容量を拡
                           Data Center 1	
                                                     張できる 



                           Data Center 2	
               データを
               複製	

経済性(Economy):                                                                               弾力性(Elasticity):
汎用的なハードウェアを                                                                                 ノード追加が簡単にで
利用できる                                                                                       きる
  May 2012	
      Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
     Page 14
まとめ	

             ビッグデータは、「ビッグデータ分析」の意味合いで使われ
              ているように見受けられます。

             本来ビッグデータは、突然押し寄せるデータの大波に由来
              しており、また、これからもデータの膨張は続くでしょう。

             ビッグデータを迅速に読み書き、保存できる高い拡張性を
              もつクラウドストレージが重要になります。




 May 2012	
       Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
   Page 15
Cloudianは、ビッグデータに最適なクラウドストレージを構築
   できるソフトウェア製品です。	




                                 www.cloudian.com	
  



May 2012	
   Copyright © 2011-2012 Gemini Mobile Technologies Inc. & KK All Rights Reserved.	
   Page 16

ビッグデータはバズワードか? (Cloudian Summit 2012)