ビッグデータ時代にむけて

    2012/05/23
    濱田 正彦



     © 2011 IBM Corporation
今日伝えたいことは


 世の中の変化


 なぜビッグデータ?


 ビッグデータ時代のインフラの課題




             © 2011 IBM Corporation
今起きてること
 デジタル・サイネージと皆さんの買い物
  – 広告や販促型のモデル
  – リアルな消費の現場に近いメディアとして注目
  – スーパーマーケットの食品売り場担当者は、情報番組(TV)の内容によって商品の配
    置を変更し、「今日のめざましTVで紹介されました!!」とPOPを書き直しているが、
    デジタルサイネージを使えば一発で最新情報に更新可能。また値引きも反映も時間に
    応じた対応を自動的に行うことができる。
  – 時間と場所を制御できる唯一のメディアといえる。
     • 企業の担当者は、自社の商品やサービスを誰に対して訴求するべきかを検討し、
       そのターゲット属性を年齢や性別、職業などといったパラメータで抽出して、その
       ターゲットにリーチしやすいであろうメディア戦略を考えられる



                                                                           人が自販機の前に立って、商品購入を
                                                                           しようという場合は、顧客属性(年齢、
                                                                           性別)を判定し、属性ごとにお勧め商品
                                                                           の表示を行ったり、季節や時間帯、環
                                                                           境に応じた商品の提案といった1人ひ
                                                                           とりを見分けた"高度なマーケティング"
                                                                           が行われる。

      出展   http://news.mynavi.jp/news/2010/08/10/058/index.html
                                                                                             3
                                                  © 2011 IBM Corporation
© 2011 IBM Corporation
© 2011 IBM Corporation
© 2011 IBM Corporation
© 2011 IBM Corporation
ゲーミフィケーション(gamification)へ

 ゲームではないアプリケーションやWebサイトなどにゲームのメカニズムを利用すること
  – 米フォースクエアの交流サイト「foursquare」にアクセスすると利用者は特定の店舗に入
    店した訪問記録を登録することができ、さまざまな勲章を得られる。
  – バッチを与えることで参加者にモチベーションを与える
  – サービスによっては、ポイントで物品と変更が可能なサービスもある。




                                                    8
                    © 2011 IBM Corporation
シリアスゲームで現実的に

 エンターテインメント性のみを目的とせず、教育・医療用途(学習要素、体
 験、関心度醸成・喚起など)を主目的とするコンピュータゲーム(エレメカも
 含まれる)のジャンル

           「えいご漬け」

           英文を聴き取って紙に書き出す学習法「ディクテーション(聴
           き取り練習)」をベースにした英語学習ソフト。ヒアリングした
           ものをタイピングし、ビジュアル化した英文の構造を見ながら
           覚える「3ウェイ方式」を繰り返すことで英語の基礎を身につ
           けることができる。




                                        9
               © 2011 IBM Corporation
ゲームと実際の報酬の結び付けも


 仮想領域の成果と現実社会の報酬とを結びつけ楽しむ


 Kiip


  – Sephora、popchips、Homerun.com、Sony
    Dash、Vitamin Water、1-800-Flowers、Dr.
    Pepper、GNC、Carl’s Jr、Hardee’sなどの有名
    ブランドと提携し、プレイヤーに対してゲーム内
    で現実の商品をプレゼントする。ユーザーが一定
    の条件をクリアすると、 popchips6箱分とか口紅
    のサンプルとか次回来店したときに使えるスムー
    ジー1杯分の引換券などがプレゼントされる。

                                                     10
                            © 2011 IBM Corporation
今起きてることを考えると…

 ITの世界で最も活気があるのは、ビジネス・アプリケーションの分野だけではなく、間違いなく
 コンシューマー・アプリケーションが注目されてる
   – 一般消費者の要求レベルがきわめて高いために、安定性や品質、信頼性といった面でも、
     多くがビジネス・アプリケーションと同等のレベルに達している
   – コンシューマーアプリケーションから生まれる情報はどう扱う?


 「コンシューマライゼーション」とは、コンシューマIT市場で広まった技術や製品が、エンタープ
 ライズIT市場に大きな影響を与えるようになることを示す言葉


 iPhoneやiPad、Android端末、Chrome OSなどの端末を特に若い世代が使いこなし、自分
 の端末をプライベート、仕事を問わずに活用するようになってきていること
   – 「BYO-3」(PCだけでなく、携帯電話端末やタブレット端末も、個人所有のものを職場に持
     ち込んで使うこと)がトレンド
   – クライアント側ソフトはあらゆる端末に対応




                                                    11
                      © 2011 IBM Corporation
データ量の増加
インターネットの登場以来、人間社会で生成されるデータ量は加速度的に増えている。
インターネットの登場以来、人間社会で生成されるデータ量は加速度的に増えている。
これらデータには、単に量が多い(Volume)だけでなく、種類の増加(Variety)、速度の高速化(Velocity)という「三
これらデータには、単に量が多い(Volume)だけでなく、種類の増加(Variety)、速度の高速化(Velocity)という「三
つのV」という特徴がある。
つのV」という特徴がある。




             44x
                           1年間に生成される
 Volume                       データ量
                                                          2020
                                                           35
                                                       zettabytes
            データとコンテンツは
            次の10年で
            激増の一途をたどります。

                                                      80%
                                                      のデータは、
                                                                    Variety
                               2011                   非構造化データ
                                1.8
                            zettabytes
                2009
              800,000
                                               10 6req/sec
             petabytes
                         Velocity              月次から日次、そしてリアルタイム解析へ
                                               超低レイテンシー処理が要求されます。
                             © 2011 IBM Corporation
新技術の台頭
データ量の増加に応じ、それを扱う新たな技術も登場・普及している。
データ量の増加に応じ、それを扱う新たな技術も登場・普及している。
これまでの定型的なシステムのみではなく、こうした新技術を習得・有効活用していく必要がある。
これまでの定型的なシステムのみではなく、こうした新技術を習得・有効活用していく必要がある。

★ストリーム・コンピューティング                                        大量データを
         InfoSphere                                    ディスク着地前に
          低




                                                          処理
           Streams
                                            リアルタイム
                                            分析・計算
 遅延時間 / レイテンシー




                                        ★DWHアプライアンス
                 ・インメモリー技術
                 ・CPU コスト低下




                                                             IBM                  大量データを
                                                             Smart               ディスク着地後に
                                                             Analytics              処理
                                                             System
                                                                            ★分散データ処理
                              DWH                                                     大量
                                                                                     分析・計算
                               今までの
                               DWH  ・マシンのコモディティー化
           高




                                    ・オープンソース技術                                 InfoSphere
                   小                                                    大       BigInsights
                                               © 2011 IBM Corporation
情報活用による他社との差別化
多種大量の情報を解析し、ビジネスに役立てることが急務となっている。
多種大量の情報を解析し、ビジネスに役立てることが急務となっている。
また増えるデータ量に対し解析にかけられるコストはフラットもしくは減少の傾向にあるため、そのギャップを埋める
また増えるデータ量に対し解析にかけられるコストはフラットもしくは減少の傾向にあるため、そのギャップを埋める
努力が必要になる。
努力が必要になる。


         3人に1人のビジネス・リーダー                                          予想される
1 in 3   は、重要な決定を信用できな
         い情報、または、情報が無い
         状態で判断しています。
                                                                  データ増加量

                                                   技術の活用により
         56%のマネージャが、取り扱わ                           このギャップを埋める

56%      なければならないデータ量が、
         とても多すぎると感じています。

                                                            本来必要となる
         60%のビジネス・リーダーは、情
60%
                                                            投資額
         報を即時に収集し、理解するこ
         とが必要であると考えています。


         83%のCIOは、「BIと分析」が、                               実際の
83%      競争を勝ち抜くためのビジョナ
         リー・プランであると考えていま
         す。
                                                          投資額



                          © 2011 IBM Corporation
世の中では(エンタープライズの世界)
Blog解析やFaceBookなどの有名どころの事例以外にも、カード会社の事例、病院の事例、
Blog解析やFaceBookなどの有名どころの事例以外にも、カード会社の事例、病院の事例、
風力発電の事例、など世界的に見れば事例が出てきている
風力発電の事例、など世界的に見れば事例が出てきている
    実際使用されている例
風力発電会社様の例                                             大手クレジットカード会社様の例
 風力発電タービン・システム–                                          準構造化された認証ログの分析
 気象データと地理データの                                                  – カードの使用履歴から顧客洞察を抽出。
 分析によって、タービンの設置場所の最適化                                            毎月10テラバイトの認証ログ
   2.8ペタバイトの気象データを各地理的な                                          法規制のため、過去7年間分のログ840テラバイトを保存。
                 設置場所で解析                                         より迅速なマーケティング活動、そして、
   97%短縮 –                                                       カード不正使用の検知に活用
       3週間から15分のモデリング解析時
       間へ
        – 設置オペレーションの最適化を図
       る
   今後4年間で20ペタバイトに


 その他・・・・

           Smart Traffic                Real time Optimization
           250K GPS probes/sec          100,000 updates/sec,
           630K segments/sec            5 ms/decision
           2 ms/decision, 4K vehicles   Round-trip automation
                                        10PB for Deep Analytics




                                        © 2011 IBM Corporation
トータルデザインの欠如が大変
Big Dataソリューションを実現するには数多くのコンポーネントを組み合わせる必要がある。ソリューションを検討する際にはインフラ
Big Dataソリューションを実現するには数多くのコンポーネントを組み合わせる必要がある。ソリューションを検討する際にはインフラ
からアプリまでのスキルが必要となるため、一人の技術者がカバーするエリアが広く、デザインが難しい。
からアプリまでのスキルが必要となるため、一人の技術者がカバーするエリアが広く、デザインが難しい。




                         インフラ                        アプリ


                            アプリ
                                                       ミドル




                            © 2011 IBM Corporation
これを実現する1つの手段として…
 エキスパート・インテグレーテッド・システムとは
 高度な専門機能の組み込みとクラウド対応を標準搭載したシステム


  エキスパートが持つ                                    設計段階からすべてを
   高度な知見を実装                                    最適に統合
 従来専門家が行っていた業務を                                ハードウェア/ソフトウェアを密接に
特定し、自動的に実行 – インフラス                             統合・調整 - すぐに使用開始可能な、
トラクチャからアプリケーションまで                              ワークロードが最適化されたシステ
                                               ム




            計画から導入、運用に至る煩雑な作業
                       から解放
                ITライフサイクルのすべてのパートを簡易化
                     システム全体の管理を統合
           最適なソリューションで構成される、幅広いオープン・エコシステム
                      © 2011 IBM Corporation             © 2012 IBM Corporation

ビッグデータ時代にむけて/濱田 正彦