More Related Content Similar to Bluemixではじめるアナリティクス
Similar to Bluemixではじめるアナリティクス (20) More from IBMソリューション (15) Bluemixではじめるアナリティクス2. © 2014 IBM Corporation
2
IBM Bluemix
www.bluemix.net
ご注意
この資料は日本アイ・ビー・エム株式会社および日本アイ・ビー・エム システムズ・エンジニアリング株
式会社の正式なレビューを受けておりません。
資料の内容には正確を期するよう注意しておりますが、この資料の内容は2014年09月現在の情報であり、
製品の新しいリリース、修正などによって動作/仕様が変わる可能性があります。
当資料は、資料内で説明されている製品の仕様を保証するものではありません。従って、この情報の利⽤
またはこれらの技法の実施はひとえに使⽤者の責任において為されるものであり、資料の内容によって受
けたいかなる被害に関しても⼀切の補償をするものではありません。
また、IBM、IBMロゴおよびibm.comは、世界の多くの国で登録されたInternational Business
Machines Corporationの商標です。他の製品名およびサービス名等は、それぞれIBMまたは各社の商標
である場合があります。現時点でのIBMの商標リストについては
http://www.ibm.com/legal/copytrade.shtmlをご覧ください。
3. © 2014 IBM Corporation
3
IBM Bluemix
www.bluemix.net
アジェンダ
ビッグデータ&アナリティクス
Bluemix ではじめるアナリティクス
ビッグデータ&アナリティクス 関連のサービス
まとめ
4. © 2014 IBM Corporation
4
IBM Bluemix
www.bluemix.net
ビッグデータ&アナリティクス
5. © 2014 IBM Corporation
5
IBM Bluemix
www.bluemix.net
今、何が起こっているのでしょうか?
あらゆるデータが
分析可能に
「分析」によって
意思決定が大幅に改善
データ活用が
企業競争力に直結
6. © 2014 IBM Corporation
6
IBM Bluemix
www.bluemix.net
意思決定のスピードが求められる時代
金融危機
グローバル化
顧客意識の変化
情報の量と質の変化
意思決定
製品戦略
ブランド戦略
マーケティング戦略
組織変革
・
・
事実に基づく
正確な判断
大量に蓄積
されたデータ
市場構造の急激な変化
このような時代でも成長するために・・・
直感ではなく スピーディーに!
市場構造が急激な変化する時代、データに基づく意思決定にもスピードが必要です。
7. © 2014 IBM Corporation
7
IBM Bluemix
www.bluemix.net
身近にあるデータから価値を引き出す
「何からはじめれば
いいのか?」
やり方が分からない?
分析環境がない?
時間がない?
今、身の回りにある取引のデータや顧客データから
もっと有益な知見を取り出せるはず・・・
まずは入手が容易なデータを使って分析を始めることが重要です。
8. © 2014 IBM Corporation
8
IBM Bluemix
www.bluemix.net
ワーク
ロード
リソース テクノロジ
分析に必要な要素
「データ」×「分析手法」 知見
既存のデータの利⽤
時間やコストをかけずに、分析に注力
柔軟な「分析基盤」
様々なワークロードタイプへの対応
柔軟なリソース割当て
新しいテクノロジーの迅速な利⽤
ETL
DM
BIツール
ETL
ETL
DWH
Mining
データ
分析基盤
知見
分析結果
クラウドの活用
分析手法
9. © 2014 IBM Corporation
9
IBM Bluemix
www.bluemix.net
Bluemix ではじめるアナリティクス
10. © 2014 IBM Corporation
10
IBM Bluemix
www.bluemix.net
データウェアハウジングおよび分析⽤の
アジャイル・プラットフォーム
統計解析
実行環境
(R)
スプレッドシート
BIツール
統計解析
統合開発環境
データロード
テーブル参照
クエリ発行
データウェアハウス
(BLU Acceleration)
ブラウザ
Bluemix
ランタイム
(Liberty, Ruby, …)
Rスクリプトの実行 Rスクリプトの開発
Analytics
Warehouse
11. © 2014 IBM Corporation
11
IBM Bluemix
www.bluemix.net
統計解析環境
R
オープンソースの統計解析向けの
プログラミング言語及び実行環境
統計解析⽤ソフトウェアの
デファクト・スタンダード
強力な統計解析・データ解析機能
多様で美しいグラフの容易な作成
RStudio
R言語の向けの統合開発環境
コードアシスト機能やグラフの描画
R Markdown形式によるドキュメント化
ドキュメントへの R スクリプトの埋込み
Knit: R Markdown HTML
12. © 2014 IBM Corporation
12
IBM Bluemix
www.bluemix.net
データウェハウスと分析実行環境
データウェアハウス分析実行環境
クエリ分析実行
分析結果
クエリ・分析処理分析実行
分析結果
インデータベース・アナリティクス
データ処理・分析処理のオフロード
インデータベース・アナリティクス
通常の分析
データ
転送量
メモリ
使用量
13. © 2014 IBM Corporation
13
IBM Bluemix
www.bluemix.net
デモの概要
販売店の売上げ明細データを⽤いて、
データの可視化とデータ分析を Bluemix 上で実現する
データベースや分析ツール等の準備が不要
データウェアハウス、統計解析の実行環境、統合開発環境が
組み込まれている
必要なのはデータだけ
Bluemixアプリケーションからのサービスの利⽤が可能
軽量フレームワークを使ったアプリケーション
ウェブ上のサービスとの連携
IBM Bluemix の Analytics Warehouse を利用して、Ruby でビジネス・インテリジェンスおよびアナリティクス・サービスを作成する
http://www.ibm.com/developerworks/jp/bigdata/library/bd-ruby-bluacceleration-app/
14. © 2014 IBM Corporation
14
IBM Bluemix
www.bluemix.net
デモ:販売店の売上げデータの可視化と分析
デモで使⽤するデータ
Cognos BI のサンプルデータ
2010年1月から 2013年8月までの 446023 件の売上げ明細データ 等
デモの流れ
Analytics Warehouse のコンソール
R スクリプトの実行と結果確認
R スクリプトからのデータベースへのアクセス
開発環境
分析結果のドキュメント化
データの可視化
データへのアクセス
売上げ明細データの表示
グラフ表示
地域別営業成績グラフの表示
データ分析
アソシエーション分析
バスケットの中の商品間の関連性(どのような商品が同時に購入されているか)
についての分析
15. © 2014 IBM Corporation
15
IBM Bluemix
www.bluemix.net
デモのまとめ
データベースや分析ツール等の準備が不要
データウェアハウス、統計解析の実行環境、統合開発環境が
組み込まれている
必要なのはデータだけ
Bluemixアプリケーションからのサービスの利⽤が可能
軽量フレームワークを使ったアプリケーション
ウェブ上のサービスとの連携
分析に最低限必要な環境が整っています。
データさえあれば、今すぐにでも、分析がはじめられます。
16. © 2014 IBM Corporation
16
IBM Bluemix
www.bluemix.net
ビッグデータ&アナリティクス 関連のサービス
17. © 2014 IBM Corporation
17
IBM Bluemix
www.bluemix.net
アナリティクス関連のサービス
インメモリ・データ・ストアから予測分析まで
18. © 2014 IBM Corporation
18
IBM Bluemix
www.bluemix.net
アナリティクス関連のサービス
名称 提供形態 説明
BigData
Analytics
Warehouse
正式版
データウェアハウジングおよび分析用のアジャイル・プラットフォーム
を提供。メモリ内の最適化および列編成された BLU アクセラ
レーション・テクノロジーを使用。
Geospatial
Analytics
Beta
リアルタイムの地理空間分析。定義された地域において、デバイ
スがいつ利用され、もしくは利用されなくなったかの情報を取得。
IBM Analytics
for Hadoop
Beta
ビッグデータ・セットの分析アプリケーションを開発するための使い
やすいインターフェースを備えた、Hadoop ベースのクラスターを
提供。大規模で複雑な分析を実行するためのエンタープライズ
機能を備えた IBM BigInsights を使用。
Time Series
Database
正式版
IoT デバイス・データのための管理対象データ・ストアを追加して、
そのデータに対する時系列分析を実行する機能を提供。
Business
Analytics
Embeddable
Reporting
Beta
IBM Cognos BI のレポートを実行。Cognos BI Dynamic
Query モードを使用して作成されたコンテンツをサポート。
REST ベースのインターフェースを使用して、レポートを実行したり、
レポートをアプリケーションに容易に統合可能。
19. © 2014 IBM Corporation
19
IBM Bluemix
www.bluemix.net
Analytics Warehouse
データウェアハウジングおよび分析⽤の
アジャイル・プラットフォーム
データウェアハウス
カラム型のインメモリーDB である
IBM BLU Acceleration を搭載
分析機能
R を使った統計解析
RStudio による統合開発環境
アクセス方法
Web コンソール
データのロード、クエリの実行、R スクリプトの
実行
分析ツールとの連携
Cognos BI, Excel, Tableau, Microstrategy の
ような分析アプリケーションとの連携
Bluemix アプリケーション
20. © 2014 IBM Corporation
20
IBM Bluemix
www.bluemix.net
DB2 BLU アクセラレーション
迅速なアナリティクスを実現する
BLUアクセラレーション
インメモリーカラム型
優れたメモリー管理技術とI/O効率、
CPU処理の最適化により実現
ハイブリッド型データベース
BLUテーブルが従来の行テーブルと
共存
同じスキーマ、ストレージ、メモ
リー内に共存
パラレル・ベクトル処理
マルチコアとSingle Instruction
Multiple Data (SIMD)によって並列
処理を実現
コンプレッション
データの順序を保持する業界初の
データ圧縮機能によって、圧縮済み
のデータを解凍することなくデータ
を処理
ストレージ
C1 C2 C3 C4 C5 C6 C7 C8C1 C2 C3 C4 C5 C6 C7 C8
圧縮とエンコードが
行われた列テーブル
C1 C2 C3 C4 C5 C6 C7 C8C1 C2 C3 C4 C5 C6 C7 C8
従来の行形式の
テーブル
SIMD機能を備えたCPU
BLUアクセラレーションを
実装したデータベース
BLU DMS
(BLUテーブル用)
ランタイム
従来の
DB2ランタイム
BLU
ランタイム
従来のDB2バッファープール
従来のDMS
(非BLUテーブル用)
21. © 2014 IBM Corporation
21
IBM Bluemix
www.bluemix.net
Analytics Warehouse のメニュー
主な機能
分析 (Analyze)
Rスクリプトの開発
統合開発環境 RStudio との連携
Rスクリプトの実行
In-Database Analysis の実現
Excel との連携
外部データへの接続: Office データ接続 (.odc) ファイル
管理 (Manage)
テーブルの参照
クエリ (SQL) の実行
データのロード
Cloudant のデータとの同期
22. © 2014 IBM Corporation
22
IBM Bluemix
www.bluemix.net
R 言語での Analytics Warehouse の利⽤
データベースへのアクセス
bluR : R から DB2 BLU へアクセスするためのライブラリ
bluQuery : データの参照 (SQLクエリの発行)
blu.data.frame : BLU データフレームの作成
インデータベース・アナリティクスを実現するためのデータフレーム
library(bluR)
con <- bluConnect( "BLUDB", "", "" ) # ローカル接続
bluAnalyticsInit( con )
data1 <- bluQuery( "SELECT * FROM GOSALES.ORDER_DETAILS" )
data2 <- blu.data.frame( "GOSALES.ORDER_DETAILS" )
bluClose(con)
DB2 BLU からデータを抽出した後は、通常の R スクリプトと同様に処理するのみ
BLU データフレームで、インデータベース・アナリティクスを簡単に実現できる
23. © 2014 IBM Corporation
23
IBM Bluemix
www.bluemix.net
Sinatra での Analytics Warehouse の利⽤
データベースへのアクセス
VCAP_SERVICES 環境変数の情報を利⽤して接続
require 'ibm_db'
conn = IBM_DB.connect "DATABASE=#{$database};HOSTNAME=#{$host};
PORT=#{$port};PROTOCOL=TCPIP;UID=#{$username};
PWD=#{$password};", '', ''
stmt = IBM_DB.exec conn, $sql1
while(res = IBM_DB.fetch_assoc stmt)
data[res['PRODUCT']][res['YEAR']] = res['PROFIT']
end
IBM_DB.close conn
DB2 BLU から抽出したデータは、Sinatra のフレームワークの中の view に値を埋め込む
24. © 2014 IBM Corporation
24
IBM Bluemix
www.bluemix.net
Geospatial Analytics (Beta)
リアルタイム地理空間データ分析⽤の
デバイス追跡プラットフォーム
特定領域へのデバイスの入退出のリアルタ
イムの追跡
軽量の MQTT プロトコルの利⽤
MQTT のメッセージ・ブローカーを使って、
デバイスからのイベントの通知の受信とデバ
イスの位置情報の提供
API によるリージョンの管理
リージョンの定義やリージョンの監視の制御
ユースケース例
ある小売店の近くに来たお客様へのリアルタ
イムなプロモーション
事故や緊急事態の発生をリアルタイムにドラ
イバーへ通知
25. © 2014 IBM Corporation
25
IBM Bluemix
www.bluemix.net
IBM Analytics for Hadoop (Beta)
Hadoop ベースのクラスター環境
Hadoop の環境の構築・管理からの開放
InfoSphere BigInsights Enterprise
Edition V3.0
オープンソースの Apache Hadoop がベース
Hive, MapReduce, Pig などが利⽤可能
ビッグデータの分析アプリケーションの
開発に注力
Hadoop クラスター上のデータへの
簡単なアクセスと簡単なデータのロード
分析アプリケーションの簡単な開発
チャートやグラフを使った
データの可視化
26. © 2014 IBM Corporation
26
IBM Bluemix
www.bluemix.net
Time Series Database
IoT デバイス・データのための
データ・ストア
メーターのような IoT デバイスの
データの蓄積と時系列分析
IBM Informix 12.10
タイム・スタンプを伴う
時系列データの分析
スマートメータ、RFID タグ、セン
サー・デバイスなど
例えばスマートメーターで収集された
電気使⽤量、株価や取引高、心電図の
記録、震動計、ネットワーク・パ
フォーマンス・レコードなど、
幅広い種類のデバイスに対応
27. © 2014 IBM Corporation
27
IBM Bluemix
www.bluemix.net
Infomix TimeSeries
時系列データ⽤のデータ・ストア
タイム・スタンプを伴う⼀連のデー
タである時系列データに対する高速
データベース
オフセット管理されたデータ
インデックスはID列のみ
時系列データへの高速なアクセス
データやインデックスの巨大化の抑制
ディスクス
ペース
他社リレーショナル・
データベース
IBM Informix
TimeSeries
リレーショナル・アプローチ
処理時間
データ・
ローディング
レポート生成
Informix TimeSeries
デバイス
ID
タイムスタンプ列
1 起点:2010-12-01 01:00:00 [(4,160,40), (4.5,155,35), ….]
2 起点:2010-12-01 01:00:00 [(5,175,44), (4.5,160,35). .]
・・・・ ・・・・
インデックス=メーターIDのみ
28. © 2014 IBM Corporation
28
IBM Bluemix
www.bluemix.net
Embeddable Reporting (Beta)
Business Intelligence のレポートや
ダッシュボードの作成や統合の
プラットフォーム
BI機能の提供
レポーティング、ダッシュボード、多次元
分析(OLAP)、スコアカード、アラート 等
Cognos BI v10.2.1.1
RESTful API でのレポートの作成、アプ
リケーションへレポートの統合
データベース
リポジトリ: MongoDB connection
レポートの仕様
データソース情報
Cognos BI model
データ: DB2 JDBC connection
レポートに表示する内容のデータ
29. © 2014 IBM Corporation
29
IBM Bluemix
www.bluemix.net
まとめ
30. © 2014 IBM Corporation
30
IBM Bluemix
www.bluemix.net
分析を成功させる「3つの要因」
分析の目的の明確化
意思決定プロセスへの組込み
分析の経験やスキルの向上
スモールスタート
トライアル&エラー
戦略
業務
実装
人
分析の目的の
明確化
意思決定プロセス
への組込み分析の経験やスキル
の向上
31. © 2014 IBM Corporation
31
IBM Bluemix
www.bluemix.net
分析で成功するための「3つのステップ」
スポンサーシップ 投資
データ
専門知識
信頼
共有すべきVisionを
明確にし、行動を促す
スキルと機能の開発
および利用
厳格さと協調によって
価値を生み出す
信頼できる組織関係
分析結果の信頼
データに自信を持つ
セキュリティと統制
価値の源泉 プラットフォーム
企業文化
評価
分析の成果と価値創出
を合致させる
ビジネスインパクト測定と未
来設計
ビッグデータを取扱う
システム基盤を確保する
事実をベースとした
意思決定を行う
実行
拡大
準備
ビッグデータ&
アナリティクス
の基礎
価値実現に
必須
価値創造の
強化
出典:Analytics: A blueprint for value – Converting big data and analytics into results,
IBM Institute for Business Value © 2013 IBM
業務
実装
業務
実装
データ
戦略 戦略
分析
基盤
人
分析
スキル
経験
ベース
ライン
知識
戦略 人
業務
実装
32. © 2014 IBM Corporation
32
IBM Bluemix
www.bluemix.net
IBM Bluemix
www.bluemix.net