db tech showcase 
Tokyo 2014 
ROOMD 
データ分析で 
Excel を活用しよう 
日本マイクロソフト株式会社 
サーバープラットフォームビジネス本部 
クラウドアプリケーションビジネス部 
北川剛(Kitagawa Tsuyoshi) 
D16
トレンドとしてのビッグデータ 
データ分析 
量・質・多様化高度化/処理能力向上 
活用 
恒常的なテーマ 
ソーシャル 
売上データ 
GPS/センサー 
他社提供の 
会員情報 
…
マイクロソフトが考えるデータ活用のポイント 
目的ビジネス要件
日常的に行われる仮説検証の例 
一般的に、コンビニはPOSシステムの販売データをもとに、よく売れた商品を売れ 
筋として発注するように思われていますが、それはまったくの誤解です。データは 
あくまでも仮説を検証するために使うのです。 
自分では何も考えずに発注をしていたら、販売データを見ても、何の検証もできま 
せん。売り上げの数字は、事前に仮説を立てることによって、初めて意味を持つの 
です。アルバイトやパートのスタッフに至るまで、仮説・検証を徹底させ、1人ひ 
とりがデータを読む力を持っていることが、大きな原動力になっているのです。 
新規顧客が伸び 
ていない? 
売上が 
落ちている! 
リピーターが減って 
いる? 
営業訪問 
回数 
新規/リピーター割合 
営業が 
提案していない? 
他チェーンと12 万円以上の平均日版の差 
引用: 
PRESIDENT BOOKS/PRESIDENT Online スペシャル– セブン&アイHLDGS 会長兼CEO 鈴木敏文特別インタビュー 
http://president.jp/articles/-/11579
マイクロソフトが考えるデータ活用のポイント 
目的ビジネス要件 
セルフサービスBI:社員の誰もが自分の手元で仮説検証ができる 
手軽で 
簡単 
スピーディ 
どこでも 
使える 
チームで 
共有 
IT要件
すべての人に強力で使い慣れたツールを 
8
データ分析のパターン 
「5年間のカテゴリーシェア推移」のように、時間軸を伸ば 
して、根源的な課題を探る(事例で言えば、「売れないこと 
が問題ではなくて5年間定番が作れない組織能力の問題」) 
インテージデータよりもクイックに商品の初速データを 
ウォッチすることにより、経営判断の迅速化を可能にする 
セルフサービスBI が 
得意な領域 
戦略ストーリーの中で、競合社とのリピート率推移の精緻な 
ウォッチなどをすることで、「告知から販促へ」等の経営判 
断を精緻化したり、店頭訴求/販促の適正化を判断する(最 
終的には定番化スキルを高める) 
② クイック 
一般的なポートフォリオ分析とも異なった軸によるポート 
フォリオによって自社の商品群の競争力を認識し、大きな経 
営判断への一助にする 
① 時系列を伸ばす 
③ 戦略ストーリー 
(競合比較) 
④ ポートフォリオ 
コーポレートBI が 
得意な領域 
セルフサービスBI が 
得意な領域 
セルフサービスBI が 
得意な領域
Microsoft のビッグデータ分析基盤の全体像 
ビッグデータ分析基盤Power BI 
機械学習 
Business 
Intelligence 
大規模データ分析 
(Hadoop) 
データマイニング 
Power Map Power View 
PowerPivot 
Power Q&A 
Power Query 
ビッグデータ分析で必要となる 
すべてのデータ分析機能を提供 
全社員が使い慣れたツールを使って 
自分自身でデータを活用可能 
情報共有(ポータル) 
データストア(RDB・File ... etc.)
Demo 
Power BI for Office 365 
IT とビジネス 
現場の橋渡しを 
行う役割 
生データ 
Power Query 
現場が活用できるデータ 
現場社員現場社員による活用 
Power View 
Power Pivot 
Power Pivot ファイルをSharePoint で共有 
Power Map 
Data Mining Power Q&A
Power BI for Office 365 
分析する 
可視化 
共有する 
見つける 
Q&A 
どこからで 
もアクセス 
発見する社内の情報も社外の情報も、 
検索し、アクセスして、 
変換する 
データとワークブックを共有。 
クラウドもオンプレミスの 
データも最新化可能。 
簡単にデータをモデル化し、 
インメモリで素早く分析 
簡単操作でインタラクティブに 
データを可視化 
自然言語で、素早く回答を得る 
HTML5 とタッチに最適化したWindows アプリ 
でモバイルからもアクセス 
拡張性| 管理性| 信頼性
13 
Power Query による外部データソースの利用 
- Microsoft Power BI 
Demo 
主な機能 
• 社内、社外データの識別と 
インポート: 
• リレーショナルデータベース 
• Excel 
• テキスト 
• XML 
• Odata 
• Web ページ 
• Hadoop HDFS 
• 検索機能による関連データ 
の探索 
• 複数データソースの結合と 
変換
14 
データの地図(Bing Map) へのマッピング 
- Microsoft Power BI 
Demo 
主な機能 
• Excel 上の地理および時間 
に関するデータが3 次元処 
理され、新しい観点での情 
報分析が可能に 
• 時系列に沿ってデータを地 
図上にレンダリング可能に
15 
Power Q&A による自然言語でのデータ操作 
- Microsoft Power BI for Office 365 
主な機能 
• Office 365 のSharePoint 
Online 上にExcel 
PowerPivot ファイルをパブ 
リッシュすることで、ブラウ 
ザからそのPowerPivot 構造 
体に対して、自然言語検索で 
結果を取り出すことができる 
• 検索結果はPower View 形式 
でブラウザに自動描画される 
• HTML5 対応で 
マルチデバイスから 
利用可能
16 
Power View 予測 
- Microsoft Power BI for Office 365 
Demo 
主な機能 
• Office 365 のSharePoint 
Online 上にExcel 
PowerView ファイルをアップ 
ロードすることでシーズナリ 
ティに基づく予測が可能 
• 信頼区間を設定可能 
標準偏差σ (シグマ) を設定し、 
予測値(水色の折れ線) の 
68%/95%/99% (1σ/2σ/3σ) 
がシェードエリア(水色の網 
掛部分) 内にあることを示す 
• データはエクスポート可能
17 
データマイニングアドインによる見識の発見 
- Excel with SQL Server Analysis Services 
主な機能 
• データマイニングアルゴリ 
ズムをデータに適用するこ 
とにより、傾向の予測、パ 
ターンの識別、およびルー 
ルや提案の作成を行い、複 
雑なデータセット内でイベ 
ントの順序を分析し、新し 
い見識を得ることができる 
• ユーザーインターフェイス 
として、Excel のアドイン 
を使用
Next Session ... 
本セッションでお伝えできなかったの部分は、B32 のセッションをお聞きください。 
ビッグデータ分析基盤Power BI 
データマイニング 
機械学習 
Business 
Intelligence 
大規模データ分析 
Power Map Power View 
(Hadoop) PowerPivot 
Power Q&A 
Power Query 
ビッグデータ分析で必要となる 
すべてのデータ分析機能を提供 
全社員が使い慣れたツールを使って 
自分自身でデータを活用可能 
情報共有(ポータル) 
データストア(RDB・File ... etc.)
今すぐお試しください! 
Step1 
Step2 最新Excelが 
含まれます 
Office 365 Enterprise 
Q&A 
Power BI 
サイト 
Excel 
アドイン 
www.office365.com Powerbi.com
関連サイト 
Power BI for Office 365 紹介ビデオ 
http://aka.ms/pbidemo 
Power BI 紹介サイト 
http://www.microsoft.com/ja-jp/ 
sqlserver/2012/powerbi/
© 2014 Microsoft Corporation. All rights reserved. Microsoft, Windows, and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. 
The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the 
part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION.

データ分析で Excel を活用しよう

  • 1.
    db tech showcase Tokyo 2014 ROOMD データ分析で Excel を活用しよう 日本マイクロソフト株式会社 サーバープラットフォームビジネス本部 クラウドアプリケーションビジネス部 北川剛(Kitagawa Tsuyoshi) D16
  • 2.
    トレンドとしてのビッグデータ データ分析 量・質・多様化高度化/処理能力向上 活用 恒常的なテーマ ソーシャル 売上データ GPS/センサー 他社提供の 会員情報 …
  • 3.
  • 4.
    日常的に行われる仮説検証の例 一般的に、コンビニはPOSシステムの販売データをもとに、よく売れた商品を売れ 筋として発注するように思われていますが、それはまったくの誤解です。データは あくまでも仮説を検証するために使うのです。 自分では何も考えずに発注をしていたら、販売データを見ても、何の検証もできま せん。売り上げの数字は、事前に仮説を立てることによって、初めて意味を持つの です。アルバイトやパートのスタッフに至るまで、仮説・検証を徹底させ、1人ひ とりがデータを読む力を持っていることが、大きな原動力になっているのです。 新規顧客が伸び ていない? 売上が 落ちている! リピーターが減って いる? 営業訪問 回数 新規/リピーター割合 営業が 提案していない? 他チェーンと12 万円以上の平均日版の差 引用: PRESIDENT BOOKS/PRESIDENT Online スペシャル– セブン&アイHLDGS 会長兼CEO 鈴木敏文特別インタビュー http://president.jp/articles/-/11579
  • 5.
  • 8.
  • 9.
    データ分析のパターン 「5年間のカテゴリーシェア推移」のように、時間軸を伸ば して、根源的な課題を探る(事例で言えば、「売れないこと が問題ではなくて5年間定番が作れない組織能力の問題」) インテージデータよりもクイックに商品の初速データを ウォッチすることにより、経営判断の迅速化を可能にする セルフサービスBI が 得意な領域 戦略ストーリーの中で、競合社とのリピート率推移の精緻な ウォッチなどをすることで、「告知から販促へ」等の経営判 断を精緻化したり、店頭訴求/販促の適正化を判断する(最 終的には定番化スキルを高める) ② クイック 一般的なポートフォリオ分析とも異なった軸によるポート フォリオによって自社の商品群の競争力を認識し、大きな経 営判断への一助にする ① 時系列を伸ばす ③ 戦略ストーリー (競合比較) ④ ポートフォリオ コーポレートBI が 得意な領域 セルフサービスBI が 得意な領域 セルフサービスBI が 得意な領域
  • 10.
    Microsoft のビッグデータ分析基盤の全体像 ビッグデータ分析基盤PowerBI 機械学習 Business Intelligence 大規模データ分析 (Hadoop) データマイニング Power Map Power View PowerPivot Power Q&A Power Query ビッグデータ分析で必要となる すべてのデータ分析機能を提供 全社員が使い慣れたツールを使って 自分自身でデータを活用可能 情報共有(ポータル) データストア(RDB・File ... etc.)
  • 11.
    Demo Power BIfor Office 365 IT とビジネス 現場の橋渡しを 行う役割 生データ Power Query 現場が活用できるデータ 現場社員現場社員による活用 Power View Power Pivot Power Pivot ファイルをSharePoint で共有 Power Map Data Mining Power Q&A
  • 12.
    Power BI forOffice 365 分析する 可視化 共有する 見つける Q&A どこからで もアクセス 発見する社内の情報も社外の情報も、 検索し、アクセスして、 変換する データとワークブックを共有。 クラウドもオンプレミスの データも最新化可能。 簡単にデータをモデル化し、 インメモリで素早く分析 簡単操作でインタラクティブに データを可視化 自然言語で、素早く回答を得る HTML5 とタッチに最適化したWindows アプリ でモバイルからもアクセス 拡張性| 管理性| 信頼性
  • 13.
    13 Power Queryによる外部データソースの利用 - Microsoft Power BI Demo 主な機能 • 社内、社外データの識別と インポート: • リレーショナルデータベース • Excel • テキスト • XML • Odata • Web ページ • Hadoop HDFS • 検索機能による関連データ の探索 • 複数データソースの結合と 変換
  • 14.
    14 データの地図(Bing Map)へのマッピング - Microsoft Power BI Demo 主な機能 • Excel 上の地理および時間 に関するデータが3 次元処 理され、新しい観点での情 報分析が可能に • 時系列に沿ってデータを地 図上にレンダリング可能に
  • 15.
    15 Power Q&Aによる自然言語でのデータ操作 - Microsoft Power BI for Office 365 主な機能 • Office 365 のSharePoint Online 上にExcel PowerPivot ファイルをパブ リッシュすることで、ブラウ ザからそのPowerPivot 構造 体に対して、自然言語検索で 結果を取り出すことができる • 検索結果はPower View 形式 でブラウザに自動描画される • HTML5 対応で マルチデバイスから 利用可能
  • 16.
    16 Power View予測 - Microsoft Power BI for Office 365 Demo 主な機能 • Office 365 のSharePoint Online 上にExcel PowerView ファイルをアップ ロードすることでシーズナリ ティに基づく予測が可能 • 信頼区間を設定可能 標準偏差σ (シグマ) を設定し、 予測値(水色の折れ線) の 68%/95%/99% (1σ/2σ/3σ) がシェードエリア(水色の網 掛部分) 内にあることを示す • データはエクスポート可能
  • 17.
    17 データマイニングアドインによる見識の発見 -Excel with SQL Server Analysis Services 主な機能 • データマイニングアルゴリ ズムをデータに適用するこ とにより、傾向の予測、パ ターンの識別、およびルー ルや提案の作成を行い、複 雑なデータセット内でイベ ントの順序を分析し、新し い見識を得ることができる • ユーザーインターフェイス として、Excel のアドイン を使用
  • 18.
    Next Session ... 本セッションでお伝えできなかったの部分は、B32 のセッションをお聞きください。 ビッグデータ分析基盤Power BI データマイニング 機械学習 Business Intelligence 大規模データ分析 Power Map Power View (Hadoop) PowerPivot Power Q&A Power Query ビッグデータ分析で必要となる すべてのデータ分析機能を提供 全社員が使い慣れたツールを使って 自分自身でデータを活用可能 情報共有(ポータル) データストア(RDB・File ... etc.)
  • 19.
    今すぐお試しください! Step1 Step2最新Excelが 含まれます Office 365 Enterprise Q&A Power BI サイト Excel アドイン www.office365.com Powerbi.com
  • 20.
    関連サイト Power BIfor Office 365 紹介ビデオ http://aka.ms/pbidemo Power BI 紹介サイト http://www.microsoft.com/ja-jp/ sqlserver/2012/powerbi/
  • 21.
    © 2014 MicrosoftCorporation. All rights reserved. Microsoft, Windows, and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION.

Editor's Notes

  • #11 まずMicrosoft のビッグデータ分析基盤の全体像をご紹介します。 ビッグデータ分析基盤 ビッグデータというキーワードが世の中で一般的に使われるようになって久しいが、ビッグデータを分析するための手法は主に4つに集約される。 数値データを集計ベースで分析するためのBusiness Intelligence 超大容量の数値データや、文字列データなどの非定型データを複数のサーバで分散処理させて分析するHadoop 人間がなかなか気づきにくいデータ間の相関関係やルールなどを、様々な統計的アルゴリズムを使って導き出すデータマイニング データマイニングと同じ様な手法を使い、モールに来たお客様が買いそうな商品を予測したり、お客様の属性情報を予測する、「未知の情報を予測する」ための機械学習」 マイクロソフトでは、これらビッグデータで必要となる全ての分析手法を実現するための基盤を提供している Power BI これらの分析基盤にアクセスする方法として、Power BIというブランドで分析のクライアント機能を提供しており、このPower BIを使う事によって、ビッグデータ分析基盤につなぎ、非常に簡単な操作でビッグデータの分析を行う事ができる様になります。
  • #17 http://blogs.msdn.com/b/powerbi/archive/2014/05/08/describing-the-forecasting-models-in-power-view.aspx https://support.office.com/en-us/article/Forecast-your-data-in-Power-View-in-HTML5-and-the-Power-BI-app-5F61CE35-A6B3-4969-AA7D-9D259609D16D Holt-Winters アルゴリズムをもとにエンハンスを追加 Use of validation window for optimal parameter selection State vector correction at the end of training window when data is noisy データポイント全体の40%未満の欠損値は線形に補完する。 タイムシリーズ ARTXP:短期的なモデル作成に向く (SQL Server 2005 で導入されたアルゴリズム) ARIMA:長期的なモデル作成に向く (SQL Server 2008 で導入されたアルゴリズム) The confidence interval shows visually how reliable the forecast is. Standard deviation is the setting for the confidence interval of forecast results. 信頼区間は、予測の信頼性を視覚的に表します。標準偏差は、予測結果の信頼区間を設定するものです。 It is important to understand that in Power View hindcasts are based only on the portion of the data preceding your selection, and not on the complete data.  This can affect the quality of the predictions in several ways: Hindcasts will not necessarily mirror predictions based on the larger data set, simply because the data is different. The farther you go back in time, the less information you have, and the less it will represent your current forecast. If there have been any significant changes in the distribution of values throughout your historical data, you should take those into account when assessing the quality of the hindcasts. <アニメーション 上段 Hindcast> ① Hindcast の説明 ② 予測を行うと、左側に引っ張れる点 (<・)が表示されるので、左にドラッグ ③ Hindcast エリアには予測した線と実際の値が表示される <アニメーション 下段 what-if analysis> ① 2010年1月の値を上方に修正 (上にドラッグ) ② 青い線の値を元に予測し直される。信頼区間 (青の網掛) も幅が狭くなっていることが確認できる 次は「課題2」