Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Tableauが魅せる Data Visualization の世界

20,912 views

Published on

Published in: Technology

Tableauが魅せる Data Visualization の世界

  1. 1. Tableau が魅せる Data Visualization の世界 Copyright ©2014 Treasure Data. All Rights Reserved. 2014/09 Takahiro Inoue (Chief Data Scientist) taka@treasure-‐‑‒data.com
  2. 2. Copyright ©2014 Treasure Data. All Rights Reserved. ⾃自⼰己紹介 • 井上 敬浩 (Twitter: @doryokujin ) • チーフデータ サイエンティスト • 慶應⼤大学院数学科統計専攻 • トレジャーデータ公式ブログ オーサー • MongoDBマスター 2 http://treasure-‐‑‒data.hateblo.jp
  3. 3. アジェンダ 1. BI / Data Visualization に関するトレンド 2. Tableau 製品群紹介 3. Tableau Desktop 紹介 4. Tableau Server 紹介 5. Tableau × Treasure Data 6. Tableau テクニック集 参考⽂文献(Tableau公式):http://www.tableausoftware.com/learn/whitepapers/download 参考⽂文献(Class Method):http://dev.classmethod.jp/ Copyright ©2014 Treasure Data. All Rights Reserved. 3
  4. 4. アジェンダ 1. BI / Data Visualization に関するトレンド 2. Tableau 製品群紹介 3. Tableau Desktop 紹介 4. Tableau Server 5. Tableau × Treasure Data 6. Tableau テクニック集 Copyright ©2014 Treasure Data. All Rights Reserved. 4 この 10 項目のトレンドに将来 性がある これらのトレンドは、顧客が現在何をしていて、将来のために どこに投資しているかについて顧客と話すことで見えてきま す。良い知らせは、先手を打って失敗した挫折感ではなく、さ らに確実な先手を打つ意欲によって推進されている投資が 最も多いことです。おそらく、過去数年間の新しいテクノロジ ーと投資がついに成果を上げ始めているのです。2013 年に は、ビジネス インテリジェンスの大きな変化を必ず期待でき ます。 www.tableausoftware.com/desktop Tableau Software は、お客様がデータを見て理解する のをお手伝いします。世界中の 10,000 を超える組織で 使用されている Tableau は、迅速な分析、視覚化、お よび超高速処理ビジネスインテリジェンスを提供して います。
  5. 5. データサイエンティストの消滅。 データサイエンスは専門家だけでなく、一般のビジネスマンが扱うものになりつつあります。 データ分析に関する知識は、肩書きに「アナリスト」が付くような専門家だけではなく、一般のビ ジネスマンにも必要な知識になり始めています。データに基づいて決定を行う企業が競争力を 高め、データを活用しない企業が競争力を弱めています。 1-‐‑‒1. 誰もがデータサイエンスを武器にできる 時代に 詳細は、The Economist の「Fostering a Data-Driven Culture (データ主導型の文化を育成)」 をご覧ください。 Copyright ©2014 Treasure Data. All Rights Reserved. 5 • データサイエンスは専⾨門家だけでなく,⼀一般のビジネスマンが扱うものになりつつあります。 • データ分析に関する知識識は,肩書きに「アナリスト」が付くような専⾨門家だけではなく,⼀一般のビ ジネスマンにも必要な知識識になり 始めています。データに基づいて決定を⾏行行う企業が競争⼒力力を⾼高め、データを活⽤用しない企業が競争⼒力力を弱めています。
  6. 6. クラウド ビジネス インテリジェンスが主流になる。 データ分析の導入を速めたい企業は、クラウド ベースのビジネス インテリジェンスの採用を推進し ています。顧客との連携やファイアウォール外のモバイル アクセスなどの新たなシナリオも、クラウ ド ビジネス インテリジェンスの導入を加速しています。また、クラウド サービスが成熟することで、 IT 部門によるビジネス インテリジェンスのクラウド化への懸念が弱まっています。 1-‐‑‒2. ビッグデータ・BI は共にクラウドへ Copyright ©2014 Treasure Data. All Rights Reserved. 6 • データ分析の導⼊入を速めたい企業は,クラウドベースのビジネスインテリジェンスの採⽤用を推進しています。 • 顧客との連携やモバイルアクセスなどの新たなシナリオもクラウドビジネスインテリジェンスの導⼊入を加速しています。 • Treasure Data のクラウド データ ウェアハウスにより,数カ⽉月かかるデータウェアハウスの構築を数⽇日で実現することができます。 • これにより,ラピッド プロトタイピングが可能になり,以前とは⽐比較にならない柔軟性をもたらします。 詳細は、ホワイトペーパー「Business Analytics in the Cloud (クラウドのビジネス分析)」をご覧 ください。
  7. 7. ストリーテリングの重要性。 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきました。スト リーテリングでは、データを利用してアイデアや洞察を効果的に伝えることができます。また、 大容量の異種データが持つ意味を汲み取ることもできます。 1-‐‑‒3. ストーリーテリングの重要性 Copyright ©2014 Treasure Data. All Rights Reserved. 7 • ⼈人々はコンテクストのないダッシュボードが増えても役⽴立立たないことを理理解してきました。 • ストーリーテリングではデータを利利⽤用してアイデアや洞洞察を効果的に伝えることができます。 • また,⼤大容量量の異異種データが持つ意味を汲み取ることもできます。 詳細は、ホワイトペーパー「5 Best Practices for Telling Great Stories (優れたスト リーを伝える 5 つのベスト プラクティス)」をご覧ください。
  8. 8. 最先端の企業にとって、モバイル ビジネス インテリジェンス は主流となり、 特別なときに使用するものではなくなっています。ビジネス ユー ザーは、オフィスだけではなく、日常業務の流れで、どんな時でも情報にアクセスする必要性に 迫られています。 事例については、ホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の 効率と変革を促進)」をご覧ください。 1-‐‑‒4. モバイルBIが主流流に Copyright ©2014 Treasure Data. All Rights Reserved. 8 • 最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり, 特別な場合のみに使⽤用するものではなくなっています。 • ビジネス ユーザーは,オフィスだけではなく⽇日常業務の流流れで,どんな時でも情報にアクセスする必要性に 迫られています。
  9. 9. ストアは解決すべき問題ではなく,優れた IT 組織の特徴の 1 つとなります。データ ストアの急増 1-‐‑‒5. データストアの急増 その昔、組織にはさまざまなタイプのデータがありまし た。CRM データ、販売時点データ、電子メールなど、組織の経 営陣は多大な努力を払い、すべてのデータを 1 つの高速なデー タ ウェアハウスに保存していました。 Copyright ©2014 Treasure Data. All Rights Reserved. 9 • その昔,組織には様々ななタイプのデータがありました。 • CRMデータ,販売時点データ,電⼦子メールなど,組織の経営 陣は多⼤大な努⼒力力を払い,すべてのデータを1つの⾃自社の⾼高速な データウェアハウスに保存していました。 • 2014年年にはこれがおとぎ話となります。すべてのデータは Fluentd ベースの Treasure Agent を通じて⼀一元的に収集管 理理でき,またトレジャーストレージはあらゆるデータの共存 を容易易に実現しています。 • トレジャーを初めとする,データや作業負荷に適したデータ 2013 年には、これがおとぎ話となります。すべてのデータを 1 か所に保管する組織はもはや存在しません。さらに、1 か所 に保管する理由もなくなります。大量のデータは Teradata や Hadoop などの場所に保管できます。取引データは Oracle や SQL Server に保管できます。データや作業負荷に適したデータ ストアは、解決すべき問題ではなく、優れた IT 組織の特徴の 1 つとなります。
  10. 10. 1-‐‑‒6. 自立性が新しいセルフサービスに Copyright ©2014 Treasure Data. All Rights Reserved. 10 • セルフ サービス BI は,ビジネス ユーザーがより優れた決定 を⾏行行うために必要なデータを分析できるようにするという考 え⽅方です。 • ⾃自⽴立立性は,この概念念の時代の到来です。これは – ビジネス ユーザーが適切切なデータにアクセスできること、 – そのデータが 使⽤用可能な形式と場所にあること、 – またビジネス ユーザーにセルフサービス分析が可能なソ リューションがあること を意味します。 • これらすべてが実現できれば,ビジネス ユーザーはビジネス 上の問題に⾃自分で対応でき,IT は安全なデータとそれにア クセスするためのソリューションの提供に集中することがで きます。
  11. 11. 1-‐‑‒7. コラボレーションは機能でなく現実に Copyright ©2014 Treasure Data. All Rights Reserved. 11 • ビジネスインテリジェンスソリューションでは,よくコラボ レーション機能が盛んに宣伝されてきましたが,2014年年には それだけでは⼗十分でなくなります。 • コラボレーションは,ビジネス インテリジェンスの導⼊入の本 質でなければなりません。 • ビジネ スに関する質問のやり取りといった共有体験なくして, ビジネスインテリジェンスは存在し得ないためです。 • 2014 年年には、企業は問題の理理解と解決に向けた共同作業に 組織全体の⼈人を関与させるための⽅方法を追求するようになり ます。
  12. 12. アジェンダ 1. BI / Data Visualization に関するトレンド 2. Tableau 製品群紹介 Copyright ©2014 Treasure Data. All Rights Reserved. 12 a. Tableau Desktop b. Tableau Reader c. Tableau Server d. Tableau Public
  13. 13. 2. ビジネスが抱える課題 1. 上層部から分析を要求されている – 幹部チームからもっとデータ主導型企業になるよう要求されているけれども,具体的な施策が見つからない。 2. ⼤大量量のレポートの要求を受け続けている – 終わらないまま毎⽇日増え続けるリストにうんざりし,お⼿手上げ状態である。 – 優秀な分析チームも最善を尽くし,少なくともリクエストに優先順位を付けて作業することは可能ですが,その場合は優先 度度の⾼高いものだけが処理理され,その他のものは⼿手つかずに終わる可能性があります。 3. レポートを提出することで、さらに必要なレポートが増えていく – レポートの作成前に必要な内容をすべて確認したにもかかわらず,フォローアップの質問は途切切れることがありません。 – あなたのレポート内容に⼈人々が惹きつけられたということでもありますが,その後の度度重なる質問に回答するため再度度チー ム内に聞いて回っていては ⾮非効率率率的です。 4. データが古いことにフラストレーションを感じている – レポートを要求し,レポートを待ち,そのレポートに 関する質問を投げかける,というサイクルで避けられない問題の 1 つに,データが最新でなくなるという点があります。 – ビジネスにおいてもプライベートにおいても,現代の世界では「すぐに満⾜足感を得たい」という⾵風潮があります。このよう に待ち時間が多くては,その期待には応えられません。 Copyright ©2014 Treasure Data. All Rights Reserved. 13
  14. 14. 2. ビジネスが抱える課題 5. マッシュアップしたデータを要求される – 実際に「マッシュアップ」という単語が使われていないかもしれませんが,「サードパーティのデータも追加してくれない か」、 「Excel ファイルに⼤大量量のデータがあるが、それがこれとどう関係しているのかが⾒見見たい」など要求されていません か? – 複数のデータソースを組み合わせることの有⽤用性は分かっていても、⼀一元管理理された BI チームでこのような調整を⾏行行うの は容易易ではありません。 6. 視覚的分析を求めている – ⼈人間は,⾏行行や列列,表を⾒見見 る よりも分かりやすい視覚的な形でデータを⾒見見た⽅方が多くの情報を認識識できます。 – まだ視覚的データを要求されてい なくても、近いうちに要求されるようになるはずです。 – それ がセルフサービスBIとどう関係するのか?データを様々な形で⾒見見ることができれば,疑問に対する新たな視点を求めら れることがなくなります。 7. すでに⼀一部で使⽤用している – 全てに当てはまるわけではありませんが,多くの企業がすでにセルフサービスBIを独⾃自に採⽤用しています。 – 才覚のあるビジネスリーダーはチームの処理理能⼒力力の限界を把握し,彼らが⾮非常に優秀で優れたプロジェクトを運営できるこ とを認識識しています。 – その結果,独⾃自のセルフサービスBIを採⽤用するケースが多く⾒見見られます。 – ITリーダーにとって希望の兆しとなるのは、その導⼊入によってすばらしい結果が⽣生み出されることで,セルフサービス BI の取り組みをサポートする⽀支援者を 得られるという点です。 Copyright ©2014 Treasure Data. All Rights Reserved. 14
  15. 15. 2. 回避したい7つの間違い 1. 複雑すぎるスタート – 野⼼心的になりすぎて,すべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成し,ユーザーにた くさんの詳細オプションを提供することは簡単です。 – 「完璧」なダッシュボードを作成するために何週間も何ヶ⽉月も時間を費やさないでください。その代わり,試作品とテスト, 調整の短いサイクルで作業します。 2. 誰も理理解できない指標を使⽤用する – あなたにとってつじつまが合う指標の表⽰示⽅方法やラベル付け⽅方法は,他の⼈人にとってもそうでしょうか? – あなたは指標を熟知しているので,別のものと検証するステップはいらないかもしれません。 – 指標がダッシュボードの⽬目標をサポートするだけ でなく,閲覧者が理理解できるようにする必要があります。 3. 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにする – ゲージのようなグラフィックやウィジェットでダッシュボードを派⼿手にデザインしすぎないようにします。 – こうしたものは⾒見見た⽬目は良良いですが,迅速かつ簡単に閲覧者に知らせるというダッシュボードの⽬目的が妨げられる場合があ ります。ダッシュボードは⾒見見た⽬目をシンプルに抑えてください。 4. 複雑なテクノロジーや⼤大きなビジネス インテリジェンス展開プロジェクトを待つ – 従来のビジネス インテリジェンス (BI) の実装は,最初の予測よりも⻑⾧長くかかる場合があります。従来の BI プロジェクト が実現するまで待つと,何ヶ⽉月も何年年も遅れる場合があります。すぐにダッシュボードを構築して配布できるアプリケー ションを使⽤用してください。 Copyright ©2014 Treasure Data. All Rights Reserved. 15
  16. 16. 2. 回避したい7つの間違い 5. ダッシュボードの作成と維持のための時間とリソースを過⼩小評価する – ダッシュボードの展開は1回で終わる作業ではありません。 – 指標に関連性があり,データが最新であるかを閲覧者と確認 することを怠ると誰も使⽤用しなくなります。定期的にダッシュ ボードの実⽤用性を確認してください。 6. 指標と⽬目標が⼀一致しない – ダッシュボードは⼤大きな⽬目標に接続するとより強⼒力力になります。部署内の主な指標が,組織全体としての成功に反映しない ダッシュボードを作成してしまうことのないようにします。 7. 効果的でない、デザインの悪いグラフやチャートを使う – グラフやチャートをデザインする際は気をつける必要があります。 – たとえば,3D チャートで閲覧者の理理解が増すことはありません。派⼿手な⾊色が解釈の邪魔になることもあります。円グラフ は値が6つ以上ある場合は特に効果的とは⾔言えません。 – 優れたビジュアライゼーションのデザインは「6. Tableau Best Practice」を参照してください。 Copyright ©2014 Treasure Data. All Rights Reserved. 16
  17. 17. 2. Tableauの特徴 Install Access Analyze Publish Share 10 X 100 TIMES FASTER PC Browser iPad Android Desktop In-Memory Data Live Connection ↑ 導⼊入から分析共有までのサイクルが10〜~100倍速いです。 ←あらゆるデータソース(インプット),あらゆる端末(アウ トプット)をTableauが繋ぎます。 ↓Tableau Desktop で作成したレポートをすぐにパブリック にできます。 Copyright ©2014 Treasure Data. All Rights Reserved. 17 • BI ソリューションでは、新しいユーザーが初めてダッシュ ボードまたはレポートを作成してパブリッシュできるよう になるまで、トレーニングに数日または数週間かかりま すか。 • BI ソリューションは綿密なスケジュールや、システムの ロードしてインストールします。スプレッドシートやリレーシ ョナル データベースからキューブ、Hadoop などに至るまで、 あらゆる種類のデータにアクセスします。この操作はワンク リックで可能です。高速データ ストアにライブ接続するか、 抽出データを高速データ エンジンにインポートするかを選 図 1. データ ワークフローのあらゆる段階で高速化 これまでのビジネス インテリジェンスと比べて、超高速処理分析では、ソフトウェアのインストールからデータへのアクセス、複雑な情報の 分析、インタラクティブなダッシュボードのパブリッシュ、組織全体での共有に至るまで、ワークフローのあらゆる段階で、その処理速度は 10 ~ 100 倍高速です。 ネス クノ 超高速 り、簡単 トピック、 ーによる をグラフ および れました。 ティブな 繰り返し スの次 続 ク アクセス め、ほ ネクタ せずに、 しまし は運送 Tableau の使 して、高速のデータ ストアに直接接続することもできます。 もちろん、これらの 2 つのデータ アクセス方式 (ライブ接続 とインメモリ) の間には完全な互換性があります。アクセス 方式がライブ接続かインメモリかにかかわらず、複数のデー タ ソースをブレンドし、組み合わせることができます。 Databases, Cubes, Spreadsheets, Hadoop More 図 10. Tableau アーキテクチャ Tableau のアーキテクチャには、膨大なデータ ソースに対応する ために、インメモリとライブ接続という 2 つの方法が用意されて います。 Create Publish Tableau Desktop Tableau Server Access Edit PC Browser Android iPad Desktop
  18. 18. 2-‐‑‒a. Tableau Desktop • 考える速さで分析する – データに接続し,コードを1⾏行行も書かずにクエリを実⾏行行できます。 – ドラッグアンドドロップを使⽤用したビュー間の直感に沿った移動が可能です。 – ペタバイト単位または何⼗十億⾏行行ものデータを測定するかどうかに関わらず,Tableau は可能な限り⾼高速に動作するように構築さ Copyright ©2014 Treasure Data. All Rights Reserved. れています。 – Windows, Mac 両対応(ver. 8.2) – Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能,ビッグデータをマウスでアドホックに 扱えます。 18
  19. 19. 2-‐‑‒b. Tableau Reader • Tableau Reader は,Tableau Desktopで作成したビジュアライゼーションを開いて表⽰示できる 無料料のデスクトップアプリケーションです。 • Tableau Reader では,データを含むTableau Desktopで作成したビジュアライゼーションを開 いて操作可能です。 • 作成者の許可の範囲内であれば,データをフィルター,ドリルダウン表⽰示が可能です。 • 作成者によって組み込まれていない場合は,操作を編集したり実⾏行行したりすることは不不可能です。 • Window, Mac 両対応 Copyright ©2014 Treasure Data. All Rights Reserved. 19
  20. 20. 2-‐‑‒c. Tableau Server • 作成したダッシュボードをWEBアプリ化する事で,どこからでもどのデバイスでも分析出来 るようになります。 • データソースへの接続を Tableau Server に集約することによりデータの共有,データマート としての利利⽤用が可能になります。 Copyright ©2014 Treasure Data. All Rights Reserved. 20
  21. 21. 2-‐‑‒d. Tableau Public • 導⼊入・利利⽤用は無料料です。 • 接続出来るデータの種類に制限されます。 • EXCEL,テキスト等,接続データソースに制限です。 • 利利⽤用出来る⾏行行数・データサイズに(100万⾏行行,1GB)制約があります。 • ⼀一般公開を前提としたサービスです。 Copyright ©2014 Treasure Data. All Rights Reserved. 21
  22. 22. アジェンダ 1. BI / Data Visualization に関するトレンド 2. Tableau 製品群紹介 3. Tableau Desktop 紹介 4. Tableau Server 紹介 5. Tableau × Treasure Data 6. Tableau テクニック集 Copyright ©2014 Treasure Data. All Rights Reserved. 22
  23. 23. 3. 画⾯面構成 Copyright ©2014 Treasure Data. All Rights Reserved. 23
  24. 24. 3. 画⾯面構成 Copyright ©2014 Treasure Data. All Rights Reserved. 24 ディメンション • 定性的な情報やカテゴリ情報を含むフィール ドを『ディメンション』として扱います • テキストや⽇日付の値を持つフィールドもこれ らに含まれます • ⾏行行または列列の棚にドラッグ&ドロップをする 事で,ヘッダを⽣生成します メジャー • ⾏行行または列列の棚にドラッグ&ドロップを⾏行行う と『軸』を⽣生成します。 • デフォルトでは数値(定量量的)情報を含む任意の フィールドを『メジャー』として扱います。
  25. 25. 3. 画⾯面構成 Copyright ©2014 Treasure Data. All Rights Reserved. 25 フィルタ
  26. 26. 3. 画⾯面構成 Copyright ©2014 Treasure Data. All Rights Reserved. 26 マーク カラー
  27. 27. 3. 画⾯面構成 Copyright ©2014 Treasure Data. All Rights Reserved. 27 マーク サイズマーク ラベル
  28. 28. 3. Show Me(表⽰示形式) a. テキストテーブル(text tables) b. ヒートマップ(heat maps) c. ハイライトテーブル(highlight tables) d. 記号マップ(symbol maps) e. ⾊色塗りマップ(filled maps) f. 円グラフ(pie charts) g. ⽔水平棒グラフ(horizontal bars) h. 積み上げ棒グラフ(stacked bars) i. 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars) j. ツリーマップ(tree maps) k. 円ビュー(circle views) l. 並列列円(side-‐‑‒by-‐‑‒side circles) Copyright ©2014 Treasure Data. All Rights Reserved. 28
  29. 29. 3. Show Me(表⽰示形式) a. 線グラフ:連続(lines continuous) b. 線グラフ:不不連続(lines discrete) c. ⼆二重線(dual lines) d. エリアチャート:連続(area charts continuous) e. エリアチャート:不不連続(area charts discrete) f. 2つの組み合わせ(dual combination) g. 散布図(scatter plots) h. ヒストグラム(histgram) i. 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot) j. ガントビュー(gantt view) k. ブレットグラフ(bullet graphs) l. パックバブル(packed bubbles) Copyright ©2014 Treasure Data. All Rights Reserved. 29
  30. 30. 3-‐‑‒1. Show Me 棒グラフ • ひと⽬目で最⾼高値と最低値を⾒見見ることができます。 • 棒グラフはさまざまなカテゴリーにうまく分けられる 数値データには特に便便利利で,データの傾向を簡単に表 すことができます。 • 例例:各サイズのシャツの数量量,発信元サイトごとの Web トラフィック、部⾨門ごとの⽀支出の割合などのカテ ゴリ間⽐比較 Copyright ©2014 Treasure Data. All Rights Reserved. • 応⽤用例例: – 1つのダッシュボードに複数の棒グラフを使⽤用:多数のス プレッドシートやスライドをめくる代わりに関連情報を簡 単に⽐比較することができ、疑問への答えを⾒見見つけやすくな ります。 – 棒に⾊色を付けてインパクトを強める:収益を棒グラフにす るとわかりやすくなりますが、さらに利利益に応じた⾊色を重 ねることで瞬時に情報が得られます。 – 積み上げ棒グラフや並列列バーを使⽤用:関連するデータを重 ねて,または横並びに表⽰示することで、分析に奥⾏行行きを与 えることができ、複数の疑問への答えを⼀一度度に⾒見見つけるこ とが可能です。 – 棒グラフとマップを組み合わせ:マップを「フィルター」 として設定することで,異異な る地域をクリックするごと に対応する棒グラフを表⽰示するようにできます。 – バーを軸の両サイドに:連続軸に沿って正の数と負の数を プロットすると傾向を把握しやすくなります。 30
  31. 31. 3-‐‑‒2. Show Me 折れ線グラフ • 折れ線グラフは個々の数値データ ポイントを「線」で Copyright ©2014 Treasure Data. All Rights Reserved. 結びます。 • それにより値の連続性をわかりやすく視覚化すること が可能です。 • 主に⼀一定期間にわたる傾向を表す際に使⽤用します。 • 応⽤用例例: – 折れ線グラフと棒グラフを組み併せ:特定の株価の1⽇日あ たりの売上⾼高を⽰示す棒グラフと、それに対応する株価の折 れ線グラフを組み合わせることで、詳細に調査するための 視覚的なキューを表すことができます。 – 線の下のエリアに影を付ける:2 つ以上の折れ線グラフが ある場合,それぞれの線の下の領領域を塗りつぶすことで⾯面 グラフを作成できます。これによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます。 31 7HFK/HDGVDSLWDO5DLVHGLQ 5XQQLQJ7RWDORIDSLWDO5DLVHGE,QGXVWULQ'HVFHQGLQJ2UGHU
  32. 32. Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1 $35,000 $30,000 $25,000 $20,000 $15,000 $10,000 $5,000 $0 Running Sum of Offer Amount (in mil) 7HFKQRORJ (QHUJ +HDOWKDUH RQVXPHU %XVLQHVV6HUYLFHV 5HDO(VWDWH 6HOHFWDQLQGXVWU WRYLHZLQGLYLGXDOFRPSDQLHV OLFNKHUHWRFOHDUILOWHU
  33. 33. 3-‐‑‒3. Show Me 円グラフ • 円グラフは、情報の相対⽐比率率率を表す際に使⽤用すます。 Copyright ©2014 Treasure Data. All Rights Reserved. ⽤用途はこれだけです。 • 円グラフは最も誤⽤用されやすいグラフです。 • データを⽐比較する場合は,棒グラフや積み上げ棒グラ フを使⽤用するようにします。 • 円の扇形を関連データとして解釈したり,1つの円を別 の円と⽐比較したりしないように。 • 例例:⽐比率率率を表す • 応用例: – 円の扇形を6つまでに制限します。⽐比率率率が6つ以上ある場 合は,棒グラフを使⽤用してください。扇形の数が多すぎる と,グラフの内容が伝わりにくくなります。 – 円をマップに重ねます。 データの地理理的な傾向を円グラ フで表すこともできます。このテクニックを使⽤用する場合 は,わかりやすくするために使⽤用する扇形の数を 2〜~3 個 にします。 32
  34. 34. 3-‐‑‒4. Show Me マップ • 郵便便番号,州名の省省略略形,国名,カスタムジオコー ディングなど、地理理的なデータを扱う場合はデータを マップ上に表⽰示する必要があります。 • 例例:州別の保険⾦金金請求,国別の製品輸出先,郵便便番号 別の交通事故数,カスタムの販売地域。 Copyright ©2014 Treasure Data. All Rights Reserved. • 応⽤用例例: – マップを他の種類のチャート,グラフ,表のフィルターと して使⽤用します。他の関連データとマップを組み合わせて, マップをフィルターとして使⽤用してデータを掘り下げるこ とで,データについてより詳しく検証,ディスカッション できます。 – マップの上にバブル チャートを重ねます。 バブル チャー トはデータの集中を表し、それぞれ異異なるサイズから関連 データを簡単に把握できるようになります。マップの上に バブルを 重ねることとで,異異なるデータ ポイントの地理理 的な影響をすばやく解釈できます。 33
  35. 35. 3-‐‑‒5. Show Me 散布図 • ⼀一部のデータをもう少し掘り下げたいのにやり⽅方がい まひとつわからない,または他の情報 が関連している かわからない場合は散布図を使⽤用すると傾向や集中, 外れ値を効果的に把握でき,さらに詳細に調査すべき 対象を⽰示してくれます。 • 例例:さまざまな年年齢における肺がんの男⼥女女別発⽣生率率率,テ クノロジーを先駆けて採⽤用する⼈人とそうでない⼈人のス マートフォンの購⼊入パターン,製品カテゴリー別の異異 なる地域への送料料。 Copyright ©2014 Treasure Data. All Rights Reserved. • 応用例: – 傾向線/最良良適合線を追加します。 データの相関性に傾向 線を追加すると結果がより明瞭になります。 – フィルターを組み込む。 散布図にフィルターを追加する と,さまざまなビューや詳細をド リルダウンすることが でき、データのパターンを素早く特定することができます。 – 情報を与えるマーク タイプを使⽤用します。 関連する図形 を使⽤用することで,データに隠さ れた背景が⾒見見えやすく なります。 34
  36. 36. 3-‐‑‒6. Show Me ガントチャート • ガントチャートはプロジェクトの開始⽇日と終了了⽇日の要 素を表すのに優れています。納期を守ることが,プロ ジェクト成功の要になります。それには達成すべき事 柄とその時期を把握することが必要です。そこでガン ト チャートの出番です。 • プロジェクト管理理にガントチャートを使⽤用するケース は多く⾒見見られますが,ガントチャートでは従業員や機 材などの他の要素が時間とともにどのように変化する のかを知ることもできます。例えば、従業員が特定の マイルストーン (資格など) を達成するまでの期間や, 時間と共にそれがどのように変化したかなど,⼈人材計 画を⽴立立てる際にもガント チャートを役⽴立立てることがで きます。 Copyright ©2014 Treasure Data. All Rights Reserved. • 応用例: – ⾊色を追加する。ガント チャート内のバーの⾊色を変えるこ とで、変数の重要側⾯面をすばやく 伝えることができます。 – マップや他の種類のチャートをガントチャートと組み合わ せる。ダッシュボードにガント チャ ートと他の種類の チャートを含めることで、フィルターやドリルダウンが可 能になり、より多くの 情報を引き出すことができます。 35
  37. 37. 3-‐‑‒7. Show Me バブルチャート • バブルチャート⾃自体はビジュアライゼーションの種類 ではなく、散布図やマップ上のデータを強調するため のテクニックと考えてください。 • 様々な⼤大きさの円によってデータの意味を表現できる ため,バブルチャートは魅⼒力力的な⽅方法で す。 • 例例:製品別,地理理別の売上の集中,学部や時間 帯ごと Copyright ©2014 Treasure Data. All Rights Reserved. の授業の出席率率率。 • 応用例: – 散布図のデータを強調する: 各データ ポイントのサイズ や⾊色を変えることで,散布図をひ と⽬目でさまざまな疑問 に答える豊かなビジュアライゼーションにできます。 – マップに重ねる:バブルによって,データの相対的な集中 を瞬時に伝えることができます。 バブルをマップのオー バーレイとして使⽤用すると,地理理的に関連するデータがす ばやく効果的に伝わります。 36
  38. 38. 3-‐‑‒8. Show Me ヒストグラム • ヒストグラムは,グループ間でのデータの分散を表⽰示 する場合に使⽤用します。たとえば,100 個のかぼちゃ があり,重量量が 1 キロ以下だと何個になるのか, 1.5~∼2 キロ、2.5~∼4.5 キロだと何個になるのかを表⽰示 する場合などです。 • データをこうしたカテゴリーにグループ化し,軸に 沿った垂直バーにプロットすることで,かぼちゃの重 量量と数の分布を⾒見見ることができます。 • データに適した分類⽅方法を決める必要がない場合もあ ります。ヒストグラムを使⽤用して、さまざ まな⽅方法を 試しながら現在の分析に規模や関連性が適しているグ ループを作成できます。 Copyright ©2014 Treasure Data. All Rights Reserved. • 例例: – データのグループ化をテストする。 データに合ったグ ループや「ビン」を模索索している場合,さまざまなヒスト グラムを作成することで最も適したデータ セットを探し 出すことがで きます。 – フィルターを追加する。データの異異なるカテゴリーをドリ ルダウンできるようにすることで,ヒストグラムは⼤大量量の データ ビューをすばやく探索索できる便便利利なツールになり ます。 37
  39. 39. 3-‐‑‒9. Show Me ブレットグラフ • ⽬目標がある場合,その⽬目標までの進⾏行行状況を追跡するにはブレッ Copyright ©2014 Treasure Data. All Rights Reserved. トグラフが適しています。 • 本質的には,ブレット グラフは棒グラフの⼀一種でダッシュボード のゲージ,メーター,サーモメーターを置き換えるために開発さ れました。その理理由は,通常ゲージなどの画像には⼗十分な情報が 表⽰示されず,貴重なダッシュボードのスペースを必要としていた ためです。 • ブレットグラフは、定義済みのパフォーマンスメトリクス (営業 ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の 売上など) を 1 つ以上の他のメジャー (年年間売上⽬目標) と ⽐比較す る場合に使⽤用します。 • ブレット グラフでは、全体的な⽬目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に⾒見見ることができます (営業担 当の年年間ノルマ達成まであとど れくらいかなど)。 • 例例:⽬目標と照らし合わせた指標のパフォーマンス評価。 営業ノル マの評価、予算と実際 の⽀支出、業績の分布 (良良い/普通/悪い)。 • 応⽤用例例: – ⾊色を使⽤用して達成のしきい値を⽰示す。プライマリメジャーの背景に⾚赤, ⻩黄⾊色,緑などの⾊色 を使⽤用すると⽬目標に対するパフォーマンスの状況をす ばやく把握できます。 – 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むこ とで、⽬目標達成のために注⽬目すべき 内容を伝えやすくなり,⽣生産的な ディスカッションに導くことができます。 38
  40. 40. 3-‐‑‒10. Show Me ヒートマップ • ヒートマップは⾊色を使⽤用して2つのカテゴリー間でデー タを⽐比較する有効な⽅方法です。カテ ゴリー間の共通部 分での⻑⾧長所と短所をすばやく伝えることができます。 • 例例:2つの要因の関係性を⽰示す。対象市場におけるセグ メンテーション分析、地域全体の製品導⼊入、営業担当 ごとのセールスリード Copyright ©2014 Treasure Data. All Rights Reserved. • 応用例: – 四⾓角形のサイズを変えます。ヒート マップでは,四⾓角形 のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を⾒見見ることができますが、3つ⽬目の要素を 追加することになります。たとえば、ヒートマップでアン ケート回答者が好むスポーツとイベントに参加する頻度度を ⾊色で⽰示し,四⾓角形の⼤大きさに各カテゴリーの回答者数を反 映させることができます。 – 四⾓角形以外を使⽤用する。 別の形のマークを使⽤用した⽅方が データをよりインパクトある形 で伝えられることがあり ます。 39
  41. 41. 3-‐‑‒11. Show Me ハイライト表 • ハイライト表は、ヒート マップをさらに進化 させたものです。⾊色を使⽤用してデータの交わり を⽰示 す以外に、ハイライト表では数値を使⽤用 して詳細情報を追加できます。 • 例例:ヒート マップの詳細情報を提供する。部 ⾨門別の市場占有率率率、特定の地域における 営業 担当者ごとの売上、各年年の都市の⼈人⼝口。 Copyright ©2014 Treasure Data. All Rights Reserved. • 応⽤用例例: – ハイライト表を他の種類のチャートと組み合わせる: たと えば、折れ線グラフとハイライ ト表を組み合わせると、 全体的な傾向を⾒見見ながらデータの特定の交差点をすばやく ドリル ダウンできるようになります。 40
  42. 42. 3-‐‑‒12. Show Me ツリーマップ • データを⾒見見て,全体と各要素との関係をひと⽬目で知りたい場合は ツリーマップが適していま す。このチャートでは他の四⾓角形の中 にネストされた⼀一連の四⾓角形を使⽤用して,階層化された データを 全体を占める割合で表します。 • チャートの名前にもあるように,データを⽊木のように関連するも Copyright ©2014 Treasure Data. All Rights Reserved. のとみなします。 • それぞれの枝が四⾓角形で表されており、それがどれくらいのデー タで構成されているかを⽰示します。各四⾓角形は全体を占める割合 に基づいてさらに⼩小さな四⾓角形 (または⼩小枝) に分けられます。 • 四⾓角形の⼤大きさと⾊色から異異なるカテゴリー間でも特定の項⽬目が関 連しているかどうかなど,データのさまざまな部分からパターン を⾒見見出すことができます。 • また、スペースを有効に活⽤用することがで きるため、データ全体 をひと⽬目で⾒見見ることができます。 • 例:全体を占める割合として階層データを⽰示す。 コンピューター 間のストレージ使⽤用率率率、 テクニカル サポート ケースの数と優先 度度の管理理、各年年の年年度度予算の⽐比較 • 応用例: – カテゴリーごとに四⾓角形に⾊色を付けてどのように階層的に構造化されて いるか表⽰示する – ツリー マップと棒グラフを組み合わせる。Tableauでは、⾏行行に別のディ メンションを置くと棒グラフのそれぞれのバーもツリーマップになりま す。これにより、バーの⻑⾧長さからアイ テムをすばやく⽐比較することがで き、同時に各バーの⽐比率率率的な関係性も⾒見見ることができます。 41
  43. 43. 3-‐‑‒13. Show Me 箱ひげ図 • 箱髭図(ボックスプロット)は、データの分布を⽰示す のに有効です。この名前はプロットの 2 つのパートを 指しています:「箱」にはデータの中央値と第 1 四分 位数および第 3 四分位数 ( 中央値より 25% 以上およ び 25% 以下) が含まれ,「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 1.5 倍内のデータを表します。 • また、髭はデータの最⼤大および最⼩小ポイントを⽰示す際 Copyright ©2014 Treasure Data. All Rights Reserved. にも使⽤用できます。 • 例例:⼀一連のデータの分布を⽰示す。ひと⽬目でデータを理理 解する、データがどのように⽚片⽅方に 偏っているかを⾒見見 る、データの外れ値を特定する。 • 応用例: – ボックス内のポイントを⾮非表⽰示にする。 これにより外れ 値を⾒見見つけやすくなります。 カテゴリー別ディメンショ ン全体でボックスプロットを⽐比較します。 – ボックスプロットはデータ セット間で分布をすばやく⽐比 較する際に有効です。 42
  44. 44. アジェンダ 1. BI / Data Visualization に関するトレンド 2. Tableau 製品群紹介 3. Tableau Desktop 紹介 4. Tableau Server 紹介 Copyright ©2014 Treasure Data. All Rights Reserved. 43 a. ⼀一般ユーザー向け画⾯面 b. 管理理者向け画⾯面 c. データ更更新⽅方法
  45. 45. 4. User Step1: Sign In Copyright ©2014 Treasure Data. All Rights Reserved. 44 • ⼀一般ユーザーの Tableau Server へのアクセス
  46. 46. 4. User Step2:View Copyright ©2014 Treasure Data. All Rights Reserved. 45
  47. 47. 4. User Step3:Workbook Copyright ©2014 Treasure Data. All Rights Reserved. 46
  48. 48. 4. User Step4:Contents Copyright ©2014 Treasure Data. All Rights Reserved. 47
  49. 49. 4. Admin: Server Status • 管理理ユーザーはサーバーのステータスなどの情報を参照できます。 Copyright ©2014 Treasure Data. All Rights Reserved. 48
  50. 50. 4. 抽出とスケジュール(Pull) Copyright ©2014 Treasure Data. All Rights Reserved. 49 • Tableau Server 側からの抽出(Pull) – 指定したデータソース(Treasure Data, Redshift, RDS,…) から定期的にデータを抽出します。
  51. 51. 4. 抽出とスケジュール(Push) Copyright ©2014 Treasure Data. All Rights Reserved. 50 • Tableau Desktop 側からのパブリッシュ – Tableau Desktop よりワークシートをパブリッシュ Create Publish Tableau Desktop Tableau Server Access Edit PC Browser Android iPad Desktop
  52. 52. 4. 抽出とスケジュール(Push) Copyright ©2014 Treasure Data. All Rights Reserved. 51 • Treasure Service からのリザルト書き出し – Tableau Console よりジョブの結果を Tableau Server に プッシュできます。 Scheduled Query
  53. 53. アジェンダ 1. BI / Data Visualization に関するトレンド 2. Tableau 製品群紹介 3. Tableau Desktop 紹介 4. Tableau Server 紹介 5. Tableau × Treasure Data Copyright ©2014 Treasure Data. All Rights Reserved. 52 1. Treasure バッチクエリ × Tableau Server 2. Treasure アドホッククエリ × Tableau Desktop
  54. 54. 5.Treasure × Tableau Copyright ©2014 Treasure Data. All Rights Reserved. 53 (分析のPDCAに必要な2つの分析エンジンを両⽅方とも提供) Plan (施策設計) Check (効果測定) Do (施策実⾏行行) Act (原因探索索) バッチ型分析 + KPIダッシュボード ・チューニング済Hadoop ・⼤大量量データが得意 KPI ・定義済指標の最新データ表⽰示 ・メンバー全員で共有 アドホック型分析 + BIツール / 統計ツール ・Treasure Query Accelerator ・⾮非常に⾼高速 ・任意の軸でアドホックに分析 ・原因の可視化
  55. 55. 5.バッチクエリ × Tableau Server Copyright ©2014 Treasure Data. All Rights Reserved. 54 Webログ Appログ センサー スマフォ Appログ RDBMS CRM ERP POS 小さい CSV/TSV c Direct Tableau Server 全件データ バッチ Result Push Treasure Agent iOS /Android SDK TD Toolbelt Web Browser Streaming Mobile Legacy Trial データ収集 データ保管 データ分析 Tableau Server 上の ソースデータを更更新
  56. 56. 5.アドホッククエリ × Tableau Desktop Copyright ©2014 Treasure Data. All Rights Reserved. 55 Webログ Appログ センサー スマフォ Appログ RDBMS CRM ERP POS 小さい CSV/TSV Treasure Agent iOS /Android SDK TD Toolbelt Web Browser Streaming Mobile Legacy Trial データ収集 データ保管 データ分析 BIツール等 Direct Tableau 全件データ バッチ データマート アドホック JDBC/ ODBC REST API アドホック
  57. 57. アジェンダ 1. BI / Data Visualization に関するトレンド 2. Tableau 製品群紹介 3. Tableau Desktop 紹介 4. Tableau Server 紹介 5. Tableau × Treasure Data 6. Tableau テクニック集 Copyright ©2014 Treasure Data. All Rights Reserved. 56
  58. 58. 6. Tableau テクニック集 1. 質問に答えるグラフを描く 2. 経時的な傾向 3. ⽐比較とランク付け 4. 相関性 5. 分布 6. ⼀一部と全体の関係 7. 最重要データの強調 8. 読みやすいビューの作成 9. ビューの整理理 10. ビューへの過剰な負荷の回避 11. 1つのビューで表⽰示する⾊色と形状の数を制限 Copyright ©2014 Treasure Data. All Rights Reserved. 57
  59. 59. 6-‐‑‒1. 質問に答えるグラフを描く Copyright ©2014 Treasure Data. All Rights Reserved. 58 • 例例えば,IPO 投資に注⽬目している株式ブローカーに対して 投資先の決定に役⽴立立つビジ ュアライゼーションを作成する とします。 • 「IPO の利利益性は株価の推移に影響を与えますか?」という ような質問をすることで右図のようなビューを作成できる でしょう。 • このビューから,IPOでの利利益がその後の株価の推移に⼤大き く影響することがわかります。 • しかし、このデータセットには過去30 年年にわたるすべての ソフトウェア会社の IPOについての情報が含まれています。 • このビューから⾒見見つけた傾向が、果たしてその期間ずっと 変わらないのか疑問に感じることでしょう。2つめのビュー を⾒見見ると,その疑問が解消します。 • このビューを⾒見見ると、傾向は 1990 年年代にのみ該当するこ とがわかります。 さらに2 つの点が明らかになります: • 1) 1980 年年代ではすべての会社が IPO で利利益を⽣生み、 • 2) 2000 年年代では IPO での利利益は株価の推移にさほど影 響を与えていません。 • これはつまり,最近の投資家は前任者よりもリスク受容型 であることを意味しませんか。またはIPOで利利益がなかった 会社も,利利益のあった会社と同様に将来性があるというこ とではないでしょうか。
  60. 60. 6-‐‑‒2. 経時的な傾向 Copyright ©2014 Treasure Data. All Rights Reserved. 59 • データの分析でもっとも頻繁に⽤用いられる⽅方法の 1つに経時的な 傾向の追跡がありま す。 右の例例でベンチャーファイナンスファ ンドの流流れの中でのセクター別の経時的な傾向を⾒見見てみましょう。 • 今までの経験から,経時的な傾向を⽰示すのに最適なビジュアライ ゼ ーションは折れ線グラフ,⾯面グラフ,棒グラフです。 • また、経過時間を X 軸に,メジャーを Y 軸に設定すると,傾向 に関する⽂文化的な慣例例に合わせたビューを作成できます。 • まず,以下に⽰示す折れ線グラフを⾒見見てみましょう。 X 軸に年年を, Y 軸には資⾦金金調達額をそれぞれ設定し、セクタータイプを⾊色でエ ンコードします。 • このビューから、すべてのセクターの資⾦金金調達における傾向が時 間の経過とともにその後も同じように続くことがわかります。 • また,個々のセクターの傾向と各セクター間における傾向の違い もわかります。 全体的な資⾦金金調達の傾向についてはどうでしょう か。 2000 年年もしくは他の任意の時点におい て,すべてのセク ターにいくらの資⾦金金調達があったか,正確な数値はわかりますか。 • 答えは No です。折れ線グラフにはその機能はありません。 • その質問に対する回答が必要な場合は,以下のような⾯面グラフや 棒グラフで調べることができます。 • これらのグラフ はどちらも時間の経過に伴う資⾦金金調達の傾向と, 期間全体を通した個々のセクターの貢献度度について詳細に述べて いるという点で優れています。 • しかしこの2つには次のよ な違いがあります:⾯面グラフは各セク ターを 1 つのパターンとし、棒グラフでは各年年を 1 つのパター ンとしています。
  61. 61. 6-‐‑‒3. ⽐比較とランク付け Copyright ©2014 Treasure Data. All Rights Reserved. 60 • データ分析の別の⼿手法に⽐比較とランク付けがあります。 • 国や地域,事業区分,営業担当者,スポーツ プレーヤーな どを 1 つまたは複数の条件に基づいて⽐比較したりランク付 けすることがあります。 • 多くの場合,これで⽅方向性や業績などがわかります。 • 棒グラフは 定量量的な値を 1 つのベースライン上での⻑⾧長さと してエンコードすることによってとても簡 単に値を⽐比較す ることができるため、⽐比較とランク付けに⾮非常に適してい ます。
  62. 62. 6-‐‑‒4. 相関性 Copyright ©2014 Treasure Data. All Rights Reserved. 61 • 世間ではよくメジャーの間の関係性を⾒見見つけようとします。それはデー タ分析で常に⾏行行なわれていることです。 • 喫煙は発ガンの原因になるのか?製品の価格は販売数に影響を与えるの か? 外気温と増加しているボート遊びには関係があるのか?政府の刺刺激 策は新たな 雇⽤用を⽣生み出すのか? • メジャー間の関係性を認識識するにはまず簡単な相関性の分析を⾏行行うこと から始めるとよいでしょう。 ただし相関性は必ずしも関係性を保証する ものではありません。 相関性は 関係性の可能性を⽰示唆するくらいの意 味合いと捉えてください。 関係性が確かに存在す ると⽴立立証するには, より洗練された⼿手法が必要になることがあります。 • ここに簡単な散布図を作成して 2 つの要素の間の関係性を⾒見見出す例例を⽰示 します。 • データは惣菜の卸売業者にに関するものです。 Y 軸には販売価格を,X 軸には販売数をそれぞれ設定し,⽉月別の売上⾼高を詳細に取り込んでいま す。 • 図を⾒見見ると (特に傾向線を加 えた際に),販売価格と販売数のマイナスの 相関性があることがわかります。 価格が⾼高ければ販売数が減り、逆もま た然りです。 • これは売上⾼高を上げるには販売価格を下げるべきということでしょう か?必ずしもそうとは限りません。 図の中で純利利益を円の⼤大きさで表し ているのを⾒見見ると,両端で⼤大きな利利益が上がっていることがわかります。 • ほかのタイプのグラフはどうでしょうか。 同じような結果を⽰示すことが できているでしょうか。この例例では,2 つの折れ線グラフと棒グラフを 組み合わせています。 販売価格と販売数の傾向線を上の⽅方に並べて表⽰示 することで,ビューアーが 2 つの傾向の⽐比較に注⽬目 するように促すこ とができます。 明らかにマイナスの相関性があることがわかりますね。 • また、下の⽅方にある純利利益の棒グラフからは,相関性の分析が妨げられ ることなく 意思決定を⾏行行うための情報を得ることができます。
  63. 63. Copyright ©2014 Treasure Data. All Rights Reserved. 6-‐‑‒5. 分布 62 • 分布の分析はデータ分析に特に便便利利です。すべての定量量的範囲にわたっ て定量量値がどの ように分布しているかがすぐにわかるからです。 • たとえば,病院で患者の治療療時間の分布について調べるとします。 この 場合どのタイプのグラフが最適でしょうか。 適したグラフはいくつかあ りますが,このような⽬目的によく使われる 2 つのタイプのグラフについ て 取り上げます。 1 つは箱髭図、もう 1 つはヒストグラムです。 • 箱髭図は複数の分布を表⽰示するのに優れています。すべてのデータポイ ント (この場合は 患者 1 ⼈人あたりの時間(分)) を 1 つの箱髭図にまと めています (下の図を参照)。 この図 では,すべてのカテゴリの最⼩小値, 25 パーセンタイル値,中央値,75 パーセンタイル値、最 ⼤大値を⼀一度度に 簡単に把握することができます。 • この箱髭図からわかるのは、Emergent (緊 急) と Non-‐‑‒Urgent (急を 要さない) のカテゴリの箱が他と⽐比べて⼤大きく,そのカテゴリの患者間 で治療療時間の⻑⾧長さが⼤大きく異異なるということです。 • その理理由は 患者の中に,緊急として病院に来たが緊急ではないと判断さ れた⼈人がいたからでしょうか。 患者の抱えている問 題は⼈人によって 様々であるため,受ける治療療も⼈人によって異異なるからでしょうか。 それ とも, 緊急治療療室にいる医師によって患者を治療療する⽅方法が⼤大きく異異な るからでしょうか。 • 分布を表⽰示するもう 1 つの⽅方法にヒストグラムがあります。患者の緊急 度度のカテゴリ別に データを分け,カテゴリごとに患者 1 ⼈人あたりの治 療療時間を図に⽰示す代わりにヒストグラ ムではデータを時間区分 (または ビン) でデータを分けてその区分ごとの患者数を記載します。 • このグラフからピークの (つまりもっとも⼀一般的な) 治療療時間が 70 分 であることが わかります。 棒グラフの⾊色によって、緊急度度カテゴリ別 の患者数の違いも⼀一⽬目瞭然です。 この結果ほとんどの時間区分にさまざ まな緊急度度の患者がいて,その中でも「緊急」と「 急を要さない」患者 が最も多いことがわかります。
  64. 64. 6-‐‑‒6. ⼀一部と全体との関係 Copyright ©2014 Treasure Data. All Rights Reserved. 63 • ⼀一部と全体の間の関係を分析することがあります。この ような場合にはよく円グラフが使 われますが,次の 2 つの理理由から円グラフはお勧めできません。 • 1) ⼈人の視覚系はパイの⾒見見積もりに不不向きであり, • 2) すぐ隣隣りのパイ同⼠士としか⽐比較できないからです。 • たとえば右の図で,1 番⼤大きなパイがどれで⻄西部地域に おける年年齢別の割合がどうなっているか,すぐに答える ことができますか? • このような⽐比較を円グラフで⾏行行うのは困難です。では棒 グラフはどうでしょうか。右下の図では,円グラフと同 じデータを合計に対する割合で⽰示した棒グラフで表して います。 • こちらのグラフなら,さきほどの質問にすぐ答えられる はずです。⻄西部地域では,25 ~∼ 40 歳のグループの割合 が最も⼤大きいことがわかります。 さらにすべての年年齢別 グループでの地域間の違いもより簡単に調べることがで きます。
  65. 65. 6-‐‑‒7. 最重要データの強調 Copyright ©2014 Treasure Data. All Rights Reserved. 64 • グラフの種類によっては複数のメジャーとディメンション を 1 つのビューに設定できるものがあります。 たとえば散 布図では,X 軸と Y 軸のメジャーを設定するほかに⾊色やサ イズ,形状でマークのメジャーを設定することができます。 • メジャーの設定先は,分析の内容や強調したい内容によっ て変わります。 最も重要なデータを X 軸と Y 軸に設定し, さほど重要でないデータを⾊色やサイズや形状に設定するの が⼀一般的です。 • 右のビューは,住宅宅購⼊入者向けに作成したものです。この ビューの⽬目的は住宅宅の販売価格,建築⾯面積,敷地⾯面積,さ らに購⼊入者が関⼼心を持つ住宅宅のタイプの関係性をわかりや すくすることにあります。このビューからまず最初にわか る関係性は何でしょうか。 • このビューでは、販売価格と敷地⾯面積の関係性がとてもわ かりやすくなっています。 しかし、この情報が果たして住 宅宅購⼊入者にとって最も重要な情報なのでしょうか。おそら くそ うではないでしょう。 • 販売価格と建築⾯面積の関係性の⽅方が重要なはずです。 住宅宅 購⼊入者が住宅宅を探すときは、敷地⾯面積よりも住みやすい⼤大 きさであるかどうかを優先するもので す。したがって右下 のようなグラフの⽅方がより効果的なのです。
  66. 66. 6-‐‑‒8. 読みやすいビューの作成 Copyright ©2014 Treasure Data. All Rights Reserved. 65 • ちょっとした変更更を加えることでビジュアライゼーション をよりわかりやすいものにできることがあります。右に⽰示 すビューをご覧ください。 • このビューは読みにくいと思いませんか。読みにくいのは おそらくすべてのラベルが縦⽅方向に記載されているからで す。そのためビュー全体が読みにくいものになっています。 • 縦⽅方向にしか表⽰示できないような⻑⾧長いラベルがある場合は ビューを回転させてみてください。 • ツールバーボタンの [Swap] (スワップ) を使⽤用すると,⾏行行 と列列のフィールドを簡単に⼊入れ替えることができます。 • 同じビューで⽅方向を縦から横に変えた例例を以下に⽰示します。 • このように少し変更更を加える ことによってグラフが読みや すくなり⽐比較もしやすくなります。
  67. 67. 6-‐‑‒9. ビューの整理理 Copyright ©2014 Treasure Data. All Rights Reserved. 66 • 営業チームのメンバーを売上⾼高とノルマで⽐比較して評価するとします。 • とりあえず2 つのメジャーを横に並べてみます。 • その結果のグラフは右のとおりです。 • しかしこのビュー から Greg Powell ⽒氏の業績がすぐにわかりますか。 • ノルマは達成しているようですがどれほどノルマを上回っているか正確 にはわかりません。 • 横⽅方向の棒グラフが 2つ横に並んでいるため,このような⽐比較がしにく くなっているのです。 • では,次のグラフはどうでしょうか。売上⾼高とノルマのデータを列列では なく⾏行行に設定しています。そのため売上⾼高の棒とノルマの棒に 1 つの ベースラインを作成できるため,⽐比較 がとても簡単になります。 • このグラフから,Greg Powell ⽒氏はノルマを上回っているものの,その 額はわずかであることがわかります。 • しかしこれよりもさらに適したビジュアライゼーションタイプがありま す。 それはブレットグラフです。 • このグラフは棒グラフに参照線を組み合わせることで,実際の数と⽬目標 の数を視覚的に⽐比較できるようになります。 • この例例で⾔言うと,実際の数は売上⾼高 (棒),⽬目標の 数はノルマ (縦の参照 線) に該当します。 • 営業チームの各メンバーがノルマを達成してい るかどうかが⼀一⽬目でわか るだけでなく,参照線を使⽤用することでデータを表す棒の数を半分に減 らすこともできるのです。
  68. 68. 6-‐‑‒10. ビューへの過剰な負荷の回避 Copyright ©2014 Treasure Data. All Rights Reserved. 67 • データのビジュアライゼーションを⾏行行う上でビューに過 重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです。右のビューをご覧ください。 • インドにおける顧客や部⾨門ごとの売上や利利益に関して何 かわかりますか。 おそらく何もわからないでしょう。こ のビューに含まれているメジャーやディメンションの数 が多すぎるのです。 • 国,部⾨門,利利益を 1 つのビューに重ねて表⽰示するのでは なく,複数の⼩小さいグラフに分割するべきです。 • 次に⽰示すビューは,関連の情報がすべてわかりやすく表 ⽰示されていて⼀一 ⽬目で理理解できます。ビジュアライゼー ションに従来のクロス集計を組み込むことには⼤大き なメ リットがあるという好例例です。
  69. 69. 6-‐‑‒11. 1つのビューで使⽤用する⾊色と形状 の数を制限 Copyright ©2014 Treasure Data. All Rights Reserved. 68 • ⾊色や形状を効果的に使⽤用すると,パターンを簡単に読み取 ることができて便便利利です。 しかし1 つのビューで使⽤用する ⾊色と形状の数が多すぎると逆効果になります。 • 右のビューでは24 ⾊色が使⽤用されています。⾊色と線が混ざり 合っていて注⽂文数に関する特定の国のパターンを読み取れ ないのはもちろんのこと、どの国がどの線で表されている のかさえ読み取るのはほぼ不不可能です。 • さらに⾒見見分けのつきやすい⾊色の種類が限られているため, 複数の国が同じ⾊色または似たような⾊色で表⽰示されています。 • 国に⾊色を設定するのではなく,部⾨門に⾊色を設定してその違 いを⾒見見てみましょう。部⾨門ごとの傾向がわかりやすくなり ましたね。 • 1つのビューで使⽤用する⾊色と形状の数を7〜~10に制限するこ とでデータを識識別しやすくなり,重要なパターンを読み取 れるようになります。 2010 2011 2012 2013 2014 2000 1500 1000 500 0 Order Quantity ‘‘ƒ›ƒŽ—‡•‘‘Ž‘” Š‰ˆ Alge Arg Aus Aus Bra Can Chi Egy Eth Fiji Fra Ger Gre Algeria Argentina Australia Austria Brazil Canada Chile Egypt Ethiopia Fiji France Germany Greece Hong Kong India Iraq Ireland Israel Italy Japan Kenya Mexico Peru Turkey 2010 2011 2012 2013 2014 2K 1K 0K Order Quantity ‹‹–‡†ƒŽ—‡•‘Ž‘”• Š‰ˆ 'HSDUWPHQW Furniture Office Supplies Technology
  70. 70. Q and A Copyright ©2014 Treasure Data. All Rights Reserved. 69

×