Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

広告におけるビッグデータの分析事例

4,664 views

Published on

Tableau Conference On Tour 2015 Tokyoで登壇した際の資料です。
サイバーエージェント アドテクスタジオでは複数の広告部門・子会社より構成されており、広告のビッグデータをTableauを利用して可視化し、業務に役立てています。
今回どのような基盤で、どのような解析をしているかについて発表させていただきました。

Published in: Technology

広告におけるビッグデータの分析事例

  1. 1. Ken Takao Infrastructure Manager, CyberAgent Inc. Presented by: 広告におけるビッグデータの分析事例 Takayuki Kawabata Senior Data Scientist, CyberAgent Inc.
  2. 2. Agenda About CyberAgent What is Ad Tech Studio Overview our BigData Platform Tableau in AdTech Studio Connection with QuickSite How analyze data byTableau Future of our Business Intelligence
  3. 3. 広告配信のビッグデータを TABLEAUを使って可視化する!
  4. 4. Ken Takao/鷹雄 健 CyberAgent Inc./株式会社サイバーエージェント AdTech Headquaters/アドテク本部 Technology Strategy Department/技術戦略室 Central Infrastructure Agency Group/シーアイエー Infrastructure Manager/インフラマネージャー
  5. 5. Takayuki Kawabata / 川端 貴幸 CyberAgent Inc./株式会社サイバーエージェント AdTech Headquaters/アドテク本部 Technology Strategy Department/技術戦略室 Scientific Advertising Team/SAT(サット) Senior Data Scientist/シニアデータサイエンティスト
  6. 6. About CyberAgent
  7. 7. Our Vision
  8. 8. 事業内容
  9. 9. What’s AdTech Studio
  10. 10. 簡易版アドテクマップ
  11. 11. サイバーエージェントのアドテクマップ
  12. 12. AdTech Studio
  13. 13. Overview our BigData Platform
  14. 14. • MySQL いっぱい • Hadoop Platform(CDH,MAPR) 数十PBのデータストア • BigQuery 数百TBのデータストア • Redshift 約10クラスター 全体で約100ノード • Matrix(旧Paraccel) SSDで約100TBのクラスター データソース
  15. 15. データベースの全体図
  16. 16. Tableau in AdTech Studio
  17. 17. • Tableau Server 35 現在のライセンス数 • Tableau Desktop 26
  18. 18. • 技術戦略室で1ライセンス購入。 ↓ • 多プロジェクトでも試用版ライセンスで急激に広まる。 ↓ • アドテクサミット(明日会議)でデータ戦略の一つとして↓ Tableau Desktop,Tableau Serverの導入が決まる。 ↓ • アドテクスタジオの共通費として購入し、基本だれでも Tableauを使えるように! どうやって導入したか?
  19. 19. 社内のポータルサイトから申請
  20. 20. • 基本的にサーバーサイドエンジニア、データサイエンティスト がDashboardを作成します。 用途としてはプロダクトマネージャー・営業用のレポートを作 成したり、開発時や運用時のデータを利用してアルゴリズム を考え、実装してその結果を確認したりします。 Tableau Desktop
  21. 21. • Tableau Desktopで作成されたDashboardをTableau Serverへ パブリッシュし、Tableau Serverでレポートの閲覧などを行い ます。 またTableau 9から利用できるサブスクリプション機能を利用 してメールでのレポート通知なども行っています。 Tableau Server
  22. 22. • AMoAdはCyberAgentとDeNA社が出資するスマートフォン広 告用アドネットワーク会社です。 Tableauは主にBigQueryと連携して利用しており、 分単位での配信データの表示を行い、広告配信の最適化の 参考にしています。 AMoAdの事例
  23. 23. Connection with QuickSight
  24. 24. How analyze data by Tableau
  25. 25. • データサイエンティストがデータを分析する上で、 Tableauをどのように使っているかの一例を紹介します • あくまで課題を解決するためのデータ分析であり、ダッシュ ボード的なきれいなグラフを作っているわけではありません! どのようにTableauをつかっているか あるプロダクトの ダッシュボード例
  26. 26. • Scientific AdvertisingTeam • アドテクスタジオにある複数のプロダクトのデータ分析に ついて横断的に担当する組織 • 主な業務 – ネット広告のClick予測モデルの作成 – DSPの入札ロジックの開発 – ユーザのデモグラ推定 – etc SATについて
  27. 27. Tableau ServerがSATと各プロダクトを繋ぐ データソースの違 いを透過的に 可視化したグラフ の共有を楽に
  28. 28. • ビジネスサイドからはCSVファイル • あるプロダクトはMySQL • 別のプロダクトはRedshift • また別のプロダクトはBigQuery • などなど 様々なデータソース
  29. 29. • Case 1:広告運用時の異常検知 • Case 2:DSPのBidロジック改善 • Case 3:位置情報の分析 • Case 4:ゲーム課金ユーザの分析 • Case 5:レベニューシェアの最適化 • Case 6:購買ユーザの予測 • Case 7:デモグラの推定 様々な事例
  30. 30. 1. 課題感のヒアリング 2. ざっくりとデータ分析、可視化して課題を具現化 3. 課題を解決するロジックを試行錯誤 4. 提案するソリューションのオフライン検証/シミュレーション 5. データをセットにしてソリューションの説明 6. 実装&オンラインでのABテスト 7. レポーティング 8. 目標達成までPDCAを回す 一案件のだいたいの流れ
  31. 31. 1. 課題感のヒアリング 2. ざっくりとデータ分析、可視化して課題を具現化 3. 課題を解決するロジックを試行錯誤 4. 提案するソリューションのオフライン検証/シミュレーション 5. データをセットにしてソリューションの説明 6. 実装&オンラインでのABテスト 7. レポーティング 8. 目標達成までPDCAを回す 一案件のだいたいの流れ 多くの場面でTableauを活用している
  32. 32. • Python + Matplotlib • 生産性は倍は違う • さらにTableau Serverでの簡単共有! Tableau以前は
  33. 33. • Tableauのつかいどころ – データが整形すでにされている – 初見のデータ – インタラクティブな分析が必要なとき • Pythonでやるとき – データが非整形 – 予測モデルなどの検討 – グラフ(ネットワーク)の可視化 – などなど とは言え使いわけ
  34. 34. • Scatter Plot(散布図) • Box Plot(箱ひげ図) • クロス集計 • Binの作成 • パラメータ • ページ データ分析で良く使うもの
  35. 35. 2変数間の相関を見るためにとにかくよく使う Scatter Plot(散布図)
  36. 36. • Scatter Matrix 散布図行列が簡単に作れるとなお良い 変数のすべてのペアを 散布図にしたもの 平均や分散などサマリーだけ でなく、データ全体を観察す ることはともて大事
  37. 37. Box Plot(箱ひげ図) 分布の違いを比較するためによく使う
  38. 38. クロス集計 説明変数と目的変数の因果関係の可視化によく使う
  39. 39. Bin 連続変数のクロス集計
  40. 40. • インタラクティブな分析をする上でよく使う • よくパラメータ化するもの – ビンのサイズ – 閾値 – 目標値 – 計算式の中のパラメータ パラメータ
  41. 41. ページ • 時系列な変化を確認するためによく使う • ぱらぱら漫画みたいに動きをもって、ちょっとした変化が追える
  42. 42. 事例紹介:DSPでのBidロジック改善 https://www.microad.co.jp/service/platform/innovative.php
  43. 43. DSPのビジネスモデル 適正な売値を見極めるために、クリックされ る確率を正確に予測することが最も大事
  44. 44. Clickと相関の強いものは? 曜日×時間 デバイスタイプ別 離脱してからの 経過時間 ※上のデータはKaggleで公開されているCTR予測コンペのもの
  45. 45. Click予測モデルの精度は? 従来の モデル 新規の モデル Clickが得られたリクエスト Clickが得られなかったリクエスト
  46. 46. • ABテストの結果、 新しいロジックは売上が伸びたが、利益がでない… 問題の原因は細かく分割して診る
  47. 47. • 入札額を細かいビンに分けて利益を可視化 問題の原因は細かく分割して診る
  48. 48. • 入札額を細かいビンに分けて利益を可視化 問題の原因は細かく分割して診る 入札額が低いところの ビンで問題あり
  49. 49. ABテストの結果をモニタリング Daily, Hourlyでモニタリング,Tableau Serverでビジネスサイドと共有
  50. 50. • 指定した更新間隔で、データソースから集計したデータを自 動で抽出する • リアルタイム性が必要ないものなどは、毎時の集計値の方 がメリットが大きい – 特にBigQueryのようにクエリ課金のクラウドでは モニタリングにはデータの抽出が便利 たくさんの抽出タスク が登録されている
  51. 51. Future of Business Intelligence
  52. 52. • 今は部門の中でも、一握りの人しかTableauを使っていない • そして、彼らは元々別の手段でデータ分析をしていた人が多 い • ハードルが高いとこれまでデータ分析を避けていた人が, Tableauを使うようになれば、真にデータに強い会社になる • データサイエンティストが作ったワークブックをTableauサーバ で共有していくことで、ビジネス・エンジニアにもTableauに興味 を抱かせていく! データ分析のリテラシーをあげる
  53. 53. シミュレーションをTableauで 運用変数を変える ことによるKPIの変 化をみてもらう
  54. 54. Viewの表示回数のランキングが便利 日別 時間別 ユーザ別View別
  55. 55. • チャレンジしたいこと • レポートの修正・変更がデータサイエンティスト中心の作業に • レポートの項目を少し変更したいだけでも、変更範囲、変更 に関わるエンジニアがそこそこ発生し、小さなPDCAは回らな い現状 • 実現すればけっこうメリットは大きい • ライセンス料金がデメリット(実質、コアライセンスが必要) Tableau ServerのViewをプロダクト管理画面のレポートに埋め込む
  56. 56. Got feedback? Please fill out the brief session survey in the conference app.

×