AdTruthが生み出す
Google アナリティクス プレミアムの
新しい活用方法
株式会社イー・エージェンシー
■Page 1Copyright© e-agency Inc. All right reserved.
本セミナーの構成
 AdTruthがもたらすメリット
 ローデータの活用による新しいアクセス解析手法
 (活用例)BigQuery連携によるリマーケティングの
実践
 最後に
 質疑応答
AdTruthがもたらすメリット
■Page 3Copyright© e-agency Inc. All right reserved.
Cookieによるユーザの識別
 Cookieを利用することで、だれにどのコンテンツを配信したかを
アクセスログに残しておくことができる。
端末その1
端末その2
Webサーバ
コンテンツ
A,B,Cを要求
A B C
D
E
F
コンテンツ
D,E,Fを要求
アクセスログ
時間 ユーザID コンテンツ
10:00 111 Aを送信
10:11 222 Dを送信
10:13 111 Bを送信
10:15 111 Cを送信
10:21 222 Eを送信
10:55 222 Fを送信
Cookie: 111
Cookie: 222
• 訪問を開始したページ、ゴールまで到着したユーザ(ブラウザ)が
判別できるので、精度の高いアクセス解析が実現可能となる。
• 訪問開始ページはAとD
• Fにアクセスしたのは222
cookie「id:111」を送信
■Page 4Copyright© e-agency Inc. All right reserved.
アクセス解析における「ユーザ」の定義
 「ユーザ」≠「人」ではない
– アクセス解析ツールの多くはCookieを利用
– 会員番号やメールアドレスなどと違って人に紐づかない
– パソコン・ブラウザを変えると別のユーザとなる
 「ユーザ」≠「デバイス」でもない
– Googleアナリティクスは1st Party Cookieでユーザを判別
– ドメインを跨いでCookieの値を共有するのが困難
– 3rd Party Cookieは拒否・定期的に削除されることが多い
• iOS版のSafariではデフォルト拒否
– スマフォ環境ではユーザ識別(の保存)方法が複数存在する
• Cookie / IDFA / Android ID / アプリやOS内の記録領域、など
■Page 5Copyright© e-agency Inc. All right reserved.
スマフォアプリの開発方法
ネイティブコードによる開発
– iOSならObjective-C、AndroidならJavaなどOS毎の言語を利用
– スマフォOSが提供するAPIにアクセスする
– ゲームなど応答速度が求められる場合、カメラなどのハードウェ
アを利用する場合に用いられる
HTML5(+JavaScript + CSS)による開発
– WebView呼ばれるアプリに埋め込んだブラウザが、ローカルもし
くはサーバにあるHTMLファイルを読み込んで表示する
– HTML5(+JavaScript + CSS)などWebサイトと同じ言語による
開発環境を利用
– ニュース記事など更新が多いコンテンツの場合に利用
■Page 6Copyright© e-agency Inc. All right reserved.
1つのスマフォで3人のユーザ
標準ブラウザやスマフォアプリ(ネイティブ・WebView)がそれぞれ
ユーザ識別子を生成するので、それぞれが別人と認識される。
標準ブラウザ スマフォアプリ
Webサイトのドメインでの
Cookie → 1人
ネイティブアプリの
ユーザ識別子 → 1人
WebViewアプリの
ユーザ識別子 → 1人
■Page 7Copyright© e-agency Inc. All right reserved.
AdTruthが全てを解決?
Google アナリティクスで、どのように活用するのか?
■Page 8Copyright© e-agency Inc. All right reserved.
AdTruthの識別子を計測
 カスタムディメンションを利用
– Google アナリティクスでAdTruthの識別子を計測する。
AdTruth ID ページ PV数
07f1c683500913b399d0374de96c2bdb /sports/baseball.html 1
fc3966e814e8b3562d17cc156926d01e /music/pops.html 1
a5c4350488e16aa65b0c3ab805f3332e /company/about.html 1
c4cbc0625c11f0b4015d637a209e271c /products/camera.html 1
1827030b6279525fec01858cd833e5a0 /furniture/desk.html 1
bd9f5886e6515eb7137f7a45d7f879a6 /books/cooking.html 1
27442b808cd8ab54f1ab4ef298940f47 /hobby/flower.html 1
– 分析者はAdTruthの識別子をみたいわけではない。
– この結果をさらに集計することで有益な分析結果が得られるが、サンプリング
やダウンロード件数の限界を考えると大規模サイトでは実用的ではない。
■Page 9Copyright© e-agency Inc. All right reserved.
AdTruthをGAのユーザ識別に利用
 ユーザID統合
– Cookie(デバイス)を、「ユーザ」という上位階層で統合
– 1人のユーザが複数のデバイスを利用するという考え方
– ここにAdTruthの識別子を使ったら、会員番号による統合が
できなくなる。
AdTruth ID
ga('create', 'UA-XXXX-Y', {
'storage': 'none',
'clientId': '35009a79-1a05-49d7-b876-2b884d0f825b'
});
 Cookieの代替え
– Google アナリティクスでは、ユーザ識別用のCookieを自分で発行することが
できる。(独自cidの利用)
https://developers.google.com/analytics/devguides/collection/analyticsjs/domains
– 永続性が低いAdTruthの識別子だと再訪の判別やアトリビューション分析に
支障がでる
– DoubleClick Cookieと紐づかないのでGDNのリマーケティングに支障がでる
AdTruth ID
■Page 10Copyright© e-agency Inc. All right reserved.
AdTruthはGAに使えない?
 AdTruthの識別子をカスタムディメンションで計測しても、
分析者が求めたい解析結果が簡単に得られない。
 AdTruthの識別子はユーザの識別には使えない
 AdTruthの識別子をGAのCookieの代替に使うデメリット
が多すぎる。
全く使う余地がないかと言えば、
そういうわけではない
■Page 11Copyright© e-agency Inc. All right reserved.
効率的な識別子の使い方
 ユーザ識別子に求められること
– 横断性: ドメイン・ブラウザ・デバイスを跨っても共有できること
– 永続性: 生成された値が継続的に利用できること
– 信頼性: 識別子の揺るぎや重複が発生しないこと
– 普遍性: 異なる環境でも同じ手法が使えること
 それぞれの手法のメリット・デメリット
 会員番号などユーザに紐づく情報は確実だが、利用できる場合が限られる
 アプリに限定すればAndroid IDやIDFAが使える
 対象サイト内での永続的なブラウザ識別は1st Party Cookieが強い
 短期間のクロスドメイン・デバイス判定はAdTruthが得意
■Page 12Copyright© e-agency Inc. All right reserved.
Cookieを超えた分析の実現
 Cookieでユーザ(デバイス)を識別するGAでは、
複数デバイスが利用される現在のユーザ行動を
捕捉しきれない。
 解析の精度を上げるには、収集したログ(行動履
歴)を、複数の識別子を適切に使ってユーザを再
判定しなおした上で集計しなおす必要がある。
アクセス解析の限界を
超えるには?
ローデータの活用による
新しいアクセス解析手法
■Page 14Copyright© e-agency Inc. All right reserved.
■Page 15Copyright© e-agency Inc. All right reserved.
 GAのレポート画面では「日付」「URL」「キャンペーン」といった切り口
で集計(解析)された結果が提供される。
集計データを提供するGA
 GAの集計データでは調べられないことも多々ある。
– 集計結果の件数が大量に存在する場合
– 予め用意された集計条件以外での切り口
– フィルタ・コンバージョン・コンテンツグループ等の事前設定を変更した集計結果
– 長期間にわたって複数のセッションを跨いだ状態での集計結果
– 他のデータソースと後から連結して集計した結果
■Page 16Copyright© e-agency Inc. All right reserved.
GAが用意していない切り口での解析
– コンテンツのアトリビューション分析ができる
– コンバージョンフローを自由なページ設定で実現できる
– サイト内バナーのクリック後の行動が追跡できる
個のレベルでユーザの行動を追跡
– Cookieと会員番号を紐づけることで、複数にわたって発生したセッションをユーザの
一連の行動として計測できる。
– 非サンプリング状態で集計すれば、ユーザ数が多くても精度を維持できる。
– 1年を超える長い期間を対象としたアトリビューション分析が可能
– コンバージョン後のユーザ行動も追跡できる
外部データとの自由な連携
– 顧客属性・購買履歴といった情報を後からアクセス解析に追加できる
– コンテンツの作者やカテゴリーといった付随情報を後から加えて解析できる
– 会員登録後の購入金額などコンバージョン結果を後から付与して解析できる
GAの限界を超えるローデータ解析
■Page 17Copyright© e-agency Inc. All right reserved.
BigQueryとは
– Google社が提供するクラウド型のビッグデータ処理サービス
– システム構築は不要で、利用した分だけ料金が発生なので経済的
– 1兆行以上の大規模なデータ分析にも対応するハイパフォーマンス
– データの集計にSQLが利用できる
Googleのビッグデータソリューション
■Page 18Copyright© e-agency Inc. All right reserved.
 Google アナリティクスプレミアムの機能としてGAのローデータが
BigQueryを介して提供され、集計データ以上の情報が解析に利用
できる
GAのローデータを提供するBigQuery連携
セッション情報
日付・時刻
参照元/キーワード
カスタム変数
ビジターID
etc….
ヒット情報
ページ
イベント
トランザクション
GA → BigQueryGAレポートU/I
■Page 19Copyright© e-agency Inc. All right reserved.
■Page 20Copyright© e-agency Inc. All right reserved.
 BigQueryをデータ解析の中心(ハブ)に位置付けることで、他の
システムからGAのローデータが利活用できるようになる。
データハブとしてのBigQuery
Google
アナリティクス
顧客データ etc.
(CRM, ERP)
SELECT
CONCAT(LPAD(STRING(HOUR(SEC_TO_TI
MESTAMP(visitStartTime))), 2, '0'),
FLOOR(MINUTE(SEC_TO_TIMESTAMP(visit
StartTime)) / 15) AS quarter_hour,
COUNT(visitId) AS numberVisits
SQLクエリー データウェアハウス
レポーティング
ツールとの連携 BIツール
セッションデータ
ヒットデータ
(活用例)
BigQuery連携による
リマーケティングの実践
■Page 22Copyright© e-agency Inc. All right reserved.
GAのリマーケティングとスマートリスト
リマーケティング(広告)
– サイトに訪問したユーザを対象にして広告を配信することで、無差別に広告
を表示させるよりも高いコンバージョンが期待できる
– 更に効率を上げるなら、「商品詳細ページを見た」「カートに商品を入れた」
といったユーザの絞り込みが必要となる
– リマーケティング対象のユーザ群をリマーケティング(リマケ)リストと呼ぶ
スマートリスト
– GAが広告主に代わって最適なリマーケティングリストを作成する機能
– 位置・ブラウザの種別・参照元・セッション滞在時間・ページ深度などGAが
収集した情報を元に、機械学習を使ってコンバージョンの確度が高いユーザ
を見つけ出す。
– 機械学習のパターンは多数のWebサイトで稼働するよう汎用性が高く、個々
のサイトの実態を考慮していない。
■Page 23Copyright© e-agency Inc. All right reserved.
BigQueryを使ったリマケリストの作成
 BigQueryのローデータがあれば、サイトの特性を考慮し、
外部データを取り込んだ状態でリマケリストが作成できる
Predictive analysis using Google Analytics Premium and BigQuery
Yutaka Koga, gTech-Ads Platform Specialist team, Nov 6, 2014
※日本語による注釈は講師
オンラインで
会員登録
顧客DBに登録
BigQueryで
ローデータと
顧客情報を連結
統計解析ソフトで
確率スコアリスト
を作成
リマケリストを広告
ネットワークに送信
コンバージョンした
ユーザ
コンバージョン
ユーザに似た
行動パターン
のユーザに広
告を露出
①
② ③
⑤
ローデータ
の収集
④ ⑥
⑦
対象ユーザに広告
を配信⑧
■Page 24Copyright© e-agency Inc. All right reserved.
予測とは?
 2変量の関係性が線形であった場合、その関係性は、Y=aX+b
という一次方程式の形で表すことができる。
 このとき、aとbが明らかとなれば、Xの値によって未知のYが計算
できる
⇒ 予測に必要なのは、正しくXを設定し、aとbを精度よく推定すること
= 数式になったものを「予測モデル」と呼ぶ
Y軸:子の身長(cm)
X軸:両親の平均身長(cm)
Y=aX+b
予測
■Page 25Copyright© e-agency Inc. All right reserved.
予測の実際: 予測モデルの作成
 ある会員があるサービスをコンバージョンする確率を予測する場合・・・
予測するもの 考えられる要因
広告Aクリック有無
サービスCV確率
コンテンツA閲覧回数
他サービスCV回数
最終CVからの日数
モデル化(サービスCV確率=0.05*広告Aクリック有無+0.008*閲覧回数+・・・)し、
各会員に当てはめて確率計算(スコアリング)
・・・
■Page 26Copyright© e-agency Inc. All right reserved.
予測を利用した広告配信リストの作成
 予測モデル構築できれば、当該サービスの広告に対する反応率が顧客個別に
算出できる。
 その反応確率降順のリストを作成し、上位から広告配信を行えばROIの改善が
期待できる。
広告配信でターゲティング可能な会員
問題: あるサービスの広告をどのターゲットに配信するか
反応確率を付与したターゲティングリスト
予測モデルで反応確率計算
⇒ 確率降順のリストを作成
■Page 27Copyright© e-agency Inc. All right reserved.
ローデータを利用した反応率予測
 BigQueryに蓄積されたユーザのサイト内行動と広告測定データを結合して解析
することで、より効率なターゲティング広告の配信が可能となる。
 サイト内行動データ
• サイト内ページ閲覧回数
• 期間内の閲覧頻度
• 最新閲覧日からの期間
• ・・・
 広告測定データ
• 広告クリック数
• 期間内のクリック頻度
• 最新クリック日からの期間
• ・・・
※上記を、キャンペーンごと、
広告種別ごとなど、様々
なレベルで集計。
 ロジスティック回帰分析
下記の式に基づき、CV確率の
予測を行う。
Y= α + β1X1 + … + βnXn
• Y を目的変数(CV予測確率)、
Xnを、Google Analyticsによ
るサイト内行動データや、広告
データなどの説明変数として、
回帰モデルを構築
• ロジスティック回帰分析により、
変数によらない切片α、およ
び、各説明変数の回帰係数
βnを算出
分析 確率スコアリスト
 CV確率のスコアリスト作成
ロジスティック回帰により、CV
確率を各ユーザに付与する
ことができます。
CV確率の高い順に広告出稿を
行うことで、全体的な広告効果
を保ったまま、広告出稿のコス
ト削減が可能となる。
データ
順位 ユーザーID CV確率
1 AAA 0.88
2 BBB 0.86
… … …
10000 CCC 0.25
… … …
上
位
の
み
に
広
告
出
稿
■Page 28Copyright© e-agency Inc. All right reserved.
確率スコアリスト作成のイメージ
 コンバージョンしたユーザのレコードから作成した予測モデルを未コンバージョン
ユーザに当てはめ、コンバージョンする確率を予測する。
Predictive analysis using Google Analytics Premium and BigQuery
Yutaka Koga, gTech-Ads Platform Specialist team, Nov 6, 2014
※日本語による注釈は講師
オンラインデータ オフラインデータ
コンバージョン
したユーザ
コンバージョン
してないユーザ
予測モデルを
作成
■Page 29Copyright© e-agency Inc. All right reserved.
確率スコアリストをグラフで表現
 ユーザごとに算出されたコンバージョンの確率をグラフで表現した結果
 予測モデルによって80%のユーザにリーチする数を減らすことができる
80%の効果を
得るための
対象ユーザ数
カーブの下の面積の大きさ
でモデルの精度を評価
予測モデルが
ない場合の対
象ユーザ数
Predictive analysis using Google Analytics Premium and BigQuery
Yutaka Koga, gTech-Ads Platform Specialist team, Nov 6, 2014
※日本語による注釈はと着色は講師
最後に
■Page 31Copyright© e-agency Inc. All right reserved.
イーエージェンシーは
Googleアナリティクスプレミアムの
導入について、
豊富な実績数を有します。
サイト規模としては、
数億~数十億強のPVクラスのサイト様をサポート。
また、弊社経由でのプレミアム適応サポートサイト数は、
合計で約700サイトにのぼります(2014/7時点)
おもてなしを科学する
今回の出会いを頂戴しまして、誠に有難うございました。
Googleアナリティクスプレミアムをきっかけとしながら、
貴社のビジネスに貢献できるよう、
尽力してまいる所存です。
ご検討の程、何卒宜しくお願い申し上げます。
質疑応答

AdTruthが生み出すGoogle アナリティクス プレミアムの新しい活用方法 第3部

  • 1.
  • 2.
    ■Page 1Copyright© e-agencyInc. All right reserved. 本セミナーの構成  AdTruthがもたらすメリット  ローデータの活用による新しいアクセス解析手法  (活用例)BigQuery連携によるリマーケティングの 実践  最後に  質疑応答
  • 3.
  • 4.
    ■Page 3Copyright© e-agencyInc. All right reserved. Cookieによるユーザの識別  Cookieを利用することで、だれにどのコンテンツを配信したかを アクセスログに残しておくことができる。 端末その1 端末その2 Webサーバ コンテンツ A,B,Cを要求 A B C D E F コンテンツ D,E,Fを要求 アクセスログ 時間 ユーザID コンテンツ 10:00 111 Aを送信 10:11 222 Dを送信 10:13 111 Bを送信 10:15 111 Cを送信 10:21 222 Eを送信 10:55 222 Fを送信 Cookie: 111 Cookie: 222 • 訪問を開始したページ、ゴールまで到着したユーザ(ブラウザ)が 判別できるので、精度の高いアクセス解析が実現可能となる。 • 訪問開始ページはAとD • Fにアクセスしたのは222 cookie「id:111」を送信
  • 5.
    ■Page 4Copyright© e-agencyInc. All right reserved. アクセス解析における「ユーザ」の定義  「ユーザ」≠「人」ではない – アクセス解析ツールの多くはCookieを利用 – 会員番号やメールアドレスなどと違って人に紐づかない – パソコン・ブラウザを変えると別のユーザとなる  「ユーザ」≠「デバイス」でもない – Googleアナリティクスは1st Party Cookieでユーザを判別 – ドメインを跨いでCookieの値を共有するのが困難 – 3rd Party Cookieは拒否・定期的に削除されることが多い • iOS版のSafariではデフォルト拒否 – スマフォ環境ではユーザ識別(の保存)方法が複数存在する • Cookie / IDFA / Android ID / アプリやOS内の記録領域、など
  • 6.
    ■Page 5Copyright© e-agencyInc. All right reserved. スマフォアプリの開発方法 ネイティブコードによる開発 – iOSならObjective-C、AndroidならJavaなどOS毎の言語を利用 – スマフォOSが提供するAPIにアクセスする – ゲームなど応答速度が求められる場合、カメラなどのハードウェ アを利用する場合に用いられる HTML5(+JavaScript + CSS)による開発 – WebView呼ばれるアプリに埋め込んだブラウザが、ローカルもし くはサーバにあるHTMLファイルを読み込んで表示する – HTML5(+JavaScript + CSS)などWebサイトと同じ言語による 開発環境を利用 – ニュース記事など更新が多いコンテンツの場合に利用
  • 7.
    ■Page 6Copyright© e-agencyInc. All right reserved. 1つのスマフォで3人のユーザ 標準ブラウザやスマフォアプリ(ネイティブ・WebView)がそれぞれ ユーザ識別子を生成するので、それぞれが別人と認識される。 標準ブラウザ スマフォアプリ Webサイトのドメインでの Cookie → 1人 ネイティブアプリの ユーザ識別子 → 1人 WebViewアプリの ユーザ識別子 → 1人
  • 8.
    ■Page 7Copyright© e-agencyInc. All right reserved. AdTruthが全てを解決? Google アナリティクスで、どのように活用するのか?
  • 9.
    ■Page 8Copyright© e-agencyInc. All right reserved. AdTruthの識別子を計測  カスタムディメンションを利用 – Google アナリティクスでAdTruthの識別子を計測する。 AdTruth ID ページ PV数 07f1c683500913b399d0374de96c2bdb /sports/baseball.html 1 fc3966e814e8b3562d17cc156926d01e /music/pops.html 1 a5c4350488e16aa65b0c3ab805f3332e /company/about.html 1 c4cbc0625c11f0b4015d637a209e271c /products/camera.html 1 1827030b6279525fec01858cd833e5a0 /furniture/desk.html 1 bd9f5886e6515eb7137f7a45d7f879a6 /books/cooking.html 1 27442b808cd8ab54f1ab4ef298940f47 /hobby/flower.html 1 – 分析者はAdTruthの識別子をみたいわけではない。 – この結果をさらに集計することで有益な分析結果が得られるが、サンプリング やダウンロード件数の限界を考えると大規模サイトでは実用的ではない。
  • 10.
    ■Page 9Copyright© e-agencyInc. All right reserved. AdTruthをGAのユーザ識別に利用  ユーザID統合 – Cookie(デバイス)を、「ユーザ」という上位階層で統合 – 1人のユーザが複数のデバイスを利用するという考え方 – ここにAdTruthの識別子を使ったら、会員番号による統合が できなくなる。 AdTruth ID ga('create', 'UA-XXXX-Y', { 'storage': 'none', 'clientId': '35009a79-1a05-49d7-b876-2b884d0f825b' });  Cookieの代替え – Google アナリティクスでは、ユーザ識別用のCookieを自分で発行することが できる。(独自cidの利用) https://developers.google.com/analytics/devguides/collection/analyticsjs/domains – 永続性が低いAdTruthの識別子だと再訪の判別やアトリビューション分析に 支障がでる – DoubleClick Cookieと紐づかないのでGDNのリマーケティングに支障がでる AdTruth ID
  • 11.
    ■Page 10Copyright© e-agencyInc. All right reserved. AdTruthはGAに使えない?  AdTruthの識別子をカスタムディメンションで計測しても、 分析者が求めたい解析結果が簡単に得られない。  AdTruthの識別子はユーザの識別には使えない  AdTruthの識別子をGAのCookieの代替に使うデメリット が多すぎる。 全く使う余地がないかと言えば、 そういうわけではない
  • 12.
    ■Page 11Copyright© e-agencyInc. All right reserved. 効率的な識別子の使い方  ユーザ識別子に求められること – 横断性: ドメイン・ブラウザ・デバイスを跨っても共有できること – 永続性: 生成された値が継続的に利用できること – 信頼性: 識別子の揺るぎや重複が発生しないこと – 普遍性: 異なる環境でも同じ手法が使えること  それぞれの手法のメリット・デメリット  会員番号などユーザに紐づく情報は確実だが、利用できる場合が限られる  アプリに限定すればAndroid IDやIDFAが使える  対象サイト内での永続的なブラウザ識別は1st Party Cookieが強い  短期間のクロスドメイン・デバイス判定はAdTruthが得意
  • 13.
    ■Page 12Copyright© e-agencyInc. All right reserved. Cookieを超えた分析の実現  Cookieでユーザ(デバイス)を識別するGAでは、 複数デバイスが利用される現在のユーザ行動を 捕捉しきれない。  解析の精度を上げるには、収集したログ(行動履 歴)を、複数の識別子を適切に使ってユーザを再 判定しなおした上で集計しなおす必要がある。 アクセス解析の限界を 超えるには?
  • 14.
  • 15.
    ■Page 14Copyright© e-agencyInc. All right reserved.
  • 16.
    ■Page 15Copyright© e-agencyInc. All right reserved.  GAのレポート画面では「日付」「URL」「キャンペーン」といった切り口 で集計(解析)された結果が提供される。 集計データを提供するGA  GAの集計データでは調べられないことも多々ある。 – 集計結果の件数が大量に存在する場合 – 予め用意された集計条件以外での切り口 – フィルタ・コンバージョン・コンテンツグループ等の事前設定を変更した集計結果 – 長期間にわたって複数のセッションを跨いだ状態での集計結果 – 他のデータソースと後から連結して集計した結果
  • 17.
    ■Page 16Copyright© e-agencyInc. All right reserved. GAが用意していない切り口での解析 – コンテンツのアトリビューション分析ができる – コンバージョンフローを自由なページ設定で実現できる – サイト内バナーのクリック後の行動が追跡できる 個のレベルでユーザの行動を追跡 – Cookieと会員番号を紐づけることで、複数にわたって発生したセッションをユーザの 一連の行動として計測できる。 – 非サンプリング状態で集計すれば、ユーザ数が多くても精度を維持できる。 – 1年を超える長い期間を対象としたアトリビューション分析が可能 – コンバージョン後のユーザ行動も追跡できる 外部データとの自由な連携 – 顧客属性・購買履歴といった情報を後からアクセス解析に追加できる – コンテンツの作者やカテゴリーといった付随情報を後から加えて解析できる – 会員登録後の購入金額などコンバージョン結果を後から付与して解析できる GAの限界を超えるローデータ解析
  • 18.
    ■Page 17Copyright© e-agencyInc. All right reserved. BigQueryとは – Google社が提供するクラウド型のビッグデータ処理サービス – システム構築は不要で、利用した分だけ料金が発生なので経済的 – 1兆行以上の大規模なデータ分析にも対応するハイパフォーマンス – データの集計にSQLが利用できる Googleのビッグデータソリューション
  • 19.
    ■Page 18Copyright© e-agencyInc. All right reserved.  Google アナリティクスプレミアムの機能としてGAのローデータが BigQueryを介して提供され、集計データ以上の情報が解析に利用 できる GAのローデータを提供するBigQuery連携 セッション情報 日付・時刻 参照元/キーワード カスタム変数 ビジターID etc…. ヒット情報 ページ イベント トランザクション GA → BigQueryGAレポートU/I
  • 20.
    ■Page 19Copyright© e-agencyInc. All right reserved.
  • 21.
    ■Page 20Copyright© e-agencyInc. All right reserved.  BigQueryをデータ解析の中心(ハブ)に位置付けることで、他の システムからGAのローデータが利活用できるようになる。 データハブとしてのBigQuery Google アナリティクス 顧客データ etc. (CRM, ERP) SELECT CONCAT(LPAD(STRING(HOUR(SEC_TO_TI MESTAMP(visitStartTime))), 2, '0'), FLOOR(MINUTE(SEC_TO_TIMESTAMP(visit StartTime)) / 15) AS quarter_hour, COUNT(visitId) AS numberVisits SQLクエリー データウェアハウス レポーティング ツールとの連携 BIツール セッションデータ ヒットデータ
  • 22.
  • 23.
    ■Page 22Copyright© e-agencyInc. All right reserved. GAのリマーケティングとスマートリスト リマーケティング(広告) – サイトに訪問したユーザを対象にして広告を配信することで、無差別に広告 を表示させるよりも高いコンバージョンが期待できる – 更に効率を上げるなら、「商品詳細ページを見た」「カートに商品を入れた」 といったユーザの絞り込みが必要となる – リマーケティング対象のユーザ群をリマーケティング(リマケ)リストと呼ぶ スマートリスト – GAが広告主に代わって最適なリマーケティングリストを作成する機能 – 位置・ブラウザの種別・参照元・セッション滞在時間・ページ深度などGAが 収集した情報を元に、機械学習を使ってコンバージョンの確度が高いユーザ を見つけ出す。 – 機械学習のパターンは多数のWebサイトで稼働するよう汎用性が高く、個々 のサイトの実態を考慮していない。
  • 24.
    ■Page 23Copyright© e-agencyInc. All right reserved. BigQueryを使ったリマケリストの作成  BigQueryのローデータがあれば、サイトの特性を考慮し、 外部データを取り込んだ状態でリマケリストが作成できる Predictive analysis using Google Analytics Premium and BigQuery Yutaka Koga, gTech-Ads Platform Specialist team, Nov 6, 2014 ※日本語による注釈は講師 オンラインで 会員登録 顧客DBに登録 BigQueryで ローデータと 顧客情報を連結 統計解析ソフトで 確率スコアリスト を作成 リマケリストを広告 ネットワークに送信 コンバージョンした ユーザ コンバージョン ユーザに似た 行動パターン のユーザに広 告を露出 ① ② ③ ⑤ ローデータ の収集 ④ ⑥ ⑦ 対象ユーザに広告 を配信⑧
  • 25.
    ■Page 24Copyright© e-agencyInc. All right reserved. 予測とは?  2変量の関係性が線形であった場合、その関係性は、Y=aX+b という一次方程式の形で表すことができる。  このとき、aとbが明らかとなれば、Xの値によって未知のYが計算 できる ⇒ 予測に必要なのは、正しくXを設定し、aとbを精度よく推定すること = 数式になったものを「予測モデル」と呼ぶ Y軸:子の身長(cm) X軸:両親の平均身長(cm) Y=aX+b 予測
  • 26.
    ■Page 25Copyright© e-agencyInc. All right reserved. 予測の実際: 予測モデルの作成  ある会員があるサービスをコンバージョンする確率を予測する場合・・・ 予測するもの 考えられる要因 広告Aクリック有無 サービスCV確率 コンテンツA閲覧回数 他サービスCV回数 最終CVからの日数 モデル化(サービスCV確率=0.05*広告Aクリック有無+0.008*閲覧回数+・・・)し、 各会員に当てはめて確率計算(スコアリング) ・・・
  • 27.
    ■Page 26Copyright© e-agencyInc. All right reserved. 予測を利用した広告配信リストの作成  予測モデル構築できれば、当該サービスの広告に対する反応率が顧客個別に 算出できる。  その反応確率降順のリストを作成し、上位から広告配信を行えばROIの改善が 期待できる。 広告配信でターゲティング可能な会員 問題: あるサービスの広告をどのターゲットに配信するか 反応確率を付与したターゲティングリスト 予測モデルで反応確率計算 ⇒ 確率降順のリストを作成
  • 28.
    ■Page 27Copyright© e-agencyInc. All right reserved. ローデータを利用した反応率予測  BigQueryに蓄積されたユーザのサイト内行動と広告測定データを結合して解析 することで、より効率なターゲティング広告の配信が可能となる。  サイト内行動データ • サイト内ページ閲覧回数 • 期間内の閲覧頻度 • 最新閲覧日からの期間 • ・・・  広告測定データ • 広告クリック数 • 期間内のクリック頻度 • 最新クリック日からの期間 • ・・・ ※上記を、キャンペーンごと、 広告種別ごとなど、様々 なレベルで集計。  ロジスティック回帰分析 下記の式に基づき、CV確率の 予測を行う。 Y= α + β1X1 + … + βnXn • Y を目的変数(CV予測確率)、 Xnを、Google Analyticsによ るサイト内行動データや、広告 データなどの説明変数として、 回帰モデルを構築 • ロジスティック回帰分析により、 変数によらない切片α、およ び、各説明変数の回帰係数 βnを算出 分析 確率スコアリスト  CV確率のスコアリスト作成 ロジスティック回帰により、CV 確率を各ユーザに付与する ことができます。 CV確率の高い順に広告出稿を 行うことで、全体的な広告効果 を保ったまま、広告出稿のコス ト削減が可能となる。 データ 順位 ユーザーID CV確率 1 AAA 0.88 2 BBB 0.86 … … … 10000 CCC 0.25 … … … 上 位 の み に 広 告 出 稿
  • 29.
    ■Page 28Copyright© e-agencyInc. All right reserved. 確率スコアリスト作成のイメージ  コンバージョンしたユーザのレコードから作成した予測モデルを未コンバージョン ユーザに当てはめ、コンバージョンする確率を予測する。 Predictive analysis using Google Analytics Premium and BigQuery Yutaka Koga, gTech-Ads Platform Specialist team, Nov 6, 2014 ※日本語による注釈は講師 オンラインデータ オフラインデータ コンバージョン したユーザ コンバージョン してないユーザ 予測モデルを 作成
  • 30.
    ■Page 29Copyright© e-agencyInc. All right reserved. 確率スコアリストをグラフで表現  ユーザごとに算出されたコンバージョンの確率をグラフで表現した結果  予測モデルによって80%のユーザにリーチする数を減らすことができる 80%の効果を 得るための 対象ユーザ数 カーブの下の面積の大きさ でモデルの精度を評価 予測モデルが ない場合の対 象ユーザ数 Predictive analysis using Google Analytics Premium and BigQuery Yutaka Koga, gTech-Ads Platform Specialist team, Nov 6, 2014 ※日本語による注釈はと着色は講師
  • 31.
  • 32.
    ■Page 31Copyright© e-agencyInc. All right reserved. イーエージェンシーは Googleアナリティクスプレミアムの 導入について、 豊富な実績数を有します。 サイト規模としては、 数億~数十億強のPVクラスのサイト様をサポート。 また、弊社経由でのプレミアム適応サポートサイト数は、 合計で約700サイトにのぼります(2014/7時点)
  • 33.
  • 34.