Hadoopエコシステムを駆使したこれからのWebアクセス解析サービス

  • 1,659 views
Uploaded on

ITmedia社主催の特集連動勉強会(@特勉)の発表資料

ITmedia社主催の特集連動勉強会(@特勉)の発表資料

More in: Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
1,659
On Slideshare
0
From Embeds
0
Number of Embeds
2

Actions

Shares
Downloads
23
Comments
0
Likes
4

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Hadoopエコシステムを駆使した これからのWebアクセス解析サービス 2014年年1⽉月23⽇日 株式会社セラン  R&D戦略略室 須⽥田幸憲 @sudabon Copyright © CELL▲NT Corp. All right Reserved. http://www.xdata.jp/
  • 2. ⾃自⼰己紹介 須⽥田幸憲(@sudabon) 株式会社セラン  R&D戦略略室  室⻑⾧長 経歴 l  1997〜~2004  NEC  中央研究所  /  ネットワークの研究 l  2005〜~2006  BIGLOBE  /  BtoBサービスの開発     <SNIP> l  2012/8〜~          現職 Hadoop歴:約1年年 好きなHadoopエコシステム:Hive Copyright © CELL▲NT Corp. All right Reserved. 2 http://www.xdata.jp/
  • 3. セランの事業紹介 1.  MOBYLOG(モビログ) l  Webアクセス解析・広告効果測定サービス l  2005年年12⽉月にサービス開始 l  PC、スマホ、ケータイ、スマホアプリの計測が可能 l  ケータイでの解析が強み(MOBYLOG  ENGINE) •  旧Omniture社(現Adobe社)のSiteCatalyst、及びWebTrends社 のWebTrends  AnalyticsにモジュールとしてOEM提供 2.  Xdata  collect(クロスデータ・コレクト) l  クラウド型のログストレージサービス l  2013年年5⽉月にサービス開始 l  Webサーバで取得できる情報に加えて、セッション情報や ユーザイベントも保存でき、CSVとしてダウンロード可能 l  ⽉月間50万件までは無料料で利利⽤用可能 Copyright © CELL▲NT Corp. All right Reserved. 3 http://www.xdata.jp/
  • 4. これまでのWebアクセス解析サービス これまでは”セッションを軸とした集計”が主流流だった   Webアクセス解析のキホン –  3⼤大重要⽤用語 •  ページビュー(PV)数 •  セッション(訪問)数 •  ユニークユーザ(UU)数 –  4⼤大指標 •  新規セッション(訪問)率率率 •  コンバージョン(CV)率率率 •  直帰率率率 •  平均滞在時間 週次や⽉月次によるチェックでWebサイトの状況把握 Copyright © CELL▲NT Corp. All right Reserved. 4 http://www.xdata.jp/
  • 5. これからのWebアクセス解析サービス ”ユニークユーザを軸とした分析”のニーズが急拡⼤大   ここでのユニークユーザを軸とした分析とは? –  ログインID等のユーザアカウントと紐紐付けができないアク セスログも対象としたユニークユーザを軸に分析 例例1)広告におけるアトリビューション分析 流流⼊入元メディア毎のコンバージョン貢献度度  ⇒  広告メディアの予算配分 例例2)ECサイトにおけるカート放棄分析 カート放棄されたユーザの購買率率率と間隔  ⇒  メール・リマーケティング Copyright © CELL▲NT Corp. All right Reserved. 5 http://www.xdata.jp/
  • 6. ECサイトにおけるUU分析の課題と対処法 1.  サイト利利⽤用時にログインが必須ではない –  ユーザを特定できないアクセスログが⽣生成される –  ECサイトに依ってはログインアカウントなしでも購⼊入可能 2.  マルチデバイスを利利⽤用するユーザの増⼤大 –  同⼀一ユーザの異異なるセッションのアクセスログが⽣生成される 実装を⼯工夫することで、結果の厳密性を向上 セッションとユーザアカウントが紐紐付いた時点で、過去に遡っ てユーザアカウントでログを分析できるように実装 Copyright © CELL▲NT Corp. All right Reserved. 6 http://www.xdata.jp/
  • 7. マルチデバイスの利利⽤用例例 朝 通勤時間にチェック 昼 昼休みに会社でチェック 夜 ⾃自宅宅のベッドで購⼊入 同⼀一ユーザが異異なるデバイスからECサイトにアクセス 異異なるセッションキーのアクセスログが⽣生成 Copyright © CELL▲NT Corp. All right Reserved. 7 http://www.xdata.jp/
  • 8. カート放棄分析① カート放棄フロー 1 訪問 商品閲覧や特定 URL参照のアク ションイベント 2 3 カート 29,907件 730,298件 100% 購⼊入 14,041件 カート利利⽤用率率率  4.1% (  ②/①*100  ) 4 CVR  1.9% (  ③/①*100  ) 5 直帰 カート前離離脱 カート放棄 231,214件 469,117件 15,886件 直帰率率率  31.7% カート放棄率率率  53.1% (  ⑤/②*100  ) ▲ 従来のアクセス解析ツールは ここまでしか分析できない。 Copyright © CELL▲NT Corp. All right Reserved. 8 http://www.xdata.jp/
  • 9. カート放棄分析② 5 カート放棄 15,886件 カート放棄率率率  53.1% (  ⑤/②*100  ) ▲ 本当に放棄? [参考情報] ・2012年年のUSでの調査結果 カート放棄率率率  =  65% <放棄理理由> 1.  配送料料  ⇒  44% 2.  将来買う予定  ⇒  41% 3.  商品価格が⾼高い  ⇒  25% [出典] Lean  Analytics [仮説]カートをお気に⼊入り代わ りに利利⽤用するユーザーが多い? Copyright © CELL▲NT Corp. All right Reserved. 9 http://www.xdata.jp/
  • 10. カート放棄分析③ カート放棄後24時間以上経過したユーザをさらに分析 カート放棄セッションの内訳 5 6 7 カート放棄 再訪問 10,394件 15,886件 9 購⼊入 34.5% 1,046件 再訪問率率率  65.4%   15,866 再訪問購⼊入率率率  6.6%   (  ⑦/⑤*100  ) (  ⑥/⑤*100  ) 8 6.6% 58.9% 7 8 9 再訪問なし 離離脱 5,472件 9,348件 未再訪問率率率    34.5%   (  ⑨/⑤*100  ) カート放棄ユーザのうち 購⼊入に⾄至らない割合は Copyright © CELL▲NT Corp. All right Reserved. 離離脱率率率  58.9%   10 14,820件 (  ⑧  +  ⑨  ) (  ⑧/⑤*100  ) 93.4 (  ⑩    /  ⑤*100  ) %◀ ここを改善することで 購⼊入数の増加が⾒見見込める 10 http://www.xdata.jp/
  • 11. カート放棄分析④ 例例えば改善⽬目標を5%に設定した場合 93.4% 14,820件 5 % 88.4% 14,020件 ◀ 800件の購⼊入増加 ⽉月間平均購買単価 改善件数 売上増 12,523円 800件 10,018,011円 ⽉月間売上の7.3% 単純計算すると 120,000,000円/年年 Copyright © CELL▲NT Corp. All right Reserved. 11 http://www.xdata.jp/
  • 12. カート放棄分析⑤ 改善⽬目標を達成するためには? カート放棄 10 14,820件 メール・リマーケティング (お・も・て・な・し) 例例)カートに⼊入っている商品に関するフォローメールを配信   1回⽬目  -‐‑‒>  ●⽇日後  :  カートリマインダー   2回⽬目  -‐‑‒>  ●⽇日後  :  クーポン   3回⽬目  -‐‑‒>  ●⽇日後  :  さらにお得なクーポン カート内の商品や顧客属性で セグメンテーションして、 メール配信するユーザを限定 実際問題として何⽇日後にメール配信すればいい? Copyright © CELL▲NT Corp. All right Reserved. 12 http://www.xdata.jp/
  • 13. カート放棄分析⑥ 購⼊入ユーザの再訪問間隔と購⼊入率率率の関係 カート放棄後に再訪問して購⼊入したユーザーの購⼊入間隔(累累積度度数分布) % 100 90 80 70 60 50 カート放棄後、 7⽇日以内の購⼊入率率率 40 30 54.0% 20 (557ユーザー) 10 0 0 7 14 21 28 35 42 49 56 ⽇日 カート放棄後、7⽇日以内  に再訪問して購⼊入する割合は  54% Copyright © CELL▲NT Corp. All right Reserved. 13 http://www.xdata.jp/
  • 14. カート放棄分析⑦ 施策例例 カート放棄ユーザに対して メール・リマーケティングを実施する 54%  となる、カート放棄後  7  ⽇日⽬目にカートリマインダーを配信 再訪問購⼊入率率率  70%  となる、カート放棄後  14  ⽇日⽬目に10%OFFクーポンを配信 再訪問購⼊入率率率  80%  となる、カート放棄後  21  ⽇日⽬目に20%OFFクーポンを配信 再訪問購⼊入率率率   施策実施により、再訪問購⼊入率率率と購⼊入間隔の関係が変わる 再訪問購⼊入率率率に基づき、⾃自動的にメール配信間隔を決定 Copyright © CELL▲NT Corp. All right Reserved. 14 http://www.xdata.jp/
  • 15. UU分析を実現する解析サービス基盤 •  Hive+MapReduce  ⇒  全アクセスログベースの集計 HBase  ⇒  ユニークユーザベースの分析 Hadoopクラスタ ログ 加⼯工なし Hive MapReduce (impala) 全アクセスログ ベースの集計 ◀ セッション単位へ加⼯工 DBサーバ order  by句句で タイムスタンプ とセッション順 に抽出 Copyright © CELL▲NT Corp. All right Reserved. HBase ユニークユーザ ベースの分析 集計・分析結果を保存 バッチ サーバ 15 http://www.xdata.jp/
  • 16. 設計におけるポイント •  Hiveテーブルのスキーマ –  顧客毎に通知されるログのパラメータ名が異異なる ⇒  JSON形式の1カラムに変換して保存して、LATERAL  VIEW 句句で個別のパラメータを抽出 •  HBaseの活⽤用⽅方法 –  ユニークユーザの全セッションの⾏行行動履履歴の検索索 ⇒  セッションの流流⼊入元やコンバージョンなどの重要な⾏行行動履履 歴をサマライズして1⾏行行として保存 ⇒  天気や平均気温などの情報も同じ⾏行行に追加 Copyright © CELL▲NT Corp. All right Reserved. 16 http://www.xdata.jp/
  • 17. Xdataサービスの紹介   クロスデータ –  2014年年春頃リリース(予定) –  ストレージサービスの”コレクト”に加えて、ECサイト向けの ユニークユーザを軸とした分析機能も提供 •  プロフィール分析 •  カート放棄分析 •  顧客セグメンテーション分析 http://www.xdata.jp/ Copyright © CELL▲NT Corp. All right Reserved. 17 http://www.xdata.jp/
  • 18. ご静聴ありがとうございました Copyright © CELL▲NT Corp. All right Reserved. http://www.xdata.jp/