Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Michio Katano
PPTX, PDF
25,990 views
GMOプライベートDMPの仕組み
GMO Private DMP の仕組みの説明 - CDH5.2, Impala2.0, HBase0.98 をフル活用したアドテク&ビッグデータのシステム
Technology
◦
Read more
75
Save
Share
Embed
Embed presentation
Download
Downloaded 216 times
1
/ 66
2
/ 66
3
/ 66
4
/ 66
5
/ 66
6
/ 66
7
/ 66
8
/ 66
9
/ 66
10
/ 66
11
/ 66
12
/ 66
13
/ 66
14
/ 66
15
/ 66
16
/ 66
17
/ 66
18
/ 66
19
/ 66
20
/ 66
21
/ 66
22
/ 66
23
/ 66
24
/ 66
25
/ 66
26
/ 66
27
/ 66
28
/ 66
29
/ 66
30
/ 66
31
/ 66
32
/ 66
33
/ 66
34
/ 66
35
/ 66
36
/ 66
37
/ 66
38
/ 66
39
/ 66
40
/ 66
41
/ 66
42
/ 66
43
/ 66
44
/ 66
45
/ 66
46
/ 66
47
/ 66
48
/ 66
49
/ 66
50
/ 66
51
/ 66
52
/ 66
53
/ 66
54
/ 66
55
/ 66
56
/ 66
57
/ 66
58
/ 66
59
/ 66
60
/ 66
61
/ 66
62
/ 66
63
/ 66
64
/ 66
65
/ 66
66
/ 66
More Related Content
PDF
Cloudera Impalaをサービスに組み込むときに苦労した話
by
Yukinori Suda
PDF
刊行記念セミナー「HBase徹底入門」
by
cyberagent
PDF
HBaseを用いたグラフDB「Hornet」の設計と運用
by
Toshihiro Suzuki
PDF
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
by
Cloudera Japan
PPTX
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
by
LINE Corporation
PPTX
HBase×Impalaで作るアドテク「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer
by
Michio Katano
PDF
HBaseCon 2012 参加レポート
by
NTT DATA OSS Professional Services
PDF
HBase at Ameba
by
Toshihiro Suzuki
Cloudera Impalaをサービスに組み込むときに苦労した話
by
Yukinori Suda
刊行記念セミナー「HBase徹底入門」
by
cyberagent
HBaseを用いたグラフDB「Hornet」の設計と運用
by
Toshihiro Suzuki
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
by
Cloudera Japan
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
by
LINE Corporation
HBase×Impalaで作るアドテク「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer
by
Michio Katano
HBaseCon 2012 参加レポート
by
NTT DATA OSS Professional Services
HBase at Ameba
by
Toshihiro Suzuki
What's hot
PDF
Oracle Cloudで始める、DBエンジニアのためのHadoop超入門(db tech showcase 2016 Oracle セッション資料)
by
オラクルエンジニア通信
PDF
オライリーセミナー Hive入門 #oreilly0724
by
Cloudera Japan
PDF
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
by
MapR Technologies Japan
PDF
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
by
Akira Shimosako
PPTX
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
by
Cloudera Japan
PDF
Impalaチューニングポイントベストプラクティス
by
Yahoo!デベロッパーネットワーク
PPT
Apache Hive 紹介
by
あしたのオープンソース研究所
PDF
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...
by
Insight Technology, Inc.
PDF
なぜApache HBaseを選ぶのか? #cwt2013
by
Cloudera Japan
PDF
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
by
MapR Technologies Japan
PDF
Hadoopのシステム設計・運用のポイント
by
Cloudera Japan
PDF
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
by
Yahoo!デベロッパーネットワーク
PDF
Kuduを調べてみた #dogenzakalt
by
Toshihiro Suzuki
PPTX
HAWQをCDHで動かしてみた
by
adachij2002
PPTX
Cloudera Impala Seminar Jan. 8 2013
by
Cloudera Japan
PDF
CDH4.1オーバービュー
by
Cloudera Japan
PDF
Osc2012 spring HBase Report
by
Seiichiro Ishida
PDF
20141106_cwt-zenmyo-naito
by
cyberagent
PDF
AWS Elastic MapReduce詳細 -ほぼ週刊AWSマイスターシリーズ第10回-
by
SORACOM, INC
PDF
20分でわかるHBase
by
Sho Shimauchi
Oracle Cloudで始める、DBエンジニアのためのHadoop超入門(db tech showcase 2016 Oracle セッション資料)
by
オラクルエンジニア通信
オライリーセミナー Hive入門 #oreilly0724
by
Cloudera Japan
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
by
MapR Technologies Japan
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
by
Akira Shimosako
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
by
Cloudera Japan
Impalaチューニングポイントベストプラクティス
by
Yahoo!デベロッパーネットワーク
Apache Hive 紹介
by
あしたのオープンソース研究所
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...
by
Insight Technology, Inc.
なぜApache HBaseを選ぶのか? #cwt2013
by
Cloudera Japan
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
by
MapR Technologies Japan
Hadoopのシステム設計・運用のポイント
by
Cloudera Japan
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
by
Yahoo!デベロッパーネットワーク
Kuduを調べてみた #dogenzakalt
by
Toshihiro Suzuki
HAWQをCDHで動かしてみた
by
adachij2002
Cloudera Impala Seminar Jan. 8 2013
by
Cloudera Japan
CDH4.1オーバービュー
by
Cloudera Japan
Osc2012 spring HBase Report
by
Seiichiro Ishida
20141106_cwt-zenmyo-naito
by
cyberagent
AWS Elastic MapReduce詳細 -ほぼ週刊AWSマイスターシリーズ第10回-
by
SORACOM, INC
20分でわかるHBase
by
Sho Shimauchi
Viewers also liked
PDF
ElasticSearch勉強会 第6回
by
Naoyuki Yamada
KEY
平均レスポンスタイム50msをPerlで捌く中規模サービスの実装/運用
by
Tatsuro Hisamori
PDF
[db tech showcase Tokyo 2015] B17:PostgreSQLで動的にスケールアウト可能な負荷分散DBクラスタを作ろう! by ...
by
Insight Technology, Inc.
PDF
AdTech Scala Meetup 7 spray-can
by
Shuya Tsukamoto
PPTX
アドテクな話
by
Jun Ichikawa
PDF
デブサミ2013【15-C-6】5msの中身を公開!~ネット広告配信と支える職人達~
by
Developers Summit
PDF
DSP「ScaleOut」の成長と負荷対策
by
Toshiaki Ishibashi
PPTX
Sano tokyowebmining 201625_v04
by
Masakazu Sano
PPTX
All about Programmatic buying(RTB), DSP,SSP, DMP & DCT - A complete digital ...
by
Karunakar Ravirala
PDF
株式会社サイバーエージェント アドテクスタジオの技術と開発
by
Naoyuki Yamada
PDF
ScalaでDSP作ってみた
by
Jiro Hiraiwa
PDF
[db tech showcase OSS 2017] A22: NoSQL:誰のための、何のためのデータベース?その将来は?by Aerospike, ...
by
Insight Technology, Inc.
PDF
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
by
Naoyuki Yamada
PDF
媒体側から見たネット広告の取引形態の多様化
by
Nori Takahiro
PPTX
ネット広告のシステム関連の話
by
株式会社ジオロジック
KEY
広告の最適化
by
章平 福井
PDF
モバイルサイト配信と広告の課題
by
Yoichiro Takehora
PDF
Ad tech 勉強会 20140115
by
ajiyoshi
PDF
DSP基礎講座(フリークアウト 佐藤裕介氏)|マナビトオンライン
by
TATEITO株式会社
PDF
Adtech2013 audiencemerger
by
Ryoji Yanashima
ElasticSearch勉強会 第6回
by
Naoyuki Yamada
平均レスポンスタイム50msをPerlで捌く中規模サービスの実装/運用
by
Tatsuro Hisamori
[db tech showcase Tokyo 2015] B17:PostgreSQLで動的にスケールアウト可能な負荷分散DBクラスタを作ろう! by ...
by
Insight Technology, Inc.
AdTech Scala Meetup 7 spray-can
by
Shuya Tsukamoto
アドテクな話
by
Jun Ichikawa
デブサミ2013【15-C-6】5msの中身を公開!~ネット広告配信と支える職人達~
by
Developers Summit
DSP「ScaleOut」の成長と負荷対策
by
Toshiaki Ishibashi
Sano tokyowebmining 201625_v04
by
Masakazu Sano
All about Programmatic buying(RTB), DSP,SSP, DMP & DCT - A complete digital ...
by
Karunakar Ravirala
株式会社サイバーエージェント アドテクスタジオの技術と開発
by
Naoyuki Yamada
ScalaでDSP作ってみた
by
Jiro Hiraiwa
[db tech showcase OSS 2017] A22: NoSQL:誰のための、何のためのデータベース?その将来は?by Aerospike, ...
by
Insight Technology, Inc.
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
by
Naoyuki Yamada
媒体側から見たネット広告の取引形態の多様化
by
Nori Takahiro
ネット広告のシステム関連の話
by
株式会社ジオロジック
広告の最適化
by
章平 福井
モバイルサイト配信と広告の課題
by
Yoichiro Takehora
Ad tech 勉強会 20140115
by
ajiyoshi
DSP基礎講座(フリークアウト 佐藤裕介氏)|マナビトオンライン
by
TATEITO株式会社
Adtech2013 audiencemerger
by
Ryoji Yanashima
Similar to GMOプライベートDMPの仕組み
PPTX
ビッグデータ活用支援フォーラム
by
Recruit Technologies
PPTX
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
by
Cloudera Japan
PDF
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
by
Treasure Data, Inc.
PDF
トレジャーデータのバッチクエリとアドホッククエリを理解する
by
Takahiro Inoue
PDF
ソリューションセッション#3 ビッグデータの3つのVと4つのプロセスを支えるAWS活用法
by
Amazon Web Services Japan
PDF
[Aws]database migration seminar_20191008
by
Toru Kimura
PDF
マッチングアプリの作り方
by
IBM Analytics Japan
PPTX
Qlik Talend Cloudしっかり学ぶ勉強会 #8 - Amazon S3 との接続.pptx
by
QlikPresalesJapan
PDF
TokyoWebminig カジュアルなHadoop
by
Teruo Kawasaki
PPTX
The truth about SQL and Data Warehousing on Hadoop
by
DataWorks Summit/Hadoop Summit
PDF
BIG DATA サービス と ツール
by
Ngoc Dao
PDF
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
by
Insight Technology, Inc.
PDF
クラウドにおけるビッグデータ分析環境
by
Kimihiko Kitase
PDF
CDH5最新情報 #cwt2013
by
Cloudera Japan
PDF
Developers.IO 2019 Effective Datalake
by
Satoru Ishikawa
PDF
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTips
by
yuichi_komatsu
PDF
【IMJ】「Adobe Media Manager」を活用したプライベートDMP構築
by
IMJ Corporation
PPTX
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
by
Cloudera Japan
PDF
Azure データサービスデザイン検討 (2015/10)
by
Koichiro Sasaki
PPTX
Summary dmp&rtb
by
Riku Kawasaki
ビッグデータ活用支援フォーラム
by
Recruit Technologies
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
by
Cloudera Japan
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
by
Treasure Data, Inc.
トレジャーデータのバッチクエリとアドホッククエリを理解する
by
Takahiro Inoue
ソリューションセッション#3 ビッグデータの3つのVと4つのプロセスを支えるAWS活用法
by
Amazon Web Services Japan
[Aws]database migration seminar_20191008
by
Toru Kimura
マッチングアプリの作り方
by
IBM Analytics Japan
Qlik Talend Cloudしっかり学ぶ勉強会 #8 - Amazon S3 との接続.pptx
by
QlikPresalesJapan
TokyoWebminig カジュアルなHadoop
by
Teruo Kawasaki
The truth about SQL and Data Warehousing on Hadoop
by
DataWorks Summit/Hadoop Summit
BIG DATA サービス と ツール
by
Ngoc Dao
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
by
Insight Technology, Inc.
クラウドにおけるビッグデータ分析環境
by
Kimihiko Kitase
CDH5最新情報 #cwt2013
by
Cloudera Japan
Developers.IO 2019 Effective Datalake
by
Satoru Ishikawa
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTips
by
yuichi_komatsu
【IMJ】「Adobe Media Manager」を活用したプライベートDMP構築
by
IMJ Corporation
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
by
Cloudera Japan
Azure データサービスデザイン検討 (2015/10)
by
Koichiro Sasaki
Summary dmp&rtb
by
Riku Kawasaki
GMOプライベートDMPの仕組み
1.
GMOプライベートDMPで挑戦した アドテク&ビッグデータのシステム
2.
2 ●自己紹介片野道雄 ▪
GMOインターネット株式会社 ▪ 次世代システム研究室 • チーフアーキテクト ▪ 元はデータベースエンジニア • Oracle RAC, MySQL, PostgreSQL (with Slony-I), XtraDB (on Fusion-io), MySQL Cluster, MariaDB Galera Cluster • CDH (Hive, HBase, Impala) • 検証でCassandraとMongoDB
3.
3 ●目次 ▪
プライベートDMPとは? ▪ GMOプライベートDMP ▪ 1st Party Cookie Syncに挑戦 ▪ Hadoopと発火の工夫 ▪ システム設計のノウハウ
4.
4 プライベートDMPとは? DWHとの違い
タグ発火と 広告配信 用語集 DMPの概要 リタゲ(DSP) との違い
5.
5 先ず、アドテクについて用語を整理
6.
6 アドテク用語 リスティング広告検索エンジンでの検索ワードに連動した広告。
Google、Yahoo。 ディスプレイ広告サイト上の広告。テキスト、バナー、動画の 広告など。 RTB (Real-Time Bidding) ディスプレイ広告におけるリアルタイム入札。 →後述 DSP (Demand-Side Platform) RTBの広告主側システム。→後述 SSP (Supply-Side Platform) RTBの広告掲載側システム。→後述
7.
7 アドテク用語 タグ
サイトに仕込むimgタグやjavascriptタグ。 サーバーにリクエストが送られ、トラッキン グや効果測定などで利用。 発火タグを呼び出し、サーバーにリクエストが送 られること。 Cookie Sync ドメインが異なるCookieのIDをリダイレクト させて紐付けること。→後述 DMP (Data Management Platform) 様々なサイトの行動ログなどを蓄積し、広告 配信などに活用するプラットフォームのこと。 →後述
8.
8 アドテク用語 オーディエンスサイト来訪者のこと。
セグメントオーディエンスの属性や趣味嗜好、行動特性 で層を区分したもの。 ターゲティング特定のセグメントに狙いを絞って、広告を打 つこと。 リターゲティング (リタゲ) サイトに訪れた行動履歴などから、オーディ エンス(セグメント)を絞って、広告を打つこと。 →後述
9.
9 RTB でのオークションの流れ
SSP / DSP
10.
10 RTB -
DSP / SSP
11.
11 プライベートDMPとは? DWHとの違い
タグ発火と 広告配信 用語集 DMPの概要 リタゲ(DSP) との違い
12.
12 DMP =
Data Management Platform データをためて活用する「箱」 ▪ パブリックDMP ▪ プライベートDMP ※2種類のDMPがある
13.
13 パブリックDMPとプライベートDMP
14.
14 パブリックDMP ボリュームが多い
インターネットユーザーをセグメント 化して、広告配信や調査に活用 提携する媒体からCookie IDを収集、 IDを統合して利用または販売
15.
15 プライベートDMP ボリュームが少ない
サイトに来た人をセグメント化して、 広告・メール配信や顧客分析に活用 ロイヤリティ向上 サイトの会員属性・購買履歴・オフラ インデータなどを取り込んで利用
16.
16 DMP =
Data Management Platform データをためて活用する「箱」 ▪ ターゲティング/リタゲ広告 ▪ CRM連携、メール配信、LPO ▪ 顧客分析
17.
17 プライベートDMPとは? DWHとの違い
タグ発火と 広告配信 用語集 DMPの概要 リタゲ(DSP) との違い
18.
18 DSPのリタゲで十分では? DSPのリタゲができない・しないこと
▪ 会員属性、購買履歴などの取り込み ▪ 行動ログの蓄積、任意の集計 ▪ 詳細なセグメント作成 ▪ 広告配信以外へのセグメント活用
19.
19 プライベートDMPとは? DWHとの違い
タグ発火と 広告配信 用語集 DMPの概要 リタゲ(DSP) との違い
20.
20 DWH =
Data WareHouse 直訳「データの倉庫」 直訳したところの意味に、差はない DMP = Data Management Platform 直訳「データ管理基盤」
21.
21 導入した企業は、意思決定にデータを 活用する点で恐らく区別してない
▪ システムを歴史的に区分している印象 ▪ DWH はBI とセットでよく語られる ▪ プライベートDMP でもBI を行いたい
22.
22 DWH 企業側で構築
基幹システム(RDB)から、分析項目に そって抽出、構造化して時系列に格納 プライベートDMP 第三者のサービス システムは提供会社それぞれ。今のと ころ、アドテク業界での用語
23.
23 プライベートDMPとは? DWHとの違い
タグ発火と 広告配信 用語集 DMPの概要 リタゲ(DSP) との違い
24.
24 DMPのセグメントにどうやって広告を 配信するのか?
基本的には、DSPのタグ(主にリタゲ用) を呼び出す= タグ発火 ※そこから先の広告配信はDSPが対応
25.
25 DSPのタグを呼び出すのには Piggy
Back という方法を 用いるのが基本
26.
26 DSPタグのPiggyBack
27.
27 続いて、プライベートDMPに おけるタグ発火までの流れ
(Piggy Back)
28.
28 プライベートDMPとタグ発火(PiggyBack)
29.
29 そして、GMOプライベートDMP
30.
30 GMOプライベートDMP 競合
特徴
31.
31 プライベートDMPの競合サービス MOTHER
smarticA!DMP
32.
32 GMOプライベートDMP 競合
特徴
33.
33 GMOプライベートDMP 特徴
ここまでのプライベートDMPの機能 ▪ 画面操作で自由にセグメント作成できる ▪ セグメント作成から発火まで速い ▪ ページやCVごとに別々のタグがいらない ▪ 3rd Party Cookieは使用しない ▪ セグメント比較レポート
34.
34 セグメント作成画面サンプル
35.
35 購買条件サンプル
36.
36 次から、もっと詳細な技術の 話に移ります
37.
37 1st Party
Cookie Syncに挑戦 広告主の複数の サイトに来訪 3rd Party Cookie タグの現状 1st Party Cookie アイデア
38.
38 広告主の複数のサイトに来訪 3rd
Party Cookie のDMPタグの場合 プライベートDMP X のCookie X が同 じなので、同じユーザーとわかる。
39.
39 しかし、世の中は 3rd
Party Cookie を 簡単に許可しない流れ
40.
40 1st Party
Cookie Syncに挑戦 広告主の複数の サイトに来訪 3rd Party Cookie タグの現状 1st Party Cookie アイデア
41.
41 実は、iPhone はデフォルトで
3rd Party Cookieが利用できない ▪ iPhone / Mac のSafari は3rd Party Cookieを受け付けない ▪ 主要ブラウザは3rd Party Cookie 拒否の 設定がある
42.
42 1st Party
Cookie Syncに挑戦 広告主の複数の サイトに来訪 3rd Party Cookie タグの現状 1st Party Cookie アイデア
43.
43 GMOプライベートDMPでは 3rd
Party Cookie を使わず、 1st Party Cookie で 複数サイト対応に挑戦
44.
44 複数サイトでの1st Party
Cookie Sync
45.
45 Hadoopと発火の工夫 タグ処理高速化
Impala + HBase オンライン条件 はリアルタイム
46.
46 タグ処理高速化JavaScript ▪
タグ出力処理は画面描画処理と分離 ▪ document.write を使用しているタグは、 iframe に書き出して画面描画処理に戻す ▪ 同一DSPは直列/別DSPは並列にタグ出力
47.
47 Hadoopと発火の工夫 タグ処理高速化
Impala + HBase オンライン条件 はリアルタイム
48.
48 GMOプライベートDMPのミドルウェア ▪
大量のタグ発火リクエストをさばきたい NoSQL HBase ▪ 蓄積されたビッグデータを集計・解析したい MPP /SQL Impala ▪ 別々のシステムを行き来したくない NoSQL + MPP /SQL = ? CDH
49.
49 CDH =
Cloudera のHadoop ディストリ ビューション ▪ Impala はCloudera が独自開発C++ ▪ CDH にはHadoop エコシステムがすべて 依存関係が解消されテストされた状態でま とまっている ▪ YARN、HBase、Hiveなど
50.
▪ Hive のテーブル定義を通して、Impalaクエリ
からHBase テーブルに読み書きできる ▪ HBase テーブルを先に作り、Hive は外部テー ブルとして作るのがポイント 50 Impala + HBase Hive から通常のテーブルとして作るとHBase のテーブル もできて便利。だが、HBase のデータ項目が増えたとき Hive 側だけで柔軟に対応できなくなる
51.
51 HBase でテーブル作成
① Hive 側でのデータベース名を接頭辞に create ‘gmo.hb_sample_master’, { NAME => 'configdata', VERSIONS => 1, TTL => -1, } ② カラムファミリー名
52.
52 Hive で外部テーブル作成
① 外部オプション CREATE EXTERNAL TABLE hbase_sample_master( sample_id int ,created_datetime string ,modified_datetime string ,status_code int ) STORED BY ② 格納先をHbase に指定 ‘org.apache.hadoop.hive.hbase.HBaseStorageHandler’ WITH SERDEPROPERTIES (“hbase.columns.mapping” = “:key, configdata:created_datetime, configdata:modified_datetime, configdata:status_code") ; ④ Key = PK ③ Hive でのカラム定義を HBase とマッピング
53.
53 Hadoopと発火の工夫 タグ処理高速化
Impala + HBase オンライン条件 はリアルタイム
54.
54 プライベートDMPとタグ発火 セグメント作成後、対象オーディエンス
が次に来訪したときにタグ発火 (=広告配信)
55.
⑥で再来訪したときにDSPタグ発火(=広告配信) 55
56.
56 この場合の問題点 ▪
オーディエンスが次に来訪したとき、 セグメントの条件と大きくズレること がある • 特に「直近○日に○回」来訪といった条件
57.
57 ●ケース① ▪
「直近7日以内に来訪」セグメント • セグメント作成時には条件に該当したが、次 の来訪が1か月後でも、タグ発火してしまう ●ケース② ▪ 「ある期間に2回来訪」セグメント • 条件に該当したオーディエンスが次に来訪し て発火するときには3回来訪していることに
58.
58 オンライン条件はリアルタイム ▪
オンライン(=URL)条件で次の工夫 • 「直近○日」来訪などの各種オンライン条件は APサーバーでリアルタイム処理 • 「ある期間に○回」といった来訪回数の条件は セグメント作成時に1回減らして、次に来訪し たときにAPサーバーで判断して発火
59.
59 システム設計のノウハウ システム設計
トランザクショ ン制御 TIPS
60.
60 システム全体
61.
61 Hadoopクラスタ(CDH)
62.
62 システム設計のノウハウ システム設計
トランザクショ ン制御 TIPS
63.
63 トランザクション制御 ▪
3 フェイズコミット • try catchで表現すると、 try { 1. MariaDB を更新 -> commit ① 2. HBase を更新 -> commit ② ※RDB のトランザクションは、 commit してからHBase を更新す るか(①)、HBase 更新を待って からcommit(②)の使い分け。 3. Rabbit MQ にエンキュー } catch( e ) { // エラーのときは、rollback またはexit }
64.
64 システム設計のノウハウ システム設計
トランザクショ ン制御 TIPS
65.
65 TIPS ▪
HDFS のパーミッション • Hiveテーブルを利用する場合は、impala 以外の Hadoopサービスのユーザーに注意(特にFlume) ▪ クエリをcast 関数でバリデーション • integer 型のパーティションキーにURLエンコード した文字を間違って投入したらHiveメタ破壊 • cast 関数を使えば値の型がおかしくても守れる
66.
66 ご清聴ありがとうございました
Download