大量データ処理とDate store handler
- 2. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-1-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ サービス概要
Yahoo!ショッピングに出店しているストア向けCRM
顧客をセグメントしてYahoo!ショッピング上に掲載するクーポンやお知らせを出
しわけできる
- 3. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-2-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ サービス概要
- 4. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-3-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ システム全体構成
FTP
Amazon EMR
Amazon
S3
Amazon
RDS
KVS (Redis)API
Batch
LOG Amazon
Kinesis
App
ユーザ
ストア
ヤフー
バリューコマース
- 5. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-4-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ システム全体構成
FTP
Amazon EMR
Amazon
S3
Amazon
RDS
KVS (Redis)API
Batch
LOG Amazon
Kinesis
App
ユーザ
ストア
ヤフー
バリューコマース
集計処理
配信・DataStore処理
- 6. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-5-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ 集計処理概要
FTP
Amazon EMR
Amazon
S3
Amazon
RDS
KVS (Redis)API
Batch
LOG Amazon
Kinesis
App
ユーザ
ストア
ヤフー
バリューコマース
集計処理
- 7. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-6-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ 集計処理概要
購買情報を元にした集計
顧客ランク
- 8. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-7-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ 集計処理概要
購買情報を元にした集計
顧客ランクの算出方法
現在からさかのぼって、離反期間を含む過去の購買金額・購買回数・購買間隔によって顧客をランク付
け
計算対象期間はストア毎に設定 (最大3年)
- 9. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-8-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ 集計処理概要
購買情報を元にした集計
顧客 × ストア × 時間軸でウインドウ集計
Aストア
商品A-1
Aストア
商品A-2
Bストア
商品B-1
Cストア
商品C-1
NOW
Bストア
商品B-2
Aストア: 直近24カ月
Bストア: 直近12カ月
Cストア: 直近18カ月
- 10. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-9-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ 集計処理概要
購買情報を元にした集計
- 11. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-10-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ Apache Spark
Apache Spark
高速かつ汎用的であることを目標に設計されたクラスタコンピューティングフレームワーク
Hadoop MapReduceのモデルを拡張しインタラクティブなクエリやストリーム処理を含
む多くの演算処理をオンメモリで行う
Apache Spark™ is a unified analytics engine for large-scale data processing.
出典: https://spark.apache.org/
出典: https://ja.wikipedia.org/wiki/Apache_Spark
- 12. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-11-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ Spark on EMR
Spark Core / Spark SQL
基本的にはDataFrameを使用
細かい制御に直接RDDを使用
データ量
顧客: 数千万ユーザ
ストア: 数千店舗
時間: Max 3年分
EMR構成
r3.4xlarge (32 vCore、122 GiB メモリ、320 SSD GB)
3 Nodes
2~4時間で処理
- 13. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-12-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ 配信処理概要
FTP
Amazon EMR
Amazon
S3
Amazon
RDS
KVS (Redis)API
Batch
LOG Amazon
Kinesis
App
ユーザ
ストア
ヤフー
バリューコマース
配信・DataStore処理
- 14. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-13-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
配信処理フロー
STORE’s R∞ 配信処理概要
KVS (Redis)API (Apache)ユーザ
UID + Store ID
お知らせ・クーポン情報
UID
ユーザ情報
(ストア毎)Yahoo!ショッピング
- 15. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-14-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ Redis Module
Redis Module
Redis 4.xから導入
外部モジュールとしてRedis機能を拡張し、独自のRedisコマンドをコアな部分とは分
離したレイヤで実装可能
動的にロード/アンロード可能
データ型(文字列型やハッシュ型など)も独自に追加可能
出典: https://redis.io/topics/modules-intro
出典: https://redis.io/topics/modules-api-ref
- 16. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-15-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ Redis Module
Example
有効期間10秒間でセット
有効期間 2018/12/31 23:59:59でセット
- 17. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-16-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ Redis Module
Example
VCCORE.SETEXAT
- 18. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-17-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ Redis Module
Example
有効期間10秒間でセット
有効期間 2018/12/31 23:59:59でセット
出典: https://redis.io/topics/modules-intro
出典: https://redis.io/topics/modules-api-ref
- 19. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-18-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ 配信処理概要
KVS (Redis)API (Apache)ユーザ
UID + Store ID
お知らせ・クーポン情報
配信処理フロー
UID
ユーザ情報
(ストア毎)Yahoo!ショッピング
- 20. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-19-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ ユーザデータ
Redis データ構造
- 21. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-20-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ ユーザデータ
Redis Module 独自コマンド
- 22. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-21-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ ユーザデータ
Redis構成
r4.2xlarge (8 vCore、61GiB メモリ)
Master 3台 x Slave 3台 (Cluster)
メモリ使用量: 25%
API(Apache)構成
m4.xlarge (4 vCore、16GiB メモリ)
4台
Max QPS: 3,000 QPS/台
- 23. 11 July 2018Copyright © , ValueCommerce Co., Ltd.
-22-
本書類の内容に関する一切の権利につきましては当社に帰属し、本書類の全部または一部
を当社の事前承諾なしに公表または第三者に開示することはできませんので、貴社限りとして
お取扱いください。
一般
STORE’s R∞ まとめ
集計処理
Apache Spark ≠ 簡単にビックデータ集計できる
簡単な集計であればいいが、複雑な集計をするには内部構造まで知らないとダメ
配信処理
レイテンシが求めらる箇所でRDBMSはボトルネックになる
KVSや共有メモリで代用
特にRedis Moduleは細かいことがいろいろできるので可能性無限大