Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Recruit Technologies
PDF, PPTX
3,948 views
20150625 cloudera
2015/06/25 HBase Meetup Tokyo Summer 2015での、池田の講演資料になります
Technology
◦
Read more
14
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 47
2
/ 47
3
/ 47
4
/ 47
5
/ 47
6
/ 47
7
/ 47
8
/ 47
9
/ 47
10
/ 47
11
/ 47
12
/ 47
13
/ 47
14
/ 47
15
/ 47
16
/ 47
17
/ 47
18
/ 47
19
/ 47
20
/ 47
21
/ 47
22
/ 47
23
/ 47
24
/ 47
25
/ 47
26
/ 47
27
/ 47
28
/ 47
29
/ 47
30
/ 47
31
/ 47
32
/ 47
33
/ 47
34
/ 47
35
/ 47
36
/ 47
37
/ 47
38
/ 47
39
/ 47
40
/ 47
41
/ 47
42
/ 47
43
/ 47
44
/ 47
45
/ 47
46
/ 47
47
/ 47
More Related Content
PDF
リクルート式Hadoopの使い方
by
Recruit Technologies
PDF
リクルート式 自然言語処理技術の適応事例紹介
by
Recruit Technologies
PDF
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
by
Recruit Technologies
PDF
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
by
Recruit Technologies
PDF
Case study of DevOps for Hadoop in Recruit.
by
Recruit Technologies
PPTX
リクルートを支える横断データ基盤と機械学習の適用事例
by
Tetsutaro Watanabe
PDF
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
by
Recruit Technologies
PPTX
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
by
DataWorks Summit/Hadoop Summit
リクルート式Hadoopの使い方
by
Recruit Technologies
リクルート式 自然言語処理技術の適応事例紹介
by
Recruit Technologies
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
by
Recruit Technologies
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
by
Recruit Technologies
Case study of DevOps for Hadoop in Recruit.
by
Recruit Technologies
リクルートを支える横断データ基盤と機械学習の適用事例
by
Tetsutaro Watanabe
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
by
Recruit Technologies
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
by
DataWorks Summit/Hadoop Summit
What's hot
PDF
リクルート式ビッグデータ活用術
by
Recruit Technologies
PDF
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
by
Recruit Technologies
PDF
リクルートにおける画像解析事例紹介と周辺技術紹介
by
Recruit Technologies
PDF
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~
by
Recruit Technologies
PDF
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
by
Recruit Technologies
PDF
リクルート式AIの活用法
by
Recruit Technologies
PDF
ビッグデータ処理データベースの全体像と使い分け
by
Recruit Technologies
PDF
Spring “BigData”
by
Recruit Technologies
PDF
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
by
Recruit Technologies
PDF
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
by
Amazon Web Services Japan
PDF
リクルート式 自然言語処理技術の適応事例紹介
by
Recruit Technologies
PPTX
WebDB Forum 2013
by
Recruit Technologies
PDF
R-tech BDGにおける自然言語処理活動
by
Recruit Technologies
PDF
リクルートにおけるPaaS活用事例
by
Recruit Technologies
PDF
Struggle against cross-domain data complexity in Recruit group
by
Recruit Technologies
PDF
3万人が利用するリクルートのワイヤレス環境 ~リアクティブからプロアクティブへ~
by
Recruit Technologies
PDF
リクルートはいかにして、ディープラーニング(深層学習)の導入を成功させたか
by
Recruit Technologies
PDF
[Developers Summit 2015 講演資料] リクルートテクノロジーズ 14,000件/秒の配信を実現した リクルートのモバイルアプリを支え...
by
Recruit Technologies
PDF
JJUG CCC リクルートの Java に対する取り組み
by
Recruit Technologies
PDF
リクルートにおける画像解析事例紹介
by
Recruit Technologies
リクルート式ビッグデータ活用術
by
Recruit Technologies
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
by
Recruit Technologies
リクルートにおける画像解析事例紹介と周辺技術紹介
by
Recruit Technologies
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~
by
Recruit Technologies
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
by
Recruit Technologies
リクルート式AIの活用法
by
Recruit Technologies
ビッグデータ処理データベースの全体像と使い分け
by
Recruit Technologies
Spring “BigData”
by
Recruit Technologies
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
by
Recruit Technologies
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
by
Amazon Web Services Japan
リクルート式 自然言語処理技術の適応事例紹介
by
Recruit Technologies
WebDB Forum 2013
by
Recruit Technologies
R-tech BDGにおける自然言語処理活動
by
Recruit Technologies
リクルートにおけるPaaS活用事例
by
Recruit Technologies
Struggle against cross-domain data complexity in Recruit group
by
Recruit Technologies
3万人が利用するリクルートのワイヤレス環境 ~リアクティブからプロアクティブへ~
by
Recruit Technologies
リクルートはいかにして、ディープラーニング(深層学習)の導入を成功させたか
by
Recruit Technologies
[Developers Summit 2015 講演資料] リクルートテクノロジーズ 14,000件/秒の配信を実現した リクルートのモバイルアプリを支え...
by
Recruit Technologies
JJUG CCC リクルートの Java に対する取り組み
by
Recruit Technologies
リクルートにおける画像解析事例紹介
by
Recruit Technologies
Viewers also liked
PPSX
HBaseとSparkでセンサーデータを有効活用 #hbasejp
by
FwardNetwork
PDF
HBase Meetup Tokyo Summer 2015 #hbasejp
by
Cloudera Japan
PDF
まだ間に合う HBaseCon2016
by
removed_07a60427aa828f9c6fab35e89e478798
PPTX
HBaseCon 2015: HBase @ CyberAgent
by
HBaseCon
PPTX
HBase×Impalaで作るアドテク「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer
by
Michio Katano
PPTX
HBaseサポート最前線 #hbase_ca
by
Cloudera Japan
PDF
HBase活用事例 #hbase_ca
by
Cloudera Japan
PDF
HBaseとRedisを使った100億超/日メッセージを処理するLINEのストレージ
by
LINE Corporation
PDF
Mahoutによるアルツハイマー診断支援へ向けた取り組み (Hadoop Confernce Japan 2014)
by
Hadoop / Spark Conference Japan
PDF
Shib: WebUI tool provides crossover of Hive and MPP
by
SATOSHI TAGOMORI
PDF
Hcj2014 myui
by
Makoto Yui
PPTX
HBase スキーマ設計のポイント
by
daisuke-a-matsui
PDF
Osc2012 spring HBase Report
by
Seiichiro Ishida
PDF
FluentdやNorikraを使った データ集約基盤への取り組み紹介
by
Recruit Technologies
PDF
実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...
by
MapR Technologies Japan
PDF
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
by
Cloudera Japan
PPTX
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
by
LINE Corporation
PPTX
トピックモデル勉強会: 第2章 Latent Dirichlet Allocation
by
Haruka Ozaki
PPTX
Hadoopカンファレンス20140707
by
Recruit Technologies
PDF
Facebook Messages & HBase
by
强 王
HBaseとSparkでセンサーデータを有効活用 #hbasejp
by
FwardNetwork
HBase Meetup Tokyo Summer 2015 #hbasejp
by
Cloudera Japan
まだ間に合う HBaseCon2016
by
removed_07a60427aa828f9c6fab35e89e478798
HBaseCon 2015: HBase @ CyberAgent
by
HBaseCon
HBase×Impalaで作るアドテク「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer
by
Michio Katano
HBaseサポート最前線 #hbase_ca
by
Cloudera Japan
HBase活用事例 #hbase_ca
by
Cloudera Japan
HBaseとRedisを使った100億超/日メッセージを処理するLINEのストレージ
by
LINE Corporation
Mahoutによるアルツハイマー診断支援へ向けた取り組み (Hadoop Confernce Japan 2014)
by
Hadoop / Spark Conference Japan
Shib: WebUI tool provides crossover of Hive and MPP
by
SATOSHI TAGOMORI
Hcj2014 myui
by
Makoto Yui
HBase スキーマ設計のポイント
by
daisuke-a-matsui
Osc2012 spring HBase Report
by
Seiichiro Ishida
FluentdやNorikraを使った データ集約基盤への取り組み紹介
by
Recruit Technologies
実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...
by
MapR Technologies Japan
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
by
Cloudera Japan
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
by
LINE Corporation
トピックモデル勉強会: 第2章 Latent Dirichlet Allocation
by
Haruka Ozaki
Hadoopカンファレンス20140707
by
Recruit Technologies
Facebook Messages & HBase
by
强 王
Similar to 20150625 cloudera
PDF
HBaseCon 2012 参加レポート
by
NTT DATA OSS Professional Services
PDF
HBaseを用いたグラフDB「Hornet」の設計と運用
by
Toshihiro Suzuki
PDF
変わる!? リクルートグループのデータ解析基盤
by
Recruit Technologies
PDF
刊行記念セミナー「HBase徹底入門」
by
cyberagent
PDF
Facebookのリアルタイム Big Data 処理
by
maruyama097
PDF
Apache Torqueについて
by
tako pons
PPT
Hadoop~Yahoo!Japanの活用について
by
kaminashi
PDF
なぜApache HBaseを選ぶのか? #cwt2013
by
Cloudera Japan
PPSX
実動するIot&hadoopから学ぶ会_資料
by
FwardNetwork
PPT
Hadoop ~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
PPT
Hadoop~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
PPTX
Struggle against crossdomain data complexity in Recruit Group
by
DataWorks Summit/Hadoop Summit
PDF
サイバージェント 秋葉原ラボのHBase 活用事例
by
cyberagent
PPTX
巨大なサービスと膨大なデータを支えるプラットフォーム
by
Tetsutaro Watanabe
PPTX
ビッグデータ&データマネジメント展
by
Recruit Technologies
PDF
第25回 Hadoopソースコードリーディング 「HBase 最新情報」
by
Toshihiro Suzuki
PDF
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)
by
NTT DATA OSS Professional Services
KEY
MapReduceからの
by
Shotaro Tsubouchi
HBaseCon 2012 参加レポート
by
NTT DATA OSS Professional Services
HBaseを用いたグラフDB「Hornet」の設計と運用
by
Toshihiro Suzuki
変わる!? リクルートグループのデータ解析基盤
by
Recruit Technologies
刊行記念セミナー「HBase徹底入門」
by
cyberagent
Facebookのリアルタイム Big Data 処理
by
maruyama097
Apache Torqueについて
by
tako pons
Hadoop~Yahoo!Japanの活用について
by
kaminashi
なぜApache HBaseを選ぶのか? #cwt2013
by
Cloudera Japan
実動するIot&hadoopから学ぶ会_資料
by
FwardNetwork
Hadoop ~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
Hadoop~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
Struggle against crossdomain data complexity in Recruit Group
by
DataWorks Summit/Hadoop Summit
サイバージェント 秋葉原ラボのHBase 活用事例
by
cyberagent
巨大なサービスと膨大なデータを支えるプラットフォーム
by
Tetsutaro Watanabe
ビッグデータ&データマネジメント展
by
Recruit Technologies
第25回 Hadoopソースコードリーディング 「HBase 最新情報」
by
Toshihiro Suzuki
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)
by
NTT DATA OSS Professional Services
MapReduceからの
by
Shotaro Tsubouchi
More from Recruit Technologies
PDF
新卒2年目が鍛えられたコードレビュー道場
by
Recruit Technologies
PDF
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
by
Recruit Technologies
PDF
Rancherを活用した開発事例の紹介 ~Rancherのメリットと辛いところ~
by
Recruit Technologies
PDF
Tableau活用4年の軌跡
by
Recruit Technologies
PDF
HadoopをBQにマイグレしようとしてる話
by
Recruit Technologies
PDF
LT(自由)
by
Recruit Technologies
PDF
リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所
by
Recruit Technologies
PDF
Company Recommendation for New Graduates via Implicit Feedback Multiple Matri...
by
Recruit Technologies
PDF
銀行ロビーアシスタント
by
Recruit Technologies
PDF
ユーザー企業内製CSIRTにおける対応のポイント
by
Recruit Technologies
PDF
ユーザーからみたre:Inventのこれまでと今後
by
Recruit Technologies
PDF
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
by
Recruit Technologies
PDF
EMRでスポットインスタンスの自動入札ツールを作成する
by
Recruit Technologies
PDF
RANCHERを使ったDev(Ops)
by
Recruit Technologies
PDF
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
by
Recruit Technologies
PDF
ユーザー企業内製CSIRTにおける対応のポイント
by
Recruit Technologies
PDF
「リクルートデータセット」 ~公開までの道のりとこれから~
by
Recruit Technologies
PDF
Hadoop’s Impact on Recruit Company
by
Recruit Technologies
PDF
リクルートにおけるデータのインフラ化への取組
by
Recruit Technologies
PDF
DataRobot活用状況@リクルートテクノロジーズ
by
Recruit Technologies
新卒2年目が鍛えられたコードレビュー道場
by
Recruit Technologies
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
by
Recruit Technologies
Rancherを活用した開発事例の紹介 ~Rancherのメリットと辛いところ~
by
Recruit Technologies
Tableau活用4年の軌跡
by
Recruit Technologies
HadoopをBQにマイグレしようとしてる話
by
Recruit Technologies
LT(自由)
by
Recruit Technologies
リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所
by
Recruit Technologies
Company Recommendation for New Graduates via Implicit Feedback Multiple Matri...
by
Recruit Technologies
銀行ロビーアシスタント
by
Recruit Technologies
ユーザー企業内製CSIRTにおける対応のポイント
by
Recruit Technologies
ユーザーからみたre:Inventのこれまでと今後
by
Recruit Technologies
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
by
Recruit Technologies
EMRでスポットインスタンスの自動入札ツールを作成する
by
Recruit Technologies
RANCHERを使ったDev(Ops)
by
Recruit Technologies
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
by
Recruit Technologies
ユーザー企業内製CSIRTにおける対応のポイント
by
Recruit Technologies
「リクルートデータセット」 ~公開までの道のりとこれから~
by
Recruit Technologies
Hadoop’s Impact on Recruit Company
by
Recruit Technologies
リクルートにおけるデータのインフラ化への取組
by
Recruit Technologies
DataRobot活用状況@リクルートテクノロジーズ
by
Recruit Technologies
20150625 cloudera
1.
リクルート式HBaseの使い方 株式会社リクルートテクノロジーズ ITソリューション統括部 ビッグデータ2グループ 池田 裕一
2.
2Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. 趣味etc 学歴 略歴 所属 氏名 自己紹介 RTC ITソリューション統括部 ビッグデータ2G 池田 裕一 東京大学大学院工学系研究科 精密機械工学専攻 社会人5年目。 某大手メーカー系SIerで3年間、Java・C++を使った位 置情報サービスの開発やAndroidアプリの開発に従事。 2014年4月からリクルートテクノロジーズ入社。 レコメンド施策開発のディレクション、自然言語処理やグラ フ解析の技術開発に従事。 テニス ゴルフ 旅行 カメラ
3.
3Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. 本日覚えて帰って頂きたい事 HBaseを使った リアルタイムレコメンドの実装方法
4.
4Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. 1 2 最近のデータ活用状況紹介 3 4 5 6 HBaseの活用事例 HBaseを使ったユーザー行動ログ収集 HBaseを使ったリアルタイムレコメンド その他の工夫点 HBaseの導入効果 アジェンダ 7 まとめと今後の展望
5.
5Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. 最近のデータ活用状況紹介
6.
6Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. Server Database 数値で見るデータ解析環境 エコシステム 本番98台/開発24台 1 PB
7.
7Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. 数値で見るHadoopの使われ方 28,344 1038万 1日あたりの全JOBの数 1日あたりの全Hbaseクエリの数
8.
8Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. 数値で見るデータ解析案件状況 約200 データ解析案件数(年間) ビッグデータ部の案件従事人数 240
9.
9Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBaseの活用事例
10.
10Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBase導入の背景 Hadoop レコメンド生成 バッチ ユーザー 行動ログ 集計バッチユーザー情報 行動ログ ユーザー毎の レコメンド ユーザー毎のパーソナライズレコメンドを日次で実施(主にHive)
11.
11Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. Hiveで解決できないサービス課題 レコメンド更新の リードタイム コールドスタート問題
12.
12Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBase導入の目的 ユーザーがサイト上で アクションしたタイミングで おすすめが変化する ユーザー毎に おすすめのアイテムを スコアが高い順で 一覧表示する 期待される効果 1. 登録直後のユーザー離脱を防ぐ 2. ユーザーアクションを活性化する 3. 応募数の増加
13.
13Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBaseを活用して実現した2つの機能 書き込み API ユーザー行動ログ収集 参照 API リアルタイムレコメンド
14.
14Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBaseを使った ユーザー行動ログ収集
15.
15Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. ユーザ行動ログ収集機能のシステム構成 Web HBase ユーザ行動ログの書 き込みAPI Hadoop 行動ログ 集計バッチ 検索API APIリクエスト 検索行動 ユーザー データ書き込み エキスポート
16.
16Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBase ユーザ行動ログ収集機能の内部処理 APIリクエスト tomcat ユーザー行動ログの書 き込みAPI 書き込み専用 ログテーブル 参照兼用書き込み ログテーブル
17.
17Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBase ユーザ行動ログ収集機能の内部処理 APIリクエスト tomcat ユーザー行動ログの書 き込みAPI 書き込み専用 ログテーブル 参照兼用書き込み ログテーブル バッチでの 分析に使用 全てのユーザーのサイト 上での全てのアクション を格納 key value Hash化した 文字列 文字列
18.
18Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBase ユーザ行動ログ収集機能の内部処理 APIリクエスト tomcat ユーザー行動ログの書 き込みAPI 書き込み専用 ログテーブル 参照兼用書き込み ログテーブル リアルタイムの レコメンドに使用 全てのユーザーの、直近 の特定アクションを格納 key CF1 CF2 アクションCD アクションCD ユーザーID アイテムCD アイテムCD
19.
19Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. ユーザ行動ログ収集機能のポイント 1. サイト上でのユーザー行動をHBaseのテーブルに入れる 2. 書き込み専用テーブルは、Hash化した文字列をkeyとして、書 き込みスピードを担保 3. 参照兼用の書き込みテーブルは、シーケンシャルな文字列をkey として、参照スピードを担保 4. カラムのバージョンを設定する事で、直近の行動ログをテーブル に格納する 5. 書き込み専用テーブルのデータはHiveテーブルにエキスポートし、 ユーザ行動分析を別途行うためのインプットとして使用する
20.
20Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBaseを使った リアルタイムレコメンド
21.
21Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. リアルタイムレコメンド機能のシステム構成 ユーザー Web HBase レコメンドテーブルの 参照API Hadoop 行動ログ 集計バッチ 検索API APIリクエスト 検索行動 レコメンド取得 レコメンド バルクロード テーブル参照
22.
22Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. リアルタイムレコメンド機能の内部処理 HBase APIリクエスト tomcat レコメンドテーブル の参照API ユーザ情報テーブル レコメンドテーブル (属性ベース) レコメンドテーブル (アイテムベース) 参照兼用書き込み ログテーブル
23.
23Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. リアルタイムレコメンド機能の内部処理 HBase APIリクエスト tomcat レコメンドテーブル の参照API ユーザ情報テーブル レコメンドテーブル (属性ベース) レコメンドテーブル (アイテムベース) 参照兼用書き込み ログテーブル ユーザーIDとレコメンドCD をリクエスト
24.
24Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. リアルタイムレコメンド機能の内部処理 HBase APIリクエスト tomcat レコメンドテーブル の参照API ユーザ情報テーブル レコメンドテーブル (属性ベース) レコメンドテーブル (アイテムベース) 参照兼用書き込み ログテーブル ユーザーIDをkeyにして、 ユーザーが直近で閲覧した アイテムを返却 key CF1 CF2 アクションCD アクションCD ユーザーID アイテムCD アイテムCD
25.
25Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. リアルタイムレコメンド機能の内部処理 HBase APIリクエスト tomcat レコメンドテーブル の参照API ユーザ情報テーブル レコメンドテーブル (属性ベース) レコメンドテーブル (アイテムベース) 参照兼用書き込み ログテーブル アイテムをkeyにして 類似するアイテムを返却 key value アイテムCD レコメンドリスト
26.
26Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. リアルタイムレコメンド機能の内部処理 HBase APIリクエスト tomcat レコメンドテーブル の参照API ユーザ情報テーブル レコメンドテーブル (属性ベース) レコメンドテーブル (アイテムベース) 参照兼用書き込み ログテーブル スコアの高いアイテムから順 に返却
27.
27Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. リアルタイムレコメンド機能の内部処理 HBase APIリクエスト tomcat レコメンドテーブル の参照API ユーザ情報テーブル レコメンドテーブル (属性ベース) レコメンドテーブル (アイテムベース) 参照兼用書き込み ログテーブル ユーザーIDをkeyにして ユーザーの属性情報を返却 key value ユーザーCD 属性CDリスト
28.
28Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. リアルタイムレコメンド機能の内部処理 HBase APIリクエスト tomcat レコメンドテーブル の参照API ユーザ情報テーブル レコメンドテーブル (属性ベース) レコメンドテーブル (アイテムベース) 参照兼用書き込み ログテーブル 属性情報keyにして、属性に 適したアイテムを返却 key value 属性CD レコメンドリスト
29.
29Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. リアルタイムレコメンド機能の内部処理 HBase APIリクエスト tomcat レコメンドテーブル の参照API ユーザ情報テーブル レコメンドテーブル (属性ベース) レコメンドテーブル (アイテムベース) 参照兼用書き込み ログテーブルスコアの高いアイテムから順に 返却
30.
30Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. リアルタイムレコメンド機能のポイント 1. ユーザのアクションに即座に対応してレコメンドできる 1. アクションが無いユーザに対しては、ユーザの属性に適したレコメ ンドができる 2. ユーザ登録直後から全てのユーザに対してレコメンドできる 3. APIのインターフェースを汎用に作ることで、新規のレコメンド テーブルにも対応できる
31.
31Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. その他の工夫点
32.
32Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. その他の工夫点 その1 〜バルクロード • 1レコードずつPUTする • 高負荷状態が長時間続く • データの参照は可能 • テーブルごと更新する • データ参照が出来ない時 間帯がある 負荷低減とテーブルアクセスの担保を両立したい importTSV CompleteBulkload
33.
33Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. その他の工夫点 その1 〜バルクロード ZooKeeperでテーブル参照とテーブル更新を管理 ZooKeeper CompleteBulkload
34.
34Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBase その他の工夫点 その1 〜バルクロード tomcat レコメンドテーブル の参照API ZooKeeper レコメンド テーブル レコメンド テーブル Hadoop データ更新処理
35.
35Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBase その他の工夫点 その1 〜バルクロード tomcat レコメンドテーブル の参照API ZooKeeper レコメンド テーブル レコメンド テーブル Hadoop データ更新処理 参照 更新
36.
36Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBase その他の工夫点 その1 〜バルクロード tomcat レコメンドテーブル の参照API ZooKeeper レコメンド テーブル レコメンド テーブル Hadoop データ更新処理 参照 更新
37.
37Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. その他の工夫点 その2 〜モニタリング
38.
38Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. その他の工夫点 その3 〜レコメンドロジック アイテムの類似度計算にword2vecを活用 各単語を表現するベクトルを学習 単語から文書中でその単語の前後に現れる単語を予測できるような表現を学習 単語を表す1-of-k表現のベクトルを入力とし、その単語の前後にある単語の出現確率を 出力とするニューラルネットを学習させ、その中間層の値を単語を表現するベクトルとして用い る w(t) w(t-1) w(t+1) w(t+2) w(t-2) INPUT PROJECTION OUTPUT 目的関数 log 𝑝(𝑤 𝑡 + 𝑖 |𝑤 𝑡 )𝑖,−𝐶≤𝑖≤𝐶,𝑖≠0𝑡 INPUT: 単語の1-of-k表現 PROJECTION: 単語 線形変換 階層的 soft-max OUTPUT: 前後の単語の出現確率 𝑝(𝑤(𝑡+𝑖)|𝑤(𝑡))
39.
39Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. リアルタイムレコメンド機能の内部処理 HBase APIリクエスト tomcat レコメンドテーブル の参照API ユーザ情報テーブル レコメンドテーブル (属性ベース) レコメンドテーブル (アイテムベース) 参照兼用書き込み ログテーブル
40.
40Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. サービスA CVRが 156% 改善 3.57% ⇒ 9.15% サービスB CVRが 31% 改善 46.59%⇒ 61.13% その他の工夫点 その3 〜レコメンドロジック
41.
41Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBaseの導入効果
42.
42Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. HBaseを導入した効果 約2.7%改善ユーザー離脱率 約16.7%改善 ユーザー1人当たりの アイテム閲覧回数 約30.8%改善ユーザー1人当たりのCVR
43.
43Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. まとめと今後の展望
44.
44Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. まとめ • HBaseをユーザーのログ収集に活用している • HBaseを使って、ユーザーのアクションに即座に対応したレコメ ンドを実現している • テーブル更新(バルクロード)はZooKeeperを使って、参照 用と更新用のテーブルの管理を行っている • レコメンドの効果測定モニタリングを行っている • リアルタイムレコメンドによってユーザーのアクション活性化に効 果を発揮している
45.
45Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. 今後の展望 リアルタイムレコメ ンドの実装 リアルタイムでの ユーザー志向分析 グラフ分析及び グラフDBの導入 A B C D E w(t) w(t+1) w(t+5) ・ ・ ・ w(t-1) w(t-5) ・ ・ ・
46.
46Copyright © Recruit
Technologies Co., Ltd. All Rights Reserved. ビジネスを踏まえて 泥臭くかつアグレッシブに 分析・エンジニアリングが できる方。 ご連絡ください。 戦友をさがしています。 Yes, We Are Hiring! 池田 裕一
47.
ご清聴ありがとうございました
Download