More Related Content
Similar to Retty recommendation project (20)
Retty recommendation project
- 1. 2018.11.17 日本OR学会 研究部会 最適化とその応用(OPTA)
ソーシャルグルメサービス Retty における
レコメンデーションの取り組み
岩永二郎
Retty株式会社
iwanaga@retty.me
- 5. 自己紹介
■ 岩永二郎
■ Data Scientist / Rettyうなぎ担当
■ 経歴
2008年3月卒 早稲田大学大学院理工学研究科数理科学専攻修士課程修了
2008年4月-2016年8月 株式社数理システム(現NTTデータ数理システム)
2016年9月-現在 Retty株式会社
2017年4月-現在 早稲田大学データサイエンス研究所招聘研究員
2018年10月-現在 上智大学非常勤講師
#データサイエンティスト #プログラマー #コンサルタント
#数理最適化 #機械学習 #自然言語処理 #統計学 #画像解析
#Python #R #SQL
#Tableau
5
- 28. Phase1-3:レコメンドの配信・表示ロジック
■ レコメンドの鮮度
✓ サイトの鮮度が落ちないようにランダム性を取り入れる
✓ キャッシュ1日 / レコメンドテーブル入れ替え XX 週間
■ A/Bテストの実施
✓ レコメンドロジックの精度検証を行う
ランダムレコメンド
エリア全店舗
お店ページ お店ページ お店ページ お店ページ
類似店舗レコメンド
レコメンド候補店舗
人気店レコメンド
レコメンド候補店舗
協調フィルタリング
レコメンド
レコメンド候補店舗
レコメンドロジックのランダム選択
ランダム抽出 ランダム抽出 ランダム抽出 ランダム抽出
お店ページ
ランダム並び替え ランダム並び替え ランダム並び替え ランダム並び替え
1
4
20C10通り
10!通り
確率
28
- 31. Phase1-5:人気店レコメンド
■ Retty 店舗 Rating データの仕様
3段階:
■ 次の仮定をおき、ユーザーごとに選好順序を定義する
✓ GoodよりもExcellentの店舗がオススメ
✓ AverageよりもGoodの店舗がオススメ
■ 選好順序グラフのPageRankを人気スコアと定義
投稿データ
STEP1
投稿データの取得
STEP2
選好順序の定義
STEP3
選好グラフの構築
投稿データ
対象ユーザ
選好グラフ
STEP4
PageRank算出
PageRank
0.12
0.03
0.01
0.11
0.02
31
- 33. ■ 手法:Item to Item Collabolative Filtering
■ Ratingデータ
■ 店舗間類似度の計算
Phase1-6:協調フィルタリングレコメンド
【Technical Note】
次のアルゴリズムを利用した
レコメンドロジックも実装
✔ Non-Negative Matrix Factorization
✔ word2vec
⇒ Serendipityが強すぎてユーザーの納得性
に欠けるため不採用
33
- 38. ■ 情報設計とは
■ アイテムレコメンドにおけるポイント
■ 情報設計におけるトレードオフの問題
Phase2-1:レコメンドの情報設計
38
知識やデータの組織化をするための表現技術
✔ 情報をわかりやすく伝える
✔ 受け手が情報を探しやすくする
情報設計
ユーザーにアイテムを魅力的に感じてもらい、
アイテムを閲覧してもらう
アイテム閲覧への
動機づけ
ユーザーがアイテムを閲覧した後に
期待がはずれてストレスに感じるのを避ける
期待はずれによる
ストレス
情報が多いほど
価値がある
情報過多であると
ユーザー体験を損ねる
- 44. 【参考】バンディットアルゴリズム-配信最適化-①
■ 技術概要
✓ バンディット問題の設定
− 時系列の要素をもつ
− 各時点で選択肢(アーム)が与えられる
− 各時点で選択をすると報酬が得られる
− 各時点での選択はそれ以前の選択と報酬を考慮して
選ぶことができる
✓ バンディット問題の目的
限られた試行回数で累積報酬を最大化する
✓ バンディット問題の特徴
各時点で探索(どのアームが良いか探る)か活用(良いアーム
を選択して高い報酬を狙う)を行う
✓ レコメンドの文脈におけるバンディットアルゴリズム
− 時点tまでの結果から時点t+1の配信アイテムを決定する
− 配信アイテムは常に確率的であり、その配信比率を決定する
- 45. 【参考】バンディットアルゴリズム-配信最適化-②
■ 適用例
✓ 複数のロジックの配信割合を最適化する
✓ 出力例:(ロジックA, ロジックB, ロジックC)=(0.7, 0.2, 0.1)
■ ソフトマックス法
■ 例
4つのロジックのCTRが (0.03, 0.023, 0.017, 0.015)の場合、
τ = 0.01とすると配信割合 = (0.51, 0.25, 0.14, 0.10)が求まる
- 47. まとめ
Phase 2
デザイン
ブラッシュアップ
Phase 1
レコメンドロジック
実装
Phase 3
配信最適化
✔ 類似店舗レコメンド
✔ 人気店レコメンド
✔ 協調フィルタリング
レコメンド
✔ 情報設計
✔ フォーマット改善
✔ バンディット
アルゴリズム
✔ Elastic Netによる
CTR予測
CTR202%改善 CTR219%改善 月間回遊数XXX万達成
✔ サービスをグロースさせるための適切な順序を踏む
✔ 各Phaseで知見が残るように実験と検証を設計
✔ 成果は定量的に測定
47
- 54. 参考文献
■ Iwanaga,J.,Nishimura, N., Sukegawa, N., &Takano. Y :“Estimating
product-choice probabilities from recency and frequency of page views”
,Knowledge-Based Systems,99,pp.157-167(2016)
■ 岩永二郎, 鍋谷昴一, 梶原悠,&五十嵐健太 :“関心度と忘却度に基づくレコメンド手
法: 単調性制約付きレコメンドモデルの構築(特集 データ解析コンペティション: インフォ
ミディアリ・データの分析)”,オペレーションズ・リサーチ: 経営の科学,Vol.59,No.2,
pp.72-80(2014)
■ 西村直樹, 鮭川矩義, 高野祐一, 岩永二郎, &水野眞治:“EC サイトの商品特性を
考慮した 2 次元確率表による購買予測(< 特集> データ解析コンペティション: 20 周
年)”,オペレーションズ・リサーチ: 経営の科学,Vol.60,No.2, pp.69-74(2015)
■ Nishimura,N.,Sukegawa,N.,Takano,Y.,&Iwanaga,J.:“A latent-class model
for estimating product-choice probabilities from clickstream data”,Information
Sciences,429, pp.406-420(2018)
- 61. ■ 実験環境
MacBook Pro (Retina, 13-inch, Early 2015)
CPU:2.9 GHz Intel Core i5
メモリ:16 GB 1867 MHz DDR3
■ ソルバー:CBC
■ 実験結果サマリ
数値実験
店舗A
店舗B
店舗C
店舗D
店舗E
61
- 63. ■ Retty テックトークで定性評価
✓ 定性評価で知見を集める
✓ モデルが未知の状態で
定量評価にこだわらない
■ 実験結果の共有(オンライン)
✓ 全員参加型の検証環境を準備
✓ 議論を活性化させる
■ 検証アンケートの実施(オンライン)
✓ 議論の場で自由にフィードバック
■ 今後の課題
✓ サービスへの接続
評価
63