チームラボにおけるレコメンデーション精度改善の取り組みについて(WebDBForum 2017)

Kidai Hayashi
Kidai Hayashiチームラボ
チームラボ 株式会社
teamLab Inc.
TEL: 03-5804-2356
MAIL: info@team-lab.com
URL: http://www.team-lab.com/
チームラボにおけるレコメンデーション精度改善の
取り組みについて
2017/09/20
WebDB Forum 2017
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
自己紹介
2
林 輝大(はやし きだい)
職種:エンジニア
仕事:主にレコメンドパッケージの導入やサイト分析
経歴:長野高専専攻科
   →チームラボ2012年新卒で入社
研究:自然言語処理
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
チームラボとは?
3
ウルトラテクノロジスト集団(社員500名弱)
プログラマ(アプリケーションプログラマ、ユーザーインター フェイスエンジニア、 DBエンジニア、ネットワーク
エンジニア)、ロボットエンジニア、数学者、建築家、 Webデザイナー、グラフィックデザイナー、 CGアニメー
ター、編集者
様々なスペシャリストが一つの空間に集まり、密にコミュニケーションを取って、思想
と価値を共有させながらものづくりを行う
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
チームラボとは?
4
Engineers
(70%)
WEBエンジニア
WEBプロダクトエンジニア
WEBフロントエンドエンジニア
スマートフォンエンジニア
インタラクティブエンジニア
データサイエンティスト
空間演出エンジニア
機械学習エンジニア
others
(5%)
ブランディングチーム
バックオフィス
など
Catalysts
(15%)
プランニング
ディレクション
プロジェクト管理
などを行うチーム
Designers
(10%)
Webデザイナー
グラフィックデザイナー
CGアニメーター
絵師
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
チームラボの仕事内容
5
Web
スマホアプリ
データ分析
実空間
ソリューション
アート
その他
仕事のほとんどが、
Webサイトやスマホアプリ
などの保守・開発です。
露出の多いアートや実空間
ソリューションのお仕事は
3割ほどです。
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
将来の分析に備えてWebサイト内データを収集するための基盤があります。
基盤などを利用した分析結果を元に、お取引先様と一緒にPDCAサイクルを
回します。
また後述のレコメンデーションを基軸としたサイト改善も行っております。
Webサイトの分析
6
課題確認
分析軸決定
ユーザ履歴抽出
目視確認
仮説をたてる
ユーザ行動
パターン分類
パターン毎に
施策提案
パターン毎に
実施検証
効果がみられない場合、再度検討
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
事例
離脱防止としてのレコメンド
オーガニック検索からの直流入を逃さないために商材への導線を増やす
販売促進としてのレコメンド
購買意欲が高まっている購買完了画面で、次に購入するための近道として
色んな商材への導線を増やす
特集・バナー・メール配信のパーソナライズ化
ユーザーの行動から好みそうなコンテンツを推測・提供をすることで、
通常の施策以上の効果を見込む
7
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
チームラボレコメンデーション
チームラボレコメンデーションというパッケージがあります。
導入先のECサイトやアプリなどで、取り扱っている商材や記事などを
オススメする機能を提供しております。
協調フィルタリングを元にした独自のアルゴリズムを利用しております。
20社以上に導入頂いております。
導入事例:
● アパレルECサイト
(月間3,000万超PV、商品点数30万点以上)
● 求人サイト
(月間1,000万超PV、案件数15万件以上)
● etc …
8
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
チームラボレコメンデーションの特徴
9
リアルタイムにレコメンド結果が変化
(数百万規模の商品でも可能)
細かなチューニングが可能
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
レコメンドのチューニング
レコメンドに関するパラメータを調整することで精度向上を目指す
パラメータは大きく分けて2つ
10
デザインに関連するもの
見た目が変わるので、
クリックに大きな影響を与えます。
● 表示件数
例:10件 or 20件
● 表示要素
例:値段を出す or 出さない
● 表示デザイン
例:カルーセル or もっとみる
ロジックに関連するもの
レコメンドの内容が変化するため、
クリック後の行動に影響します。
● 商品属性での絞り込み
例:1,000円以上の商品に限定
● 計算に使用するログの量と
種類を増やす
● パーソナライズレコメンドに
利用するログの件数を変える
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
レコメンドの問題点
ある程度は精度をあげることができるが、
アルゴリズムが持つ根本的な原因を回避しきれるわけではない。
問題点(ログベースの推薦アルゴリズム特有)
・ログの少ない商品からのオススメが微妙(新作商品など)
・人気な商品を閲覧することでオススメ内容がガラリと変わる
レコメンドのアルゴリズムを修正することで根本的な問題の解決を図る
11
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
問題点の改善のために
新エンジンの開発、実験を日々行っております。
現在の取り組み
ログの少ない商品のオススメ精度向上するための手法を検討中です。
今回はDNNを用いた実験をご紹介します。
12
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
実験に用いた手法
● Wangらが2015年に提案した Collaborative Deep Learning (CDL) を利用
○ H. Wang, N. Wang and D.-Y. Yeung, In Proceedings of KDD’15, 2015
● 協調フィルタリングの実現方法の一つである Matrix Factorization に
Neural Network を組み合わせ、アイテムの情報を潜在変数に導入した
モデル
13
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
予備知識:Matrix Factorization
Matrix Factorization (行列因子分解) は以下のようにユーザ毎、アイテム毎の
潜在変数の内積が評価値となるというモデルを元に潜在変数を計算する手法
である
14
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
手法の選出理由
● アイテムの特徴として画像や説明文が利用できる。
(ログ不足でのレコメンド精度の解消に期待が持てそう)
15
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
画像などの高次元データに対応
● 中間層から潜在変数の間に1層の線形変換を導入
● Convolution Layer を導入
Wangらの手法との相違点 1/2
16
Wangらの手法では入力データは文章の
Bag-of-Wordsであり、画像と比較すると
次元が低い。
そのため、Wangらのモデルでは
Autoencoderの中間層の次元が潜在変
数の次元に束縛されており、画像などの
高次元データを入力した場合に
Autoencoderの学習がうまく進まない現
象が発生した。
FC
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
Wangらの手法との相違点 2/2
Implicit Feedback※ を導入
● 出力行列Rを{0, 1}要素の行列とする
● ユーザ i がアイテム j を複数個・複数回購入したとき Rij
=1 という情報に
大きい重みを付与して潜在変数の更新を行う手法
※ Y.F. Hu, Y. Koren, and C. Volinsky, “Collaborative Filtering for Implicit Feedback Datasets,” Proc. IEEE Int’l Conf. Data Mining
(ICDM 08), IEEE CS Press, 2008, pp. 263-272.
17
レーティング:
★★☆☆☆
購買したか
Yes(1) / No(0)
1回購買した 10回購買した
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
データセット
● 大手アパレルサイトの2017年7月分の購買データを使用
(ユーザ数:15万、アイテム数:7万、レコード数:33万件)
● アイテムの情報として商品画像を利用
● 各ユーザごとに購入したアイテムのうち2割をランダムに隠して
テストデータとした
評価
● Mean Average Precision@10 (MAP@10) で評価 (次頁)
上記を元に、既存のシステムと比較実験を行った
比較実験
18
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
Mean Average Precision@10 (MAP@10) の定義
評価指標
19
テストセットにおけるユーザ u についての購買アイテム数
k 番目にレコメンドされたアイテムが Positive なら1となる関数
k 番目までのレコメンドされた中での Precision
ユーザ u に対してレコメンドされたアイテム個数
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
Result (64x64)
20
学習データに含まれる
商品の結果上位
学習データに含まれ
ていない商品の
結果上位
ユーザーの
購買データ
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
Result
naive MFのが一番精度が出る結果となった
21
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
● CDL > 既存レコメ
○ リアルタイム性は失われるものの、精度の改善が期待できる
● MF > CDL
○ 論文とは異なる結果になった
○ 画像データを入力としているため、うまく適用できていない可能性
○ 説明文での実験、ネットワークの見直し、ログがない商品だけでの評価
それぞれの手法の長所で補い合うようなエンジンの開発に取り組んでいきたい
その他の懸念事項
● コスト面での不安
○ 学習頻度を検討することによって改善の可能性
○ 例:DNN部分は月一回の更新、 MF部分は毎日更新
● データ量での不安
○ ユーザー数、アイテム数、ログの数 に線形で計算量が増加
○ 例:33万件→3000万件 線形(100倍時間かかる)
考察と課題
22
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
● チームラボの仕事のほとんどはWeb関連
● チームラボレコメンデーションを基軸としたサイト改善を行っている
● チームラボレコメンデーションは協調フィルタリングをベースとした
システムで、ログベースのレコメンドの問題点を含んでいる
● CDLで既存レコメンドの精度を上回ったが、画像の特徴を活かせていない
● それぞれの手法の長所で補い合うようなエンジンの開発に取り組みたい
まとめ
23
We are the future.
Copyright (C) teamLab Inc.All rights reserved.
WebDB Forum 2017 - 2017/09/20
質疑応答
24
1 of 24

Recommended

Codevs5.0勉強会 by
Codevs5.0勉強会Codevs5.0勉強会
Codevs5.0勉強会Kidai Hayashi
3.9K views69 slides
ChatGPT and the Future of Work - Clark Boyd by
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
28.7K views69 slides
Getting into the tech field. what next by
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
6.7K views22 slides
Google's Just Not That Into You: Understanding Core Updates & Search Intent by
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
7K views99 slides
How to have difficult conversations by
How to have difficult conversations How to have difficult conversations
How to have difficult conversations Rajiv Jayarajah, MAppComm, ACC
5.7K views19 slides
Introduction to Data Science by
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data ScienceChristy Abraham Joy
82.6K views51 slides

More Related Content

Recently uploaded

光コラボは契約してはいけない by
光コラボは契約してはいけない光コラボは契約してはいけない
光コラボは契約してはいけないTakuya Matsunaga
30 views17 slides
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」 by
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PC Cluster Consortium
68 views12 slides
定例会スライド_キャチs 公開用.pdf by
定例会スライド_キャチs 公開用.pdf定例会スライド_キャチs 公開用.pdf
定例会スライド_キャチs 公開用.pdfKeio Robotics Association
154 views64 slides
パスキーでリードする: NGINXとKeycloakによる効率的な認証・認可 by
パスキーでリードする: NGINXとKeycloakによる効率的な認証・認可パスキーでリードする: NGINXとKeycloakによる効率的な認証・認可
パスキーでリードする: NGINXとKeycloakによる効率的な認証・認可Hitachi, Ltd. OSS Solution Center.
13 views22 slides
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向 by
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向Hitachi, Ltd. OSS Solution Center.
110 views26 slides

Recently uploaded(7)

光コラボは契約してはいけない by Takuya Matsunaga
光コラボは契約してはいけない光コラボは契約してはいけない
光コラボは契約してはいけない
Takuya Matsunaga30 views
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」 by PC Cluster Consortium
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」 by PC Cluster Consortium
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」

Featured

Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright... by
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
12.8K views21 slides
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present... by
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
55.5K views138 slides
12 Ways to Increase Your Influence at Work by
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
401.7K views64 slides
ChatGPT webinar slides by
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slidesAlireza Esmikhani
30.5K views36 slides
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G... by
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...DevGAMM Conference
3.6K views12 slides

Featured(20)

Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright... by RachelPearson36
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson3612.8K views
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present... by Applitools
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools55.5K views
12 Ways to Increase Your Influence at Work by GetSmarter
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
GetSmarter401.7K views
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G... by DevGAMM Conference
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
DevGAMM Conference3.6K views
Barbie - Brand Strategy Presentation by Erica Santiago
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
Erica Santiago25.1K views
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well by Saba Software
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Saba Software25.3K views
Introduction to C Programming Language by Simplilearn
Introduction to C Programming LanguageIntroduction to C Programming Language
Introduction to C Programming Language
Simplilearn8.5K views
The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr... by Palo Alto Software
The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr...The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr...
The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr...
Palo Alto Software88.4K views
9 Tips for a Work-free Vacation by Weekdone.com
9 Tips for a Work-free Vacation9 Tips for a Work-free Vacation
9 Tips for a Work-free Vacation
Weekdone.com7.2K views
How to Map Your Future by SlideShop.com
How to Map Your FutureHow to Map Your Future
How to Map Your Future
SlideShop.com275.1K views
Beyond Pride: Making Digital Marketing & SEO Authentically LGBTQ+ Inclusive -... by AccuraCast
Beyond Pride: Making Digital Marketing & SEO Authentically LGBTQ+ Inclusive -...Beyond Pride: Making Digital Marketing & SEO Authentically LGBTQ+ Inclusive -...
Beyond Pride: Making Digital Marketing & SEO Authentically LGBTQ+ Inclusive -...
AccuraCast3.4K views
Exploring ChatGPT for Effective Teaching and Learning.pptx by Stan Skrabut, Ed.D.
Exploring ChatGPT for Effective Teaching and Learning.pptxExploring ChatGPT for Effective Teaching and Learning.pptx
Exploring ChatGPT for Effective Teaching and Learning.pptx
Stan Skrabut, Ed.D.57.7K views
How to train your robot (with Deep Reinforcement Learning) by Lucas García, PhD
How to train your robot (with Deep Reinforcement Learning)How to train your robot (with Deep Reinforcement Learning)
How to train your robot (with Deep Reinforcement Learning)
Lucas García, PhD42.5K views
4 Strategies to Renew Your Career Passion by Daniel Goleman
4 Strategies to Renew Your Career Passion4 Strategies to Renew Your Career Passion
4 Strategies to Renew Your Career Passion
Daniel Goleman122K views
The Student's Guide to LinkedIn by LinkedIn
The Student's Guide to LinkedInThe Student's Guide to LinkedIn
The Student's Guide to LinkedIn
LinkedIn88.1K views
Different Roles in Machine Learning Career by Intellipaat
Different Roles in Machine Learning CareerDifferent Roles in Machine Learning Career
Different Roles in Machine Learning Career
Intellipaat12.4K views

チームラボにおけるレコメンデーション精度改善の取り組みについて(WebDBForum 2017)

  • 1. チームラボ 株式会社 teamLab Inc. TEL: 03-5804-2356 MAIL: info@team-lab.com URL: http://www.team-lab.com/ チームラボにおけるレコメンデーション精度改善の 取り組みについて 2017/09/20 WebDB Forum 2017
  • 2. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 自己紹介 2 林 輝大(はやし きだい) 職種:エンジニア 仕事:主にレコメンドパッケージの導入やサイト分析 経歴:長野高専専攻科    →チームラボ2012年新卒で入社 研究:自然言語処理
  • 3. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 チームラボとは? 3 ウルトラテクノロジスト集団(社員500名弱) プログラマ(アプリケーションプログラマ、ユーザーインター フェイスエンジニア、 DBエンジニア、ネットワーク エンジニア)、ロボットエンジニア、数学者、建築家、 Webデザイナー、グラフィックデザイナー、 CGアニメー ター、編集者 様々なスペシャリストが一つの空間に集まり、密にコミュニケーションを取って、思想 と価値を共有させながらものづくりを行う
  • 4. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 チームラボとは? 4 Engineers (70%) WEBエンジニア WEBプロダクトエンジニア WEBフロントエンドエンジニア スマートフォンエンジニア インタラクティブエンジニア データサイエンティスト 空間演出エンジニア 機械学習エンジニア others (5%) ブランディングチーム バックオフィス など Catalysts (15%) プランニング ディレクション プロジェクト管理 などを行うチーム Designers (10%) Webデザイナー グラフィックデザイナー CGアニメーター 絵師
  • 5. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 チームラボの仕事内容 5 Web スマホアプリ データ分析 実空間 ソリューション アート その他 仕事のほとんどが、 Webサイトやスマホアプリ などの保守・開発です。 露出の多いアートや実空間 ソリューションのお仕事は 3割ほどです。
  • 6. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 将来の分析に備えてWebサイト内データを収集するための基盤があります。 基盤などを利用した分析結果を元に、お取引先様と一緒にPDCAサイクルを 回します。 また後述のレコメンデーションを基軸としたサイト改善も行っております。 Webサイトの分析 6 課題確認 分析軸決定 ユーザ履歴抽出 目視確認 仮説をたてる ユーザ行動 パターン分類 パターン毎に 施策提案 パターン毎に 実施検証 効果がみられない場合、再度検討
  • 7. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 事例 離脱防止としてのレコメンド オーガニック検索からの直流入を逃さないために商材への導線を増やす 販売促進としてのレコメンド 購買意欲が高まっている購買完了画面で、次に購入するための近道として 色んな商材への導線を増やす 特集・バナー・メール配信のパーソナライズ化 ユーザーの行動から好みそうなコンテンツを推測・提供をすることで、 通常の施策以上の効果を見込む 7
  • 8. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 チームラボレコメンデーション チームラボレコメンデーションというパッケージがあります。 導入先のECサイトやアプリなどで、取り扱っている商材や記事などを オススメする機能を提供しております。 協調フィルタリングを元にした独自のアルゴリズムを利用しております。 20社以上に導入頂いております。 導入事例: ● アパレルECサイト (月間3,000万超PV、商品点数30万点以上) ● 求人サイト (月間1,000万超PV、案件数15万件以上) ● etc … 8
  • 9. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 チームラボレコメンデーションの特徴 9 リアルタイムにレコメンド結果が変化 (数百万規模の商品でも可能) 細かなチューニングが可能
  • 10. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 レコメンドのチューニング レコメンドに関するパラメータを調整することで精度向上を目指す パラメータは大きく分けて2つ 10 デザインに関連するもの 見た目が変わるので、 クリックに大きな影響を与えます。 ● 表示件数 例:10件 or 20件 ● 表示要素 例:値段を出す or 出さない ● 表示デザイン 例:カルーセル or もっとみる ロジックに関連するもの レコメンドの内容が変化するため、 クリック後の行動に影響します。 ● 商品属性での絞り込み 例:1,000円以上の商品に限定 ● 計算に使用するログの量と 種類を増やす ● パーソナライズレコメンドに 利用するログの件数を変える
  • 11. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 レコメンドの問題点 ある程度は精度をあげることができるが、 アルゴリズムが持つ根本的な原因を回避しきれるわけではない。 問題点(ログベースの推薦アルゴリズム特有) ・ログの少ない商品からのオススメが微妙(新作商品など) ・人気な商品を閲覧することでオススメ内容がガラリと変わる レコメンドのアルゴリズムを修正することで根本的な問題の解決を図る 11
  • 12. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 問題点の改善のために 新エンジンの開発、実験を日々行っております。 現在の取り組み ログの少ない商品のオススメ精度向上するための手法を検討中です。 今回はDNNを用いた実験をご紹介します。 12
  • 13. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 実験に用いた手法 ● Wangらが2015年に提案した Collaborative Deep Learning (CDL) を利用 ○ H. Wang, N. Wang and D.-Y. Yeung, In Proceedings of KDD’15, 2015 ● 協調フィルタリングの実現方法の一つである Matrix Factorization に Neural Network を組み合わせ、アイテムの情報を潜在変数に導入した モデル 13
  • 14. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 予備知識:Matrix Factorization Matrix Factorization (行列因子分解) は以下のようにユーザ毎、アイテム毎の 潜在変数の内積が評価値となるというモデルを元に潜在変数を計算する手法 である 14
  • 15. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 手法の選出理由 ● アイテムの特徴として画像や説明文が利用できる。 (ログ不足でのレコメンド精度の解消に期待が持てそう) 15
  • 16. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 画像などの高次元データに対応 ● 中間層から潜在変数の間に1層の線形変換を導入 ● Convolution Layer を導入 Wangらの手法との相違点 1/2 16 Wangらの手法では入力データは文章の Bag-of-Wordsであり、画像と比較すると 次元が低い。 そのため、Wangらのモデルでは Autoencoderの中間層の次元が潜在変 数の次元に束縛されており、画像などの 高次元データを入力した場合に Autoencoderの学習がうまく進まない現 象が発生した。 FC
  • 17. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 Wangらの手法との相違点 2/2 Implicit Feedback※ を導入 ● 出力行列Rを{0, 1}要素の行列とする ● ユーザ i がアイテム j を複数個・複数回購入したとき Rij =1 という情報に 大きい重みを付与して潜在変数の更新を行う手法 ※ Y.F. Hu, Y. Koren, and C. Volinsky, “Collaborative Filtering for Implicit Feedback Datasets,” Proc. IEEE Int’l Conf. Data Mining (ICDM 08), IEEE CS Press, 2008, pp. 263-272. 17 レーティング: ★★☆☆☆ 購買したか Yes(1) / No(0) 1回購買した 10回購買した
  • 18. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 データセット ● 大手アパレルサイトの2017年7月分の購買データを使用 (ユーザ数:15万、アイテム数:7万、レコード数:33万件) ● アイテムの情報として商品画像を利用 ● 各ユーザごとに購入したアイテムのうち2割をランダムに隠して テストデータとした 評価 ● Mean Average Precision@10 (MAP@10) で評価 (次頁) 上記を元に、既存のシステムと比較実験を行った 比較実験 18
  • 19. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 Mean Average Precision@10 (MAP@10) の定義 評価指標 19 テストセットにおけるユーザ u についての購買アイテム数 k 番目にレコメンドされたアイテムが Positive なら1となる関数 k 番目までのレコメンドされた中での Precision ユーザ u に対してレコメンドされたアイテム個数
  • 20. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 Result (64x64) 20 学習データに含まれる 商品の結果上位 学習データに含まれ ていない商品の 結果上位 ユーザーの 購買データ
  • 21. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 Result naive MFのが一番精度が出る結果となった 21
  • 22. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 ● CDL > 既存レコメ ○ リアルタイム性は失われるものの、精度の改善が期待できる ● MF > CDL ○ 論文とは異なる結果になった ○ 画像データを入力としているため、うまく適用できていない可能性 ○ 説明文での実験、ネットワークの見直し、ログがない商品だけでの評価 それぞれの手法の長所で補い合うようなエンジンの開発に取り組んでいきたい その他の懸念事項 ● コスト面での不安 ○ 学習頻度を検討することによって改善の可能性 ○ 例:DNN部分は月一回の更新、 MF部分は毎日更新 ● データ量での不安 ○ ユーザー数、アイテム数、ログの数 に線形で計算量が増加 ○ 例:33万件→3000万件 線形(100倍時間かかる) 考察と課題 22
  • 23. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 ● チームラボの仕事のほとんどはWeb関連 ● チームラボレコメンデーションを基軸としたサイト改善を行っている ● チームラボレコメンデーションは協調フィルタリングをベースとした システムで、ログベースのレコメンドの問題点を含んでいる ● CDLで既存レコメンドの精度を上回ったが、画像の特徴を活かせていない ● それぞれの手法の長所で補い合うようなエンジンの開発に取り組みたい まとめ 23
  • 24. We are the future. Copyright (C) teamLab Inc.All rights reserved. WebDB Forum 2017 - 2017/09/20 質疑応答 24