SlideShare a Scribd company logo
RandomSortFieldとMahoutの
                                  CTR比較について




                                                             GMO インターネット
                                                             新里 祐教
Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
自己紹介
          • やってること
                     – AP、インフラ、NW … etc
                     – 最近はJava多め
                     – OSS:SIPropの中に居ます


          • Solrの利用
                     – 9199.JP街検索
                       ローカルエリア検索
                       1.3から1.4へ移行

                     – GMOとくとくショップ
                       グループの店舗・商品データ



Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
Randomなデータを表示させたい欲求・要望




                                               毎回違うデータを表示したい

                                                        とりあえず何か出したい

                                                似たようなコンテンツが良い



Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
ランダムデータを掲出する理由

                                                             サーチエンジン対策
                                                             (とにかく何かリンクが欲しい)
       PV増やしたい!!
       ・CTR(Click Through Rate)
       ・Conversion Rate                                            コストかけたくなーぃ
       ・巡回率上げたい


                  特集ページは?                                          自然な感じでお願い♪
                  ・プロモーション
                  ・キャンペーン


                                                              ランダムで・・・



Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
Solrでランダム
       •       schema.xmlに追加(1.4)
                 <fieldType name="random" class="solr.RandomSortField"
                      indexed="true" />
                 <dynamicField name="random*" type="random" />

       •       クエリ
                 – sort=randomSSS
                 – SSSはシードの文字列
                 – シードが同じ場合、検索結果も同じになる

       •       シードのローテーション
                 – AP側でシードを制御
                 – yyyymmddhh形式のシードにして時間・日
                   次のシードを生成

       •       レコメン的
                 – 検索されたキーワード
                                                                           商品と同じ
                 – 同じカテゴリ                                                カテゴリorキーワード
                 – 似たような価格帯
                 ※ MoreLikeThisという選択肢も




Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
レコメンド
         •       Mahoutを利用
                   –      機械学習のアルゴリズムが豊富
                              •    ベイジアン、K平均法、SlopeOne、K近傍法、
                                   SVD…
                   –      Hadoopとの親和性

         •       ログ解析とスコア
                   –      日次で20Gbyte程度のログを対象
                   –      Hadoopを使ってログ解析、スコアを生成
                   –      アルゴリズム
                              •    最尤法, Tanimoto係数, k近傍法
                              •    レコメン結果商品の更に先も対象

                   –      フィルター
                              •    一見さんをどうするか・・・
                              •    スパム的に商品を見ているユーザ
                              •    スコアが低すぎるのは間引く

                                                               この商品を見た人は
         •       表示される商品
                   –      似たような商品                              こんな商品も見てます
                   –      合わせて買う商品
                   –      掘り起こしの効果




Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
パフォーマンス
          •       表示エリアの工夫
                  出し位置を変えてみたり・・・
          •       インプレッション(インプレッション数/全体PV )
                     –     レコメンド
                           avg: 22.8%, max: 29.6%, min: 18.7%
                     –     Solr
                           avg: 58.1%, max: 70.4%, min: 52.6%


                                      80.0%
                                      60.0%
                              掲出率




                                      40.0%
                                      20.0%
                                        0.0%
                                                                                                           day
                                                                                                                   レコメンエリア
                                               2001/1/25                                  2001/2/1

                                                             recommend(mahout)
                                                             category keyword match(solr)


          •       CTR(クリック数/インプレッション数)
                     –     レコメンド
                           avg: 8.4%, max: 9.0%, min: 7.1%
                     –     Solr
                           avg: 1.8%, max: 2.1%, min: 1.6%

                                    10.0%
                                     8.0%
                                     6.0%
                                                                                                                 Solr Randomエリア
                              ctr




                                     4.0%
                                     2.0%
                                     0.0%
                                            2001/1/25                                2001/2/1        day
                                                           recommend(mahout)
                                                           category keyword match(solr)


Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
リファラの利用
          •       検索エンジン経由のユーザが8割以上
                     –     リファラ+カテゴリ+RandomSortFieldに変更

          •       インプレッション
                     –     レコメンド
                               avg: 30.7%, max: 34.2%, min: 27.8%
                     –     Solr
                               avg: 66.9%, max: 70.2%, min: 66.1%

                                                            80.0%

                                                            60.0%
                                                     掲出率




                                                            40.0%

                                                            20.0%

                                                             0.0%
                                                                    01/1/25     01/2/1                         01/2/8   day
                                                                               recommend(mahout)
                                                                               category keyword match(solr)

          •       CTR
                     –     レコメンド
                               avg: 8.0%, max: 8.3%, min: 7.4%
                     –     Solr
                               avg: 3.1%, max: 3,8%, min: 2.6%

                                                           10.0%
                                                            8.0%
                                                            6.0%
                                                     ctr




                                                            4.0%
                                                            2.0%
                                                            0.0%
                                                                   01/1/25     01/2/1                         01/2/8    day
                                                                              recommend(mahout)
                                                                              category keyword match(solr)


Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
終わりに…
          • カテゴリ、キーワード、リファラと組合せるとGood
                     – 商品名を形態素解析してマッチするのもアリかも


          • レコメンドはデータが無い場合、表示が無い
                     – CTRは高い半面、データ次第で表示されない
                     – 補完する意味で、RandomSortField


          • RandomSortFieldを使うと
                     – 商品のカテゴリにマッチして
                     – 検索キーワードやリファラをキーに
                     それっぽい雰囲気の商品が表示できる

Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.

More Related Content

More from Hirotaka Niisato

ポスト君とIoTとline bot
ポスト君とIoTとline botポスト君とIoTとline bot
ポスト君とIoTとline bot
Hirotaka Niisato
 
WebとIoTとMake
WebとIoTとMakeWebとIoTとMake
WebとIoTとMake
Hirotaka Niisato
 
おうちハックナイト
おうちハックナイトおうちハックナイト
おうちハックナイト
Hirotaka Niisato
 
QS Tools for Emotions and Communication
QS Tools for Emotions and CommunicationQS Tools for Emotions and Communication
QS Tools for Emotions and Communication
Hirotaka Niisato
 
Makeでも使われる色んなセンサー
Makeでも使われる色んなセンサーMakeでも使われる色んなセンサー
Makeでも使われる色んなセンサー
Hirotaka Niisato
 
How to MAKE HVC-C Protyping Application
How to MAKE HVC-C Protyping ApplicationHow to MAKE HVC-C Protyping Application
How to MAKE HVC-C Protyping ApplicationHirotaka Niisato
 
ネット側からの物作り
ネット側からの物作りネット側からの物作り
ネット側からの物作り
Hirotaka Niisato
 
Maker Faire Taipei 2014 workshop
Maker Faire Taipei 2014 workshopMaker Faire Taipei 2014 workshop
Maker Faire Taipei 2014 workshopHirotaka Niisato
 
android bazaar and conference 2014 spring
android bazaar and conference 2014 springandroid bazaar and conference 2014 spring
android bazaar and conference 2014 springHirotaka Niisato
 
国内外のMaker faireに参加してみて
国内外のMaker faireに参加してみて国内外のMaker faireに参加してみて
国内外のMaker faireに参加してみてHirotaka Niisato
 
Interactive Application using Kinect and Android
Interactive Application using Kinect and AndroidInteractive Application using Kinect and Android
Interactive Application using Kinect and AndroidHirotaka Niisato
 
Data analytics with hadoop hive on multiple data centers
Data analytics with hadoop hive on multiple data centersData analytics with hadoop hive on multiple data centers
Data analytics with hadoop hive on multiple data centersHirotaka Niisato
 
Android and OpenNI - NUI Application Treasure Hunter Robot
Android and OpenNI - NUI Application   Treasure Hunter RobotAndroid and OpenNI - NUI Application   Treasure Hunter Robot
Android and OpenNI - NUI Application Treasure Hunter RobotHirotaka Niisato
 
Androidで出来る!! KinectとiPadを使った亀ロボ
Androidで出来る!! KinectとiPadを使った亀ロボAndroidで出来る!! KinectとiPadを使った亀ロボ
Androidで出来る!! KinectとiPadを使った亀ロボ
Hirotaka Niisato
 

More from Hirotaka Niisato (16)

ポスト君とIoTとline bot
ポスト君とIoTとline botポスト君とIoTとline bot
ポスト君とIoTとline bot
 
WebとIoTとMake
WebとIoTとMakeWebとIoTとMake
WebとIoTとMake
 
おうちハックナイト
おうちハックナイトおうちハックナイト
おうちハックナイト
 
QS Tools for Emotions and Communication
QS Tools for Emotions and CommunicationQS Tools for Emotions and Communication
QS Tools for Emotions and Communication
 
Makeでも使われる色んなセンサー
Makeでも使われる色んなセンサーMakeでも使われる色んなセンサー
Makeでも使われる色んなセンサー
 
How to MAKE HVC-C Protyping Application
How to MAKE HVC-C Protyping ApplicationHow to MAKE HVC-C Protyping Application
How to MAKE HVC-C Protyping Application
 
ネット側からの物作り
ネット側からの物作りネット側からの物作り
ネット側からの物作り
 
Maker Faire Taipei 2014 workshop
Maker Faire Taipei 2014 workshopMaker Faire Taipei 2014 workshop
Maker Faire Taipei 2014 workshop
 
android bazaar and conference 2014 spring
android bazaar and conference 2014 springandroid bazaar and conference 2014 spring
android bazaar and conference 2014 spring
 
国内外のMaker faireに参加してみて
国内外のMaker faireに参加してみて国内外のMaker faireに参加してみて
国内外のMaker faireに参加してみて
 
3 Dセンサーの活用
3 Dセンサーの活用3 Dセンサーの活用
3 Dセンサーの活用
 
Interactive Application using Kinect and Android
Interactive Application using Kinect and AndroidInteractive Application using Kinect and Android
Interactive Application using Kinect and Android
 
Data analytics with hadoop hive on multiple data centers
Data analytics with hadoop hive on multiple data centersData analytics with hadoop hive on multiple data centers
Data analytics with hadoop hive on multiple data centers
 
Android and OpenNI - NUI Application Treasure Hunter Robot
Android and OpenNI - NUI Application   Treasure Hunter RobotAndroid and OpenNI - NUI Application   Treasure Hunter Robot
Android and OpenNI - NUI Application Treasure Hunter Robot
 
Androidで出来る!! KinectとiPadを使った亀ロボ
Androidで出来る!! KinectとiPadを使った亀ロボAndroidで出来る!! KinectとiPadを使った亀ロボ
Androidで出来る!! KinectとiPadを使った亀ロボ
 
Jjug 20090421
Jjug 20090421Jjug 20090421
Jjug 20090421
 

Recently uploaded

MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
iPride Co., Ltd.
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
NTT DATA Technology & Innovation
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
Toru Tamaki
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
yassun7010
 
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
Sony - Neural Network Libraries
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
Fukuoka Institute of Technology
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
Matsushita Laboratory
 
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
Yuuitirou528 default
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
atsushi061452
 

Recently uploaded (16)

MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
 
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
 
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
 

RandomSortFieldとMahoutのCtr比較について

  • 1. RandomSortFieldとMahoutの CTR比較について GMO インターネット 新里 祐教 Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 2. 自己紹介 • やってること – AP、インフラ、NW … etc – 最近はJava多め – OSS:SIPropの中に居ます • Solrの利用 – 9199.JP街検索 ローカルエリア検索 1.3から1.4へ移行 – GMOとくとくショップ グループの店舗・商品データ Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 3. Randomなデータを表示させたい欲求・要望 毎回違うデータを表示したい とりあえず何か出したい 似たようなコンテンツが良い Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 4. ランダムデータを掲出する理由 サーチエンジン対策 (とにかく何かリンクが欲しい) PV増やしたい!! ・CTR(Click Through Rate) ・Conversion Rate コストかけたくなーぃ ・巡回率上げたい 特集ページは? 自然な感じでお願い♪ ・プロモーション ・キャンペーン ランダムで・・・ Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 5. Solrでランダム • schema.xmlに追加(1.4) <fieldType name="random" class="solr.RandomSortField" indexed="true" /> <dynamicField name="random*" type="random" /> • クエリ – sort=randomSSS – SSSはシードの文字列 – シードが同じ場合、検索結果も同じになる • シードのローテーション – AP側でシードを制御 – yyyymmddhh形式のシードにして時間・日 次のシードを生成 • レコメン的 – 検索されたキーワード 商品と同じ – 同じカテゴリ カテゴリorキーワード – 似たような価格帯 ※ MoreLikeThisという選択肢も Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 6. レコメンド • Mahoutを利用 – 機械学習のアルゴリズムが豊富 • ベイジアン、K平均法、SlopeOne、K近傍法、 SVD… – Hadoopとの親和性 • ログ解析とスコア – 日次で20Gbyte程度のログを対象 – Hadoopを使ってログ解析、スコアを生成 – アルゴリズム • 最尤法, Tanimoto係数, k近傍法 • レコメン結果商品の更に先も対象 – フィルター • 一見さんをどうするか・・・ • スパム的に商品を見ているユーザ • スコアが低すぎるのは間引く この商品を見た人は • 表示される商品 – 似たような商品 こんな商品も見てます – 合わせて買う商品 – 掘り起こしの効果 Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 7. パフォーマンス • 表示エリアの工夫 出し位置を変えてみたり・・・ • インプレッション(インプレッション数/全体PV ) – レコメンド avg: 22.8%, max: 29.6%, min: 18.7% – Solr avg: 58.1%, max: 70.4%, min: 52.6% 80.0% 60.0% 掲出率 40.0% 20.0% 0.0% day レコメンエリア 2001/1/25 2001/2/1 recommend(mahout) category keyword match(solr) • CTR(クリック数/インプレッション数) – レコメンド avg: 8.4%, max: 9.0%, min: 7.1% – Solr avg: 1.8%, max: 2.1%, min: 1.6% 10.0% 8.0% 6.0% Solr Randomエリア ctr 4.0% 2.0% 0.0% 2001/1/25 2001/2/1 day recommend(mahout) category keyword match(solr) Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 8. リファラの利用 • 検索エンジン経由のユーザが8割以上 – リファラ+カテゴリ+RandomSortFieldに変更 • インプレッション – レコメンド avg: 30.7%, max: 34.2%, min: 27.8% – Solr avg: 66.9%, max: 70.2%, min: 66.1% 80.0% 60.0% 掲出率 40.0% 20.0% 0.0% 01/1/25 01/2/1 01/2/8 day recommend(mahout) category keyword match(solr) • CTR – レコメンド avg: 8.0%, max: 8.3%, min: 7.4% – Solr avg: 3.1%, max: 3,8%, min: 2.6% 10.0% 8.0% 6.0% ctr 4.0% 2.0% 0.0% 01/1/25 01/2/1 01/2/8 day recommend(mahout) category keyword match(solr) Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 9. 終わりに… • カテゴリ、キーワード、リファラと組合せるとGood – 商品名を形態素解析してマッチするのもアリかも • レコメンドはデータが無い場合、表示が無い – CTRは高い半面、データ次第で表示されない – 補完する意味で、RandomSortField • RandomSortFieldを使うと – 商品のカテゴリにマッチして – 検索キーワードやリファラをキーに それっぽい雰囲気の商品が表示できる Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.