数据和算法驱动的本地生活推荐

860 views

Published on

数据和算法驱动的本地生活推荐

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
860
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
24
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

数据和算法驱动的本地生活推荐

  1. 1. 数据和算法驱动的 本地生活推荐大众点评网 · 李新
  2. 2. 内容提要• 本地生活推荐的广泛应用场景• 推荐的原料:数据 -聚沙成金• 推荐的内核:挖掘• 推荐的引擎:算法• 推荐的地基:架构• 推荐的立场:公正、分享、多赢
  3. 3. 点评的起源就是推荐• Web2.0推荐: • 我为人人,人人为我 • 上传商户信息、商品图片 • 描述性和结构化评价• 大众推荐:个人点评的有机聚合 • 星级 • 商户简介 • 推荐菜 • 代表性点评• 个性化推荐:个性化消费 starting for future
  4. 4. 本地生活的推荐场景• 旅游到外地 • 喜好相近的人在当地的选择:避险• 白领午餐 • 基于签到和朋友兴趣等:极速决策• 附近有啥好吃的 • 附近推荐菜:决策,尝新• 10个团购邮件,9个与我无关 • 基于过往购买、签到、浏览等:精准推广
  5. 5. 附近推荐菜
  6. 6. 附近推荐菜
  7. 7. 点评的推荐特点• 与电商比: • 地域性:区域热点未必是全国热点 • 非标准化:服务可比性差 • 品牌:商户品牌重于商品品牌 • 质量:被推荐的商户也是用户上传 • 推荐理由:基于web 2.0,还要概括总结群众智慧• 与广告比: • Impulse & Intent:即时冲动 意愿预测 • 长期兴趣未必是此时此地的消费决策结果• 与团购网站比: • 数据来源:主站、手机APP、团购网,多样 • 推荐形式:团购网、邮件、手机APP、主站,多样 • 推荐内容:自然结果、团购、优惠券 ,多元
  8. 8. 推荐的原料:数据 -聚沙成金• 类型: • 消费过程: 查找、决策、签到、消费、支付、评价、分享 • 用户页面行为: 浏览、搜索、收藏、标签、照片、签到、点评、社交图 • 消费对象:商户、服务、商品信息• 采集:GA? 性能,准确性• 存储:海量,安全• 即刻:当次访问的处理• 清洗:去爬虫,去重,反作弊,去广告,去小号等• 抽取:结构化信息• 串连:跨时间 跨平台
  9. 9. 推荐的内核:挖掘• 用户画像• 用户分群• 商户画像• 商户/产品的分类和聚类• 点评的情感分析• 上传图片的分类、聚类、识别• 理由:综合性 准确性 代表性
  10. 10. 推荐的引擎:算法• 特征表达: • 计数或类别 • 非常稀疏而且正反馈不足 • 颗粒度的掌握vs 概念漂移• 建模: • 基于内容 • 协同过滤:基于用户 vs 基于内容项 • 行为定向 • 基于传导 • 增量学习• 评估: • 线下评估 • 线上A/B测试
  11. 11. 推荐的地基:架构• 海量数据的采集、存储、处理、分析• 端到端的A/B框架• 多优化目标• 多算法支持• 算法并行化• 增量建模• 实时性与互动• 当次访问的处理• 邮件系统的模板数
  12. 12. 推荐的立场:公正 · 平衡 · 多赢 广告 推荐 诚信 搜索 坚持用户利益至上的多方博弈
  13. 13. Q & A联系方式: xin.li@dianping.com 新浪微博: 谷民李新

×