Your SlideShare is downloading. ×
0
豆瓣在推荐领域的实践与思考<br />胖子@豆瓣<br />2009.12.19<br />
豆瓣的推荐引擎--豆瓣猜<br />
豆瓣猜的产品形态<br />喜欢XX的也喜欢<br />豆瓣猜你会喜欢<br />今日推荐<br />围绕推荐设计的产品<br />
什么样的产品适合推荐?<br />具有媒体性的产品(MediaProduct)<br />口味(taste)很重要<br />单位成本不重要<br />有瀑布效应 (information cascade)<br />多样性<br />
媒体类产品的数据特征<br />
文章<br /> 人<br /> 图书<br />条目数<br />小组<br />单曲<br />唱片<br />电影<br />广告<br />用户数<br />
 图书<br />文章<br />广告<br />稀疏性<br /> 人<br />小组<br />唱片<br />电影<br />单曲<br />时效性<br />
 人<br />文章<br /> 图书<br />多样性<br />小组<br />单曲<br />唱片<br />电影<br />广告<br />时效性<br />
 人<br />文章<br /> 图书<br />多样性<br />小组<br />唱片<br />单曲<br />电影<br />广告<br />反馈<br />
什么样的产品适合推荐?<br />条目增长相对稳定<br />能够获得快速反馈<br />稀疏性、多样性和时效性的平衡<br />
豆瓣的成长<br />通过算法分析应对高成长性<br />
推荐系统的可扩展性<br />User-Item矩阵       ,平均每行的非零元素个数是L个,考虑                  的计算复杂性<br />假设A的非零元均匀分布,求S的非零元素个数<br />S中任一元素非零的概率为,<...
则S的非零元素个数<br />
考虑A中的元素非均匀分布的情况<br />let<br />according to Cauchy-Schwarz Inequality <br />so<br />
推荐系统的可扩展性<br />降低存储空间<br />近似算法/分块<br />并行/分布式计算<br />
推荐系统面临的挑战<br />产品形态<br />推荐是一项技术还是一种产品/功能?<br />推荐能否有独立的产品形态?<br />
兴趣过多<br />推荐质量<br />冷启动<br />用户收藏<br />
评价指标<br />Hit-rate / RMSE<br />点击率<br />如何形成闭环?<br />
黑盒推荐的问题<br />倾向于给出平庸的推荐<br />放大噪声<br />有信息,无结构<br />缺乏对用户的持续关注<br />
下一代推荐系统<br />
Prediction<br />明确的优化指标<br />静态模型/系统<br />由数据形成信息<br />
Forecasting<br />闭环的系统<br />动态模型<br />由信息形成知识<br />
Recommendation<br />以用户为中心,建立用户行为模型<br />有记忆的,进化的系统<br />由知识形成系统结构<br />
下一代推荐系统<br />技术准备<br />云计算<br />Open ID<br />Semantic Web<br />…<br />
推荐<br />Anti-Spammer<br />信息过滤<br />广告<br />个性化技术<br />机器学习<br />用户模型<br />…<br />聚类<br />协同过滤<br />矩阵分解<br />分类器<br />
个性化推荐与非个性化推荐<br />人人都需要过滤器?<br />?<br />
如何发现信息<br />排序 (Ranking)<br />关联 (Correlation)<br />聚类/分类 (Clustering/Classification)<br />过滤 (Filtering)<br />
一些有用的方法<br />EM<br />Correlation<br />Eigen Vector <br />Bayes<br />Boosting<br />Meta-Heuristics<br />
Algorithms should facilitate rather than replace social processes.<br />
Q & A<br />Thanks<br />
Upcoming SlideShare
Loading in...5
×

王守崑 - 豆瓣在推荐领域的实践和思考

30,451

Published on

Published in: Technology
9 Comments
178 Likes
Statistics
Notes
No Downloads
Views
Total Views
30,451
On Slideshare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
1,764
Comments
9
Likes
178
Embeds 0
No embeds

No notes for slide

Transcript of "王守崑 - 豆瓣在推荐领域的实践和思考"

  1. 1. 豆瓣在推荐领域的实践与思考<br />胖子@豆瓣<br />2009.12.19<br />
  2. 2.
  3. 3. 豆瓣的推荐引擎--豆瓣猜<br />
  4. 4. 豆瓣猜的产品形态<br />喜欢XX的也喜欢<br />豆瓣猜你会喜欢<br />今日推荐<br />围绕推荐设计的产品<br />
  5. 5. 什么样的产品适合推荐?<br />具有媒体性的产品(MediaProduct)<br />口味(taste)很重要<br />单位成本不重要<br />有瀑布效应 (information cascade)<br />多样性<br />
  6. 6. 媒体类产品的数据特征<br />
  7. 7. 文章<br /> 人<br /> 图书<br />条目数<br />小组<br />单曲<br />唱片<br />电影<br />广告<br />用户数<br />
  8. 8. 图书<br />文章<br />广告<br />稀疏性<br /> 人<br />小组<br />唱片<br />电影<br />单曲<br />时效性<br />
  9. 9. 人<br />文章<br /> 图书<br />多样性<br />小组<br />单曲<br />唱片<br />电影<br />广告<br />时效性<br />
  10. 10. 人<br />文章<br /> 图书<br />多样性<br />小组<br />唱片<br />单曲<br />电影<br />广告<br />反馈<br />
  11. 11. 什么样的产品适合推荐?<br />条目增长相对稳定<br />能够获得快速反馈<br />稀疏性、多样性和时效性的平衡<br />
  12. 12. 豆瓣的成长<br />通过算法分析应对高成长性<br />
  13. 13. 推荐系统的可扩展性<br />User-Item矩阵 ,平均每行的非零元素个数是L个,考虑 的计算复杂性<br />假设A的非零元均匀分布,求S的非零元素个数<br />S中任一元素非零的概率为,<br />
  14. 14. 则S的非零元素个数<br />
  15. 15. 考虑A中的元素非均匀分布的情况<br />let<br />according to Cauchy-Schwarz Inequality <br />so<br />
  16. 16. 推荐系统的可扩展性<br />降低存储空间<br />近似算法/分块<br />并行/分布式计算<br />
  17. 17. 推荐系统面临的挑战<br />产品形态<br />推荐是一项技术还是一种产品/功能?<br />推荐能否有独立的产品形态?<br />
  18. 18. 兴趣过多<br />推荐质量<br />冷启动<br />用户收藏<br />
  19. 19. 评价指标<br />Hit-rate / RMSE<br />点击率<br />如何形成闭环?<br />
  20. 20. 黑盒推荐的问题<br />倾向于给出平庸的推荐<br />放大噪声<br />有信息,无结构<br />缺乏对用户的持续关注<br />
  21. 21. 下一代推荐系统<br />
  22. 22. Prediction<br />明确的优化指标<br />静态模型/系统<br />由数据形成信息<br />
  23. 23. Forecasting<br />闭环的系统<br />动态模型<br />由信息形成知识<br />
  24. 24. Recommendation<br />以用户为中心,建立用户行为模型<br />有记忆的,进化的系统<br />由知识形成系统结构<br />
  25. 25. 下一代推荐系统<br />技术准备<br />云计算<br />Open ID<br />Semantic Web<br />…<br />
  26. 26. 推荐<br />Anti-Spammer<br />信息过滤<br />广告<br />个性化技术<br />机器学习<br />用户模型<br />…<br />聚类<br />协同过滤<br />矩阵分解<br />分类器<br />
  27. 27.
  28. 28. 个性化推荐与非个性化推荐<br />人人都需要过滤器?<br />?<br />
  29. 29. 如何发现信息<br />排序 (Ranking)<br />关联 (Correlation)<br />聚类/分类 (Clustering/Classification)<br />过滤 (Filtering)<br />
  30. 30. 一些有用的方法<br />EM<br />Correlation<br />Eigen Vector <br />Bayes<br />Boosting<br />Meta-Heuristics<br />
  31. 31. Algorithms should facilitate rather than replace social processes.<br />
  32. 32. Q & A<br />Thanks<br />
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×