王守崑 - 豆瓣在推荐领域的实践和思考
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share

王守崑 - 豆瓣在推荐领域的实践和思考

  • 33,769 views
Uploaded on

 

More in: Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
  • 不能选择进度,郁闷了
    Are you sure you want to
    Your message goes here
  • 公式没解释。。。
    Are you sure you want to
    Your message goes here
  • 谢谢你!真不错
    Are you sure you want to
    Your message goes here
  • 学习!
    Are you sure you want to
    Your message goes here
  • 公式有些难于理解。
    Are you sure you want to
    Your message goes here
No Downloads

Views

Total Views
33,769
On Slideshare
29,836
From Embeds
3,933
Number of Embeds
23

Actions

Shares
Downloads
1,744
Comments
9
Likes
177

Embeds 3,933

http://www.it168.com 2,115
http://gengrenjie.com 682
http://www.alibuybuy.com 468
http://www.slideshare.net 419
http://static.slidesharecdn.com 72
http://yunti.sinaapp.com 56
http://www.20ju.com 40
http://www.kuqin.com 39
http://www.lifeyun.com 9
http://www.iweb34.com 6
https://twitter.com 5
http://woshao.com 4
http://cache.baidu.com 3
http://www.linxun.info 3
http://article.woshao.com 2
http://www.91op.com 2
http://www.mefeedia.com 2
http://blog.linxun.info 1
http://trunk.ly 1
http://www.zhuaxia.com 1
http://20ju.com 1
http://www.taaza.com 1
http://fbweb-test.comoj.com 1

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. 豆瓣在推荐领域的实践与思考
    胖子@豆瓣
    2009.12.19
  • 2.
  • 3. 豆瓣的推荐引擎--豆瓣猜
  • 4. 豆瓣猜的产品形态
    喜欢XX的也喜欢
    豆瓣猜你会喜欢
    今日推荐
    围绕推荐设计的产品
  • 5. 什么样的产品适合推荐?
    具有媒体性的产品(MediaProduct)
    口味(taste)很重要
    单位成本不重要
    有瀑布效应 (information cascade)
    多样性
  • 6. 媒体类产品的数据特征
  • 7. 文章

    图书
    条目数
    小组
    单曲
    唱片
    电影
    广告
    用户数
  • 8. 图书
    文章
    广告
    稀疏性

    小组
    唱片
    电影
    单曲
    时效性
  • 9.
    文章
    图书
    多样性
    小组
    单曲
    唱片
    电影
    广告
    时效性
  • 10.
    文章
    图书
    多样性
    小组
    唱片
    单曲
    电影
    广告
    反馈
  • 11. 什么样的产品适合推荐?
    条目增长相对稳定
    能够获得快速反馈
    稀疏性、多样性和时效性的平衡
  • 12. 豆瓣的成长
    通过算法分析应对高成长性
  • 13. 推荐系统的可扩展性
    User-Item矩阵 ,平均每行的非零元素个数是L个,考虑 的计算复杂性
    假设A的非零元均匀分布,求S的非零元素个数
    S中任一元素非零的概率为,
  • 14. 则S的非零元素个数
  • 15. 考虑A中的元素非均匀分布的情况
    let
    according to Cauchy-Schwarz Inequality
    so
  • 16. 推荐系统的可扩展性
    降低存储空间
    近似算法/分块
    并行/分布式计算
  • 17. 推荐系统面临的挑战
    产品形态
    推荐是一项技术还是一种产品/功能?
    推荐能否有独立的产品形态?
  • 18. 兴趣过多
    推荐质量
    冷启动
    用户收藏
  • 19. 评价指标
    Hit-rate / RMSE
    点击率
    如何形成闭环?
  • 20. 黑盒推荐的问题
    倾向于给出平庸的推荐
    放大噪声
    有信息,无结构
    缺乏对用户的持续关注
  • 21. 下一代推荐系统
  • 22. Prediction
    明确的优化指标
    静态模型/系统
    由数据形成信息
  • 23. Forecasting
    闭环的系统
    动态模型
    由信息形成知识
  • 24. Recommendation
    以用户为中心,建立用户行为模型
    有记忆的,进化的系统
    由知识形成系统结构
  • 25. 下一代推荐系统
    技术准备
    云计算
    Open ID
    Semantic Web

  • 26. 推荐
    Anti-Spammer
    信息过滤
    广告
    个性化技术
    机器学习
    用户模型

    聚类
    协同过滤
    矩阵分解
    分类器
  • 27.
  • 28. 个性化推荐与非个性化推荐
    人人都需要过滤器?

  • 29. 如何发现信息
    排序 (Ranking)
    关联 (Correlation)
    聚类/分类 (Clustering/Classification)
    过滤 (Filtering)
  • 30. 一些有用的方法
    EM
    Correlation
    Eigen Vector
    Bayes
    Boosting
    Meta-Heuristics
  • 31. Algorithms should facilitate rather than replace social processes.
  • 32. Q & A
    Thanks