豆瓣在推荐领域的实践与思考胖子@豆瓣2009.12.19
豆瓣的推荐引擎--豆瓣猜
豆瓣猜的产品形态喜欢XX的也喜欢豆瓣猜你会喜欢今日推荐围绕推荐设计的产品
什么样的产品适合推荐?具有媒体性的产品(MediaProduct)口味(taste)很重要单位成本不重要有瀑布效应 (information cascade)多样性
媒体类产品的数据特征
文章 人 图书条目数小组单曲唱片电影广告用户数
 图书文章广告稀疏性 人小组唱片电影单曲时效性
 人文章 图书多样性小组单曲唱片电影广告时效性
 人文章 图书多样性小组唱片单曲电影广告反馈
什么样的产品适合推荐?条目增长相对稳定能够获得快速反馈稀疏性、多样性和时效性的平衡
豆瓣的成长通过算法分析应对高成长性
推荐系统的可扩展性User-Item矩阵       ,平均每行的非零元素个数是L个,考虑                  的计算复杂性假设A的非零元均匀分布,求S的非零元素个数S中任一元素非零的概率为,
则S的非零元素个数
考虑A中的元素非均匀分布的情况letaccording to Cauchy-Schwarz Inequality so
推荐系统的可扩展性降低存储空间近似算法/分块并行/分布式计算
推荐系统面临的挑战产品形态推荐是一项技术还是一种产品/功能?推荐能否有独立的产品形态?
兴趣过多推荐质量冷启动用户收藏
评价指标Hit-rate / RMSE点击率如何形成闭环?
黑盒推荐的问题倾向于给出平庸的推荐放大噪声有信息,无结构缺乏对用户的持续关注
下一代推荐系统
Prediction明确的优化指标静态模型/系统由数据形成信息
Forecasting闭环的系统动态模型由信息形成知识
Recommendation以用户为中心,建立用户行为模型有记忆的,进化的系统由知识形成系统结构
下一代推荐系统技术准备云计算Open IDSemantic Web…
推荐Anti-Spammer信息过滤广告个性化技术机器学习用户模型…聚类协同过滤矩阵分解分类器
个性化推荐与非个性化推荐人人都需要过滤器??
如何发现信息排序 (Ranking)关联 (Correlation)聚类/分类 (Clustering/Classification)过滤 (Filtering)
一些有用的方法EMCorrelationEigen Vector BayesBoostingMeta-Heuristics
Algorithms should facilitate rather than replace social processes.
Q & AThanks

王守崑 - 豆瓣在推荐领域的实践和思考