动态推荐系统关键技术研究

动态推荐系统关键技术研究项亮指导老师：杨青研究员

主要内容引言动态评分预测问题动态Top-N推荐问题时效性的影响动态推荐系统原型小结与展望 2 Recommender System

引言推荐系统的主要任务帮助用户发现他们可能感兴趣的内容（个性化推荐系统）将内容投放给可能会对它们感兴趣的用户（个性化广告）推荐系统无论在工业界还是学术界都是一个重要的研究热点。 3

引言著名商业推荐系统 4

引言推荐系统的主要算法按照使用数据分：协同过滤：用户行为数据内容过滤：用户内容属性和物品内容属性社会化过滤：用户之间的社会网络关系按照模型分：最近邻模型：基于用户/物品的协同过滤算法 Latent Factor Model：基于矩阵分解的模型图模型：二分图模型，社会网络图模型 5

引言推荐系统中常见的时间效应用户兴趣的变化物品流行度的变化季节效应 6

引言协同过滤数据集： {(用户，物品，行为，时间)} 问题：通过研究用户的历史行为和兴趣爱好，预测用户将来的行为和喜好。是用户集合，是物品集合，是时间集合 7

主要内容引言动态评分预测问题动态Top-N推荐问题时效性的影响动态推荐系统原型小结与展望 8

问题简述数据集：显性反馈数据集 {(用户，物品，评分，时间)} 问题定义给定用户u，物品i，时间t，预测用户u在时间t对物品i的评分 9

相关研究时间无关的评分预测问题算法基于用户/物品的协同过滤算法基于矩阵分解的模型 Latent Factor Model 受限波尔兹曼机 RBM 时间相关的评分预测问题算法用户会喜欢和他们最近喜欢的物品相似的物品用户会喜欢和他们兴趣相似的用户最近喜欢的物品 10

时间效应时间效应一：全局平均分的变化 Netflix数据集中用户评分平均分随时间的变化曲线 11

时间效应时间效应二：物品平均分的变化 Netflix数据集中物品平均分随物品在线时间的变化曲线 12

时间效应时间效应三：用户偏好的变化 13

时间效应时间效应四：用户兴趣的变化用户对物品的兴趣会随时间发生改变。年龄增长：青年->中年生活状态变化：学生->工作社会热点影响：北京奥运会 14

时间效应时间效应五：季节效应 15

模型和算法用户兴趣模型时间无关的Latent Factor Model (RSVD) 时间相关的Latent Factor Model (TRSVD) 3 5 1 5 3 2 2 4 4 2 3 4 5 1 2 16

模型和算法 Tensor分解 17 物品用户时间

模型和算法模型优化 18

模型和算法季节效应 19

实验分析数据集(Netflix数据集) 评测指标 20

实验分析实验结果 TRSVD和RSVD模型在Probe测试集上的RMSE比较 21

实验分析实验结果季节效应的影响 22

问题简述数据集：隐性反馈数据集 {(用户，物品，时间)} 问题定义给定用户u，时间t，预测用户u在时间t可能会喜欢的物品列表R(u) 24

相关研究基于邻域的协同过滤算法 ItemCF：推荐给用户那些和他们之前喜欢的物品类似的物品 UserCF：推荐给用户那些和他们兴趣相似的用户喜欢的物品基于评分数据的Top-N推荐算法推荐给用户那些他们可能评分最高的物品 25

时间效应用户兴趣分为短期兴趣和长期兴趣短期兴趣：临时，易变长期兴趣：长久，稳定短期兴趣可能会转化为长期兴趣 26 因此，需要在推荐系统中综合考虑用户的长期兴趣和短期兴趣。

模型和算法用户物品二分图模型 a A b B 图中节点具有高相关的三个条件： ,[object Object]

两个顶点之间的路径比较短；

两个顶点之间的路径不经过有很大出度的顶点。个性化推荐问题可以转变为计算用户节点和物品节点的相关性的问题。 c C d D 27

模型和算法路径融合算法找出用户顶点和物品顶点之间的最短路径；计算每条最短路径的权重；将所有最短路径的权重线性叠加作为最终用户对物品喜好程度的度量。 28

模型和算法用户时间段图模型顶点权重定义 A a A:1 A:2 b B B:1 c 用户u对物品i的兴趣函数： B:2 29

模型和算法基于图的个性化推荐算法 30 P(A,c,2) A A A A A A a a a a a a A:1 A:1 A:1 A:1 A:1 A:1 A:2 A:2 A:2 A:2 A:2 A:2 b b b b b b B B B B B B B:1 B:1 B:1 B:1 B:1 B:1 c c c c c c B:2 B:2 B:2 B:2 B:2 B:2

实验分析数据集 CiteULike : 4607个用户，16,054篇论文和109,364条用户和论文之间的关系记录 Delicious : 8,861个用户，3,257篇网页和59,694条用户和网页之间的收藏关系记录评测指标 31

实验分析实验结果 CiteULike Delicious 32

实验分析实验结果 CiteULike Delicious 33

问题简述每个在线系统都是一个动态系统，但它们有不同的演化速率。新闻，博客演化的很快，但音乐，电影的系统演化的却比较慢。不同演化速率的系统需要不同类型的推荐算法。 Fast Slow 35

在线系统的变化速率这幅图显示了不同系统，相似热门度的物品的平均生存周期。一个物品的生存周期定义为该物品被至少一个用户关注过的天数。 36

在线系统的变化速率这幅图显示了不同系统，相隔t天的两天，item热门程度的相似度。图表显示，NYTimes的演化很快，相隔1天，item的热门程度就会有很大的变化。而对于Netflix，即使过了2个月，热门电影也没有太大的变化 37

模型和算法时间段图模型 38 a A A b A a B A:1 c a a:1 A:1 A:2 b A:2 b B b:1 B c B:1 c B:1 (A,a,1) (A,c,2) (B,b,1) (B,c,2) c:2 B:2 B:2

模型和算法时间段图模型 39 顶点权重定义 A a A:1 a:1 A:2 b B b:1 c B:1 用户u对物品i的兴趣函数： c:2 B:2

实验分析数据集评测指标 Precision/Recall 40

实验分析实验结果 41 8种算法在5个数据集上的召回率(N = 20)

时效性的影响实验结果 42

动态推荐系统原型推荐系统架构 45 用户行为数据库用户界面日志系统推荐引擎

用户行为数据库行为提取和分析用户行为模型用户兴趣特征相似度表相关推荐初步推荐结果用户反馈模型推荐解释结果过滤和排名最终推荐结果离线系统在线系统动态推荐系统架构 46

动态推荐系统关键技术研究

Recommended

Recommended

More Related Content

Similar to 动态推荐系统关键技术研究

Similar to 动态推荐系统关键技术研究 (20)

More from Liang Xiang

More from Liang Xiang (7)

动态推荐系统关键技术研究