文章目录
- 推荐系统的分类
- 基于人口统计学的推荐算法
- 基于内容的推荐算法
- 基于协同过滤的推荐算法
- 协同过滤(CF)推荐方法
- 基于近邻
- 基于用户的协同过滤
- 基于物品的协同过滤
- 混合推荐
- 推荐系统实验方法
- 离线实验
- 用户调查
- 在线实验
学习下b站上尚硅谷的推荐系统的课程,顺便做一下笔记,加深一下印象,并且方便以后回来查看。
推荐系统的分类
- 根据实时性分类:
- 离线推荐
- 实时推荐
- 根据是否个性化分类:
- 基于统计的推荐
- 个性化推荐
- 根据推荐原则分类:
- 基于相似度的推荐
- 基于知识的推荐
- 基于模型的推荐
- 根据数据源分类:
- 基于人口统计学的推荐
- 基于内容的推荐
- 基于协同过滤的推荐
而他们之间又有这样的关系,就是除了基于统计的推荐,都可以算作基于个性化的推荐
基于人口统计学的推荐算法
基于内容的推荐算法
基于协同过滤的推荐算法
- 协同过滤(Collaborative Filtering,CF)
- 基于近邻的协同过滤
- 基于用户(User-CF)
- 基于物品(Item-CF)
- 基于模型的协同过滤
- 奇异值分解(SVD)
- 潜在语义分析(LSA)
- 支撑向量机(SVM)
协同过滤(CF)推荐方法
- 基于内容(Content based,CB)主要利用的是用户评价过的物品的内容特征,而CF方法还可以利用用户评分过得物品内容。
- CF可以解决CB的一些局限:
- 物品不完全或者难以获得时,依然可以通过其他用户的反馈给出推荐。
- CF基于用户之间对物品的评价质量,避免了CB仅依赖内容可能造成的对物品质量判断的干扰。
- CF推荐不受内容限制,只要其他类似用户给出对不同商品的兴趣,CF就可以给用户推荐出内容差异很大的物品(但又某种内在联系)
基于近邻
基于用户的协同过滤
基于物品的协同过滤
混合推荐
实际网站的推荐系统往往都不是单纯只采用了某一种推荐的机制和策略,往往是将多 个方法混合在一起,从而达到更好的推荐效果。比较流行的组合方法有:
-
加权混合
- 用线性公式(linear formula)将几种不同的推荐按照一定权重组合起来,具体权重的值需要
在测试数据集上反复实验,从而达到最好的推荐效果
-
切换混合
- 切换的混合方式,就是允许在不同的情况(数据量,系统运行状况,用户和物品的数目等)下, 选择最为合适的推荐机制计算推荐
-
分区混合
- 采用多种推荐机制,并将不同的推荐结果分不同的区显示给用户
-
分层混合
- 采用多种推荐机制,并将一个推荐机制的结果作为另一个的输入,从而综合各个推荐机制的优 缺点,得到更加准确的推荐
推荐系统实验方法
离线实验
- 通过体制系统获得用户行为数据,并按照一定格式生成一个标准的数据集,将数据集按照一定的规则分成训练集和测试集
- 在训练集上训练用户兴趣模型,在测试集上进行预测
- 通过事先定义的离线指标评测算法在测试集上的预测结果
用户调查
用户调查需要有一些真实用户,让他们在需要测试的推荐系统上完成一些任务。我们需要记录他们的行为,并让他们回答一些问题。最后进行分析。
在线实验
AB测试