推荐系统实践 笔记

news2025/1/6 18:36:11

诸神缄默不语-个人CSDN博文目录

这是我2020年写的笔记,我从印象笔记搬过来公开。
如果那年还在读本科的同学也许有印象,那年美赛出了道根据电商评论给商户提建议的题。其实这件事跟推荐系统关系不大,但我们当时病急乱投医,我打开了这本书。
然后发现还蛮好玩的就看完了。

这本书写于2012年,哦多么古早的时代……
小书,读得很快,但是能让用户迅速对早期推荐系统有个通览的了解。
如果我以后真的干推荐系统了,可能会再回来更新相应笔记内容。

文章目录

  • 第一章 好的推荐系统
  • 第二章 利用用户行为数据
    • 2.1 用户行为数据
    • 2.2 用户行为分析
  • 第三章 推荐系统冷启动问题
  • 第四章 利用用户标签数据
  • 第五章 利用上下文信息
  • 第六章 利用社交网络数据
  • 第七章 推荐系统实例
  • 第八章 评分预测问题
  • 其他来源的相关参考资料
    • 豆瓣书评
    • 知乎
    • CSDN
    • 博客园
    • 豆瓣用户整理的附录和参考资料

第一章 好的推荐系统

  1. 在推荐系统中,主要有3种评测推荐效果的实验方法,即离线实验( offline experiment)、用户调查( user study)和在线实验( online experiment)。
    1. 离线实验
      离线实验的方法一般由如下几个步骤构成:
      1. 通过日志系统获得用户行为数据,并按照一定格式生成一个标准的数据集;
      2. 将数据集按照一定的规则分成训练集和测试集;
      3. 在训练集上训练用户兴趣模型,在测试集上进行预测;
      4. 通过事先定义的离线指标评测算法在测试集上的预测结果。
    2. 用户调查:尽量是双盲实验
    3. 在线实验:AB测试
      1. 周期长
      2. 切分流量(正交):控制变量,以防互相干扰
  2. 推荐系统评测指标
    1. 用户满意度
      1. 用户调查:问卷
      2. 在线实验:一些对用户行为的统计
    2. 预测准确度:离线数据集做机器学习
      1. 评分预测
        1. RMSE,MAE
        2. Netflix认为RMSE加大了对预测不准的用户物品评分的惩罚(平方项的惩罚),因而对系统的评测更加苛刻。研究表明,如果评分系统是基于整数建立的(即用户给的评分都是整数),那么对预测结果取整会降低MAE的误差
      2. TopN推荐: 给用户一个个性化的推荐列表
        1. 准确率( precision) /召回率( recall)
        2. 用户在训练集上的行为给用户作出的推荐列表
        3. 用户在测试集上的行为列表
        4. 有的时候,为了全面评测TopN推荐的准确率和召回率,一般会选取不同的推荐列表长度N,计算出一组准确率/召回率,然后画出准确率/召回率曲线( precision/recall curve)
      3. 覆盖率( coverage):描述一个推荐系统对物品长尾的发掘能力
        1. 最简单的定义:推荐系统能够推荐出来的物品占总物品集合的比例
        2. 内容提供商会关心这一指标
        3. 其他衡量指标:信息熵、基尼系数
          在这里插入图片描述
      4. 多样性
        在这里插入图片描述
        在这里插入图片描述
      5. 新颖性:给用户推荐那些他们以前没有听说过的物品
      6. 惊喜度 (serendipity):如果推荐结果和用户的历史兴趣不相似,但却让用户觉得满意,那么就可以说推荐结果的惊喜度很高,而推荐的新颖性仅仅取决于用户是否听说过这个推荐结果
      7. 信任度( trust)
        1. 提高推荐系统的信任度的方法
          1. 增加推荐系统的透明度( transparency):主要办法是提供推荐解释。只有让用户了解推荐系统的运行机制,让用户认同推荐系统的运行机制,才会提高用户对推荐系统的信任度
          2. 考虑用户的社交网络信息,利用用户的好友信息给用户做推荐,并且用好友进行推荐解释。这是因为用户对他们的好友一般都比较信任,因此如果推荐的商品是好友购买过的,那么他们对推荐结果就会相对比较信任。
      8. 实时性
        1. 实时地更新推荐列表来满足用户新的行为变化
        2. 推荐系统需要能够将新加入系统的物品推荐给用户
      9. 健壮性(即robust,鲁棒性)指标:一个推荐系统抗击作弊的能力
        1. 著名作弊方法: 行为注入攻击 ( profile injection attack)
        2. 评测的主要方法:模拟攻击
        3. 提高系统健壮性的方法
          1. 选择健壮性高的算法
          2. 设计推荐系统时尽量使用代价比较高的用户行为
          3. 在使用数据前,进行攻击检测,从而对数据进行清理
      10. 商业目标
      11. 在这里插入图片描述
      12. 评测维度
        1. 用户维度:主要包括用户的人口统计学信息、活跃度以及是不是新用户等。
        2. 物品维度:包括物品的属性信息、流行度、平均分以及是不是新加入的物品等。
        3. 时间维度:包括季节,是工作日还是周末,是白天还是晚上等。

第二章 利用用户行为数据

2.1 用户行为数据

  1. 日志 会话日志
  2. 显性反馈行为( explicit feedback)和隐性反馈行为( implicit feedback)
  3. 正反馈和负反馈

2.2 用户行为分析

  1. 用户活跃度和物品流行度的分布:长尾分布 Power Law在这里插入图片描述
  2. 协同过滤算法
    1. 基于邻域的方法( neighborhood-based)
      1. 基于用户的协同过滤算法:这种算法给用户推荐和他兴趣相似的其他用户喜欢的物品。
        基于用户的协同过滤算法主要包括两个步骤:
        1. 第一步:找到和目标用户兴趣相似的用户集合。
          1. 关键:计算两个用户的兴趣相似度
          2. 协同过滤算法主要利用行为的相似度计算兴趣的相似度
        2. 第二步:找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。
          1. 物品-用户倒排表
          2. UserCF算法会给用户推荐和他兴趣最相似的K个用户喜欢的物品
            在这里插入图片描述
        3. 缺点
          1. 首先,随着网站的用户数目越来越大,计算用户兴趣相似度矩阵将越来越困难,其运算时间复杂度和空间复杂度的增长和用户数的增长近似于平方关系
          2. 其次,基于用户的协同过滤很难对推荐结果作出解释
      2. 基于物品的协同过滤算法ItemCF:这种算法给用户推荐和他之前喜欢的物品相似的物品
        基于物品的协同过滤算法主要分为两步:
        1. 第一步:计算物品之间的相似度。
        2. 第二步:根据物品的相似度和用户的历史行为给用户生成推荐列表。
        3. 用ItemCF算法计算物品相似度时也可以首先建立用户—物品倒排表(即对每个用户建立一个包含他喜欢的物品的列表),然后对于每个用户,将他物品列表中的物品两两在共现矩阵C中加1。
          在这里插入图片描述
          在这里插入图片描述在这里插入图片描述
        4. 哈利波特问题:惩罚热门商品
    2. LFM隐语义模型( latent factor model)
      1. 物品分类(属于每个类的权重)
        在这里插入图片描述
      2. 隐性反馈行为的负样本采集
    3. 基于图的随机游走算法( random walk on graph)
      1. 用户行为数据的二分图表示
      2. 基于图的推荐算法
        1. 给用户u推荐物品的任务就可以转化为度量用户顶点和与没有边直接相连的物品节点在图上的相关性,相关性越高的物品在推荐列表中的权重就越高。
        2. 一般来说图中顶点的相关性主要取决于下面3 个因素:
          1. 两个顶点之间的路径数
          2. 两个顶点之间路径的长度
          3. 两个顶点之间的路径经过的顶点
        3. 基于随机游走的PersonalRank算法

第三章 推荐系统冷启动问题

  1. 用户冷启动
  2. 物品冷启动
  3. 系统冷启动

  1. 提供非个性化的推荐:非个性化推荐的最简单例子就是热门排行榜,我们可以给用户推荐热门排行榜,然后等到用户数据收集到一定的时候,再切换为个性化推荐。
  2. 利用用户注册时提供的年龄、性别等数据做粗粒度的个性化。
    1. 用户的注册信息分3种:
    2. 人口统计学信息:包括用户的年龄、性别、职业、民族、学历和居住地。
    3. 用户兴趣的描述:有一些网站会让用户用文字描述他们的兴趣。
    4. 从其他网站导入的用户站外行为数据:比如用户通过豆瓣、新浪微博的账号登录,就可以在得到用户同意的情况下获取用户在豆瓣或者新浪微博的一些行为数据和社交网络数据。
    5. 基于注册信息的个性化推荐流程基本如下:
    6. (1) 获取用户的注册信息;
    7. (2) 根据用户的注册信息对用户分类;
    8. (3) 给用户推荐他所属分类中用户喜欢的物品。
  3. 利用用户的社交网络账号登录(需要用户授权),导入用户在社交网站上的好友信息,然后给用户推荐其好友喜欢的物品。
  4. 要求用户在登录时对一些物品进行反馈,收集用户对这些物品的兴趣信息,然后给用户推荐那些和这些物品相似的物品。
    1. 启动物品的特点:比较热门、具有代表性和区分性、启动物品集合要有多样性
    2. 决策树
      在这里插入图片描述
  5. 对于新加入的物品,可以利用内容信息,将它们推荐给喜欢过和它们相似的物品的用户。
    在这里插入图片描述
    1. 话题模型LDA(物品的话题分布相似度:KL散度)
  6. 在系统冷启动时,可以引入专家的知识,通过一定的高效方式迅速建立起物品的相关度表。

第四章 利用用户标签数据

在这里插入图片描述

  1. 标签:特征表现方式
  2. 根据给物品打标签的人的不同,标签应用一般分为两种
    1. 一种是让作者或者专家给物品打标签
    2. 另一种是让普通用户给物品打标签,也就是UGC( User Generated Content,用户生成的内容)的标签应用。
  3. UGC
    1. 标签系统中的推荐问题主要有以下两个。
    2. 如何利用用户打标签的行为为其推荐物品(基于标签的推荐)?
    3. 如何在用户给物品打标签时为其推荐适合该物品的标签(标签推荐)?
  4. 标签扩展(标签相似度)
    1. 话题模型
    2. 基于邻域的方法
      在这里插入图片描述
  5. 标签清理
    1. 有的标签不反应用户兴趣
    2. 有的标签是同义词
    3. 将标签作为推荐解释
    4. 方法
      1. 去除词频很高的停止词
      2. 去除因词根不同造成的同义词
      3. 去除因分隔符造成的同义词
  6. 基于图的推荐算法
    1. 节点:用户、物品、标签
    2. SimpleTagGraph
    3. PersonalRank
  7. 给用户推荐标签
    1. 方便用户输入
    2. 提高数据质量(同义词)
    3. 推荐的标签:热门标签,该物品常用,该用户常用
    4. 对新用户/新物品
      1. 抽取关键词作为标签
      2. 扩展标签(见上)
    5. 基于图的标签推荐算法

第五章 利用上下文信息

  1. 时间
    1. 用户历史兴趣变化
    2. 物品生命周期
    3. 季节效应
    4. 节日效应
    5. 推荐算法的时间多样性
      1. 实时推荐系统
      2. 在生成推荐结果时加入一定的随机性
      3. 对较久远的行为降权
      4. 随机应用不同的推荐算法
      5. 最近最热门
      6. ItemCF算法(数学衰减函数)
      7. UserCF算法(相似兴趣用户的最近行为)
      8. 时间段图模型(路径融合算法)
  2. 地点
    1. 基于位置的服务LBS
    2. (明尼苏达大学)LARS位置感知推荐系统
      1. 物品/用户:有无空间属性
      2. 用户有地理位置——金字塔模型:树,ItemCF。每一层训练推荐模型,叠加
      3. 物品有地理位置——TravelPenalty
  3. 心情

第六章 利用社交网络数据

  1. 社会化推荐
    1. 增加推荐的信任度
    2. 解决冷启动问题
  2. 社交图谱/兴趣图谱
  3. 双向确认的社交网络数据/单向关注的社交网络数据/基于社区的社交网络数据
  4. 基于邻域的社会化推荐算法
    1. 用户之间的熟悉程度(共同好友比例)
    2. 用户之间的兴趣相似度
  5. friendship/membership(同一社区)
  6. 时效问题——解决方案:做截断(只用相似度最高的N个好友、只用1个月的行为等)、重新设计数据库(Twitter的消息队列,每次更新都把所有人的写一遍)
  7. 评测:用户调查和在线实验(AB Test)
  8. 信息流推荐(Facebook的EdgeRank)
  9. 给用户推荐好友:链路预测link prediction
    1. 基于内容的匹配
    2. 基于共同兴趣的好友
    3. 基于社交网络图的好友推荐
  10. 随机图
  11. 中心度

第七章 推荐系统实例

外围架构
在这里插入图片描述

按照前面数据的规模和是否需要实时存取,不同的行为数据将被存储在不同的媒介中。一般来说,需要实时存取的数据存储在数据库和缓存中,而大规模的非实时地存取数据存储在分布式文件系统(如HDFS)中。

  1. 推荐系统架构
    1. 生成用户特征(人口统计学特征、行为特征、话题特征(历史行为→话题模型))
    2. 根据特征找到物品
      在这里插入图片描述
  2. 推荐引擎架构
    在这里插入图片描述
    1. 生成用户特征向量
      1. 特征和特征的权重
      2. 用户行为的种类(代价反映的偏爱)
      3. 用户行为产生的时间
      4. 用户行为的次数
      5. 物品的热门程度
    2. 生成用户推荐物品列表
    3. 过滤(用户已经产生过行为物品、候选物品以外的物品、某些质量很差的物品(用户评分))
    4. 排名
      1. 新颖性排名(内容相似度矩阵)
      2. 多样性(内容、属性上的)
      3. 时间多样性(实时性)
      4. 用户反馈(点击模型)

第八章 评分预测问题

  1. 前:TopN推荐
  2. 按时间划分数据集
  3. 评分预测算法
    1. 平均值
      1. 全局平均值
      2. 用户评分平均值
      3. 物品评分平均值
      4. 用户分类对物品分类的平均值
      5. 分类: 用户和物品的平均分, 用户活跃度和物品流行度
    2. 基于邻域的方法
    3. 隐语义模型与矩阵分解模型: 如何通过降维的方法将评分矩阵补全
      1. SVD分解
      2. Funk-SVD/LFM
      3. 加入偏置项后的LFM
      4. 考虑邻域影响的LFM
    4. 加入时间信息
      1. 基于邻域的模型融合时间信息
      2. 基于矩阵分解的模型融合时间信息
    5. 模型融合
      1. 模型级联融合
      2. 模型加权融合

其他来源的相关参考资料

豆瓣书评

  1. 新一代推荐系统包含三个子模块
    1. 前台的展示页面
    2. 后台的日志系统
    3. 推荐算法系统
  2. 社交网站的API接口:好友行为

知乎

  1. 入门推荐系统,你不应该错过的知识清单 - 第四范式 先荐的文章 - 知乎
  2. 推荐系统入门要点哪些技能树? - 知乎

CSDN

  1. 《推荐系统实践》项亮 书中程序实现
  2. 推荐系统案例

博客园

  1. 协同滤波 Collaborative filtering 《推荐系统实践》 第二章

豆瓣用户整理的附录和参考资料

附上Reference 中的干货 (Paper,Blog等资料的链接)

http://en.wikipedia.org/wiki/Information_overload
P1

http://www.readwriteweb.com/archives/recommender_systems.php
(A Guide to Recommender System) P4

http://en.wikipedia.org/wiki/Cross-selling
(Cross Selling) P6

http://blog.kiwitobes.com/?p=58 , http://stanford2009.wikispaces.com/
(课程:Data Mining and E-Business: The Social Data Revolution) P7

http://thesearchstrategy.com/ebooks/an%20introduction%20to%20search%20engines%20and%20web%20navigation.pdf
(An Introduction to Search Engines and Web Navigation) p7

http://www.netflixprize.com/
p8

http://cdn-0.nflximg.com/us/pdf/Consumer_Press_Kit.pdf
p9

http://stuyresearch.googlecode.com/hg-history/c5aa9d65d48c787fd72dcd0ba3016938312102bd/blake/resources/p293-davidson.pdf
(The Youtube video recommendation system) p9

http://www.slideshare.net/plamere/music-recommendation-and-discovery
( PPT: Music Recommendation and Discovery) p12

http://www.facebook.com/instantpersonalization/
P13

http://about.digg.com/blog/digg-recommendation-engine-updates
(Digg Recommendation Engine Updates) P16

http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en//pubs/archive/36955.pdf
(The Learning Behind Gmail Priority Inbox)p17

http://www.grouplens.org/papers/pdf/mcnee-chi06-acc.pdf
(Accurate is not always good: How Accuracy Metrics have hurt Recommender Systems) P20

http://www-users.cs.umn.edu/~mcnee/mcnee-cscw2006.pdf
(Don’t Look Stupid: Avoiding Pitfalls when Recommending Research Papers)P23

http://www.sigkdd.org/explorations/issues/9-2-2007-12/7-Netflix-2.pdf
(Major componets of the gravity recommender system) P25

http://cacm.acm.org/blogs/blog-cacm/22925-what-is-a-good-recommendation-algorithm/fulltext
(What is a Good Recomendation Algorithm?) P26

http://research.microsoft.com/pubs/115396/evaluationmetrics.tr.pdf
(Evaluation Recommendation Systems) P27

http://mtg.upf.edu/static/media/PhD_ocelma.pdf
(Music Recommendation and Discovery in the Long Tail) P29

http://ir.ii.uam.es/divers2011/
(Internation Workshop on Novelty and Diversity in Recommender Systems) p29

http://www.cs.ucl.ac.uk/fileadmin/UCL-CS/research/Research_Notes/RN_11_21.pdf
(Auralist: Introducing Serendipity into Music Recommendation ) P30

http://www.springerlink.com/content/978-3-540-78196-7/#section=239197&page=1&locus=21
(Metrics for evaluating the serendipity of recommendation lists) P30

http://dare.uva.nl/document/131544
(The effects of transparency on trust in and acceptance of a content-based art recommender) P31

http://brettb.net/project/papers/2007%20Trust-aware%20recommender%20systems.pdf
(Trust-aware recommender systems) P31

http://recsys.acm.org/2011/pdfs/RobustTutorial.pdf
(Tutorial on robutness of recommender system) P32

http://youtube-global.blogspot.com/2009/09/five-stars-dominate-ratings.html
(Five Stars Dominate Ratings) P37

http://www.informatik.uni-freiburg.de/~cziegler/BX/
(Book-Crossing Dataset) P38

http://www.dtic.upf.edu/~ocelma/MusicRecommendationDataset/lastfm-1K.html
(Lastfm Dataset) P39

http://mmdays.com/2008/11/22/power_law_1/
(浅谈网络世界的Power Law现象) P39

http://www.grouplens.org/node/73/
(MovieLens Dataset) P42

http://research.microsoft.com/pubs/69656/tr-98-12.pdf
(Empirical Analysis of Predictive Algorithms for Collaborative Filtering) P49

http://vimeo.com/1242909
(Digg Vedio) P50

http://glaros.dtc.umn.edu/gkhome/fetch/papers/itemrsCIKM01.pdf
(Evaluation of Item-Based Top-N Recommendation Algorithms) P58

http://www.cs.umd.edu/~samir/498/Amazon-Recommendations.pdf
(Amazon.com Recommendations Item-to-Item Collaborative Filtering) P59

http://glinden.blogspot.com/2006/03/early-amazon-similarities.html
(Greg Linden Blog) P63

http://www.hpl.hp.com/techreports/2008/HPL-2008-48R1.pdf
(One-Class Collaborative Filtering) P67

http://en.wikipedia.org/wiki/Stochastic_gradient_descent
(Stochastic Gradient Descent) P68

http://www.ideal.ece.utexas.edu/seminar/LatentFactorModels.pdf
(Latent Factor Models for Web Recommender Systems) P70

http://en.wikipedia.org/wiki/Bipartite_graph
(Bipatite Graph) P73

http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=4072747&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D4072747
(Random-Walk Computation of Similarities between Nodes of a Graph with Application to Collaborative Recommendation) P74

http://www-cs-students.stanford.edu/~taherh/papers/topic-sensitive-pagerank.pdf
(Topic Sensitive Pagerank) P74

http://www.stanford.edu/dept/ICME/docs/thesis/Li-2009.pdf
(FAST ALGORITHMS FOR SPARSE MATRIX INVERSE COMPUTATIONS) P77

https://www.aaai.org/ojs/index.php/aimagazine/article/view/1292
(LIFESTYLE FINDER: Intelligent User Profiling Using Large-Scale Demographic Data) P80

http://research.yahoo.com/files/wsdm266m-golbandi.pdf
( adaptive bootstrapping of recommender systems using decision trees) P87

http://en.wikipedia.org/wiki/Vector_space_model
(Vector Space Model) P90

http://tunedit.org/challenge/VLNetChallenge
(冷启动问题的比赛) P92

http://www.cs.princeton.edu/~blei/papers/BleiNgJordan2003.pdf
(Latent Dirichlet Allocation) P92

http://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence
(Kullback–Leibler divergence) P93

http://www.pandora.com/about/mgp
(About The Music Genome Project) P94

http://en.wikipedia.org/wiki/List_of_Music_Genome_Project_attributes
(Pandora Music Genome Project Attributes) P94

http://www.jinni.com/movie-genome.html
(Jinni Movie Genome) P94

http://www.shilad.com/papers/tagsplanations_iui2009.pdf
(Tagsplanations: Explaining Recommendations Using Tags) P96

http://en.wikipedia.org/wiki/Tag_(metadata)
(Tag Wikipedia) P96

http://www.shilad.com/shilads_thesis.pdf
(Nurturing Tagging Communities) P100

http://www.stanford.edu/~morganya/research/chi2007-tagging.pdf
(Why We Tag: Motivations for Annotation in Mobile and Online Media ) P100

http://www.google.com/url?sa=t&rct=j&q=delicious%20dataset%20dai-larbor&source=web&cd=1&ved=0CFIQFjAA&url=http%3A%2F%2Fwww.dai-labor.de%2Fen%2Fcompetence_centers%2Firml%2Fdatasets%2F&ei=1R4JUKyFOKu0iQfKvazzCQ&usg=AFQjCNGuVzzKIKi3K2YFybxrCNxbtKqS4A&cad=rjt
(Delicious Dataset) P101

http://research.microsoft.com/pubs/73692/yihgoca-www06.pdf
(Finding Advertising Keywords on Web Pages) P118

http://www.kde.cs.uni-kassel.de/ws/rsdc08/
(基于标签的推荐系统比赛) P119

http://delab.csd.auth.gr/papers/recsys.pdf
(Tag recommendations based on tensor dimensionality reduction)P119

http://www.l3s.de/web/upload/documents/1/recSys09.pdf
(latent dirichlet allocation for tag recommendation) P119

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.94.5271&rep=rep1&type=pdf
(Folkrank: A ranking algorithm for folksonomies) P119

http://www.grouplens.org/system/files/tagommenders_numbered.pdf
(Tagommenders: Connecting Users to Items through Tags) P119

http://www.grouplens.org/system/files/group07-sen.pdf
(The Quest for Quality Tags) P120

http://2011.camrachallenge.com/
(Challenge on Context-aware Movie Recommendation) P123

http://bits.blogs.nytimes.com/2011/09/07/the-lifespan-of-a-link/
(The Lifespan of a link) P125

http://www0.cs.ucl.ac.uk/staff/l.capra/publications/lathia_sigir10.pdf
(Temporal Diversity in Recommender Systems) P129

http://staff.science.uva.nl/~kamps/ireval/papers/paper_14.pdf
(Evaluating Collaborative Filtering Over Time) P129

http://www.google.com/places/
(Hotpot) P139

http://www.readwriteweb.com/archives/google_launches_recommendation_engine_for_places.php
(Google Launches Hotpot, A Recommendation Engine for Places) P139

http://xavier.amatriain.net/pubs/GeolocatedRecommendations.pdf
(geolocated recommendations) P140

http://www.nytimes.com/interactive/2010/01/10/nyregion/20100110-netflix-map.html
(A Peek Into Netflix Queues) P141

http://www.cs.umd.edu/users/meesh/420/neighbor.pdf
(Distance Browsing in Spatial Databases1) P142

http://www.eng.auburn.edu/~weishinn/papers/MDM2010.pdf
(Efficient Evaluation of k-Range Nearest Neighbor Queries in Road Networks) P143

http://blog.nielsen.com/nielsenwire/consumer/global-advertising-consumers-trust-real-friends-and-virtual-strangers-the-most/
(Global Advertising: Consumers Trust Real Friends and Virtual Strangers the Most) P144

http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en//pubs/archive/36371.pdf
(Suggesting Friends Using the Implicit Social Graph) P145

http://blog.nielsen.com/nielsenwire/online_mobile/friends-frenemies-why-we-add-and-remove-facebook-friends/
(Friends & Frenemies: Why We Add and Remove Facebook Friends) P147

http://snap.stanford.edu/data/
(Stanford Large Network Dataset Collection) P149

http://www.dai-labor.de/camra2010/
(Workshop on Context-awareness in Retrieval and Recommendation) P151

http://www.comp.hkbu.edu.hk/~lichen/download/p245-yuan.pdf
(Factorization vs. Regularization: Fusing Heterogeneous
Social Relationships in Top-N Recommendation) P153

http://www.infoq.com/news/2009/06/Twitter-Architecture/
(Twitter, an Evolving Architecture) P154

http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=0CGQQFjAB&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.165.3679%26rep%3Drep1%26type%3Dpdf&ei=dIIJUMzEE8WviQf5tNjcCQ&usg=AFQjCNGw2bHXJ6MdYpksL66bhUE8krS41w&sig2=5EcEDhRe9S5SQNNojWk7_Q
(Recommendations in taste related domains) P155

http://www.ercim.eu/publication/ws-proceedings/DelNoe02/RashmiSinha.pdf
(Comparing Recommendations Made by Online Systems and Friends) P155

http://techcrunch.com/2010/04/22/facebook-edgerank/
(EdgeRank: The Secret Sauce That Makes Facebook’s News Feed Tick) P157

http://www.grouplens.org/system/files/p217-chen.pdf
(Speak Little and Well: Recommending Conversations in Online Social Streams) P158

http://blog.linkedin.com/2008/04/11/learn-more-abou-2/
(Learn more about “People You May Know”) P160

http://domino.watson.ibm.com/cambridge/research.nsf/58bac2a2a6b05a1285256b30005b3953/8186a48526821924852576b300537839/$FILE/TR%202009.09%20Make%20New%20Frends.pdf
(“Make New Friends, but Keep the Old” – Recommending People on Social Networking Sites) P164

http://www.google.com.hk/url?sa=t&rct=j&q=social+recommendation+using+prob&source=web&cd=2&ved=0CFcQFjAB&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.141.465%26rep%3Drep1%26type%3Dpdf&ei=LY0JUJ7OL9GPiAfe8ZzyCQ&usg=AFQjCNH-xTUWrs9hkxTA8si5fztAdDAEng
(SoRec: Social Recommendation Using Probabilistic Matrix) P165

http://olivier.chapelle.cc/pub/DBN_www2009.pdf
(A Dynamic Bayesian Network Click Model for Web Search Ranking) P177

http://www.google.com.hk/url?sa=t&rct=j&q=online+learning+from+click+data+spnsored+search&source=web&cd=1&ved=0CFkQFjAA&url=http%3A%2F%2Fwww.research.yahoo.net%2Ffiles%2Fp227-ciaramita.pdf&ei=HY8JUJW8CrGuiQfpx-XyCQ&usg=AFQjCNE_CYbEs8DVo84V-0VXs5FeqaJ5GQ&cad=rjt
(Online Learning from Click Data for Sponsored Search) P177

http://www.cs.cmu.edu/~deepay/mywww/papers/www08-interaction.pdf
(Contextual Advertising by Combining Relevance with Click Feedback) P177
http://tech.hulu.com/blog/2011/09/19/recommendation-system/
(Hulu 推荐系统架构) P178

http://mymediaproject.codeplex.com/
(MyMedia Project) P178

http://www.grouplens.org/papers/pdf/www10_sarwar.pdf
(item-based collaborative filtering recommendation algorithms) P185

http://www.stanford.edu/~koutrika/Readings/res/Default/billsus98learning.pdf
(Learning Collaborative Information Filters) P186

http://sifter.org/~simon/journal/20061211.html
(Simon Funk Blog:Funk SVD) P187

http://courses.ischool.berkeley.edu/i290-dm/s11/SECURE/a1-koren.pdf
(Factor in the Neighbors: Scalable and Accurate Collaborative Filtering) P190

http://nlpr-web.ia.ac.cn/2009papers/gjhy/gh26.pdf
(Time-dependent Models in Collaborative Filtering based Recommender System) P193

http://sydney.edu.au/engineering/it/~josiah/lemma/kdd-fp074-koren.pdf
(Collaborative filtering with temporal dynamics) P193

http://en.wikipedia.org/wiki/Least_squares
(Least Squares Wikipedia) P195

http://www.mimuw.edu.pl/~paterek/ap_kdd.pdf
(Improving regularized singular value decomposition for collaborative filtering) P195

http://public.research.att.com/~volinsky/netflix/kdd08koren.pdf
(Factorization Meets the Neighborhood: a Multifaceted
Collaborative Filtering Model) P195

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1063548.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Golang interface 接口的应用场景 使用细节

应用场景介绍 对初学者讲,理解接口的概念不算太难,难的是不知道什么时候使用接口,下面我例举几个应用场景: 1.说现在美国要制造轰炸机,武装直升机,专家只需把飞机需要的功能/规格定下来即可,然…

​“FTX 传奇曾经大佬 SBF 的审判:密友出庭指控,陪审团选择延长,听证会揭示 “

备受期待的 FTX 创始人 SBF 刑事审判开始,引发了检方和辩方之间关于他在加密货币交易所垮台中所扮演角色的冲突。美国助理检察官塞恩雷恩(ThaneRehn)将 SBF 描述为一位前雄心勃勃的人物,过着建立在欺骗基础上的奢华生活方式。 SBF 的律师马克科…

逻辑回归评分卡

文章目录 一、基础知识点(1)逻辑回归表达式(2)sigmoid函数的导数损失函数(Cross-entropy, 交叉熵损失函数)交叉熵求导准确率计算评估指标 二、导入库和数据集导入库读取数据 三、分析与训练四、模型评价ROC曲线KS值再做特征筛选生成报告 五、行为评分卡模型表现总结 一、基础知…

【数据结构】初探时间与空间复杂度:算法评估与优化的基础

🚩纸上得来终觉浅, 绝知此事要躬行。 🌟主页:June-Frost 🚀专栏:数据结构 🔥该文章主要了解算法的时间复杂度与空间复杂度等相关知识。 目录: 🌏 时间复杂度&#x1f52d…

基于自私羊群优化的BP神经网络(分类应用) - 附代码

基于自私羊群优化的BP神经网络(分类应用) - 附代码 文章目录 基于自私羊群优化的BP神经网络(分类应用) - 附代码1.鸢尾花iris数据介绍2.数据集整理3.自私羊群优化BP神经网络3.1 BP神经网络参数设置3.2 自私羊群算法应用 4.测试结果…

苹果手机怎么备份所有数据?2023年iPhone 15数据备份常用的3种方法!

当苹果手机需要进行刷机、恢复出厂设置、降级iOS系统等操作时,我们需要将自己的iPhone数据提前进行备份。 特别是在苹果发布新iOS系统时,总有一些小伙伴因为升降级系统,而导致了重要数据的丢失。 iPhone中储存着重要的照片、通讯录、文件等数…

STM32--人体红外感应开关

本文主要介绍基于STM32F103C8T6和人体红外感应开关实现的控制算法 简介 人体红外模块选用HC-SR501人体红外传感器,人体红外感应的主要器件为人体热释电红外传感器。人体都有恒定的体温,一般在36~37度,所以会发出特定波长的红外线&#xff0…

windows系统服务管理命令sc

sc可以用于管理系统服务、计划任务、系统日志等方面,是不可或缺的神器。 基本用法 在命令提示符下输入sc命令,然后按回车键。 上图展示的是sc命令的使用方法,支持哪些参数实现哪些功能 要查看系统所有服务列表,包括它们是否正在…

基于入侵杂草优化的BP神经网络(分类应用) - 附代码

基于入侵杂草优化的BP神经网络(分类应用) - 附代码 文章目录 基于入侵杂草优化的BP神经网络(分类应用) - 附代码1.鸢尾花iris数据介绍2.数据集整理3.入侵杂草优化BP神经网络3.1 BP神经网络参数设置3.2 入侵杂草算法应用 4.测试结果…

Mac版快速切换工具:One Switch中文 for mac

One Switch是一款功能强大、体验极简的Mac菜单栏工具,适合需要频繁切换系统设置和启动应用程序的用户使用。通过它,用户可以更方便地完成日常操作,提高工作效率。 快速访问工具:One Switch提供了一个便捷的菜单栏图标,…

1700*C. Number of Ways(贪心前缀和)

Problem - 466C - Codeforces Number of Ways - 洛谷 解析: 首先判断所有数总和是否能被三整除。 之后遍历前缀和数组,如果某个位置的前缀和等于sum/3,则记录。 某个位置前缀和等于sum/3*2则记录答案。 注意由于分成三份,所以同…

出去重复的列值(关键词:distinct)

MySQL从小白到总裁完整教程目录:https://blog.csdn.net/weixin_67859959/article/details/129334507?spm1001.2014.3001.5502 语法格式: select distinct 列名 from 表名; 案例:查询emp表中,员工的职位(job),并去重…

第八章 排序 五、快速排序

目录 一、算法思想 二、例子 三、代码实现 四、验证 五、算法效率分析 1、时间复杂度 ​编辑 2、空间复杂度 3、小结 4、优化思路 5、稳定性 六、总结 一、算法思想 首先,选取一个数作为序列的基准数,分别定义序列的第一个数和最后一个数为l…

Go Gin Gorm Casbin权限管理实现 - 1. Casbin概念介绍以及库使用

1. 核心概念 核心配置中含两部分模型配置以及策略配置,给出两个示范配置,在此基础上对实际请求进行分析。 1.1 Model 模型文件,存储了请求定义(request_definition),策略定义(policy_definition),匹配规则(matchers)&a…

黑豹程序员-架构师学习路线图-百科:AJAX

文章目录 1、什么是AJAX2、发展历史3、工作原理4、一句话概括 1、什么是AJAX Ajax即Asynchronous(呃森可乐思) Javascript And XML(异步JavaScript和XML) 在 2005年被Jesse James Garrett(杰西詹姆斯加勒特&#xff09…

Yolov5 ONNX导出报错: export failure: Unsupported ONNX opset version: 17

目录 1.问题描述 1.1 报错1 : 1.2 报错 2 2.解决方案 介绍 ONNX(Open Neural Network Exchange)是一个用于机器学习模型的开放式标准,它旨在使不同的深度学习框架能够将训练好的模型在不同平台上无缝运行。它是由Microsoft和F…

第二课 前缀和、差分、双指针扫描

文章目录 第二课 前缀和、差分、双指针扫描lc1.两数之和--简单题目描述代码展示 lc11.盛最多水的容器--中等题目描述代码展示 lc15.三数之和--中等题目描述代码展示 lc42.接雨水--困难题目描述代码展示 lc53.最大子数组和--中等题目描述代码展示 第二课 前缀和、差分、双指针扫…

基于goravel的CMS,企业官网通用golang后台管理系统

2023年9月11日10:47:00 仓库地址: https://gitee.com/open-php/zx-goravel-website 框架介绍 Goravel SCUI 后端开发组件 go 1.20 Goravel 1.13 数据库 sql(使用最新日期文件) goravel\doc\sql_bak mysql 8.0 前端开发组件 scui 1.6.9 node v14.21.3 效果图…

凉鞋的 Unity 笔记 106. 第二轮循环场景视图Sprite Renderer

106. 第二轮循环&场景视图&Sprite Renderer 从这一篇开始,我们开始进行第二轮循环。 这次我们至少能够在游戏运行窗口看到一些东西。 首先还是在场景层次窗口进行编辑,先创建一个 Sprite,操作如下: 创建后,会在 Scene …

【锁的区别】C++线程库和POSIX线程库锁的区别

C线程库和POSIX线程库锁的区别 C线程库代码段的互斥:mutex、recursive_mutex、timed_mutex、recursive_timed_mutex互斥量mutex:直接进行lock()或者unlock()递归互斥锁recursive_mutex:可以多次加锁,意味着加几次锁就需要解几次锁…