推荐系统召回之userCF

推荐系统召回之userCF

news2026/2/8 3:35:20

基于用户的协同过滤算法userCF
1.1 相似度计算
通过计算用户之间的相似度。这里的相似度指的是两个用户的兴趣相似度。

假设对于用户u uu和v vv，N ( u ) N(u)N(u)指的是用户u uu喜欢的物品集合，N ( v ) N(v)N(v)指的是用户v vv喜欢的物品集合，可以通过Jaccard公式计算u uu和v vv的相似度：
在这里插入图片描述

或者通过余弦相似度来计算：
在这里插入图片描述

这种方法需要计算两两用户之间的相似度，复杂度为O ( ∣ U ∣ 2 ) O(|U|^2)O(∣U∣
2
)，这种方法非常耗时，特别是大量的用户之间没有相关性时，即∣ N ( u ) ∣ ⋂ ∣ N ( v ) ∣ |N(u)|\bigcap|N(v)|∣N(u)∣⋂∣N(v)∣为0，对这些用户的计算是完全不需要的。因此，只需先判断∣ N ( u ) ∣ ⋂ ∣ N ( v ) ∣ |N(u)|\bigcap|N(v)|∣N(u)∣⋂∣N(v)∣是否为0，为0的用户之间计算相似度即可。
在这里插入图片描述

对于矩阵1.1，首先建立从物品到用户的二维倒排表，每一个物品都在表中占据一行。对于表的每一行，首个元素是一个物品，如果某用户u对该物品产生过行为，则将u加入到该行中。对于每一行的用户列表，里面的用户两两之间都存在着相似性。
在这里插入图片描述

然后，建立|U| X |U|的稀疏矩阵C，首先，初始化C的各个元素为0，

在这里插入图片描述

如果用户u和用户v同时在倒排表的k行中出现过，那么说明u和v共同对这k个物品产生过行为，遍历二维倒排表的每一行中的用户列表，对于其中的任意两个用户u和v，将C[u][v]和C[v][u]加1。这样，遍历完成之后，C[u][v]的值就等于：

在这里插入图片描述

可知，上述矩阵是一个对称矩阵。

1.2 topN推荐
在计算出了所有用户两两之间的相似度后，userCF算法会向用户推荐与它兴趣相近的k个用户最喜欢的物品，如下公式度量了用户u对物品i的感兴趣程度：
在这里插入图片描述

在这里插入图片描述

1.3 算法参数
参数k是UserCF算法的重要参数，它对推荐算法的各种指标都会产生一些列的影响：

精度（准确率和召回率）：准确率和召回率与参数k并不呈线性关系，但是选择合适的k对于获得推荐系统高的精度比较重要。

流行度：k越大，则UserCF推荐的物品就越热门。

覆盖率：k越大，流行度就越大，而覆盖率会相应地越小。

参考链接：
https://www.zybuluo.com/xtccc/note/200979

仅为笔记记录使用，侵删。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/449331.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

体验 Kubernetes Cluster API

体验 Kubernetes Cluster API

体验 Kubernetes Cluster API 什么是 Kubernetes Cluster API安装 Kind增加 ulimit 和 inotify创建 Kind 集群安装 clusterctl CLI 工具初始化管理集群创建一个工作负载集群访问工作负载集群部署一个 CNI 解决方案安装 MetalLB部署 nginx 示例清理(参考)capi-quickstart.yaml 文…

阅读更多...

C++的类和对象（2）

C++的类和对象（2）

类和对象 1.类对象模型1.1. 如何计算类对象的大小1.2. 类的存储模式讨论1.3. 类对象的空间符合结构体对齐规则 2. this指针2.1. this指针的引出2.2. this指针的特性2.3.面试题2.4. C语言和C实现栈的对比 1.类对象模型 1.1. 如何计算类对象的大小 class A { public: void Prin…

阅读更多...

类加载与卸载

类加载与卸载

加载过程其中验证,准备,解析合称链接加载通过类的完全限定名,查找此类字节码文件,利用字节码文件创建Class对象. 验证确保Class文件符合当前虚拟机的要求,不会危害到虚拟机自身安全. 准备进行内存分配,为static修饰的类变量分配内存,并设置初始值(0或null).不包含ﬁnal修饰…

阅读更多...

用python脚本从Cadence导出xdc约束文件

用python脚本从Cadence导出xdc约束文件

用python脚本从Cadence导出xdc约束文件概述转换方法先导出csv文件修改CSV文件 CSV转XDC检查输出XDC文件csv2xdc源代码下载概述在Cadence设计完成带有FPGA芯片的原理图的时候，往往需要将FPGA管脚和网络对应关系导入vivado设计软件中，对于大规模FPGA管…

阅读更多...

springboot+vue准妈妈孕期交流平台（源码+文档）

springboot+vue准妈妈孕期交流平台（源码+文档）

风定落花生，歌声逐流水，大家好我是风歌，混迹在java圈的辛苦码农。今天要和大家聊的是一款基于springboot的准妈妈孕期交流平台。项目源码以及部署相关请联系风歌，文末附上联系信息。 💕💕作者：…

阅读更多...

C++引用篇

C++引用篇

文章目录一、引用概念及示例二、引用做函数参数二、引用做函数的返回值四、常引用五、引用和指针的区别一、引用概念及示例 c语言指针存变量地址，然后通过解引用可以访问或者改变变量，且也可以改变指针变量里面存的地址修改变量这样还需要对指针变量…

阅读更多...

Faster RCNN系列3——RPN的真值详解与损失值计算

Faster RCNN系列3——RPN的真值详解与损失值计算

Faster RCNN系列： Faster RCNN系列1——Anchor生成过程 Faster RCNN系列2——RPN的真值与预测值概述 Faster RCNN系列3——RPN的真值详解与损失值计算 Faster RCNN系列4——生成Proposal与RoI Faster RCNN系列5——RoI Pooling与全连接层目录一、RPN真值详解二、…

阅读更多...

手把手教你实现el-table实现跨表格禁用选项，以及禁用选择后，对应的全选按钮也要禁用任何操作

手把手教你实现el-table实现跨表格禁用选项，以及禁用选择后，对应的全选按钮也要禁用任何操作

哈喽大家好啊今天我要实现不能跨表格选择，如果我选择了其中一个表格的选项后，那么其他的表格选项则被禁用然后我选择了其中一个表格行，我其他的表格选项则应该被禁用实现代码： 其中关键属性： selectable仅对 typ…

阅读更多...

如何保障企业网络安全

如何保障企业网络安全

随着信息技术的迅速发展，网络已经渗透到了我们生活的方方面面。企业对网络的依赖程度也越来越高，网络安全问题已经成为了企业面临的一个重要挑战。那么，在这个风险重重的网络世界里，我们如何充分利用现有技术保障企业网络安全呢&a…

阅读更多...

智能指针——C++

智能指针——C++

智能指针相较于普通指针的区别，就是智能指针可以不用主动释放内存空间，系统会自动释放，避免了内存泄漏。 1、unique_ptr：独占指针需包含的头文件：#include <memory> unique_ptr 三种定义方式先定义一个类 …

阅读更多...

learn_C_deep_5 (温故知新、sigend char a = -128的深度理解、unsigned int类型的写法规范）

learn_C_deep_5 (温故知新、sigend char a = -128的深度理解、unsigned int类型的写法规范）

目录温故知新理解"unsigned int a -10;" 如何理解大小端大小端的概念大小端是如何影响数据存储的 sigend char a -128的深度理解 10000000为什么是-128，而不是-0 代码练习 unsigned int类型的写法规范温故知新理解"unsigned int a…

阅读更多...

python数据结构与算法-动态规划(最长公共子序列)

python数据结构与算法-动态规划(最长公共子序列)

一、最长公共子序列问题 1、问题概念一个序列的子序列是在该序列中删去若干元素后得到的序列。例如："ABCD”和“BDF”都是“ABCDEFG”的子序列。最长公共子序列(LCS) 问题: 给定两个序列X和Y，求X和Y长度最大的公共子字列。例:X"ABBCBDE”…

阅读更多...

【ABAQUS Python二次开发】 debug : ini解析ERROR：没有实例属性‘__getintem__’

【ABAQUS Python二次开发】 debug : ini解析ERROR：没有实例属性‘getintem’

我的主页： 技术邻：小铭的ABAQUS学习的技术邻主页博客园 : HF_SO4的主页哔哩哔哩：小铭的ABAQUS学习的个人空间csdn：qgm1702 博客园文章链接： https://www.cnblogs.com/aksoam/p/17287136.html abaqus python 搭配ini…

阅读更多...

古埃及：金字塔

古埃及：金字塔

文章目录 I 建造金字塔1.1 切割巨石1.2 开凿巨石1.3 摞石1.4 大金字塔的入口呈三角形 see also I 建造金字塔在生活中，事实是正确的，如果理论解释不了现实，需要更正理论。 1.1 切割巨石建筑材料巨石的切割：把石英砂粘在了铜锯…

阅读更多...

记一次Macbook pro电池修复

记一次Macbook pro电池修复

记一次Macbook pro电池修复 mac版本 A1708 问题描述 Macbook更换新电池后，在项头栏中，没有显示电池图标，系统设置里面也找不到电池图标。这样开机还得连着电源线 ~ ^~ 原因分析： 有可能是电池排线坏了。解决方案&#xff1a…

阅读更多...

【C/C++】C++11 线程库重大历史意义

【C/C++】C++11 线程库重大历史意义

文章目录 C11 线程库重大意义【C11 中最重要的特性：就是对线程进行支持】API 比较C11 线程库APILinux/Win 系统线程库 API代码示例 Demo C11 线程库重大意义【C11 中最重要的特性：就是对线程进行支持】 C11 线程库解决了历史多线程跨平台问题&#xff0…

阅读更多...

C++语法（20）---- 模拟红黑树

C++语法（20）---- 模拟红黑树

C语法（19）---- 模拟AVL树_哈里沃克的博客-CSDN博客https://blog.csdn.net/m0_63488627/article/details/130229501?spm1001.2014.3001.5501 目录 1.红黑树介绍 2.模拟实现 1.枚举红黑颜色 2.节点的定义 3.树类框架 4.插入 5.检查 3.代码实现 1…

阅读更多...

【开发经验】spring事件监听机制关心的同步、异步、事务问题

【开发经验】spring事件监听机制关心的同步、异步、事务问题

文章目录 spring发布订阅示例同步核心源码分析如何配置异步事务问题观察者模式又称为发布订阅模式，定义为：对象间的一种一对多的依赖关系，当一个对象的状态发生改变时，所有依赖它的对象都得到通知并被自动更新。如下图所示&…

阅读更多...

【Go】六、并发编程

【Go】六、并发编程

文章目录并发编程1、并发介绍2、Goroutine3、runtime包 3、Channel3.1、channel相关信息 4、Goroutine池（❌）5、定时器6、select多路复用7、并发安全和锁8、Sync9、原子操作（atomic包） 并发编程 1、并发介绍 1、进程和线程 …

阅读更多...

心塞，被面试官在朋友圈吐槽了

心塞，被面试官在朋友圈吐槽了

前阵子一个后辈小学弟向我诉苦，说自己在参加某大厂测试的时候被面试官怼得哑口无言，场面让他一度十分尴尬。印象最深的就是下面几个问题： 自动化测试中，如何解决Case依赖？你们公司业务中，自动化和手工分…

阅读更多...

推荐文章

最新文章