【论文阅读】23_SIGIR_Disentangled Contrastive Collaborative Filtering(分离对比协同过滤)

news2025/1/23 1:03:05

【论文阅读】23_SIGIR_Disentangled Contrastive Collaborative Filtering(分离对比协同过滤)

文章目录

  • 【论文阅读】23_SIGIR_Disentangled Contrastive Collaborative Filtering(分离对比协同过滤)
    • 1. 来源
    • 2. 介绍
    • 3. 模型方法
      • 3.1 分解的意图表示
        • 3.1.1 建模潜在的意图因素
        • 3.1.2 具有全局上下文的多意图表示
      • 3.2 分离对比学习
        • 3.2.1 解纠缠数据增强
        • 3.2.2 对比学习
      • 3.3 模型分析
    • 4. 实验
      • 4.1 数据集
      • 4.2 评估指标和实验设置
      • 4.3 实验结果(大表)
    • 5. 总结

1. 来源

在这里插入图片描述

  • 2023—SIGIR
  • 论文地址
  • code 地址

2. 介绍

最近的研究表明,图神经网络(GNNs)普遍用于建模协同过滤(CF)。对于这一研究方向,图对比学习(GCL)通过学习增强的用户和项目表示,在解决监督标签短缺问题方面表现出了强大的性能。虽然其中许多显示了其有效性,但有两个关键问题仍未被探索:

  • i)大多数现有的基于gcl的CF模型仍然受到限制,因为忽略了用户-项目交互行为往往是由各种潜在意图因素(例如,购买家庭聚会、首选颜色或产品品牌);
  • ii)他们引入的非自适应增强技术容易受到噪声信息的影响,这引起了人们对模型的鲁棒性和合并误导性自我监督信号的风险的关注。

针对这些限制,作者提出了一个分离对比协同过滤框架(DCCF),以自适应的方式实现与自监督增强的意图解纠缠。通过全局背景学习分离表示,作者的DCCF不仅能够从纠缠的自监督信号中提取更细粒度的潜在因素,而且可以减轻增强诱导的噪声。最后,引入了交叉视图对比学习任务,利用参数化交互掩模生成器实现自适应增强。在各种公共数据集上的实验表明,作者的方法与现有的解决方案相比的优越性。

3. 模型方法

在这里插入图片描述

3.1 分解的意图表示

3.1.1 建模潜在的意图因素

在推荐场景中,作者将大小为 𝐼 的用户集 U = 𝑢1,…,𝑢𝑖,…,𝑢𝐼 和大小为 𝐽 的项目集 I = 𝑣1,…,𝑣𝑗,…,𝑣𝐽 之间的交互矩阵表示为 A \mathcal A A∈R𝐼×𝐽。如果用户 𝑢𝑖 以前采用了项目 𝑣𝑗,则 A𝑖𝑗∈A 设置为1,否则,A𝑖𝑗为0。模型旨在预测候选用户在其观察到的交互作用下采用一个项目的可能性。从概率的角度来看,作者的预测模型旨在估计用户 𝑢𝑖 和项目 𝑣𝑗 之间交互的条件概率 𝑃(𝑦|𝑢𝑖,𝑣𝑗),其中 𝑦 是学习的偏好得分。

当与物品互动时,用户通常会有不同的意图,比如对特定品牌的偏好或对电影的类型和演员的兴趣。为了捕获这些不同的意图,作者分别从用户端和项目端假设 𝐾 不同的意图 𝑐𝑢 和 𝑐𝑣。物品方面的意图也可以被理解为物品的上下文,例如,一个打算在情人节购物的用户可能会偏好那些具有“浪漫”上下文的物品。作者对用户-项目偏好的预测目标可以呈现如下:
在这里插入图片描述
用户-项目交互概率 𝑦 由潜在意图 𝑐𝑢 和 𝑐𝑣 决定,可以通过以下公式推导出:
在这里插入图片描述
在这里,作者使用 𝑓(·)来表示编码意图上的预测函数。根据统计理论,作者做了以下近似来推导出预测目标:
在这里插入图片描述
通过上述推断,近似误差,称为Jensen gap,可以在作者的预测函数𝑓(·)中很好地有界。

3.1.2 具有全局上下文的多意图表示

虽然意图多样性通过解纠缠表示被编码在现有的推荐系统中,但全局层面的意图感知协作关系在很大程度上被忽视了。全局级用户(项目)依赖建模可以通过不受直接本地连接限制的信息传播,增强基于GNN的消息传递模型对稀疏性和过平滑问题的鲁棒性。为此,作者建议通过本地和全局级别的嵌入来理清用户和项目之间的协作关系,以便进行信息传播。

  • 基于图的消息传递。由于图神经网络的强大力量,gnn已经成为在最先进的推荐系统中捕获协同滤波信号的普遍学习范式。例子包括LightGCN 、LR-GCCF 和HGCF 。这些研究所提供的见解启发了作者使用基于图的消息传递框架来构建DCCF模型。一般来说,作者的消息传播层由用户/项目嵌入矩阵 E ( u ) E^{(u)} E(u)∈R𝐼×𝑑 和 E ( v ) E^{(v)} E(v)∈R𝐽×𝑑 如下:
    在这里插入图片描述
    在这里插入图片描述
    为了利用高阶协同滤波信号,作者在不同的图层之间执行基于gnn的嵌入传播,例如从(𝑙−1)层到(𝑙)层,如下所示:
    在这里插入图片描述
    为了抑制过平滑效应,这里也引入了残差连接。

  • 意图感知的信息聚合。作者将描述如何将具有意图感知的全局用户(项目)依赖项合并到基于gnn的协作过滤框架中。在作者的多意图编码器中,解纠缠的用户-条目偏好保留在 E P ( c u ∣ u ) [ c u ] E_{P(c^u|u)}[c^u] EP(cuu)[cu] E P ( c v ∣ v ) [ c v ] E_{P(c^v|v)}[c^v] EP(cvv)[cv] 中。在作者的DCCF中,作者分别为用户和项目定义了 𝐾 全局意图原型 { c u k ∈ R d } k = 1 K \{c_u^k \in R^d\}_{k=1}^K {cukRd}k=1K { c v k ∈ R d } k = 1 K \{c_v^k \in R^d\}_{k=1}^K {cvkRd}k=1K。有了这些可学习的意图嵌入,作者通过使用第 𝑙 个图嵌入层的全局上下文聚合不同 𝐾 意图原型之间的信息来生成用户和项目表示,使用以下设计:
    在这里插入图片描述
    第 𝑙 层特定的用户和物品嵌入表示如下:
    在这里插入图片描述
    用户 𝑢𝑖 与每个意图原型 c𝑢 之间的相关性得分定义为 P ( c u k ∣ e i , j ( u ) ) P(c_u^k|e_{i,j}^{(u)}) P(cukei,j(u)),可以推导如下:
    在这里插入图片描述
    这里是 𝜂(·)=exp(·)。在生成传播的消息后,作者将局部协同滤波信号与全局解纠缠协同关系集成,对其进行细化,(6) 式变为:
    在这里插入图片描述
    在这个方程中, R l − 1 ( u ) ∈ R I × d R^{(u)}_{l-1} \in R^{I \times d} Rl1(u)RI×d R l − 1 ( v ) ∈ R J × d R^{(v)}_{l-1} \in R^{J \times d} Rl1(v)RJ×d 表示所有的用户意图嵌入和项目意图嵌入。将意图解纠缠后合并到图的神经结构中,使作者学习到的表示能够有效地解开了复杂的用户-项目交互行为的潜在因素。

3.2 分离对比学习

从对比学习的最新发展中得到启发,作者探索了对比增强的潜力,以解决推荐系统中的数据稀疏性问题。虽然自监督信号可以通过最大化对比视图之间的正对之间的一致性来产生,但作者认为这种增强容易受到数据噪声的影响,如错误点击。有噪声的对比正则化可能会误导自监督的学习过程。例如,通过有噪声交互边缘上的节点自识别来增强模型以实现嵌入一致性,可能涉及有噪声的自监督信号,导致次优表示。为了解决这一挑战,作者设计了可学习的增强器,它同时考虑本地协作关系和全局分离的用户(项)依赖关系。通过这样做,可学习的对比增强器可以自适应地学习解纠缠的SSL信号。

3.2.1 解纠缠数据增强

为了使数据增强能够适应每个连接跳,作者为每个GNN层引入了一个可学习的关系矩阵 G l ∈ R I × J \mathcal{G}^l \in R^{I \times J} GlRI×J 来编码用户和项目之间的隐式关系。受之前关于图去噪的工作的启发,作者的目标是生成一个图掩模 M l ∈ R I × J \mathcal{M}^l \in R^{I \times J} MlRI×J,它可以通过元素级乘法获得关系矩阵: G l = M l ⊙ A \mathcal{G}^l = \mathcal{M}^l ⊙ \mathcal A Gl=MlA

  • 学习图形掩码。图形掩码 M𝑙 中的每个条目 M l \mathcal{M}^l Ml𝑖𝑗∈[0,1]都反映了用户𝑖和项目𝑗之间的交互被掩码的程度。该值越接近0,交互作用的重要性就越小,反之亦然。在作者的DCCF模型中,作者基于用户 ( r i , l u ) (r^{u}_{i,l}) (ri,lu) 和项目 ( r i , l v ) (r^{v}_{i,l}) (ri,lv) 的分离嵌入,推导出了 M l \mathcal{M}^l Ml𝑖𝑗,以保持意图感知的交互模式。具体来说,作者使用节点嵌入之间的余弦相似度来衡量交互的重要性:
    在这里插入图片描述
    掩模值是通过将与[0,1]的相似性范围线性变换得到的,使用公式: M i , j l = ( s ( r i , l u , r j , l v ) + 1 ) / 2 \mathcal{M}^l_{i,j} = (s(r^{u}_{i,l}, r^{v}_{j,l}) + 1)/2 Mi,jl=(s(ri,lu,rj,lv)+1)/2

  • 可学习的增强。当用户 𝑖 和项目 𝑗 之间没有交互作用时,A𝑖𝑗为0。 G l \mathcal{G}^l Gl 是通过 M l \mathcal{M}^l Ml A \mathcal{A} A的元素级乘法得到的。为了计算简单,只计算观察到的交互作用的掩模值。利用学习到的关系矩阵,作者用节点的度将其归一化如下(为简单起见,省略了层索引):
    在这里插入图片描述
    为了将作者的自适应增强与消息传递方案相结合,作者将归一化学习关系矩阵 G ˉ l \bar{\mathcal{G}}^l Gˉl应用于节点的消息上进行可学习传播。通过这种设计,作者扰动图的结构,以生成对比学习视图与自适应增强。具有自适应掩蔽的增强可以正式表示如下:
    在这里插入图片描述
    为了生成多个对比视图,作者同时考虑了局部协作信号和全局解纠缠关系。特别地,作者在等式中使用两个可学习的掩模矩阵(Z𝑙(𝑢)和Z𝑙(𝑢)进行增强 等式5),以及在等式中具有意图分离的全局嵌入(R𝑙(𝑢)和R𝑙(𝑢) 等式7)。作者分别使用以下公式推导出两个掩模值 M l \mathcal{M}^l Ml𝑖𝑗: M i , j l = ( s ( r i , l u , r j , l v ) + 1 ) / 2 \mathcal{M}^l_{i,j} = (s(r^{u}_{i,l}, r^{v}_{j,l}) + 1)/2 Mi,jl=(s(ri,lu,rj,lv)+1)/2 M ′ i , j l = ( s ( z i , l u , z j , l v ) + 1 ) / 2 \mathcal{M'}^l_{i,j} = (s(z^{u}_{i,l}, z^{v}_{j,l}) + 1)/2 Mi,jl=(s(zi,lu,zj,lv)+1)/2。在此之后,作者的增强感知消息传递范式可以用以下嵌入细化细节来描述:
    在这里插入图片描述
    这里,H𝛽 和 H𝛾分别表示局部级和全局级的增广表示。类似地,项目嵌入也以类似的方式进行融合。

3.2.2 对比学习

使用上述增强表示视图,作者对用户和项目的不同视图嵌入进行对比学习。根据监督对比信号的方法,作者使用来自原始CF视图和每个增强视图的相同用户(项目)的嵌入来生成每个正对。不同节点的编码表示被视为负对。具体来说,作者使用增强器:

  • i)具有自适应增强的局部协作视图(H𝛽,(𝑢));
  • ii)分离的全局协作视图(R(𝑢));
  • iii)自适应增强视图(H𝛾,(𝑢))。

作者使用InfoNCE损失生成对比性的自我监督信号如下:
在这里插入图片描述
这里,m表示从GNN编码的嵌入(z∈Z(𝑢))的原始视图。n从三个增强嵌入数据之一(h𝛽∈H𝛽,𝑢),R(𝑢)和h𝛾∈H𝛾,(𝑢)中采样。余弦相似度函数用𝑠(·)表示。来自用户侧的对比性学习损失可以形式化如下:
在这里插入图片描述
通过叠加𝐿图神经层,特定层的嵌入跨不同的层聚合如下:E(𝑢)= ∑ \sum E(𝑢)𝑙和E(𝑣)= ∑ \sum E𝑙(𝑣)。用户项目偏好得分衍生为:
在这里插入图片描述
为了使用估计的偏好评分来优化经典的监督推荐任务,作者使用了以下贝叶斯个性化排名(BPR)损失:
在这里插入图片描述
其中 R 是每个小批中采样交互的集合。对于每个用户 𝑢𝑖,作者从训练数据中抽取𝑆 阳性项目(𝑝𝑠索引)和𝑆阴性项目(𝑛𝑠索引)。
最后,作者将自监督损失与经典推荐损失整合到多任务学习目标中,如下:
在这里插入图片描述
其中,𝜆1,𝜆2和𝜆3是可调的权重。Θ1={E(𝑢)0,E(𝑣)0} 和 Θ2 = {{c𝑘𝑢}𝐾𝑘=1,{c𝑘𝑣}𝐾𝑘=1}是作者的模型中可训练的参数。

3.3 模型分析

见原论文 3.3 节。

4. 实验

4.1 数据集

在这里插入图片描述

4.2 评估指标和实验设置

为了减轻负项目实例抽样的偏差,作者对所有项目遵循全秩协议来衡量作者的推荐结果的准确性。作者使用两个被广泛采用的基于排名的指标来评估所有方法的性能,即 Recall@N and NDCG (Normalized Discounted Cumulative Gain)@N:召回率@N和NDCG(标准化贴现累积增益)@N。
在这里插入图片描述

4.3 实验结果(大表)

在这里插入图片描述

5. 总结

本文提出了一种解纠缠对比学习方法,探讨了交互隐含意图的潜在因素。作者引入了一个图结构学习层,它基于学习的解纠缠用户(项目)意图感知依赖来实现自适应交互增强。沿着增强的意图感知图结构,作者提出了一种意图感知的对比学习方案,它带来了解纠缠自监督信号的好处。作者广泛的实验验证了作者提出的模型在不同的推荐数据集上的有效性。在未来的工作中,一个潜在的扩展是将解纠缠表示学习与因果分析相结合,以解决有噪声交互数据的偏差问题。此外,通过考虑用户特征的多样性,个性化增强可以进一步增强推荐者中定制图扰动操作的对比学习能力。通过根据特定的用户特征定制增强操作,作者可以更好地捕获个人偏好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/563884.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

最小生成树 Prim算法实现(c语言代码)

【问题描述】 城市之间的公路交通可以用一个无向图表示。如下图所示: 顶点表示城市、边表示城市之间有公路相连,边上的权值表示城市之间的公路长度。 编程解决以下问题: (1)输入城市信息和城市之间公路的信息&…

2023最新SRC漏洞挖掘快速上手攻略!

前言 随着网络安全的快速发展,黑客攻击的手段也越来越多样化,因此SRC漏洞挖掘作为一种新的网络安全技术,也在不断发展和完善。那么,作为一个网安小白如果想要入门SRC漏洞挖掘,需要掌握哪些知识呢?以下是本…

Vue3入门

前言 在Vue 3提供的丰富的基础配置和插件生态系统之下,它是一种适用于多场景开发的前端框架,包括web应用程序、移动应用和桌面应用。使用Vue 3,您可以快速高效构建出具有优秀用户体验的应用程序。 准备工作 首先,我们需要安装V…

运营-15.涉及促销活动的计算原则

1.是否 参与促销活动 如果商品参加促销活动,则在订单结算的时候显示已经参加的活动,否 则不显示; 2.是否 满足促销条件 如果有参加某个活动,则还要判断是否满足活动的条件,比如满200减 10,但是商品价格不足…

spring-cloud-alibaba-seata分布式事务实例

第一步: 首先访问: https://seata.io/zh-cn/blog/download.html 下载我们需要使用的seata1.6.0服务 第二步: 1.在你的参与全局事务的数据库中加入undo_log这张表 -- for AT mode you must to init this sql for you business database. the seata server not need it. CRE…

关于档案室十防环境监控的一些关键内容

档案库房十防监控系统 智慧档案平台/温湿度/空气质量/漏水/视频/门禁/一体化管控平台 HONSOR多维空间可视化智慧档案库房建设一体化平台分享 三维可视化智慧档案馆库房一体化环境安全管控系统平台【相关项目经验图片/相关系统拓展图】【鉴赏】 1、智慧档案馆 2、智慧档案库房…

从零开始之电机FOC控制

我们将撕开FOC神秘而虚伪的面纱,以说人话的方式讲述它。真正的做到从零开始,小白一看就会,一学就废。 如果觉得有用的话,就点个赞呗,纯手码。 一、什么是FOC? FOC是Field Orientation Control的缩写&#…

2023年,千万别裸辞....

作为IT行业的大热岗位——软件测试,只要你付出了,就会有回报。说它作为IT热门岗位之一是完全不虚的。可能很多人回说软件测试是吃青春饭的,但放眼望去,哪个工作不是这样的呢?会有哪家公司愿意养一些闲人呢?…

GaussDB云数据库SQL应用系列-基础使用

目录 一、前言 二、前提条件 1、连接数据库实例 2、GaussDB实例正常运行 三、操作示例 1、选择实例并进入SQL执行界面 2、创建数据库用户 3、创建数据库 4、创建SCHEMA 5、创建表(增删改查) 1)创建3张表,并初始化一些数…

Revit技巧 | 楼梯总画不好?原来是这些技巧你没有掌握

Revit技巧 | 楼梯总画不好?原来是这些技巧你没有掌握 楼梯在我们BIM考试中是重点和难点,根据我们对历年考考题的分析,楼梯部分涉及到的考点为: 栏杆扶手样式的设置; 楼梯踏步数的设置; 楼梯踏板宽度的设…

Adapt Learning使用教程(Adapt Framework/Adapt Authoring)(二)

此文章在上一章的环境配置下操作的,如果还没配置参考我的上一篇文章:Adapt Learning使用教程(Adapt Framework/Adapt Authoring)(一) 。环境配置好了之后,就该从GitHub上拉取代码啦&#xff0c…

如何入门Python——学习Python的指南针

✅作者简介:2022年博客新星 第八。热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏…

【JOSEF约瑟 应用于输配电路、变压器 JDP-1004双位置继电器 端子排】

名称:双位置继电器;品牌:JOSEF约瑟;型号:JDP-1440;触点容量:250V2A;功率消耗:≤5W;额定电压:220V/110V;外形尺寸:868573特…

LeetCode——矩阵中移动的最大次数

目录 1、题目 2、题目解读 3、代码 1、题目 2684. 矩阵中移动的最大次数 - 力扣(Leetcode) 给你一个下标从 0 开始、大小为 m x n 的矩阵 grid ,矩阵由若干 正 整数组成。 你可以从矩阵第一列中的 任一 单元格出发,按以下方式遍…

面了一个00后测试工程师,问啥啥不会开口就要15k,我也是麻了····

在深圳这家金融公司也待了几年,被别人面试过也面试过别人,大大小小的事情也见识不少,今天又是团面的一天, 一百多个人都聚集在一起,因为公司最近在谈项目出来面试就2个人,无奈又被叫到面试房间。 整个过程我…

一体化医学影像平台PACS源码,影像存档与传输系统源码

PACS影像存档与传输系统源码 PACS即影像存档与传输系统,是医学影像、数字化图像技术、计算机技术和网络通讯技术相结合的产物,是处理各种医学影像信息的采集、存储、报告、输出、管理、查询的计算机应用程序。 是基于DICOM标准的医学影像管理系统&…

分布式锁-Redis

一、为什么要有锁的概念 1.假如现在我们有这么一个场景: 用户在淘宝app上购买商品,用户提交订单的时候提交了,多点击了几次。 不管用户点击几次,只要用户一直停留在一个页面,那么就必须生成一个订单。 1.1 如果我们的服务是单体服务的话 比如现在我们的…

单片机中GPIO八种工作模式详细分析

今天给大家讲解一下 GPIO 基础,参考资料: STM32F1xx 官方资料: 《STM32中文参考手册V10》-第8章通用和复用功能IO(GPIO和AFIO) GPIO 是通用输入/输出端口的简称,是 STM32 可控制的引脚。GPIO 的引脚与外部硬件设备连接&#xff…

2023护网蓝初面试题汇总

一、描述外网打点的流程? 二、举几个 FOFA 在外网打点过程中的使用小技巧? 三、如何识别 CND ? 四、邮件钓鱼的准备工作有哪些? 五、判断出靶标的 CMS ,对外网打点有什么意义? 六、 Apache Log4j2…

云原生之深入解析Kubernetes常见的多集群方案

一、前言 Kubernetes 从 1.8 版本起就声称单集群最多可支持 5000 个节点和 15 万个 Pod,实际上应该很少有公司会部署如此庞大的一个单集群,很多情况下因为各种各样的原因我们可能会部署多个集群,但是又想将它们统一起来管理,这时…