论文笔记-WSDM2024-LLMRec

news2025/4/21 17:28:31

论文笔记-WSDM2024-LLMRec: Large Language Models with Graph Augmentation for Recommendation

  • LLMRec: 基于图增强的大模型推荐
  • 摘要
  • 1.引言
  • 2.前言
    • 2.1使用图嵌入推荐
    • 2.2使用辅助信息推荐
    • 2.3使用数据增强推荐
  • 3.方法
    • 3.1LLM作为隐式反馈增强器
    • 3.2基于LLM的辅助信息增强
      • 3.2.1用户画像与项目属性增强
      • 3.2.2辅助信息融合
    • 3.3使用去噪稳健机制训练
      • 3.3.1带噪声剪枝的增强优化
      • 3.3.2通过MAE增强语义特征
  • 4.实验
    • 4.1实验设置
    • 4.2模型性能
    • 4.3消融实验
    • 4.4超参数实验
  • 5.总结

LLMRec: 基于图增强的大模型推荐

论文: LLMRec: Large Language Models with Graph Augmentation for Recommendation
代码: LLMRec

摘要

以往的研究通过引入辅助信息来解决数据稀疏问题,但这种方法常常引发噪声、可用性差和低数据质量等问题,从而影响用户偏好的准确建模。

本文提出了一个名为LLMRec的新框架,基于LLM图增强策略提升推荐系统。LLMRec通过三种方式增强交互图:(i) 强化用户-项目交互边,(ii) 加深对项目节点属性的理解,以及 (iii) 从自然语言角度生成用户画像。此外,为确保增强数据的质量,本文还开发了一种去噪数据稳健化机制,包括噪声隐式反馈剪枝和基于MAE的特征增强技术,以优化增强数据并提高其可靠性。

1.引言

辅助信息的数据质量问题包括:i) 数据噪声:属性或特征可能与用户偏好缺乏直接相关性。ii) 数据异质性:每种信息都有独特的特征、结构和表示,忽略这种异质性会导致分布失衡。iii) 数据不完整性:项目可能有不完整的文本描述或缺少关键的属性。

本文旨在通过显式增强潜在用户-项目交互边以及改进用户/项目节点的辅助信息来克服这些挑战。首先,LLMRec利用LLMs从自然语言的角度预测用户-项目交互。与间接的ID嵌入相比,自然语言表示更直观地反映了用户偏好。其次,LLMs在大量现实世界知识上进行训练,可以理解用户偏好并提供有价值的补充信息。另外,LLMs的综合词库将嵌入统一到一个向量空间中,缩小了异质特征之间的差距,促进了编码器的计算。这样的整合防止了特征在不同向量空间中的分散,从而提供了更准确的结果。

其主要贡献可以概述如下:

  • LLMRec 是一项开创性工作,利用LLMs进行图增强,包括:i) 用户-项目交互边,ii) 项目节点属性,iii) 用户节点画像。

  • 所提出的 LLMRec 通过使 LLM 能够明确推理用户-项目交互模式,解决了隐式反馈信号稀缺的问题。

  • 通过用户/项目属性生成和去噪增强稳健机制(结合噪声反馈修剪和基于 MAE 的特征增强)解决了低质量辅助信息的问题。

2.前言

2.1使用图嵌入推荐

CF通过稀疏的隐式反馈 E + E^+ E+ 学习,旨在获取协同用户-物品对应的嵌入 E u ​ E_u​ Eu E i ​ E_i​ Ei,以进行推荐。部分推荐系统采用图神经网络(GNNs)来建模复杂的高阶用户-物品关系,将 E + E^+ E+ 视为稀疏交互图的边。因此,CF 过程可以分为两个阶段:二分图嵌入和用户-物品预测。优化协同图嵌入 E = { E u , E i } E = \{ E_u, E_i \} E={Eu,Ei} 的目标是最大化后验估计,形式化表示如下:
在这里插入图片描述
其中, p ( E ∣ E + ) p(E|E^+) p(EE+) 的目标是尽可能多地将 E + E^+ E+ 中的用户-物品关系编码到 E u ​ E_u​ Eu E i ​ E_i​ Ei 中,以实现准确的用户-物品预测。

2.2使用辅助信息推荐

为了解决数据稀疏性问题,许多研究引入了形式为节点特征 F F F 的辅助信息,将推荐器编码器 f Θ ​ f_\Theta​ fΘ 视为特征图。带有辅助信息 F F F f Θ f_\Theta fΘ 的学习过程被表述为最大化后验估计 p ( Θ ∣ F , E + ) p(\Theta|F, E^+) p(Θ∣F,E+)
在这里插入图片描述

2.3使用数据增强推荐

尽管将辅助信息引入推荐系统取得了显著进展,但低质量的辅助信息可能会削弱稀疏交互数据 E + E^+ E+ 的有效性。LLMRec 专注于用户-物品交互特征图的增强,这涉及到 LLM 增强的用户-物品交互边 E A ​ E_A​ EA 和 LLM 生成的节点特征 F A ​ F_A​ FA。增强交互特征图的优化目标为:
在这里插入图片描述

3.方法

LLMRec的框架如图1所示。
在这里插入图片描述

3.1LLM作为隐式反馈增强器

采用LLM作为知识感知采样器,从自然语言的角度对用户-物品(u-i)训练数据进行成对采样。具体而言,将每个用户的历史交互物品与辅助信息(如年份、类型)以及物品候选池 C u C_u Cu 输入到 LLM 中。然后,LLM从 C u ​ C_u​ Cu 中选择用户 u u u 可能交互的物品( i u + i^+_u iu+)或不太可能交互的物品( i u − i^-_u iu)。增强用户-物品交互边并将其纳入训练数据的过程可以形式化为:
在这里插入图片描述
其中, i u + , i u − ​ i^+_u, i^-_u​ iu+,iu 是 LLM 基于输入提示 P u U I ​​ P^{UI}_u​​ PuUI​​从候选集 C u ​ C_u​ Cu 中为用户 u u u 选择的 BPR 正负样本,增强数据集 E A ​ E_A​ EA 包含成对训练三元组 ( u , i u + , i u − ) (u, i^+_u, i^-_u) (u,iu+,iu)。文本的 u-i 增强提示 P u U I ​​ P^{UI}_u​​ PuUI​​ 包含不同的组成部分:i) 任务描述,ii) 历史交互,iii) 候选物品,以及 iv) 输出格式描述,如图 2(a) 所示。
在这里插入图片描述

3.2基于LLM的辅助信息增强

3.2.1用户画像与项目属性增强

LLM 基于辅助信息增强范式包括两个步骤:

  1. 用户/物品信息精炼。通过使用从数据集的交互和辅助信息中衍生的提示,使 LLM 生成不在数据集中的用户和物品属性。具体示例见图 2(b)©。

  2. LLM 增强的语义嵌入。增强后的用户和物品信息将被编码为特征,并作为推荐系统的输入。使用 LLM 作为编码器提供了高效且先进的语言理解能力,使得用户交互偏好画像化并消除物品属性的偏见。

形式上,基于 LLM 的辅助信息增强如下:
在这里插入图片描述
其中 f A , u , f A , i ∈ R d L L M ​ f_{A,u}, f_{A,i} \in \mathbb{R}^{d_{LLM}}​ fA,u,fA,iRdLLM 是经过 LLM 增强的用户/物品特征,具有 LLM 的隐藏维度 d L L M d_{LLM} dLLM。文本提示 P u U ​​ P^U_u​​ PuU​​ P i I ​​ P^I_i​​ PiI​​ 分别用于用户 u u u 和物品 i i i 的属性精炼。 A u ​ A_u​ Au A i ​ A_i​ Ai 表示生成的文本属性,这些属性将通过 LLM 的嵌入能力编码为特征 F A , u , F A , i ​ F_{A,u}, F_{A,i}​ FA,u,FA,i

3.2.2辅助信息融合

在获得用户/物品的增强辅助信息后,采用以下三个步骤融合信息:

  1. 增强语义投影。使用带 dropout 的线性层,不仅减少 LLM 增强的语义特征的维度,还将这些增强特征映射到它们自己的空间。

  2. 协同上下文注入。为了将高阶协同连接注入到增强特征中,LLMRec 使用轻量级的图神经网络作为编码器。

  3. 语义特征融合。将增强特征 F A ​ F_A​ FA 视为附加组成部分,而不是作为推荐系统的可学习向量的初始化。这允许使用缩放因子和归一化灵活调整 LLM 增强特征的影响。

形式上, F A ​ F_A​ FA 的融合表示为:
在这里插入图片描述
最终的预测表示 h u ​ h_u​ hu h i ​ h_i​ hi 位于 R 1 × d \mathbb{R}^{1 \times d} R1×d。用户画像为 A u ​ A_u​ Au,去偏见的物品属性为 A i ​ A_i​ Ai,原始的多模态辅助信息为 M M M。特征的具体类型为 f k ​ f_k​ fk。使用聚合权重 ω 1 ​ \omega_1​ ω1 L 2 ​ L_2​ L2 归一化来调整特征向量,以减轻分布差异,确保额外特征在推荐编码器中的有效性。

3.3使用去噪稳健机制训练

3.3.1带噪声剪枝的增强优化

本文使用并集 E ∪ E A ​ E \cup E_A​ EEA 训练推荐系统,通过增加监督信号来优化 BPR 损失,利用整合的 LLM 增强用户偏好来提升推荐系统的性能:
在这里插入图片描述
其中,正负样本对的预测分数通过最终表示 h h h 的内积获得,样本数量 ∣ E A ∣ |E_A| EA 由批量大小 B B B 和比率 ω 3 ​ \omega_3​ ω3 控制。权重衰减正则化 ∥ Θ ∥ 2 \|\Theta\|^2 ∥Θ2 ω 2 ​ \omega_2​ ω2 加权,以减轻过拟合。 σ ( ⋅ ) \sigma(\cdot) σ() 是激活函数 sigmoid,用于引入非线性。

为了增强增强数据的有效性,本文选择剔除不可靠的用户-项目交互噪声。具体来说,在每次迭代后,排序后丢弃最大的负值。这有助于优先考虑和强调相关的监督信号,同时减轻噪声的影响。形式上,带有噪声修剪的目标 L B P R ​ L_{BPR}​ LBPR 可以重写为:
在这里插入图片描述
其中,函数 SortAscend ( ⋅ ) [ 0 : N ] \text{SortAscend}(\cdot)[0:N] SortAscend()[0:N] 对值进行排序并选择前 N N N 个。保留的数量 N N N N = ( 1 − ω 4 ) ⋅ ∣ E ∪ E A ∣ N = (1 - \omega_4) \cdot |E \cup E_A| N=(1ω4)EEA 计算,其中 ω 4 ​ \omega_4​ ω4 是一个比率。该方法允许对损失样本进行控制性修剪,强调相关信号,同时减少噪声。这可以避免不可靠的梯度反向传播的影响,从而使优化过程更加稳定和有效。

3.3.2通过MAE增强语义特征

为了减轻噪声增强特征的影响,采用掩码自编码器MAE进行特征增强。形式上,选择一个节点子集 e ⊂ V e \subset V eV 并使用掩码标记 [MASK] 来掩盖它们的特征,表示为 f [ MASK ] f[\text{MASK}] f[MASK]。掩码操作可以表示为:
在这里插入图片描述
为了增强特征编码器,引入特征恢复损失 L F R ​ L_{FR}​ LFR,通过比较掩码属性矩阵与原始增强特征矩阵来实现,带有一个缩放因子 γ \gamma γ。恢复损失函数 L F R ​ L_{FR}​ LFR 定义为:
在这里插入图片描述
最终的优化目标是噪声修剪的 BPR 损失 L B P R ​ L_{BPR}​ LBPR 和特征恢复损失 L F R ​ L_{FR}​ LFR 的加权和。

4.实验

4.1实验设置

数据集:ML-10M和Netflix

基线:

  1. 一般CF方法:MFBPR,NGCF和LightGCN

  2. 带有辅助信息的方法:VBPR,MMGCN和GRCN

  3. 数据增强方法:LATTICE

  4. 自监督方法:CLCRec,MMSSL和MICRO

4.2模型性能

在这里插入图片描述
结论:

  1. LLMRec整体性能优越:LLMRec通过明确增强用户-物品交互边和提高辅助信息的质量,超越了基线模型。

  2. 辅助信息的有效性:辅助信息的整合显著增强了推荐系统的能力,MMSSL和MICRO的性能优于NGCF。

  3. 不准确的增强对模型的改进有限:LATTICE和MICRO,也利用辅助信息进行数据增强,但与LLMRec相比,改进有限。

  4. 相对于自监督学习方法的优势:MMSSL和MICRO的自监督模型在通过自监督信号解决稀疏性方面表现优异,然而并未超越LLMRec。

4.3消融实验

在这里插入图片描述
结论:

  1. w/o-u-i:禁用 LLM 增强的隐式反馈 E A ​ E_A​ EA 导致性能显著下降。这表明,LLMRec通过包含上下文知识增加了潜在的监督信号,从而更好地把握用户偏好。

  2. w/o-u:去除用户画像增强器导致性能下降,这表明增强的用户信息能够有效地利用历史交互和物品端知识来总结有用的用户偏好画像。

  3. w/o-u&i:去除用户和物品的增强辅助信息时,推荐准确性下降。这一发现表明,基于LLM的增强信息为推荐系统提供了有价值的增强数据,帮助获得高质量和信息丰富的表示。

  4. w/o-prune:去除噪声修剪导致性能下降。这表明去除噪声隐式反馈信号的过程有助于防止不正确的梯度下降。

  5. w/o-QC:当同时去除对隐式反馈和语义特征质量的限制时,性能受到影响。这表明,通过整合噪声修剪和语义特征增强,去噪数据鲁棒性机制带来了显著的好处。

4.4超参数实验

在这里插入图片描述
结论:

  1. 温度系数 τ \tau τ:温度系数 τ \tau τ 影响文本的随机性。较高的值(>1.0)增加多样性和创造性,而较低的值(<0.1)则导致更集中。如表 4 所示,增加 τ \tau τ 最初改善了大多数指标,但随后出现下降。

  2. Top-p 值 p p p:Top-p 采样根据由 top-p 参数 p p p 决定的阈值选择标记。较低的 p p p 值优先考虑可能的标记,而较高的值则鼓励多样性。较小的 p p p 值往往能产生更好的结果,可能是因为避免了未列出的候选选择。较高的 p p p 值则会因重复的 LLM 推理导致标记浪费。

  3. 候选项数量 C C C:使用 C C C 来限制基于 LLM 的推荐的物品候选项。表 5 显示 C = 10 C = 10 C=10 产生了最佳结果。较小的值限制了选择,而较大的值则增加了推荐的难度。

5.总结

本研究旨在设计增强LLM的模型,以应对稀疏的隐式反馈信号和低质量辅助信息的挑战,通过分析用户互动偏好和去偏见商品属性来实现。为了确保增强数据的质量,引入了一种去噪增强鲁棒性机制。LLMRec 的有效性得到了理论分析和实验结果的支持,展示了其在基准数据集上优于最先进推荐技术的优势。未来的研究方向包括将因果推理整合到侧信息去偏见中,以及探索上下文感知用户偏好的反事实因素。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2301595.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算四个锚点TOA定位中GDOP的详细步骤和MATLAB例程

该MATLAB代码演示了在三维空间中,使用四个锚点的TOA(到达时间)定位技术计算几何精度衰减因子(GDOP)的过程。如需帮助,或有导航、定位滤波相关的代码定制需求,请联系作者 文章目录 DOP计算原理MATLAB例程运行结果示例关键点说明扩展方向另有文章: 多锚点Wi-Fi定位和基站…

Lookup Join显著增强,Paimon1.0版本如何做的?

Hi&#xff0c;大家好&#xff0c;我们又满血复活了。 2025年开年更新频率不快&#xff0c;一方面是大模型如火如荼&#xff0c;也一直在补相关知识&#xff1b;另外一方面&#xff0c;新的一年里身体健康被我摆到了第一位&#xff0c;不会像前几年那么卷了。 后续我们的更新会…

Vue前端开发-Vant组件之Button组件

Vant 有丰富的UI组件&#xff0c;而基础组件是全部组件的核心&#xff0c;基础组件中将常用的元素做了二次的开发&#xff0c;封装成Vant格式组件&#xff0c;如按钮、图片和布局等&#xff0c;这些封装后的Vant组件&#xff0c;提供了更多面向实际应用的属性和事件&#xff0c…

DeepSeek 接入PyCharm实现AI编程!(支持本地部署DeepSeek及官方DeepSeek接入)

前言 在当今数字化时代&#xff0c;AI编程助手已成为提升开发效率的利器。DeepSeek作为一款强大的AI模型&#xff0c;凭借其出色的性能和开源免费的优势&#xff0c;成为许多开发者的首选。今天&#xff0c;就让我们一起探索如何将DeepSeek接入PyCharm&#xff0c;实现高效、智…

【Linux网络编程】应用层协议HTTP(请求方法,状态码,重定向,cookie,session)

&#x1f381;个人主页&#xff1a;我们的五年 &#x1f50d;系列专栏&#xff1a;Linux网络编程 &#x1f337;追光的人&#xff0c;终会万丈光芒 &#x1f389;欢迎大家点赞&#x1f44d;评论&#x1f4dd;收藏⭐文章 ​ Linux网络编程笔记&#xff1a; https://blog.cs…

健康养生:从生活细节开启活力之旅

在忙碌的现代生活里&#xff0c;健康养生不再是一个抽象概念&#xff0c;而是关乎生活质量的关键。其实&#xff0c;只要掌握日常养生要点&#xff0c;就能轻松开启活力满满的健康生活。 饮食是健康的基石。每日饮食需遵循 “彩虹原则”&#xff0c;摄入多种颜色食物。早餐时&…

DeepSeek + Mermaid编辑器——常规绘图

下面这张图出自&#xff1a;由清华大学出品的 《DeepSeek&#xff1a;从入门到精通》。 作为纯文本生成模型&#xff0c;DeepSeek虽不具备多媒体内容生成接口&#xff0c;但其开放式架构允许通过API接口与图像合成引擎、数据可视化工具等第三方系统进行协同工作&#xff0c;最终…

【拥抱AI】GPT Researcher的诞生

一、GPT Researcher 研究过程总结 GPT Researcher 是一个开源的自主智能体&#xff0c;旨在通过利用人工智能技术实现高效、全面且客观的在线研究。它通过一系列创新的设计和优化&#xff0c;解决了传统研究工具&#xff08;如 AutoGPT&#xff09;中存在的问题&#xff0c;如…

Redis7——基础篇(三)

前言&#xff1a;此篇文章系本人学习过程中记录下来的笔记&#xff0c;里面难免会有不少欠缺的地方&#xff0c;诚心期待大家多多给予指教。 基础篇&#xff1a; Redis&#xff08;一&#xff09;Redis&#xff08;二&#xff09; 接上期内容&#xff1a;上期完成了Redis的基本…

MySQL登录问题总结

不管何种数据库&#xff0c;使用的第一步都是先登录。 MySQL命令行登录语句&#xff1a;mysql -u username -P port -p -D database_name 登录MySQL的报错一般从报错信息都能得到反馈&#xff0c;常见报错原因分析如下&#xff0c;实例中的以test用户为例&#xff0c;登录环境为…

Redis 持久化:从零到掌握

Redis 作为一款广泛使用的内存数据库&#xff0c;虽然核心功能是基于内存提供高性能的数据存取&#xff0c;但在实际应用中&#xff0c;数据的持久化是不可忽视的。毕竟&#xff0c;内存中的数据一旦出现故障或重启&#xff0c;就会面临数据丢失的风险。因此&#xff0c;Redis …

Mybatis MyBatis框架的缓存 一级缓存

1. 缓存的概念 缓存的概念 在内存中临时存储数据&#xff0c;速度快&#xff0c;可以减少数据库的访问次数。经常需要查询&#xff0c;不经常修改的数据&#xff0c;不是特别重要的数据都适合于存储到缓存中。 2.Mybatis缓存 mybatis包含了一个非常强大的查询缓存特性&#…

第1章大型互联网公司的基础架构——1.6 RPC服务

你可能在1.1节的引言中注意到业务服务层包括HTTP服务和RPC服务&#xff0c;两者的定位不一样。一般来说&#xff0c;一个业务场景的核心逻辑都是在RPC服务中实现的&#xff0c;强调的是服务于后台系统内部&#xff0c;所谓的“微服务”主要指的就是RPC服务&#xff1b;而HTTP服…

idea-gradle打包运行配置

最近接触了一个项目&#xff0c;使用gradle做为构建工具&#xff0c;这里记录一波&#xff0c;毕竟平时使用的都是maven idea 配置 这里有个坑&#xff0c;Gradle Wrapper&#xff0c;配置的地址gradle下载超时 这个配置修改成阿里的 第一张 第二张 第二张配置的jvm貌似没啥用…

(新版本onenet)stm32+esp8266/01s mqtt连接onenet上报温湿度和远程控制(含小程序)

物联网实践教程&#xff1a;微信小程序结合OneNET平台MQTT实现STM32单片机远程智能控制 远程上报和接收数据——汇总 前言 之前在学校获得了一个新玩意&#xff1a;ESP-01sWIFI模块&#xff0c;去搜了一下这个小东西很有玩点&#xff0c;远程控制LED啥的&#xff0c;然后我就想…

一键部署开源DeepSeek并集成到钉钉

一键部署开源DeepSeek并集成到钉钉 简介&#xff1a; DeepSeek发布了两款先进AI模型V3和R1&#xff0c;分别适用于对话AI、内容生成及推理任务。由于官方API流量限制&#xff0c;阿里云推出了私有化部署方案&#xff0c;无需编写代码即可完成部署&#xff0c;并通过计算巢AppF…

【爬虫基础】第一部分 网络通讯 P1/3

前言 1.知识点碎片化&#xff1a;每个网站实现的技术相似但是有区别&#xff0c;要求我们根据不同的网站使用不同的应对手段。主要是常用的一些网站爬取技术。 2.学习难度&#xff1a;入门比web简单&#xff0c;但后期难度要比web难&#xff0c;在于爬虫工程师与网站开发及运维…

车载音频配置(二)

目录 OEM 自定义的车载音频上下文 动态音频区配置 向前兼容性 Android 14 车载音频配置 在 Android 14 中,AAOS 引入了 OEM 插件服务,使你可以更主动地管理由车载音频服务监督的音频行为。 随着新的插件服务的引入,车载音频配置文件中添加了以下更改: • OEM 自定义的车…

级联选择器多选动态加载

一.级联展示 注&#xff1a;因为级联选择器这里是动态加载&#xff0c;因此如果上来选中一级就需要加载出后面三级的全部数据&#xff0c;依然会很卡&#xff0c;因此&#xff0c;和产品协商把一二级多选框去掉了&#xff0c;这样也避免了你选择一级不能实现子级被全部选中的问…

华为动态路由-OSPF-骨干区

华为动态路由-OSPF-骨干区 一、OSPF简介 1、OSPF概述 OSPF是一种开放式的、基于链路状态的内部网关协议&#xff08;IGP&#xff09;&#xff0c;用于在自治系统内部进行路由选择和通信。 OSPF是互联网工程任务组&#xff08;IETF&#xff09;定义的标准之一&#xff0c;被广…