笔记整理:吴飞跃,东南大学硕士,研究方向为推荐系统
链接:https://doi.org/10.1145/3539597.3570386
动机
在实际推荐场景中,用户和物品之间存在多种类型的交互行为,如在线购物平台上的点击、标记为喜欢和购买等。传统的推荐技术通常只关注用户和物品之间单一类型的行为建模,因此如何充分利用多种行为信息进行推荐对于现有系统具有重要意义,这在两个方面提出了需要探索的挑战:(1)利用用户的个性化偏好捕捉多行为依赖关系;(2)处理目标行为稀疏监督信号导致的推荐不足。本文旨在探索利用用户个性化偏好来捕捉多行为依赖关系以及处理目标行为稀疏监督信号引起的不足推荐两个方面所面临的挑战。
贡献
本文的主要贡献包括以下几个方面:
1、提出了一个新的推荐框架KMCLR(Knowledge Enhancement Multi-Behavior Contrastive Learning Recommendation),该框架包括两个对比学习任务和三个功能模块,通过将多行为信息和知识图谱信息相结合,增强用户层和物品层的表示,强调从不同角度对用户-物品信息进行建模,缓解目标行为数据稀疏的问题。
2、在KMCLR框架中,提出了两个对比学习任务和一个损失范式,可以更好地建模行为之间的粗粒度共性和用户之间的细粒度差异,以提高推荐性能。这是第一次将多行为对比学习和知识图谱对比学习联合引入推荐系统。
3、在三个真实数据集上进行了各种实验,结果显示KMCLR框架优于各种最先进的推荐方法。此外,还进行了消融实验,以更好地理解KMCLR的模型设计,证明其中关键组件的有效性。
方法
总体框架如图1所示,主要由三个模块组成,分别是多行为学习模块、知识增强模块以及联合学习模块,并提出了两种类型的对比学习任务来捕获多行为互动特征和物品层面的知识特征。多行为学习模块通过两个行为编码器捕获用户的历史互动行为,以学习用户的多行为特征表达。知识增强模块通过知识图谱编码器学习物品的知识图谱嵌入表示。联合学习模块通过提出的两种CL任务(行为对比学习任务和知识图谱对比学习任务)联合训练多行为学习模块和知识增强模块,以学习用户和物品的联合表示。
图1 总体框架图
1、多行为学习模块
在此模块中,用户的多行为互动图被输入到多行为编码器中。通过此编码器构建用户单行为表达。KMCLR根据目标行为与其他行为的对比损失优化用户-物品嵌入。此过程利用多行为信息增强用户级嵌入表达。
多行为学习模块通过两个行为编码器(行为编码器A和行为编码器B)分别学习用户的两个历史行为(行为A和行为B)的表达。然后,将行为编码器A的输出(行为A的用户表达)作为目标,行为编码器B的输出(行为B的用户表达)作为负例,通过对比学习任务优化模型。同样,我们也将行为编码器B的输出作为目标,行为编码器A的输出作为负例进行优化。
定义的自监督对比学习损失函数如上所示,其中, τ 是用于控制softmax曲线平滑度的参数, (∼) 是对之间的距离函数,代表正负例对之间的相似度。
通过这个过程,模型学会将两个行为中的用户表达拉近(如果这两个行为来自同一用户),而将不同用户的表达推远(如果这两个行为来自不同用户)。所以,该模块通过多个行为的信息学到了用户的个性化特征,增强了用户级的表达,缓解了单一行为数据的稀疏性问题,为后续的推荐提供了更加丰富的用户表达。
2、知识增强模块
知识图谱作为辅助信息输入到知识增强模块。KMCLR利用不同的图嵌入技术,关注KG中的理性和语义信息以获得不同的节点表达。基于每个图嵌入表达,从用户的角度提出一种项目评分评估方法,通过保留低噪声项目信息构建用户-项目嵌入。这些经过处理的数据将根据CL任务进一步用于优化项目级嵌入表达。
知识增强模块主要利用外部的知识图谱信息增强物品的表达。具体来说,该模块首先使用不同的图嵌入方法(如TransR)学习知识图谱中的实体和关系的表达。然后,基于这些表达,提出一种从用户的角度评价物品的方法,筛选出那些与用户偏好最相关的物品。
最后,该模块将筛选出的相关物品作为目标,将不相关物品作为负例,构建知识图谱对比学习任务,通过该任务优化用户和物品的表达。这个过程可以使表达学习到物品间的语义相关性与差异,增强物品级的特征表达。
和多行为学习模块类似,此类对比学习的损失函数定义如上。
3、联合学习模块
通过上述模块,以不同的方式获得了两种类型的用户-物品嵌入,一种使用多行为信息,另一种使用KG信息。这些从不同角度获得的嵌入包含着不同重点的信息,需要以合理的方式结合。因此,赋予一个结合权重α,并通过实验探索最佳结合结果。
在优化阶段,使用贝叶斯个性化排序(BPR)推荐损失作为主要任务损失来进一步优化参数:
其中 代表用户u的可见交互集合。
实验
表1 数据集概况
实验使用了三个真实世界的数据集,分别是Yelp、Tmall和Retail。
表2 性能表现对比
作者将KMCLR与不同的模型进行了对比。其中基于CF的方法有BPR、LightGCN、AutoRec和NGCF,知识感知推荐方法有KGAT、KGCL,多行为推荐方法有NMTR、MATN、MBGCN、KHGT、CML。
在和所有其他基线模型的对比中,KMCLR在所有数据集上均取得了最优的性能,验证了该模型的有效性。
总结
作者提出了KMCLR,一种新的基于知识增强的多行为对比学习推荐框架。具体来说,联合引入了多行为信息和知识图谱信息到推荐系统中,以增强用户行为方面和项目方面的信息,缓解目标行为数据稀疏性问题。此外,通过设计两种对比学习任务和联合训练方法,KMCLR可以从多角度学习个人偏好,考虑不同行为和视角之间的共性和差异。各种数据集上的大量实验结果证明了KMCLR与各种最先进方法的有效性。未来工作的一个有希望的方向是进一步探索一种有效的模型来解决引入额外信息所造成的噪声信号问题。
OpenKG
OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。
点击阅读原文,进入 OpenKG 网站。