笔记整理:俞洪涛,浙江大学硕士,研究方向为知识图谱表示学习
链接:https://dl.acm.org/doi/10.1145/3539597.3570483
动机
在基于知识图谱的推荐系统中,用户和项目的交互信息通常会在模型中占主导地位,而KG中的信息很少被编码到嵌入表示中。例如,在KGAT的模型中,在得到项目节点的表示时,用户节点所占的权重,通常远大于实体节点。此外KG中存在与推荐系统无关的信息,这提升了对信息做聚合的难度。
贡献
为了解决上面提到的这两个问题,文章使用了一个对比学习的loss,对比学习UI交互图中的item表示和KG图中item表示,通过两个视角的表示,来缓解KG中的信息被忽略的问题。此外,文章引入了两个可学习的视图生成器,以自适应地删除数据增强过程中与任务无关的边,并帮助解决由知识过载带来的噪声。
本文的贡献总结如下:
作者强调了基于KG的推荐的最先进方法范式中的两个关键局限因素,即交互支配和知识过载。
作者提出了一个名为KACL的新模型,该模型可以自动删除与任务无关的边,并对用户-项目交互视图和KG视图之间共享的信息进行编码,以获得高质量的节点表示。
作者在三个公共基准上的实验表明,与最先进的基线相比,KACL可以显著提高top-K推荐的性能。
方法
作者提出的方法的总体架构图如下图所示:
作者首先介绍了传统的基于GNN的推荐系统:
大多数基于KG的推荐系统的现有模型在图上进行分层消息聚合后,使用图神经网络(GNN)来学习每个节点的表示向量。首先使用一个单独的GAT层来得到节点的表示:
然后使用GCN层来更新节点的表示:
最后使用BPR loss更新模型参数:
之后作者介绍了知识自适应的对比学习,主要有三个主要部分组成:
(1)分别从交互和知识图中自适应生成视图;
(2)增强图上的用户/项目/实体的关系感知结构编码;
(3)对比学习任务,强制项目表示对两个视图共享的信息进行编码。
对于图结构上的自适应数据增强模块,为了充分探索有助于推荐的交叉视图信息,作者建议设计增强策略,该策略倾向于保持重要和推荐相关的边缘不变,同时干扰可能不重要的边缘。
在KG视图和用户交互图两个视角上,作者采用两种不同的方式来计算边的权重向量:
对于KG视图,采用relation-aware的方式:
对于用户交互图,不引入关系特征:
并最终计算得到扰动概率p:
在关系感知的图注意节点编码模块中,文中引入了三个GNN模块,获得节点的编码表示:GNNV1,GNNV2,和GNNrec。
其中GNNV1和GNNrec的是前面提到的传统GNN推荐系统。GNNV2针对知识图谱的异构性,引入了关系感知注意力机制,其中注意力公式入如下:
对比学习任务模块计算不同视角下的节点表示,计算对比学习Loss:
首先将在UI图空间中的 和 通过mlp,转到同一空间中,得到 ,再随机选择另一个节点,得到 ,计算对比学习Loss:
最终整个模型由推荐系统BPRloss,对比学习模块的loss和KG表示学习的loss组成:
实验
实验部分,作者在Amazon-Book,LastFM,Movielens三个知识图谱推荐数据集上进行了实验,并和多项baseline模型进行了对比,实验结果如下:
从实验结果中可以看到,论文提出的方法相比于已有模型取得了巨大的进步,同时,作者通过消融实验表明,对比学习模块、数据增强模块以及KG表示学习模块都对模型最终的结果有着明显的提升,其中,对比学习模块给模型带来的增益是最明显的。
总结
在本文中,作者提出了一种新的、紧凑的基于KG的推荐模型KACL,它超越了典型的基于CKG的范式的限制,采用了一种基于对比学习的新范式。作者采用了一个多任务学习框架,该框架可以通过用户-项目交互图视图和知识图视图之间的额外对比学习来补充经典的推荐损失。对比学习模块可以提取两个视图共享的信息,从而缓解交互支配和任务无关的噪声。还提出了自适应视图生成器来帮助去除数据扩充中与推荐无关的边缘。实验结果验证了KACL相对于所有先进模型的优势,并证明了每个提出的组件的有效性。
OpenKG
OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。
点击阅读原文,进入 OpenKG 网站。