论文浅尝 | Knowledge Graph Contrastive Learning for Recommendation

news2024/10/1 5:25:28

9683babe32956c14ca0e268bb19c4a4a.png

笔记整理:刘尧锟,天津大学硕士

链接:https://arxiv.org/pdf/2205.00976.pdf

动机

知识图谱已被用作有用的辅助信息来提高推荐质量。在这些推荐系统中,知识图谱信息通常包含丰富的事实和项目之间的内在语义相关性。然而,此类方法的成功依赖于高质量的知识图谱,并且可能无法学习质量表示,面临两个挑战:i)实体的长尾分布导致 KG 增强项目表示的监督信号稀疏;ii) 现实世界的知识图谱通常是嘈杂的,并且包含项目和实体之间与主题无关的连接。这种 KG 的稀疏性和噪声使得 item-entity 依赖关系偏离了反映它们的真实特征,这显着放大了噪声效应,阻碍了用户偏好的准确表示。为了填补这一研究空白,我们设计了一个通用的知识图对比学习框架(KGCL),以减轻知识图增强推荐系统的信息噪声。在三个公共数据集上进行的大量实验证明了我们的 KGCL 始终优于最先进的技术。

亮点

KGCL的亮点主要包括:

(1)这项工作引入了在联合自我监督学习范式下将知识图学习与用户-项目交互建模相结合的思想,以提高鲁棒性并缓解推荐的数据噪声和稀疏问题;

(2)提出了一个通用的 KGCL,一个知识图引导的拓扑去噪框架,提供具有知识感知对比目标的跨视图自识别监督信号。我们还提供理论分析来证明综合学习目标带来的好处;

(3)对三个公共数据集进行了不同的实验,提出的 KGCL 在不同的设置中始终优于各种最先进的推荐方法。进一步的消融分析证明了我们关键组件的合理性。

概念及模型

MCCLK包括三个主要模块:1)关系感知知识聚合。设计了一个关系感知知识嵌入层,以反映知识图连接结构上的关系异质性;2)知识图谱增强。利用外部项目语义相关性来指导跨视图自监督信号的数据增强;3)知识引导的对比学习。将我们的知识图增强模式与图对比学习范式相结合,旨在提高基于图的协同过滤在模型准确性和鲁棒性方面的表示能力。 

模型整体框架如下:

3ef9e6a75bfd0c54d5d9c3da0df98663.png

l关系感知知识聚合

为了解决在知识图谱上手动设计路径生成的局限性,我们的 KGCL 将依赖实体和关系的上下文投影到具有参数化注意力矩阵的特定表示中。为此,我们在Gk 中的项目及其连接实体之间建立了消息聚合机制,用于基于异构注意力聚合器生成知识感知项目嵌入,如下所示 

dfd33167a34c052b58d174800215ff2a.png

此外,为了进一步增强实体-项目依赖关系的多关系语义表示空间,我们在关系感知知识聚合器和 TransE之间执行替代训练。 这种基于翻译的知识图嵌入的一般思想是使头部和关系嵌入和的总和与尾部表示一样接近。定义来表示嵌入向量之间的基于L1范数的相似性测量函数。基于翻译的优化损失基于翻译的优化损失 L:

6a41569d564c7aa13dea578dab3b577f.png

l知识图谱增强

在我们的 KGCL 框架中,我们建议通过实体方面的自我辨别生成不同的知识图结构视图,用于对比学习。特别是,我们在输入知识图谱上采用随机数据增强方案来生成两个相关的数据视图。然后,导出单个项目的知识图结构一致性,以反映项目对知识噪声扰动的不变性。为此,我们因此在知识图结构上设计了数据增强算子如下:

4c95a97ddb28fce1e8755eecc217796d.png

为了探索基于增强视图的每个项目的一致性属性,定义了项目i的知识图结构一致性ci与从不同视图编码的表示之间的一致性,如下:

60022881aae9d5136480fa1a0aafcb80.png

l知识引导的对比学习

利用基于图的协同过滤框架和关系感知知识聚合机制对用户和项目的表示进行编码。由于 LightGCN [11] 的有效性和轻量级架构,采用其消息传播策略对来自用户-项目交互的协作效果进行编码,如下所示:

04590fd6c6c6d71c9d05477c1cfc8c14.png

损失如下:

c5b020cda98421eb87e58e7abde6a3b5.png

4fb0be2c32b3815fe2c1e55bd6f62772.png

5a91f5b631ca751e92bfda9c6cf98dc5.png

理论分析

实验

作者采用了3个公开数据集进行实验,分别是:Yelp2018、 Amazon-Book和 MIND。首先是有效性实验,模型的评价指标为:recall 和ndcg。

4d4a68c9021ab8c22fc22321a28a4fa9.png

在所有指标方面,KGCL在三个数据集上始终优于所有baseline。

通过比较KGCL和两种变体来检查模型中主要组件对最终性能的贡献:

•w/o KGA:KGCL 的变体,在用户-项目交互图上没有知识引导的增强方案。相反,交互图的对比视图是通过随机边采样构建的,用于互信息估计。

•w/o KGC:我们从 KGCL 中删除知识图对比学习组件,并将从我们的关系感知知识聚合器编码的项目表示直接转发到基于图的 CF 框架中进行对比学习。

图3报告了两种变体和KGCL的结果。

2fff44753607aed4676fd2672f2b09cb.png

为了研究我们的 KGCL 在处理没有足够交互的用户方面的稳健性,我们遵循 [50] 中的类似设置来生成稀疏用户集,Yelp2018 和 Amazon-Book 的交互少于 20 次,而 MIND 数据的交互次数少于5。图 6 报告了稀疏用户的结果。

6a4708916e968f94285536d5384e5ad3.png

为了证明我们的 KGCL 在长尾项目推荐中的效果,我们将所有项目分成五个具有相同数量的项目(交互密度从第 0 组增加到第 4 组)。对不同的项目组进行单独的评估。结果如图5所示.

c4193cfdd69aea891c19a78ba07a881a.png

总结

在这项工作中,提出的 KGCL 框架在知识引导的对比学习范式下进行了探索知识图语义和缓解推荐的数据噪声问题的初步尝试。基于估计知识模糊项目对用户偏好学习的影响,进行 KG 感知数据增强以研究辅助自我监督信号。这项工作为知识感知推荐系统开辟了新的研究可能性。与各种最先进的方法相比,对几个真实世界数据集的广泛实验证明了 KGCL 的优越性。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

20389372bddf541073d9020785c99a41.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/95898.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python源码学习新手攻略

Python源码学习是许多编程初学者在学习Python过程中十分重要的一个必经步骤,不仅如此,一些有一定开发经验的程序员想要提升自身,也常常需要阅读并学习优秀核心技术栈的源码。那么我们应该如何开始Python源码学习呢?下面小编就来和…

自学Web前端开发学习讲解 – 入门篇

很多人都对web前端感兴趣,这一期主要聊关于如何入门学习Web前端开发的过程分享,此篇适合想入门初学者,大佬就不用看了。主要内容是以本人这一路自学web前端的一些经验和建议,学习哪些知识,以及如何正确的去学&#xff…

AI绘画火爆,到现在还只是冰山一角?AIGC掀起当代新艺术浪潮

前言: hello,大家好我是Dream。近日,各大社交平台掀起了一股“AI绘图”风潮,很多同学朋友纷纷在社交平台上晒出了属于自己的AI照片,一时间AI相关话题热度高涨。那对于AI绘画以及开启AI内容创作新时代的昆仑万维你究竟了…

东北大学2023分布式操作系统考试题目及答案

Note:答案仅供参考,自己所写,不是标准答案,若发现错误,请指正,谢谢! 文章目录考试题目参考答案考试题目 1、简述分布式系统的设计目标中开放性的特点有哪些? 、 、 、 、 、 、 、…

​燕东微科创板上市:市值276亿 亦庄国投与京东方是股东

雷递网 雷建平 12月16日北京燕东微电子股份有限公司(简称:“燕东微”,股票代码为:“688172”)今日在科创板上市,燕东微本次发行17986.5617万股,发行价21.98元,募资总额39.56亿元。燕…

关于hcaptcha (vm wasm ob)三合一

该文章主要提供交流学习使用,请勿利用其进行不当行为! 如本篇文章侵犯了贵公司的隐私,请联系我立刻删除! 如因滥用解密技术而产生的风险与本人无关! 1 Hcaptcha hCaptcha 旨在解决机器学习中最劳动密集型的问题&am…

毕业设计 - 基于 java web的网上花店销售系统设计与实现【源码+论文】

文章目录前言一、项目设计1. 模块设计数据流图功能模块2. 实现效果二、部分源码项目源码前言 今天学长向大家分享一个 毕业设计项目: 网上花店销售系统的设计与实现 一、项目设计 1. 模块设计 数据流图 功能模块 1、首页(主界面) 提供简洁美观的主界…

Jenkins+Kubernetes企业级DevOps容器云平台

一、Kubernetes在DevOps中的作用 1、DevOps DevOps假导所有新的功能特性可以像流动的水一样,迭代到用户的终端,而水是不能讲流的,为了保证水流的质量,我们就必须在水流动的途中治理,直到最终交付到用户的手中。 DevOps是一套方法论、一系列的原则和实践,其主要目标为帮…

【Robot Framework】发送GET和POST请求

做接口自动化时,经常要使用GET与POST请求,那么如何使用RF发送对应的请求呢? 一、安装RequestsLibrary pip install robotframework-requests安装以后,导入到对应的测试套件或测试用例中. 本次主要介绍通过RequestsLibrary来实现…

JavaEE - JVM八股文(JVM内存区域划分,典型面试题,JVM类加载机制)

文章目录1. JVM运行时数据区(内存区域划分)2. JVM类加载机制常见面试题1. JVM运行时数据区(内存区域划分) JVM运行时数据区域也叫内存布局,但需要注意的时它和Java内存模型(JMM)不同&#xff0…

使用PyTorch进行知识蒸馏的代码示例

随着机器学习模型的复杂性和能力不断增加。提高大型复杂模型在小数据集性能的一种有效技术是知识蒸馏,它包括训练一个更小、更有效的模型来模仿一个更大的“教师”模型的行为。 在本文中,我们将探索知识蒸馏的概念,以及如何在PyTorch中实现它…

计算机毕设Python+Vue校园舆情监控系统(程序+LW+部署)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

C#修改富文本框(RichTextBox)指定内容颜色

1.前言 最近给客户做了一个协议解包与组包的工具,以便于他们给终端客户或者集成商使用,让客户能够快速集成产品协议,降低客户集成工作量,产品协议是基于JT/T808,但是有增加了自己的一些特殊修改。 客户使用的是C#开发…

数据库原理及MySQL应用 | 并发控制

无论何时,只要有多个查询需要在同一时刻修改数据,都会产生并发控制问题,MySQL通过多版本并发控制和加锁实现并发控制。 多用户并发执行事务访问同一个数据库时,可能引发脏写、脏读、不可重复读、幻读等一致性问题。并发事务访问相同记录的情况&#xff0…

Golang 【basic_leaming】数组

阅读目录Array(数组)数组定义数组的初始化方法一方法二方法三数组的遍历数组是值类型多维数组二维数组的定义二维数组的遍历数组练习题1、请求出一个数组的和以及平均值 for-range2、请求出一个数组的最大值,并得到对应的下标3、从数组 [1, 3, 5, 7, 8] 中找出和为 …

探花交友_第10章_搭建后台系统(新版)

探花交友_第10章_搭建后台系统(新版) 文章目录探花交友_第10章_搭建后台系统(新版)1.1 概述1.2 API网关1.2.1 搭建网关依赖引导类跨域问题配置类配置文件测试1.2.2 配置鉴权管理器1.3 Nacos配置中心1.3.1 添加依赖1.3.2 添加boots…

33.数据统计

数据统计 后台系统首页中,显示各种统计数据,比如:累计用户数、新增用户数、登录次数等内容。 解决方案 数据库表分析 一、数据采集 需求: 1、探花系统将用户操作日志写入RabbitMQ 2、管理后台获取最新消息,构造日…

SpringBoot+微信小程序实现的云音乐小程序系统 附带详细运行指导视频

文章目录一、项目演示二、项目介绍三、项目运行截图四、主要代码一、项目演示 项目演示地址: 视频地址 二、项目介绍 项目描述:这是一个基于SpringBoot微信小程序框架开发的云音乐微信小程序系统。首先,这是一个前后端分离的项目&#xff…

C语言百日刷题第十五天

前言 今天是刷题第15天,放弃不难,但坚持一定很酷~ 再刷一套模拟题 C语言百日刷题第十五天前言一、选择题二、判断题三、多选题四、填空题五、分析程序题一、选择题 1.下列选项中,不属于开发一个C语言应用程序的具体实现步骤的是&#xf…

为什么网络应用程序是今年的主要攻击媒介之一

网络犯罪分子在绕过最新的网络应用程序防火墙方面的独创性正在将互联网应用程序变成今年增长最快的攻击媒介。面向公众的 Web 应用程序现在是渗透组织边界的最广泛使用的攻击媒介。 根据卡巴斯基全球应急响应团队最近的一份报告,始于 Web 应用程序的攻击从 2020 年…