论文浅尝 | KGE by Adaptive Limit Scoring Loss Using DWS

news2024/10/5 16:27:19

419411a4cfa8655ec4609c02e44d721c.png

笔记整理:陈磊,天津大学硕士

链接:https://ieeexplore.ieee.org/ielx7/6287639/7859429/08057770.pdf

动机

设计一个强大而有效的损失框架对于知识图嵌入模型区分正确和不正确的三元组至关重要。经典的基于边距的排名损失将正负三元组的分数限制为具有合适的边距。最近提出的基于限制的评分损失独立地限制了正负三元组分数的范围。然而,这些损失框架使用相等或固定的惩罚项来降低正负样本对的分数,这在优化上是不灵活的。如果三元组分数与最佳值相差甚远,则应予以强调。因此,论文提出了自适应极限评分损失Adaptive Limit Scoring Loss,它简单地重新加权每个三元组以突出优化差的三元组分数。论文将这个损失框架应用于几个知识图谱嵌入模型,如TransE、TransH和ComplEx。链接预测和三元组分类的实验结果表明,论文提出的方法已经达到了与技术水平相当的性能。

亮点

MCCF的亮点主要包括:

(1)论文提出了自适应极限评分损失,这有利于知识图谱嵌入具有灵活的优化和明确的正负三元组分离的特点;

(2)与最近的知识图谱嵌入负样本损失框架基于限制的评分损失和双限制评分损失相比,论文的方法不仅减少了需要调整的参数的数量,而且提高了性能;

(3)论文在WordNet和Freebase数据集上进行了链接预测和三元组分类任务的实验,结果表明论文提出的方法具有优越性,其性能与目前最先进的技术水平相当。

概念及模型

论文首先介绍了用于优化知识图谱嵌入模型的自适应极限评分损失。其次,论文根据圆心的定位方法引入不同的损失指标进行优化。

自适应极限评分损失

基于Double Limit Scoring Loss (Zhou et al., 2021)的工作,论文考虑通过允许每个三元组得分根据它当前的优化状态以自己的速度学习来增强优化的灵活性。然后,论文将自适应的惩罚项分别添加到正负三元组评分中。于是得到了损失函数LAS。

5ef5ca07ef196f7b3391ea9326233127.png

这其中αp和αn是非负权重因子。在训练过程中,当反向传播到Sp(或Sn)时,梯度将乘以αp(或αn)。当三元组得分与其最优值相差很大时,它应该获得一个大的权重因子,以便获得大梯度的有效更新.为此,论文以一种自适应的方式定义了αp和αn。

38a97fa41d71178268c2699c2943306f.png

总体而言,等式 (4) 中的自适应极限评分损失期望 Sp< μp 和 Sn > μn。论文通过推导决策边界进一步分析了μ和 μn的设置。在优化过程中,决策边界实现为

8abde4465ab5de05825696520d3aa686.png

再结合等式5,论文可以得到

aac5a74423c1e272d892d97027f914b8.png

其中 C = ((vp − μp )2 +(vn −μn)2) /4 。等式(6)表明决策边界是圆弧,如图 1b 所示。圆的中心在Sn = (vn +μn)/2 , Sp = (vp +μp )/2,半径等于√C。这里论文有四个超参数:μp和μn 来自方程(4),vp和vn来自方程(5)。定位圆心后,四个超参数可以减少到两个。

定位圆心

圆心是 (Sn, Sp) 的理想优化目标,圆弧是实际的决策边界。通常,论文期望 Sn 的得分较低,而 Sp的得分更高。然而,论文的模型训练是基于开放世界假设,即知识图谱只包含真实的事实,而未观察到的事实可能是错误的,也可能只是缺失,这意味着生成的负三元组可能是正确的,但它们不会出现在原始知识图中。因此,论文不希望 Sn 是无限的,而是一个有限的值。这里论文考虑两种选择:

恒定自适应极限评分损失(CAS):论文将圆的中心设置为常数 (0, μp +μn)。相应地,等式(5)中的两个超参数Vp,Vn可以设置为Vp = −μp,Vn =μn +2μp。等式(6)中的决策边界可以降级为:

cb95aa977dacefeffee37cd70a25a8b2.png

等式(7)中定义的决策边界旨在优化 Sp→ 0 和Sn→ μp +μn(实际上 (0, μp +μn) 无法达到,在等式 (4) 中论文限制 Sp≥ μp , Sn ≤ μn)。常数 (μp +μn) 的选择受到方程 (5) 中动态加权的取值范围的启发。当需要对模型嵌入进行优化时(即 Sp > μp , S nn ), 将 vp = -μp代入等式(5),可得正三元组动态权重范围αp> 2μp .同理,将 vn = μn+2μp代入式(5),论文可以得到相同范围的负三元组动态权重αn> 2μp

独立自适应极限评分损失(IAS):当模型嵌入处于不同状态时(例如图2中的 P1、P2 和 P3),它应该有不同的优化轨迹。论文期望找到每个独立嵌入状态的最佳轨迹。以图2中的点P1为例(假设其坐标为(Sn,Sp)),其对应的决策边界是最大的弧线(位于浅蓝色扇形区域),

e45f5fa9596a3eaec81c1e3e77059dd5.png

而圆的中心是PC1 (C1n , 0)。根据相似三角形△PC 1 P0 P′0 ∼△PC 1 P1 P′1 论文可以得到:

23edd812424c2b4d045ace7a44d32320.png

其中 Sn < μn, Sp > μp。结合等式(6)定义的圆心,等式(5)中的两个超参数vp ,v n可以通过设为vp = −μp, v n =μn + 2μp (μn − Sn)/ (Sp − μp)来消去。与LCAS相比,LIAS可以独立设置每个样本的圆心,获得独立的优化轨迹。

自适应极限评分通过添加自适应惩罚项来动态调整优化过程,进一步改善了双倍评分损失LSS。在模型训练的初期,正反三元组的分数离优化还很远,这时增加惩罚项的权重,获得较大的梯度。这有利于模型的早期快速收敛。在训练过程中,当成对的正负三元组的优化出现偏差时,如正三元组接近最优,而负三元组离要求还很远时,惩罚项会增加负三元组的权重,使负三元组能及时调整。除了对正负评分的单独限制外,带惩罚项的差异化步伐调整也可以缓解重叠问题,如图a和b中的T′:

08594d343800fff1be954fce563b100b.png

理论分析

实验

论文在实验中使用了两个流行的知识图谱FreeBase和WordNet的一些子集,包括来自 WordNet 的 WN18、WN18RR 和 WN11,以及来自 Freebase 的 FB15k、FB15K-237 和 FB13。这些子集的统计数据如下表所示。其中FB15k-237和 WN18RR分别是 FB15k 和 WN18 删除了逆向关系的子集。

25652907a7f7587b3c168f9301c4b9b6.png

首先链接预测任务在WN18 和 FB15K数据集上实验的评价指标为:Mean和Hits@10。其中“raw”和“filt”的设置是为了区分是否考虑正确知识图中存在的损坏三元组的影响。从下表中可以看到具有LAS(包括 CAS 和 IAS)损失的模型都有不同程度的改善。与结果已经很高的 WN18(hit@10 上的 95%)相比,FB15K 有了显着的改进。在 FB15K 上,结果(比较 Hit@10 的最佳结果)增加了 TransE 6.4%,TransH-SS 1.6% 和 ComplEx-SS 0.7%。

62e34ab60ba8be8105e0a9cb29ccc5dd.png

然后链接预测任务在WN18 和 FB15K数据集上实验的评价指标是MR, MRR, Hits@1, Hits@3 and Hits@10。从下表中,可以看到具有LAS损失的模型在所有指标上都优于相应的具有LR、LRS和LSS的模型。

4eabb597b9c491a7118f5c87bd15f341.png

最后三元组分类任务,通常由翻译模型测试,很少由非线性模型验证。因此,在这个实验中,论文只测试比较翻译模型的系列并使用了三个数据集:WN11、FB13和FB15K进行实验。从下图的实验结果可以看出,在 WN11 上,具有LAS的模型都可以达到 84% 的准确率。在 FB13 上,具有LAS的模型与以前的损失模型相当。在 FB15K 上,带有 LAS的模型与以前的模型相比有了显着的改进,并且TransH-CAS 的表现最好,在比较模型中达到了 91.6% 的准确率。

5217f73c0fd45c27d9ac86472f1d92fb.png

从下图a可以看出,LAS可以更快地收敛并达到更低的状态。这一现象证实了LAS有一个更明确的收敛目标,这促进了正负三元组的可分离性。从下图b可以看出,LIAS的权重变化比LCAS更敏感,两者的整体权重动态变化更接近。在实际应用中,论文建议先使用较简单的LCAS,而LIAS可能会带来一些更好的结果。

e5c3e3496a20b7f38f5a3ee3f155f860.png

总结

论文提出了一个新颖的自适应极限评分损失框架,用于学习知识图谱嵌入。其提议的自适应评分损失的关键思想是重新加权每个三元组并突出显示优化少的三元组分数。对于动态权重的设置,首先根据圆心的定位提出了恒定自适应和独立自适应的方法。然后将其损失框架应用于 TransE、TransH、ComplEx 和 RotatE 等多个知识图嵌入模型,并在 WordNet 和 Freebase 数据集上进行链接预测和三元组分类任务的实验。实验结果表明了论文提出的方法的优越性。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

78b8d5218327d4168f240aae723a4d2a.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/344149.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

极智AI | 算能SDK架构

欢迎关注我的公众号 [极智视界]&#xff0c;获取我的更多经验分享 大家好&#xff0c;我是极智视界&#xff0c;本文介绍一下 算能SDK架构。 邀您加入我的知识星球「极智视界」&#xff0c;星球内有超多好玩的项目实战源码下载&#xff0c;链接&#xff1a;https://t.zsxq.com…

华芯微特开发环境搭建-SWM34SVET6为例

SWM34S系列是cortex-M33&#xff0c;内核是arm-v8指令集&#xff0c;和其他cortex系列有差异&#xff0c;要新的工具版本支持&#xff08;jlink要升级到V9以上&#xff0c;keil要升级到5.32以上&#xff09;。 1.Keil要先安装5.36的版本&#xff0c;并取得版权&#xff08;5.3…

【MYSQL中级篇】数据库数据查询学习

&#x1f341;博主简介 &#x1f3c5;云计算领域优质创作者   &#x1f3c5;华为云开发者社区专家博主   &#x1f3c5;阿里云开发者社区专家博主 &#x1f48a;交流社区&#xff1a;运维交流社区 欢迎大家的加入&#xff01; 相关文章 文章名文章地址【MYSQL初级篇】入门…

网络安全-Kali更新源(APT)

网络安全-Kali更新源(APT&#xff09; 这篇东东很少内容 Kali是基于乌班图开发出来的 这个APT不是攻击的那个APT 这个APT和centos里面的YUM是一样的 下面是介绍的一些国内的APT包&#xff0c;我自己用的阿里云 通俗点怎么理解呢&#xff0c;你手机里面的应用市场&#xff0c;苹…

【闲聊】我用ChatGPT参加了大数据面试

用Chat GPT试了试面试题&#xff0c;回答得比较简单。 问&#xff1a;你可以以应聘者的身份参加一场大数据程序员面试吗 答&#xff1a;可以 &#xff0c;如果您符合面试要求&#xff0c;可以参加大数据程序员面试。 问&#xff1a;那么为什么你要投递大数据开发这个岗位 答&am…

数据结构总结

数据结构总结排序算法冒泡排序选择排序插入排序希尔排序堆排序快速排序算法归并排序计数排序基数排序树红黑树基本概念规则B树基础知识规则B树图回溯算法并查集拓扑排序其他算法KMP算法例题数组类求最大和子数组求子数组最大乘积删除重复链表元素十大排序算法参考 排序算法 冒…

16:00面试,16:09就出来了 ,问的实在是太...

从外包出来&#xff0c;没想到算法死在另一家厂子 自从加入这家公司&#xff0c;每天都在加班&#xff0c;钱倒是给的不少&#xff0c;所以也就忍了。没想到8月一纸通知&#xff0c;所有人不许加班&#xff0c;薪资直降30%&#xff0c;顿时有吃不起饭的赶脚。 好在有个兄弟内…

情人节快到了,我部署了一套情侣头像小程序,并过审了

最近在学习如何部署微信小程序&#xff0c;目的就是像拥有一个属于自己的小程序 之前做的是一个微信公众号&#xff0c;靠自然的流量虽然也开通了流量主&#xff0c;但是每天收益就是那0.0几的,所有寻思看能不能做一个小程序出来。不会写小程序的我&#xff0c;也只能用现成的…

IO流01_字节字符流、缓冲流、标准输入、输出流、打印流

文章目录①. IO流概述及分类②. 字节输入流 - FileInputStream③. 字节输出流 - FileOutputStream④. 字符输入流 - FileReader⑤. 字符输出流 - FileWriter⑥. 字节缓冲流 - Buffered⑦. 掌握 - 相关流习题操作⑧. 标准输入、输出流(了解)⑨. 打印流 - PrintStream、PrintWrit…

Retinanet网络与focal loss损失

1.损失函数 1&#xff09;原理 本文一个核心的贡献点就是 focal loss。总损失依然分为两部分&#xff0c;一部分是分类损失&#xff0c;一部分是回归损失。 在讲分类损失之前&#xff0c;我们来回顾一下二分类交叉熵损失 &#xff08;binary_cross_entropy&#xff09;。 计…

算法设计与分析(屈婉玲)视频笔记day2

序列求和的方法 数列求和公式 等差、等比数列与调和级数 求和的例子 二分检索算法 二分检索运行实例 2 n 1个输入 比较 t 次的输入个数 二分检索平均时间复杂度 估计和式上界的放大法 放大法的例子 估计和式渐近的界 估计和式渐近的界 小结 • 序列求和基本公式&#xff1a;…

使用 CSS 变量更改多个元素样式

使用 CSS 变量更改多个元素样式 var() 函数用于插入自定义的属性值&#xff0c;如果一个属性值在多处被使用&#xff0c;该方法就很有用。 custom-property-name 是必需的, 自定义属性的名称&#xff0c;必需以 – 开头。 value 可选。备用值&#xff0c;在属性不存在的时候使…

牛客网Python篇数据分析习题(六)

1.某公司计划举办一场运动会&#xff0c;现有运动会项目数据集items.csv。 包含以下字段&#xff1a; item_id&#xff1a;项目编号&#xff1b; item_name:项目名称&#xff1b; location:比赛场地。 有员工报名情况数据集signup.csv。包含以下字段&#xff1a; employee_id&a…

高性能(二)

三、读写分离和分库分表 1.读写分离 1.1 概述 将数据库的读写操作分散到不同的数据库节点上 通常一主多从一台主数据库负责写&#xff0c;多台从数据库负责读。 主库和从库之间会进行数据同步&#xff0c;以保证从库中数据的准确性。 1.2 问题及解决 1.2.1 问题 主从同…

ChatGPT眼中的产品经理是这样的

在玩ChatGPT的时候&#xff0c;突发奇想&#xff0c;ChatGPT对产品经理的认知是啥样呢&#xff1f;于是我找了几个大家都比较关注的产品经理问题&#xff0c;看看ChatGPT是如何回答的。1、产品经理可以干一辈子嘛&#xff1f;2、产品经理的核心竞争力是啥&#xff1f;3、产品经…

【本周特惠课程】深度学习6大模型部署场景(Pytorch+NCNN+MNN+Tengine+TensorRT+微信小程序)速成!...

前言欢迎大家关注有三AI的视频课程系列&#xff0c;我们的视频课程系列共分为5层境界&#xff0c;内容和学习路线图如下&#xff1a;第1层&#xff1a;掌握学习算法必要的预备知识&#xff0c;包括Python编程&#xff0c;深度学习基础&#xff0c;数据使用&#xff0c;框架使用…

操作系统——1.操作系统的概念、定义和目标

目录 1.概念 1.1 操作系统的种类 1.2电脑的组成 1.3电脑组成的介绍 1.4操作系统的概念&#xff08;定义&#xff09; 2.操作系统的功能和目标 2.1概述 2.2 操作系统作为系统资源的管理者 2.3 操作系统作为用户和计算机硬件间的接口 2.3.1用户接口的解释 2.3.2 GUI 2.3.3接…

代码随想录第十一天(459)

文章目录459. 重复的子字符串答案思路暴力破解移动匹配459. 重复的子字符串 也不知道为啥这个提示简单题…… 答案思路 暴力破解 例如&#xff1a;abcabc 移位一次&#xff1a;cabcab 移位两次&#xff1a;bcabca 移位三次&#xff1a;abcabc 现在字符串和原字符串匹配了…

搭建Vue版Ant Design Pro后台管理系统

搭建Vue版Ant Design Pro后台管理系统 此文章通过基于Vue实现的Ant DesignPro脚手架快速构建一个后台管理系统的前端 相关文档链接 1、【Ant Design Pro of Vue 官方文档】2、【Vue 官方文档】3、【Vue Router 官方文档】 Ant Design Pro相关系列文章&#xff1a; 一、AntDesig…

Ansible中常用的模块

目录 一、Ansible Ad-Hoc命令集 1 Ad-hoc 使用场景 2 Ansible的并发特性 3 Ansible-doc用法 4 ansible命令运行方式及常用参数 5 ansible的基本颜色代表 6 ansible中的常用模块 command模块 shell模块 script模块 copy模块 fetch模块 unarchive模块 archive模块…