A Novel Negative Sample Generating Method for KnowledgeGraph Embedding

news2025/4/18 9:42:13

摘要

为了有效地提取知识图中的关系和原因,将实体和关系编码到一个连续的低维语义空间中。在负样本生成阶段,大多数知识图嵌入方法更注重替换头或尾实体以提高训练效率,很少替换关系。这些负样本生成方法对关系预测的贡献不大。本文提出了一种新的负三重组生成方法。与仅替换TransE、TransH、TransR等实体的方法相比,本文提出的方法以适当的比例替换实体和关系。在WN18和FB15K等经典数据集上的实验结果表明,该方法在关系链路预测精度上明显优于原始方法,对实体链路预测影响较小。根据实验结果,我们还发现,随着关系替换概率比例的增加,关系链接预测能力增强,实体链接预测能力减弱。

2 Related Work

在TransG[18]中,负三元组不仅通过替换头或尾实体生成,而且通过将关系r替换为从关系集r中均匀抽样的随机关系生成,即

 

它们只是简单地用等概率替换实体和关系来生成负三元组,而忽略了实体和关系替换概率的比例对实体和关系预测性能的影响。

为了提高负训练样本的质量,Type-Constraints[9]采用了约束实体范围生成负样本的策略。受生成式对抗网络(generative adversarial networks, GANs)[7]的启发,KBGAN[5]采用一些知识嵌入模型作为生成器来构造质量更好的负样本。为了获得优异的训练效率,ComplEx[16]研究了正、负样本比例的影响。研究表明,每阳性样本产生更多的阴性样本可以获得更好的结果,每阳性样本产生50个阴性样本是准确性和训练时间之间的良好权衡。

在此工作中,我们将关系替换引入到负样本生成中,并为实体和关系设置不同的替换概率,以获得更好的实体和关系预测结果。

3 The Proposed Negative Samples Generating Method

在本节中,提出了一种新的生成负样本的方法来改进知识表示模型的训练过程。在本文提出的方法中,通过替换正三元组(h;r;t)∈S中的头部实体h、尾部t或关系r来生成负样本集S’,并且每次只替换每个观察三元组中的一个项目。如何设置关联概率和实体替换概率是本文研究的重点。我们分两步解决这个问题。首先,根据知识图中实体和关系的数量设置实体替换概率和关系替换概率,然后根据关系r的所有三元组中的两个统计量设置正尾部实体替换概率:1)每个头部实体的平均尾部实体数量,2)每个尾部实体的平均头部实体数量。详细描述如下。

在许多知识表示模型中,通常采用基于边际的分数函数,以负抽样作为训练目标:

与其他损失函数认为负例为假的假设不同,这个损失函数只是假设负例不如正例有效。它使消极的例子比积极的例子得分低。

在小批量模式下,可采用随机梯度下降法(SGD)对式(3)进行优化[14]。详细的培训程序如下。首先,所有实体和关系的嵌入向量从均匀分布随机初始化。接下来,在每次迭代中,对实体和关系的嵌入向量进行规范化。然后,从集合S中抽取一小部分正事实,对于每一个正事实,相应地生成一个负三元组。将正面事实和生成的负面事实作为小批量的训练样例。然后用恒学习率梯度下降法更新小批量中实体和关系的嵌入向量。

为了改进TransE、TransH和TransR等知识图嵌入方法的训练过程,我们通过用关系替换破坏三元组来扩展负例空间。因此我们的负三重集也可以用第2节中的公式(2)来描述。然后,提出了一种新的生成负三元组的方法,并将其应用于transse、TransH和TransR三种表示模型。受TransH方法的启发,我们对正三元组中的关系、头实体或尾实体设置了不同的替换概率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1546307.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

dubbo再回首

dubbo 服务框架, 远程通讯,集群容错,自动发现 spi: 接口全限定名找到指定目录下对应的文件,获取具体的实现类然后加载 增加缓存存储实例,对ioc api对支持 流程: 之前的博客实战总结&#xff1…

Linux之文件管理与重定向

文件的管理 最开始说到过, 一个进程是可以打开多个文件的并且可以对这些文件做出不同的操作, 也就是说加载到内存中的文件可能存在多个. 操作系统要不要管理这些打开的文件呢? 当我们在程序里面打开多个文件时, 操作系统肯定是得对这些文件进行管理的, 而管理的本质就是对数…

百度百科词条创建流程是怎样的?

百度百科词条,作为当今权威的知识分享平台之一,越来越多的个人和企业希望自己在百度百科上拥有独立的词条。如何创建一个高质量的百度百科词条呢?本文伯乐网络传媒将为您详细解析百度百科词条的创建流程及编辑技巧,并提供一些常见…

“数字化”持续走热,VR全景助力制造业上“云”

制造业要升级,数字化改造是重要途径。 早年间,由于对数字化的认识不足,一些企业明明有数字化改造需求,却不敢、不愿、不会上“云”。直到此次两会期间,2024年政府工作报告再次提出推动制造业数字化转型,越…

Learn OpenGL 25 法线贴图

为什么要引入法线贴图 我们的场景中已经充满了多边形物体,其中每个都可能由成百上千平坦的三角形组成。我们以向三角形上附加纹理的方式来增加额外细节,提升真实感,隐藏多边形几何体是由无数三角形组成的事实。纹理确有助益,然而…

SHA加密

天行健,君子以自强不息;地势坤,君子以厚德载物。 每个人都有惰性,但不断学习是好好生活的根本,共勉! 文章均为学习整理笔记,分享记录为主,如有错误请指正,共同学习进步。…

软件设计师19--文件管理

软件设计师19--文件管理 考点1:文件相关概念例题: 考点2:树形目录结构(绝对路径与相对路径)例题: 考点3:位示图例题: 考点4:索引文件索引文件结构例题: 考点1…

【Java并发知识总结 | 第五篇】深入理解Synchronized底层原理(Monitor对象、Synchronized锁优化)

文章目录 5.深入理解Synchronized底层原理(Monitor对象、Synchronized锁优化)5.1Synchronized的特性5.1.1原子性5.1.2可见性5.1.3有序性5.1.4可重入性 5.2Synchronized的用法5.3Synchronized的两种同步方式4.3.1同步代码块5.3.2同步方法 5.4Synchronized…

第九届蓝桥杯大赛个人赛省赛(软件类)真题C 语言 A 组-分数

solution1 直观上的分数处理 #include <iostream> using namespace std; int main() {printf("1048575/524288");return 0; }#include<stdio.h> #include<math.h> typedef long long ll; struct fraction{ll up, down; }; ll gcd(ll a, ll b){if…

后端常见面经之MySQL

MySQL字段类型 数值类型 整型经常被用到&#xff0c;比如 tinyint、int、bigint 。默认是有符号的&#xff0c;若只需存储无符号值&#xff0c;可增加 unsigned 属性。 int(M)中的 M 代表最大显示宽度&#xff0c;并不是说 int(1) 就不能存储数值10了&#xff0c;不管设定了显…

openssl AF_ALG引擎使用

cmd AF_ALG是Linux提供的一种虚拟接口&#xff0c;用于访问内核中的加密算法。在Linux中&#xff0c;可以使用AF_ALG接口配合加密算法框架&#xff08;Crypto API&#xff09;来进行加密操作。 以下是一个使用AF_ALG和openssl进行加密操作的例子&#xff1a; # 加密 openssl…

SpringBoot—@ConditionalOnBean与@ConditionalOnClass

一、ConditionalOnBean概念 需求场景 比如下面一种场景&#xff0c;我在实例化People对象的时候&#xff0c;需要注入一个City对象。这个时候问题来了&#xff0c;如果city没有实例化&#xff0c;那么下面就会报空指针或者直接报错。 所以这里需求很简单&#xff0c;就是当前c…

服务运营|香港大学雷骁:收益管理中价格歧视的公平性

编者按&#xff1a; INFORMS George B. Dantzig Dissertation Award 用于表彰运筹学和管理科学领域中具有创新性和实用性的最佳毕业设计。香港大学助理教授雷骁题为“Revenue Management in Video Games and With Fairness” 是这一奖项2023年度的提名者之一。 这篇毕业设计重…

利用AI技术预测未被充分监测的流域中的极端洪水事件笔记

利用人工智能&#xff08;AI&#xff09;技术预测未被充分监测的流域&#xff08;ungauged watersheds&#xff09;中的极端洪水事件 文章目录 利用人工智能&#xff08;AI&#xff09;技术预测未被充分监测的流域&#xff08;ungauged watersheds&#xff09;中的极端洪水事件…

bsd猜想 Murmuration of Eliptic Curves(笔记)

BSD Alexey Pozdnyakov (University of Connecticut) YUTUBE视频&#xff0c; B站搬运地址新生代女数学家Nina Zubrilina得到椭圆曲线椋鸟群飞模式精确公式与证明 Arithmetic Geometry算术几何 希尔伯特第十问题 希尔伯特第十问题&#xff08;Hilbert’s Tenth Problem&#…

TransUNet论文笔记

论文&#xff1a;TransUNet&#xff1a;Transformers Make Strong Encoders for Medical Image Segmentation 目录 Abstract Introduction Related Works 各种研究试图将自注意机制集成到CNN中。 Transformer Method Transformer as Encoder 图像序列化 Patch Embed…

拼板注意事项和步骤

拼板注意事项和步骤 综述&#xff1a;本文讲述了AD软件中拼板的注意事项以及拼板的步骤。 1. 拼板注意事项 拼板时应注意定位孔、光学定位点、工艺边、间距和器件冲突等问题。 2. 拼板步骤 ①点击“放置”→“拼板阵列”→“panels”→“properties”&#xff0c;浏览需要…

晴问算法 动态规划(简单)

动态规划的递归写法和递推写法 斐波那契数列II 题目描述 给定正整数&#xfffd;&#xff0c;求斐波那契数列的第&#xfffd;项&#xfffd;(&#xfffd;)。 令&#xfffd;(&#xfffd;)表示斐波那契数列的第&#xfffd;项&#xff0c;它的定义是&#xff1a; 当&…

【MD】激光驱动原子动力学的全尺寸从头算模拟

Zeng Q, Chen B, Zhang S, et al. Full-scale ab initio simulations of laser-driven atomistic dynamics[J]. npj Computational Materials, 2023, 9(1): 213.核心研究内容&#xff1a; 本文研究了激光驱动的原子动力学的全尺度从头算模拟。研究的重点是探讨在极端条件下材料…

C语言结构体之位段

位段&#xff08;节约内存&#xff09;&#xff0c;和王者段位联想记忆 位段是为了节约内存的。刚好和结构体相反。 那么什么是位段呢&#xff1f;我们现引入情景&#xff1a;我么如果要记录一个人是男是女&#xff0c;用数字0 1表示。我们发现只要一个bit内存就可以完成我们想…