时序结构重要性加权图卷积网络用于时序知识图谱补全

news2025/1/19 23:08:15

目录

摘要部分

四元数

时间戳

时间信息对四元数的影响

知识图谱里的结构信息

时序注意模块

重要性加权的图卷积网络

引言部分

现有方法的不足

本文主要贡献

准备工作

问题定义

大部分方法的缺陷

本文方法

框架

时序注意模块

实体分类

带有注意力机制的双向长短期记忆模型

时序感知注意力

节点重要性加权的GCN—TS-GCN

时间语义重要性

结构重要性

知识图谱补全

TS-GCN算法

总结


摘要部分

现有的时序知识图谱补全的方法忽略了时序信息对四元数的影响。

四元数

在时序知识图谱中,四元数是由三元组(头实体、关系、尾实体)和时间戳组成的。四元数是由三元组和时间戳组成的,表示了一个在特定时间有效的知识事实。

时间戳

时间戳是一个特定的时间点或时段,用来表示三元组在何时有效或发生。

时间信息对四元数的影响

这是指如何将时间戳与三元组相结合,以表示知识事实在不同时间的状态。例如,如果我们有关于奥巴马是美国总统的三元组,并附加了2009-2017的时间戳,那么这个四元数就表示了奥巴马在这个时间段内是美国总统的事实。

知识图谱里的结构信息

在一个复杂的图结构中,当信息从一个节点传递到另一个节点时,每个节点的重要性是不同的。这可能是因为某些节点在网络中的位置更为核心,或者它们与更多其他节点相连,或者基于其他一些度量标准。这种不同的重要性可能会影响信息在网络中的传播方式和速度。

所以为了解决现有方法的问题,本文提出了一种新的基于一个时序注意模块和一个重要性加权的GCN的解决方法(ATL-TKGC)。

时序注意模块

这个模块主要是捕捉时间戳实体间的联系和语义层面上的关系。

重要性加权的图卷积网络

重要性加权的图卷积网络(GCN)充分考虑了结构的重要性,并将时态信息的关注点集中在实体上,以便进行加权整合。


引言部分

现有方法的不足

  • 没有充分利用时间信息对三元组的影响。
  • 带时间戳的四元数应当作为一个整体来建模,也就是说,三元组事实在特定的时间点或时期是正确的。
  • 忽略时间对不同类型实体的影响模式。
  • 不能捕捉时间信息对不同实体的影响大小。

本文主要贡献

  • 设计了一种基于时态注意力学习(TAL-TKGC)的时态知识图谱补全方法,该方法可以捕捉时间戳与三元组之间的深层联系。
  • 改进了图卷积网络(GCN),使其能够基于节点的时态语义和结构重要性,以不同的权重聚合结构信息和节点嵌入。
  • 在两个公共数据集ICEWS14和ICEWS05-15上进行了比较和加速实验。结果验证了所提模型在多个GPU上的性能和可扩展性。

准备工作

问题定义

主要任务是根据现有事实预测四元数在某时刻缺失的部分。

可被分为两种类型的预测。

  • (?,r, t, time)
  • ( h , r , ? , time )

大部分方法的缺陷

  • 没有考虑时态四元数的完整性
  • 没有挖掘时态信息对事实的多维影响

本文方法

框架

主要包含三个主要模块

  • 时序注意模块
  • 时序知识图谱嵌入模块
  • 补全模块

时序注意模块

实体分类

时间信息只能影响一个实体的动态属性,并且具有相同类型的实体将具有近似相同的属性随时间变化。

所以对TKGC任务进行分类,并基于分类提取其动态嵌入,以提高TKGC任务的准确性。

带有注意力机制的双向长短期记忆模型

解决弱标签或无标签下实体的多分类问题 。

该模型首先将实体的文本信息输入到Bi-LSTM模型中,并使用Bi-LSTM模型提取上下文的语义信息来处理长序列数据。引入注意力机制提取文本中的重要词信息,充分提取文本中最关键和最有价值的信息,以提高模型分类的准确性。

文本中第j个字对第i个字的关注程度按如下计算

加权词嵌入按如下计算

时序感知注意力

关系,尾实体和时间对于头实体的注意力按如下计算

节点重要性加权的GCN—TS-GCN

传统的消息传递公式 

传统消息传递机制中同样的权值不可避免地削弱紧密连接节点的局部特征,加强稀疏连接节点的局部特征。

时间语义重要性

节点的时间语义重要性按如下计算

结构重要性

节点的位置可以在一定程度上反映图的结构信息。

通过K-shell分解算法得到结构重要性。

k-壳分解算法根据节点的位置为节点分配不同级别的重要性。

结合了节点重要性的加权GCN方法的消息传递机制可以描述如下

负采样

是通过用实体集合中的任何实体随机替换四元数中的头或尾实体而得到的。

损失函数

知识图谱补全

TTransE模型
它将事实的合理性视为在联合解释关系和时间后头实体和尾实体在向量空间中之间的距离的大小。

 

评分函数

如果事实(eh,er,et,etime)是真实的,那么对应的分数应该接近于零。

TS-GCN算法

总结

大多数现有的TKGC方法将时间信息合并到三元组中,并将它们转换为KGC任务,这并没有充分利用时间信息对三元组的影响。此外,现有的基于消息传递网络的嵌入学习方法将具有相同注意力的邻居传递的特征进行聚合,忽略了每个节点在消息传递过程中具有不同重要性的复杂结构信息。因此,设计了一种基于时间属性感知的TKGC方法(TAL-TKGC),其中包括一个时间注意模块和一个重要性加权GCN时间注意模块用于捕捉语义层次上的时间戳、实体和关系之间的深层联系。同时,在重要性加权GCN中,将时间信息的结构重要性和对实体的关注度作为信息聚合的权重,从而将实体信息转移到具有不同时间注意度的相邻节点。对两个基准数据集的实验结果验证了该方法的性能。同时,我们还验证了该模型在多个gpu上具有良好的可伸缩性

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/895841.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring-MVC的数据响应-19

在访问服务端MVC的时候,这个controller层进行相应操作之后 他要做两件事:页面跳转和返回字符串,在做完这些操作之后,我们一般进行页面展示:排除页面展示之外,有些需求可能直接回写给我们一些数据: 页面跳…

实验一 Hbase的安装部署与基本操作

系列文章目录 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 例如:第一章 Python 机器学习入门之pandas的使用 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目…

gcc语法解析如何解决dangling else的问题?

GCC上古版本(3.4)还有yacc,学习GCC如何实现if else 嵌套的问题。即: 问题 else后面的if到底是else if语义 if (xxx)a1 else if (xxx) a2还是 else (语法块中的if else)。 if (xxx)a1 else if (xxx) a 2 else a2;PostgreSQL的…

Codeforces Round 881 Div.3

文章目录 贪心:A. Sasha and Array Coloring结论:B. Long Long性质:C. Sum in Binary Treedfs求叶子数量:D. Apple Tree二分与前缀和:E. Tracking Segments 贪心:A. Sasha and Array Coloring Problem - A…

作为10年的测试人员给学习软件测试的几点建议

下面几点给做测试的朋友参考一下: 1、钱肯定少过开发人员,除非你工作3,4年才能拿年薪10W以上。 2、加班的现象可以说是很普遍,周一到周五随时加班是很正常的,周末肯定有一天要加班。 3、不管怎么样努力和用什么测试效…

ROS局部路径规划器插件teb_local_planner流程梳理(上)

在我之前的文章《ROS导航包Navigation中的 Movebase节点路径规划相关流程梳理》中已经介绍过Move_base节点调用局部路径规划器插件的接口函数是computeVelocityCommands,接下来,我们就从这个函数入手梳理一下teb_local_planner功能包的工作流程。 ☆注&a…

Vue使用Element的表格Table显示树形数据,多选框全选无法选中全部节点

使用Element的组件Table表格,当使用树形数据再配合上多选框,如下: 会出现一种问题,点击左上方全选,只能够选中一级树节点,子节点无法被选中,如图所示: 想要实现点击全选就选中所有的…

强强联手:Eyeshot 2023.2 集成 CAD Exchanger SDK 3.21 Crack

Lab 中的新绘图模式和网格抽取、Eyeshot 集成以及从 CAD Exchanger 3.21.0 中的 CATIA 导入图形 PMI 通过探索新的绘图模式和可调整的网格抽取,更深入地了解实验室,见证与 devDept Eyeshot 的无缝集成,并直接从 CATIA 导入图形 PMI。 今年 8…

阿里云100元预算可选的云服务器配置2核2G3M带宽

阿里云服务器100元可以买到哪些配置?如果是一年时长,轻量应用服务器2核2G3M带宽一年108元,系统盘为50GB高效云盘。以前阿里云服务器ECS卖过35元一年、69元、88元、89元和99元的都有过,但是现在整体费用上涨,入门级云服…

超实用的40道JAVA经典算法题(含答案)

作为一名Java程序员,想要拿到一份满意的offer,就必须做好充足的准备。众所周知,算法可以说是大厂面试Java程序员的必问题。好的算法可以让性能得到万倍提升,做到毫秒级处理千万数据的程度。因此,算法的重要性不言而喻&…

【云原生,k8s】Helm应用包管理器介绍

目录 一、为什么需要Helm? (一)Helm介绍 (二)Helm有3个重要概念: (三)Helm特点 二、Helm V3变化 (一)架构变化 (二)自动创建名…

ICCV23 | Ada3D:利用动态推理挖掘3D感知任务中数据冗余性

​ 论文地址:https://arxiv.org/abs/2307.08209 项目主页:https://a-suozhang.xyz/ada3d.github.io/ 01. 背景与动因 3D检测(3D Detection)任务是自动驾驶任务中的重要任务。由于自动驾驶任务的安全性至关重要(safety-critic),对感知算法的延…

CodeSite for .NET Crack

CodeSite for .NET Crack CodeSite for.NET与Visual Studio集成,通过实时查看器日志记录系统提供对代码执行的更深入了解,该系统有助于在本地或远程执行代码时快速查找问题。超越传统的断点调试,在应用程序继续运行时记录应用程序的执行&…

强训第34天

选择 A B D 由协议处理粘包问题 C C C host字段表示要访问的IP地址 Connection为Close,为短连接 A RTT报文往返时间,根据窗口大小和拥塞控制可以得知发了1 2 4 8 总共16个接收缓存并且没由进行数据提取,则剩余接收量为16-151,会经…

k8s简介、虚拟机快速搭建k8s集群、集群管理方式及K8S工作原理和组件介绍

文章目录 1、k8s简介1.1、部署方式的变迁1.2、定义1.3、Kubernetes提供的功能 2、虚拟机快速搭建k8s集群2.1、虚拟机配置(centos7 2G内存2个处理器)2.2、基础环境准备2.3、docker安装(易踩坑)2.4、安装k8s组件2.5、master节点部署…

Power BI 之 初相识

一、简介 传统数据分析工具入Excel等分析大数据量存在一些弊端,一是无法应对多数据源,二是数据量大容易卡死,三是无法根据数据源动态变化,导致每天重复分析数据,无法关注数据价值本身。 Power BI(简写PBI…

隧道代理技术解析:为批量数据采集提供强大支持

嘿!作为一名专业的爬虫程序员,我今天要和大家分享一个强大的技术,它能够为批量数据采集提供强大的支持——隧道代理技术。如果你在进行大规模数据采集任务时遇到了IP封禁和限制的问题,那么这项技术将是你的救星。废话不多说&#…

案例-基于MVC和三层架构实现商品表的增删改查

文章目录 0. 项目介绍1. 环境准备2. 查看所有2.1 编写BrandMapper接口2.2 编写服务类,创建BrandService,用于调用该方法2.5 编写Servlet2.4 编写brand.jsp页面2.5 测试 3.添加3.1 编写BrandMapper接口 添加方法3.2 编写服务3.3 改写Brand.jsp页面&#x…

【使用群晖远程链接drive挂载电脑硬盘】

文章目录 前言1.群晖Synology Drive套件的安装1.1 安装Synology Drive套件1.2 设置Synology Drive套件1.3 局域网内电脑测试和使用 2.使用cpolar远程访问内网Synology Drive2.1 Cpolar云端设置2.2 Cpolar本地设置2.3 测试和使用 3. 结语 前言 群晖作为专业的数据存储中心&…

用pytorch实现AlexNet

AlexNet经典网络由Alex Krizhevsky、Hinton等人在2012年提出,发表在NIPS,论文名为《ImageNet Classification with Deep Convolutional Neural Networks》,论文见:http://www.cs.toronto.edu/~hinton/absps/imagenet.pdf &#xf…