论文浅尝 | Future Event Prediction Based on Temporal KG Embedding

news2024/11/16 17:46:49

f25dfc52b0b8aecccaa3b449289991f4.png

笔记整理:杨露露,天津大学硕士

链接:https://www.techscience.com/csse/v44n3/49146/html

动机

对未来事件的准确预测在许多领域为社会带来巨大利益,减少损失,如内乱、流行病和犯罪。知识图谱是描述和建模复杂系统的通用语言。不同类型的事件不断发生,这些事件通常与历史事件和并发事件有关。在本文中,作者将未来事件的预测形式化为一个时态知识图谱推理问题。现有的大多数研究要么对静态知识图谱进行推理,要么假设在训练过程中所有时间戳的知识图谱都是可用的。因此,他们不能有效地推理时间知识图谱和预测未来发生的事件。为了解决这个问题,最近的一些工作学习基于历史事件的时态知识图谱来推断未来的事件。然而,这些方法并没有综合考虑历史事件和同期事件背后的潜在模式和影响。本文基于一种新的历史事件和并发事件注意感知机制,通过对事件知识图谱序列进行递归建模,提出了一种新的图表示学习模型,即RE-GAT。更具体地说,RE-GAT使用一个基于注意力的历史事件嵌入模块来编码过去的事件,并使用一个基于注意力的并发事件嵌入模块来建模相同时间戳的事件关联。为了优化实体和关系的嵌入,开发了基于翻译的解码器模块和学习目标。在四个基准数据集上评估了作者提出的方法。大量实验结果表明,与各种基线相比,RE-GAT模型具有优越性,这证明作者的方法可以更准确地预测将要发生的事件。

亮点

本文的亮点主要包括:

1.将未来事件预测问题形式化为时态知识图谱的推理问题;2.RE-GAT使用RNN和GNN联合编码来自历史和并发事件的时间和结构事件信息,以预测未来事件。此外,采用了一种新颖的注意力机制,以确保更好地表示与事件相关的复杂模式。

概念及模型

RE-GAT由实体和关系嵌入编码器和解码器组成。前者包含基于注意力的并发事件嵌入模块和基于注意力的历史事件嵌入模块;后者适用基于翻译的分数函数来完成相应的实体预测任务。

具体来说,RE-GAT:

•使用基于注意力的递归神经网络对历史事件中的信息序列模式进行建模。•使用基于注意力的图神经网络表示机制学习每个时间戳的知识图谱中并发事件之间的局部结构关系。•基于学习到的时间事件主题嵌入、事件对象嵌入和事件类型嵌入,使用经典的基于翻译的解码器预测后续时间戳的未来事件。

模型整体框架如下:

416d653e6b6da25f98b6d7beb235592c.png

•基于注意力的并发事件嵌入模块

为了在同一时间戳捕获并发事件信息,本模块使用基于注意力的历史事件嵌入模块来编码这些事件中实体和关系之间的结构依赖和关联。由于图形神经网络(GNN)对非结构化图形数据具有强大的表达能力,并且邻域在现实中发挥不同的影响,因此作者使用ω层图形注意网络(GAT)来建模邻域并发事件信息。为了表示模型中事件实体的逆事件类型(关系),作者添加了逆事件四元组  在相同的时间戳下,为每个事件  指定基于事件的KG。具体来说,对于时间戳t处的每个知识图,事件对象o在 ω 层处获得其嵌入,从  层的图形注意网络框架下的四元组中相应的事件主题和事件类型,学习其在  层的向量表示,即:

ece6c4f78f16e52e279b413382720a56.png

b08f98a09adc9a2718b28b50bc91b031.png

其中,  分别表示在时间戳t处事件对象o、事件主题s和事件类型r的l^th层的向量嵌入;  是可学习的注意力权重,  和  是  层中可学习的权重矩阵参数。在等式(5)中,计算事件主题和事件对象之间的成对非标准化注意力得分,其中∥表示串联。首先连接事件对象和事件主题的向量表示,然后取具有可学习权重向量a^((l))的点积。最后将LeakyReLU应用于点积结果。在等式(6)中,使用softmax函数规范化包含事件对象实体的所有四元组的注意力得分。与经典图卷积网络(GCN)的聚合器类似,并发事件的嵌入量乘以注意得分,相加,再加上等式(7)中的自循环嵌入量。注意,每个KG   由一组发生在同一时间戳的事件组成。我们使用等式(7)中的   捕获事件主题、事件类型和事件对象之间的关系。

•基于注意力的历史事件嵌入模块

本模块旨在为实体对之间的历史事件模式建模,跨时间编码时间信息,并为实体和关系生成时间嵌入。为了涵盖尽可能多的历史事件的时间模式,模型需要考虑事件的时间序列。大量堆叠的基于翻译的GAT模块可能会引入消失梯度问题,从而防止在训练迭代过程中权重发生变化。因此,作者在基于注意力的历史事件嵌入模块中使用时间门组件来解决此问题。事件实体矩阵H_t由最后一层ω中基于注意的并发事件嵌入模块在时间戳t处的输出计算得出,即 ω 和  。更具体地说,

474681961b50019c379f99be7ab6f179.png

其中,⊗表示元素级别的点积操作。时间门矩阵U_t∈R^(|E|×d)应用非线性sigmoid转换:

dcfb1f6286a58c8a4ec7b617b97a3492.png

为了更好地捕获事件表示,我们采用了历史事件关注机制,该机制允许模块动态选择和线性组合关系的不同历史事件:

321d0f064d19cefaf577c908c3c7f0f1.png

其中,    是参数,因素 ατ 决定了在进行预测时应该强调或忽略历史事件的哪一部分。关系嵌入r_t形成t处关系的嵌入矩阵,即  。

•基于翻译的解码器模块

为了对等式(7)中向量表示的平移特性进行余弦排序,选择ConvTransE作为解码器模型来计算等式中的条件概率。事件对象的概率为:

15113b75a0efd6937ef3b1f87c9fb14d.png

同样,事件类型的概率分数为:

2e89d41cec502358b129558b5ae6d7e4.png

其中,σ(∙)表示广泛使用的sigmoid函数,在时间戳t-1处,在H_(t-1)和R_(t-1) 处的事件主题s, 事件类型r和事件对象o的矢量表示    。

•学习目标

事件对象实体预测问题(s,r,?,t)可以看作是一个多类分类问题,其中每个类对应于每个事件对象实体。同样,我们也可以将主题实体预测问题(?,r,o,t)视为一个多类分类任务。在不损失一般性的情况下,作者将未来事件预测问题描述为以时间戳四元组(s,r,?,t)预测事件对象。可以很容易地扩展模型来预测事件主题实体,即(?,r,o,t)。使用  ∈  和  ∈  表示时间戳t处事件实体预测任务和关系预测任务的标签向量表示。

f0f7ea594920c2c354d3be44f43bc95e.png

其中,Τ表示训练数据集中基于事件的KG时间戳总数,  和  分别表示  和  中的第i个矢量元素。对于确实发生的事件,向量  和  的元素为1,否则为0。将多任务学习框架用于事件实体预测和事件类型预测任务。因此,最终损失分数可计算为:

092ac8cf47b4eb9b83af424d343074c6.png

其中, λ 是参数,可以根据任务选择参数值,并控制每个组件的重要性。

理论分析

实验

作者使用了四个基于事件的时态知识图谱数据集,它们用时间戳记录事件,即ICEWS05-15、ICEWS14,ICEWS18和GDELT。主要将RE-GAT与以往的静态KG和时态KG方法进行比较。静态KG推理模型包括TransE、DistMult、CompleEx和RotatE。时态KG学习方法包括HyTE、TA DistMult、RE-NET和CyGNet。

637d4e7cec926bcd9ee1090ad15d8fd2.png

实验结果如下:

a98d532a25bd895ef15b8a02fb28d28c.png

可以看出,静态KGE方法比RE-GAT方法差得多,因为它们无法捕获时间事件信息。在RE-GAT在MRR和H@1/3/10指标中,HyTE和TADistMult只能独立地学习每个时间戳的事件表示,并且缺乏捕获长期依赖性的能力。

还可以看出,RE-GAT优于ICEWS05-15、ICEWS14和ICEWS18数据集上的所有基线。例如,RE-GAT比第二好成绩提高了11.19% 在ICEWS05-15数据集上的度量H@3。

为了进一步研究RE-GAT模型的性能和知识图谱的可视化优势,对ICEWS18测试数据集基于事件的时态知识图谱中的三个子图进行了案例研究。如下图所示,作者得到了时间戳为2018/09/26和2018/09-27的历史事件(四次),并试图预测2018年9月28日军事(塔利班)将使用非常规暴力的实体。如下图中2018/09/208的子图所示,RE-GAT成功获得了正确答案军事(阿富汗),这表明RE-GAT模型可以学习时间和结构事件信息。

962e5ed0f7801db7761e717009983a69.png

总结

提前预测事件(如政治事件、流行病和犯罪等)的发生是非常可取的,以减少潜在的损害和社会动荡。本文将事件预测问题表示为时态知识图谱的推理问题。提出了RE-GAT模型解决这个问题。RE-GAT从历史和并发结构的角度学习事件信息,以进行未来预测,还考虑了过去历史事件和同一时间戳内并发事件的复杂影响,这使得它能够有效地捕获历史模式和邻域事件交互。在四个真实数据集上的实验结果表明,RE-GAT模型比基线有显著改进。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

a984c05c31aad2da10a3c413bc13d4ef.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/140458.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【状态估计】将变压器和LSTM与卡尔曼滤波器结合到EM算法中进行状态估计(Python代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

讨教大学|六西格玛之属性值数据一致性分析

相信大家在日常的工作中肯定会遇到这样一种情况:产品的质量特性属于外观特性,即 需要靠人工判断产品是不是符合标准。当遇到客户投诉,或者内部报废率比较高的时候,经 常会遇到客户和领导的挑战: 如何保证员工清楚的知…

IO、NIO、BIO傻傻分不清吗,让我对象告诉你~~

1、Stream 与 Channel stream 不会自动缓冲数据,channel 会利用系统提供的发送缓冲区、接收缓冲区(更为底层)stream 仅支持阻塞 API,channel 同时支持阻塞、非阻塞 API,网络 channel 可配合 selector 实现多路复用二者…

电商系统概要设计

设计一个最小化的电商系统,理清楚电商系统的架构。目前唯一能确定的是,老板要做一个电商系统。具体做成什么样,还不清楚。你需要和老板讨论需求。 你:“咱们要做的业务模式是C2C、B2C还是B2B呢?” 老板:“…

CES 2023:NVIDIA发力元宇宙与汽车市场

作为全球规模最大、影响最为广泛的国际消费电子展,2023年的CES(Consumer Electronics Show)在美国拉斯维加斯如约而至。众所周知,作为全球消费电子产业发展的风向标,每年的CES都汇聚了各大科技企业最先进的技术与产品。…

Renesas setting-文件导入

导入工程 1.1, 文件\从文件系统选中打开项目… 1.2, 打开xpg_app文件 链接文件 2.1,选中项目\右键\属性 2.2,删除文件(在不同电脑中绝对路径不同) 属性\路径和符号, 源位置(delete C 文件)&…

在未联网的计算机中部署 yum 源和 EPICS 环境

1. 基本背景 EPICS 软件仓库:192.168.206.234:8888 安装方式:yum 2. 配置跳板机 跳板机功能:借助ssh 隧道服务进行端口转发,使未联网的计算机能够访问软件仓库。 将未联网的计算机与一台申请了无线校园网的笔记本电脑进行有线…

PCB结构和谐振(一)

本文构建了包括不同的旋转角度、不同的叠层和两种不同布线方法(W 形和蛇形线)的测试手段,对应于这些设计的谐振是通过 VNA 测量获得的。然后,使用仿真方法来帮助我们理解这些实验结果。为了消除仿真与实验之间的差异,研…

【chatGPT】一位聊天永远秒回的朋友

目录一、chatGPT介绍二、通过猿如意体验三、在openAI官网体验2.1注册openAI2.2使用和问题说明一、chatGPT介绍 ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的…

债务豁免,只是中昌数据的一次“回光返照”?

‍‍数据智能产业创新服务媒体——聚焦数智 改变商业因为经营不善,中昌大数据股份有限公司(以下简称“中昌数据”)已被实施退市风险警示,1月3日,中昌数据发布公告称收到两位债权人的《债务豁免函》,对中昌…

线程安全中的原子性,有序性和可见性

对于Java并发编程,一般来说有以下的关注点: 线程安全性,正确性。 线程的活跃性(死锁,活锁) 性能 其中线程的安全性问题是首要解决的问题,线程不安全,运行出来的结果和预期不一致,那就连基本要…

计算机的发展史与计算机硬件组成

作者简介:一名在校云计算网络运维学生、每天分享网络运维的学习经验、和学习笔记。 座右铭:低头赶路,敬事如仪 个人主页:网络豆的主页​​​​​​ 目录 前言 一.计算机的发展史 1.计算机发展的四个时代 二.计算机硬件组成 …

#D. Journey之二

一,题目Description给出一棵树N个点及数字K接下来N-1行描述有关边的开始点,结束点.保证图中不会有环接下来K个数字,代表你要走过的点的编号.当然你可以自己选择出发点及行进的路线不一定按给定编号顺序前行,求走过的最短距离。FormatInput第一行给出N,K。…

工具及方法 - 文件正在被使用,无法改名或删除怎么办

有时我们想重命名或删除一个文件时,会提示错误,提示文件被占用。 比如提示:“The action can’t be completed because the folder is open in another program“。 或者: 或者: 就是因为有进程锁定(process is lock…

004-Ensp-实验-配置DNS

实验要求 1. 在PC2中Ping www.pc1.com 可以访问到PC2 2. 在PC1中Ping www.pc2.com 可以访问到PC2 网络结构 实验步骤 #需要开启DHCP [Huawei]interface g0/0/0 [Huawei-GigabitEthernet0/0/0]dhcp server dns-list 192.168.0.100 测试

人工智能:数字图像类型和常见格式介绍

❤️作者主页:IT技术分享社区 ❤️作者简介:大家好,我是IT技术分享社区的博主,从事C#、Java开发九年,对数据库、C#、Java、前端、运维、电脑技巧等经验丰富。 ❤️个人荣誉: 数据库领域优质创作者🏆&#x…

【C语言】-深入内存带你看数据的存储

🎇作者:小树苗渴望变成参天大树 🎉 作者宣言:认真写好每一篇博客 🎊作者gitee:link 如 果 你 喜 欢 作 者 的 文 章 ,就 给 作 者 点 点 关 注 吧! 数据的存储🧨 前言✨一、数据类型…

007-Ensp-实验-配置静态路由

实验要求 PC1 可以访问到 PC2 网络结构 实验步骤 1. AR1 G0/0/0 - G0/0/1 配置IP 2. AR2 G0/0/0 - G0/0/1 配置IP 3. PC1 PC2 配置IP/GateWay 4. AR1 配置静态路由表 ip route-static 192.168.1.0 255.255.255.0 192.168.5.2 5. AR2 配置静态路由表 ip route-static 19…

Linux虚拟机克隆后网卡名从eth0变成eth1

文章目录一 系统环境二 问题发现三 解决过程一 系统环境 原本被克隆的主机是 rhel6.9 的操作系统。 二 问题发现 对 rhel6.9 的主机克隆后,发现无法SSH远程连接,从而发现可能是网卡的问题需要解决。 首先检查网卡服务是否启动 发现network服务是正常运…

java在线视频播放系统视频网站影视网站电影电视剧播放网站源码

简介 ssm开发的视频网站。本项目主要包括了视频展示和查询功能,用户中心,积分管理,管理员管理等功能。 演示视频 https://www.bilibili.com/video/BV1tT4y1N7t8/?share_sourcecopy_web&vd_sourceed0f04fbb713154db5cc611225d92156 技…