走进知识图谱(二)【世界知识图谱篇】知识表示的经典模型与平移模型及基于复杂关系建模的知识表示学习

news2024/12/28 5:36:55

        上篇文章提到,该系列文章将主要围绕世界知识图谱和语言知识图谱这两大类知识图谱进行展开,并且提到知识图谱的主要研究包括了知识表示学习、知识自动获取和知识的推理与应用三大部分。今天主要介绍世界知识图谱的知识表示学习,其中包括经典的知识表示学习模型、平移模型和平移模型的一个变种——基于复杂关系建模的知识表示学习。

        知识表示学习

        知识图谱的知识表示主要解决的问题就是:如何把知识图谱中结构化的知识更好的表示成计算机可以高效率处理应用的形式。因为知识图谱中的结构化知识虽然对于人类来讲看上去很好理解,但是其本身的图结构,对于计算机来说是很难利用的。因此,把知识图谱中的知识表示成计算机易于处理的低维稠密向量,不仅可以方便计算机高效处理,还可以解决原本知识图谱中表示存在的结构稀疏的问题。而知识图谱中的主要内容包括实体和关系两者,因此知识图谱的知识表示的核心就是:对知识图谱中的实体和关系,以及实体和关系之间的联系这三者进行表示,并且是表示成低维稠密向量。

        知识表示存在以下几个问题:1. 实体和关系的种类众多 2. 实体和关系的形式众多 3. 以上两者导致的知识图谱中的实体和关系不准确针对知识表示存在的问题。

        研究人员的研究方案也就包括:1. 如何充分表示不同的实体和关系,以及解决其中的不准确信息 2. 如何把同一个实体和关系的不同形式表现出来,即融入世界知识在不同形式的信息载体中的信息。

        知识表示学习旨在将实体与关系表示为低维连续空间之中的向量,在此使用粗体的符号 h, t,r 表示头尾实体与关系对应的表示向量。

知识表示学习的经典模型

        知识表示的经典模型主要包括:结构向量模型(Structure Embedding,SE)、语义匹配能量模型(Semantic Meaching Energy,SME)、隐变量模型(Latent Factor Model,LFM)、矩阵分解模型(RESCAL及其改进HolE)。

1. 结构向量模型结构向量模型为头实体与尾实体分别设计了一个关系特化的映射矩阵 r, Mr, ,这些映射矩阵将会在训练过程中进行自动更新。模型对每个三元组(h,r,t)的评分函数定义为:

E(h,r,t)=∥M r,1​ h−M r,2t∥

|| || 是欧式距离,其公式是:d(x,y) = sqrt( (x1-y1)^2 + (x2-y2)^2 + ... + (xn-yn)^2 )。M r,1​·h是实体h在关系r下的嵌入向量,M r,2·t是实体t在关系r下的嵌入向量。这里的意思是,两个实体之间在关系r下的距离,等于两个实体的嵌入向量在关系r的映射矩阵下的欧式距离。欧式距离越小,两个实体的距离越小。即这两个实体和关系r之间联系非常大。

2. 语义匹配能量模型语义匹配能量模型与结构向量模型不同,使用低维向量表示实体及关系。在此之上,模型使用矩阵映射、点乘等操作,对实体与关系的联系进行评估。具体地,语义匹配能量模型设计了线性形式与双线性形式两种对元组的评分函数。

E(h,r,t)=(M1​h+M2​r+b1​)⊤(M3​t+M4​r+b2​)

E(h,r,t)=((M1​h⊙M2​r)+b1​)⊤((M3​t⊙M4​r)+b2​)

其中,⊙是element-wise(Hadamard)积;M1, M2, M3, M4是投影函数的权重矩阵,b1, b2是偏置。
3. 隐变量模型隐变量模型将实体表示成低维向量。将关系表示为双线性变换矩阵Mr ,在知识表示学习效果与计算复杂度方面都有显著改善。模型的评分函数为:

E(h,r,t) = hMrt

4. 矩阵分解模型。矩阵分解模型基于矩阵分解的方式进行知识表示学习,其中以 RESCAL模型和HolE模型为代表。

平移模型(TransE)

        平移的思想在Bordes 等研究者在2013年提出知识表示学习算法平移模型TransE之前就被广泛应用,以Word2Vec为例。它是Google AI 2013年提出的一种词向量模型,它通过训练一个神经网络来学习词之间的联系,并将词映射到一个低维空间中。平移模型将实体和关系映射至同1个低维向量空间,将实体与实体之间的关系表示为实体之间的平移操作。 

 平移模型的思想就是两个头尾实体可以表示成一个实体向量等与另一个实体向量与关系向量的和。其评分函数为:

E(h, r, t) = ||  h + r - t || L1/L2

由于只考虑了向量之间的平移操作,平移模型的计算复杂度大大降低并且学到的知识表示在知识图谱补全等任务方面的效果也得到了显著提升。但是其也存在:

  • 过于理想化的平移假设,在对知识图谱中的复杂关系进行建模时往往存在问题
  • 仅仅关注知识图谱三元组的局部信息,而忽略了知识图谱网络的全局结构与关系之间的推理逻辑
  • 只关注了知识图谱自身的网络结构信息,忽略了众多多源异质的丰富信息,如文本、实体类型与图像等信息

等问题,因此研究人员陆续提出了多个基于平移模型TransE的改进模型,下面先介绍一种基于复杂关系建模的知识表示学习。

基于复杂关系建模的知识表示学习

        TransE模型(经典的平移模型)无法解决复杂关系建模的问题,因为它只能对1对1的关系进行建模,对于1对多和多对多的关系则无法建模。而其改进模型TransR则可以很好的解决该问题。

TransR 与传统模型的主要差异在于它为 每种关系定义了单独的语义空间 ,并使用不同的映射矩阵 Mr 定义从实体空间到各个关系空间的映射。

TransR可以让每个实体针对每个关系有不同的映射结果,可以很好的解决1对多和多对多的关系。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/868456.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

netty基础与原理

Netty线程模型和Reactor模式 简介:reactor模式 和 Netty线程模型 设计模式——Reactor模式(反应器设计模式),是一种基于 事件驱动的设计模式,在事件驱动的应用中,将一个或多个客户的 服务请求分离&#x…

跑步运动耳机哪个牌子好、跑步运动耳机推荐

随着生活质量的提高,运动健身已经成为一种新的潮流,而跑步更是如今众多人参与的热门运动项目之一。在谈到跑步时,很多人习惯性地戴上耳机,在奔跑的过程中播放自己喜欢的音乐,以免运动变得枯燥,并增添一些轻…

开工大吉|华润鞋业二期自动化改造项目开工典礼圆满举行

2023年8月10日上午,山东百华鞋业有限公司择良辰吉时隆重举行了华润鞋业二期厂房动工仪式,公司总经理郭兴梅女士携公司管理层代表和施工单位代表参加了动工仪式。 根据公司发展规划,对未来发展的美好期许,以及公司生产与研发保持的…

从 Zebec Protocol 长期布局看,ZBC 通证的潜在应用场景

流支付协议 Zebec Protocol 在去年被推出以来,始终保持着较为迅猛的市场进展,与此同时其还基于 ZBC 构建了全新的治理体系,并上线了以 ZBC 资产为核心的治理系统,让生态逐渐走向 DAO。

题目大解析(3)

题目 字符串中的第一个唯一字符 字符串中的第一个唯一字符 原题链接:字符串中的第一个唯一字符 计数法: class Solution { public:int firstUniqChar(string s) {int arr[130] {0};for(auto x : s){arr[x-0];}int i 0;for(auto x : s){if(arr[x-0] …

《算法竞赛·快冲300题》每日一题:“造电梯”

《算法竞赛快冲300题》将于2024年出版,是《算法竞赛》的辅助练习册。 所有题目放在自建的OJ New Online Judge。 用C/C、Java、Python三种语言给出代码,以中低档题为主,适合入门、进阶。 文章目录 题目描述题解C代码Java代码Python代码 “ 造…

使用python对图像加噪声

加上雨点噪声 import cv2 import numpy as npdef get_noise(img, value10):#生成噪声图像>>> 输入: img图像value 大小控制雨滴的多少 >>> 返回图像大小的模糊噪声图像noise np.random.uniform(0, 256, img.shape[0:2])# 控制噪声水平&#xff…

Arduino ESP32 v2 使用记录:开发环境搭建

文章目录 目的开发环境搭建程序下载测试使用VS Code进行开发批量烧录固件到模块中总结 目的 在之前的文章 《使用Arduino开发ESP32(01):开发环境搭建》 中介绍了使用Arduino开发ESP32的开发环境搭建内容,只不过当时的 Arduino co…

写一个函数返回参数二进制中 1 的个数(c语言三种实现方法)

(本文旨在自己做题时的总结,我会给出不同的解法,后面如果碰到新的题目还会加入其中,等于是我自己的题库。 1.写一个函数返回参数二进制中 1 的个数。 比如: 15 0000 1111 4 个 1 方法一: #include…

Kubernetes 调度约束(亲和性、污点、容忍)

目录 一、Pod启动典型创建过程 二、调度流程 三、指定调度节点 1.使用nodeName字段指定调度节点 2.使用nodeSelector指定调度节点 2.1给对应的node节点添加标签 2.2修改为nodeSelector调度方式 3.通过亲和性来指定调度节点 3.1节点亲和性 3.2Pod亲和性与反亲和性 3.2…

SAP MM学习笔记18- SQVI 工具

Tr-cd SQVI 是一个SAP数据库工具。 使用这个工具,可以自己构建查询界面中的条件,查询对象,从而自由查询数据,实现标准没有的功能。 1,SQVI 和 SQ1,SQ2,SQ3 的不同 SQ1,2&#xff0…

【hello C++】智能指针

目录 一、内存泄漏 1.1 什么是内存泄漏,内存泄漏的危害 1.2 内存泄漏分类 1.3 如何检测内存泄漏 1.4 如何避免内存泄漏 二、智能指针的使用及原理 2.1 RAII 2.2 智能指针的原理 2.3 智能指针的发展历程 2.4 智能指针的模拟及实现 三、shared_ptr 常见的问题 3.1 线程…

10.pod资源限制和健康检查

文章目录 资源限制探针(健康检查)启动、退出动作总结 资源限制 当定义 Pod 时可以选择性地为每个容器设定所需要的资源数量。 最常见的可设定资源是 CPU 和内存大小,以及其他类型的资源。当为 pod 中的容器指定了 request 资源时&#xff0c…

5. vue-element-admin 二次开发攻略指南

vue-element-admin一站式后端 UI框架二次开发攻略指南 1.1 前言1.2 修改 Logo 名称和图标1.3 控制设置齿轮是否显示或隐藏1.4 框架安装依赖优化脚本1.5 定义多环境配置文件1.6 优化打包流程1.7 优化打包流程输出文件路径配置1.8 nginx 配置1.9 docker file 配置 2. 代码地址 1.…

计算机网络-专业术语

计算机网络-专业术语 实体 实体:任何可发送或接收信息的硬件或软件进程 对等实体:收发双方相同层次中的实体 协议 控制两个对等实体进行逻辑通信的规则的集合 协议三要素 语法 定义所交换的信息的格式 是用户数据与控制信息的结构和格式 语义 定义收发双方所需要完成的操作…

STM32CubeMX之freeRTOS信号量

队列可以传输数据,任务之间和任务和中断之间,消息队列用来传数据,占用时间也长 但哦我们有时候只需要传递状态,只需要一个数值表示 如果我们屏幕按固定刷新,就会很消耗资源,如果我们数据变化了&#xff0…

Hadoop+Python+Django+Mysql热门旅游景点数据分析系统的设计与实现(包含设计报告)

系统阐述的是使用热门旅游景点数据分析系统的设计与实现,对于Python、B/S结构、MySql进行了较为深入的学习与应用。主要针对系统的设计,描述,实现和分析与测试方面来表明开发的过程。开发中使用了 django框架和MySql数据库技术搭建系统的整体…

人工智能讲师AIGC讲师叶梓:大模型这么火,我们在使用时应该关注些什么?-2

以下为叶老师讲义分享: P6-P9 一些考验大模型的经典问题: 1、鲁迅与周树人是同一个人吗?2、圆周率的最后一位3、蓝牙耳机坏了4、最新的:奶奶的睡前故事 关于事实的问答结果: 知识的时效性: 未完,下一章继续……

java程序打包成exe在无java环境执行

最近写了个小工具,但是java写的,给朋友用的时候不能直接用,因此学习了一下java打包成exe。 众所周知,java需要jvm环境,所以打包的时候需要把稍微轻一点的jre打包进去。接下来是详细步骤。 java程序打包成jar 这个在…

C#随机法 双峰函数 求极值 避免落入局部最优解

避免落入局部最优解,只要让步长够长即可。 x1 resultX1 random1.NextDouble()*100; 如果后面不乘以100,则很大概率落入负数的最大值 Random random1 new Random(DateTime.Now.Millisecond);double x1 0, resultX10,max-999999,maxTemp0;for (int i …