结合实体类型信息(3)——TransT: 基于类型的多重嵌入表示用于知识图谱补全

news2024/11/16 8:58:10

1  引言

1.1  问题

        仅仅依赖于三元组的结构化信息有其局限性,因为它们往往忽略了知识图谱中丰富的语义信息以及由这些语义信息所代表的先验知识。语义信息是指实体和关系的含义,比如“北京”是“中国”的首都,“苹果”是一种水果。先验知识则包含了更广泛的概念层次和常识,如国家通常有首都,水果可以被吃等。

        实体的表示形式:将每个实体表示为单个向量,不能捕捉实体的不确定语义。这是对丰富语义进行建模的关键限制。例如牛顿即使物理学家又是作家,导致向量表示困难。

        后验概率估计:传统的最大似然估计方法只关注形成三元组的概率,而忽略了已知实体和关系对预测的影响。通过引入后验概率的概念,我们能够更准确地反映优化的目标,同时利用先验概率来指导预测过程,从而提高预测的准确性。这种方法在处理缺失值预测时,能够更加细致地考虑问题的条件性,避免了仅依赖于整体三元组概率所带来的局限性。

        具体来说,之前的最大似然模型本质上最大化了概率p(h, r, t),即h, r, t形成一个三元组的概率p(h, r, t)。然而,在预测缺失的尾实体(h, r, ?)时,头实体h和关系r已经是已知的,它们可能会影响尾实体t的可能选择。因此,预测t的后验概率p(t | h, r)比p(h, r, t)更准确地表达了优化目标。换句话说,我们可以根据三元组中缺失元素的先验概率来削减可能的选择范围。

1.2  解决方案

        提出了一种将结构化信息和描述实体类别的实体类型相结合的方法。

        ①从实体类型构造了多类型关系,并设计了基于类型的语义相似度,用于多嵌入表示和先验知识发现。

        ②提出了一个多重嵌入模型,将每个实体表示为具有特定语义的多个向量。

        ③KGs中三元组元素之间的语义相似性来估计实体和关系预测的先验概率。

1.3  结合的信息

        结构化信息+实体类型

1.4  相关知识

先验概率(Prior Probability)

先验概率是指在没有考虑任何具体观测数据或新信息之前,对某个事件或假设发生的概率的估计。它是基于先前的经验、历史数据、专家判断或其他背景知识来确定的概率。先验概率反映了我们对事件发生可能性的初始信念或不确定性。

例如,在医疗诊断中,医生可能会基于病人的症状和一般疾病的发生率给出某种疾病的先验概率。在选举预测中,候选人在没有最新民调数据的情况下赢得选举的估计概率就是一种先验概率。

后验概率(Posterior Probability)

后验概率是在观察到某些数据或信息之后,对该事件或假设发生概率的修正后的估计。它是通过将先验概率与新的证据或数据相结合,利用贝叶斯定理计算得出的更新概率。后验概率更加反映实际情况,因为它考虑了新的证据影响。

继续用医疗诊断的例子,当医生获得了病人的实验室检测结果后,他们可以根据这些结果更新疾病发生的概率,这就是后验概率。在选举预测中,一旦有了最新的民调数据,原先的估计概率就会被调整,产生一个新的后验概率。

贝叶斯定理

贝叶斯定理是计算后验概率的关键公式,它表述了如何根据先验概率和观测数据来更新概率估计。贝叶斯定理的形式化表达如下:

𝑃(𝐻∣𝐸)=𝑃(𝐸∣𝐻)⋅𝑃(𝐻) / 𝑃(𝐸)

其中:

  • 𝑃(𝐻∣𝐸)是后验概率,即在证据E出现的情况下,假设H为真的概率。
  • 𝑃(𝐸∣𝐻)是似然性,即在假设H为真的情况下,观测到证据E的概率。
  • 𝑃(𝐻)是先验概率,即在没有证据E的情况下,假设H为真的概率。
  • 𝑃(𝐸)是证据E出现的边际概率,通常通过全概率公式计算得出。

2  方法

        目标是获得实体和关系的向量表示,从而最大化所有现有三元组的预测概率。

        当预测三元组(h,r,t)的尾部实体时,我们期望在给定三元组满足原则h+r≈t且头部实体和关系分别为h和r的条件下,最大化尾部实体t的概率。我们将这个条件概率记作p(t|h,r,true),其中true意味着三元组(h,r, *)是“真”的。“真”代表三元组满足h+r≈t的原则。“真”三元组在这篇论文中也被称为正确的三元组。最大化这个概率是尾部预测的目的。根据贝叶斯定理,p(t|h,r,true)可以被视为后验概率,它与先验概率的相关性如下式所示:

        其中p(true|h,r,t)是(h,r,t)为“真”的概率,p(t|h,r)是t的先验概率,即在没有具体三元组信息的情况下,t作为尾实体的概率。要获得最可能的实体,我们只能比较三元组(h,r,∗)的概率。所有这些概率都有相同的p(true|h,r),我们可以省略(1)中的p(true|h,r),因为这个因子对于所有t来说是相同的,并且不会改变我们比较𝑝(𝑡∣ℎ,𝑟,𝑡𝑟𝑢𝑒)时的结果。简化后的公式变为:

𝑝(𝑡𝑟𝑢𝑒∣ℎ,𝑟,𝑡)是由多个嵌入表示法估计出的似然性,而𝑝(𝑡∣ℎ,𝑟)和𝑝(𝑟∣ℎ,𝑡)则分别代表了各个实体或关系的先验概率。

2.1  基于类型的语义相似度

        为了估计似然和先验概率,我们引入语义相似度来度量实体语义与类型信息的区别

        所有出现在头部(或尾部)具有相同关系的实体都有一些共同的类型。这些常见的类型决定了这种关系,T_r,head表示头部中的实体,T_r,tail表示尾部中的实体。我们从这些公共类型构造关系的类型集:

T_e是实体e的类型集,∩ρ是一个特殊的交集,它包含属于大多数类型集的元素。这个交集可以捕获比普通交集更多的实体类型信息。然而,更多的信息可能包含更多的噪音。因此,我们通过参数ρ来平衡影响,ρ是所有Te中类型的最低频率,即是一个阈值。

        根据实体和关系的类型信息,我们将关系和实体的不对称语义相似度表示为受Jaccard索引启发的两组相似度:        

        三个式子分别是关系与头部之间的语义相似度,关系与尾部之间的语义相似度,头部与尾部之间的语义相似度。基于类型的语义相似度在后续估计特别是先验概率估计中起着重要的作用。

2.3  多嵌入表示

        语义丰富的实体在KGC中难以准确表示。因此,很难准确地测量似然p(true|h,r,t)。在这一部分中,我们介绍了多重嵌入表示法来捕捉实体语义,以获得准确的似然

        如上图TransE一个实体只有一个向量表示,了克服这个缺点,TransT将每个实体语义表示为一个向量,并将每个实体表示为一组语义向量。在我们的方法中,我们将每个语义嵌入到向量空间中。我们假设关系具有单一语义,实体具有多个语义。因此,每个关系都表示为单个向量。为了适应丰富的实体语义,我们将每个实体表示为一组语义向量,而不是单个向量。

        可能性p(true | h, r, t)取决于随机变量h和t的所有可能语义组合的期望概率。这可以定义如下所示的三元组向量表示的可能性:

n_h和n_t为h和t的实体语义个数;W是随机变量h、t的分布(由于每个实体都有不同的语义组合,所以它们被视为随机变量。这里的随机并不是指真正的随机性,而是指不确定性)。p_true(v_h,i,v_r,v_t,j)是具有h的第i个语义向量V_h,i和t的第j个语义向量V_t,j的分量的似然。根据h + r≈t的原理,该似然由h + r与t的差值决定:

对于给定的关系r,三元组(h, r, t)的真实性概率p_true(v_{h,i}, v_r, v_{t,j})由两部分组成:

  1. 距离函数d:该函数度量了h + rt之间的差异。在这里,距离越小,说明h + rt越接近,那么真实性概率就越大。
  2. 压缩函数σ:这是一个转换函数,将距离d的值从0到正无穷转化为概率值从1到0。这是因为,语义向量的组合越接近,其对应的真实性概率应该越高。

        距离函数d采用了一范数(1-norm),也就是欧几里得空间中各坐标绝对值之和。压缩函数σ采用了指数函数e^{-x},使得较大的距离d得到较小的概率值。

        如何利用随机过程来捕捉实体的语义信息?为了避免人为设置实体的语义数量(n_hn_t)带来的主观性,提出了一个基于中国餐馆过程 (Chinese Restaurant Process, CRP) 的随机生成过程来建模语义向量。CRP是一种常用的Dirichlet过程形式,它可以模拟新顾客进入餐厅并选择餐桌的过程,其中每张桌子代表一个类簇,顾客的选择概率会受到已知类簇大小的影响。在这个模型中,作者将尾部实体(或头部实体)在每个三元组中生成新的语义向量的概率(通过生成新的语义向量,模型能够更细致地理解和区分知识图谱中的复杂结构和语义细节,这对于提高模型的性能和泛化能力是非常重要的),定义如下:

2.3  先验概率估计

        先验概率从语义的角度反映了KG的特征。通过基于类型的语义相似度来估计先验概率,同公式(2)、(3)和(4)。

        在三元组(h, r, t)中,三个元素(头实体 h、关系 r 和尾实体 t)的类型集之间存在明显的关系。因此,可以通过计算缺失元素与其它元素之间的语义相似性来估计其先验分布。当预测三元组中的 t 时,具有更多共同类型的实体更有可能出现所以,使用 t 及其上下文(*,h,r)之间的语义相似性来估计 t 的先验概率:

其中,s(r_tail, t)^λ_tail 表示关系 r 的尾属性 r_tail 和目标实体 t 之间的语义相似度,乘以 λ_tail 这个权重。 λ_relation, λ_head, λ_tail ∈ {0, 1} 是相似度权重,因为 h 和 r 对于 t 的先验概率有不同的影响。通过这些权重可以针对不同情况选择不同的相似度。同样地:

2.4  目标函数(损失函数)和负采样

为了达到最大化后验概率的目标,目标函数定义为负采样的预测误差之和。当预测三元组的不同元素时,我们替换相应的元素来获得负三元组。预测误差表示为分段函数:

        通过训练三元组与其负样本的概率差来衡量概率估计的性能。将目标函数定义为预测误差的总和:

 Δ(h‘,r’,t‘)是负三元组集。预测的总后验概率通过目标函数(损失函数)的最小化来最大化。此外,采用随机梯度下降法优化目标函数,并对实体的语义向量进行归一化处理,避免了过拟合度的问题。

3

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1923589.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

uniapp编译成h5后接口请求参数变成[object object]

问题:uniapp编译成h5后接口请求参数变成[object object] 但是运行在开发者工具上没有一点问题 排查: 1:请求参数:看是否是在请求前就已经变成了[object object]了 结果: 一切正常 2:请求头:看…

yolov8-obb训练自己的数据集(标注,训练,推理,转化模型)

一、源码 直接去下载官方的yolov8源码就行,那里面集成了 obb ultralytics/ultralytics/cfg/models/v8 at main ultralytics/ultralytics GitHub 二、环境 如果你训练过yolov5以及以上的yolo环境,可以直接拷贝一个用就行,如果没有的话 直…

破解数据孤岛:论数据中台对企业数据治理的作用与挑战-亿发

在数字化转型浪潮中,数据中台这一概念频频被提及。然而,业界目前尚未对数据中台形成统一的定义。本文将基于PowerData的理解,深入探讨数据中台的核心价值与挑战。 数据中台的本质 数据中台不仅仅是一项单一的技术,而是涵盖数据集…

R语言中交互式图表绘制

revenue <- read.csv("data/revenue.csv") 数据集放在了文章末尾&#xff0c;需要自取。 if(!require(plotly)) install.packages("plotly") # 绘制柱状图 p <- plot_ly(revenue,y ~本周,x ~游戏名称,type "bar",name "本周&q…

记一次项目经历

一、项目需求 1、设备四个工位&#xff0c;每个工位需要测试产品的电参数&#xff1b; 2、每个另外加四个位置温度&#xff1b; 3、显示4个通道电流曲线&#xff0c;16个通道温度曲线&#xff1b; 4、可切换工艺参数&#xff1b; 5、常规判定&#xff0c;测试数据保存到表格内&…

AndoridStudio 使用 Inspect code 检查优化代码

日常开发时&#xff0c;AS 会有报黄提示&#xff0c;如果不修改&#xff0c;日积月累下来&#xff0c;应用性能就有问题了。 针对这种情况&#xff0c;可以使用 AS 自带的 Inspect code 功能来批量检查、优化代码。 选择 Code – Inspect Code &#xff0c; 按需选择 整个工…

如何允许从互联网(外网)进入路由器管理页面

1.绑定UDP端口 操作如图所示&#xff1a; 2.然后再绑定虚拟换回网卡 3.然后再把出端口编号设置成为2 使他成为一个双向输入输出具体操作如图所示&#xff1a; 4.进入防火墙然后再启动防火墙进行端口配置&#xff1a; 1.进入端口g0/0/0配置ip地址&#xff08;注意配置的ip地…

【web]-f12-iphone6

题目&#xff1a;屌丝没有苹果&#xff0c;手机都买不起&#xff0c;咋办&#xff1f;室友的iphone6好眼馋&#xff0c;某些网站也只有手机打得开(答案为flag{}形式&#xff0c;提交{}中内容即可) 手机模式浏览&#xff0c;F5刷新下就可以看到了。 flag a2a7c20140d7520903a70…

uniapp内置组件scroll-view案例解析

参考资料 文档地址&#xff1a;https://uniapp.dcloud.net.cn/component/scroll-view.html 官方给的完整代码 <script>export default {data() {return {scrollTop: 0,old: {scrollTop: 0}}},methods: {upper: function(e) {console.log(e)},lower: function(e) {cons…

MSPM0G3507(三十七)——最新资料包

所有代码本人全部试过都能用 &#xff0c;有啥疑问直接提出 推荐用软件OLED硬件6050&#xff0c;硬件6050读取速度较快&#xff0c;比较稳定 OLED是单独的纯OLED 两个6050程序分别为硬件6050软件oled&#xff0c;软件6050硬件OLED 全都是在CCStheia上编程&#xff0c;有啥问…

sentinel源码分析: dashboard与微服务的交互、pull模式持久化

文章目录 原始方式微服务端规则如何保存规则如何加载进内存微服务端接收控制台请求控制台推送规则总结 pull拉模式官方demo如何整合Spring Cloud整合Spring Cloud 前置知识 SentinelResource的实现原理、SphU.entry()方法中ProcessorSlotChain链、entry.exit() 建议先会使用se…

SvANet:微小医学目标分割网络,增强早期疾病检测

SvANet&#xff1a;微小医学目标分割网络&#xff0c;增强早期疾病检测 提出背景前人工作医学对象分割微小医学对象分割注意力机制 SvANet 结构图SvANet 解法拆解解法逻辑链 论文&#xff1a;SvANet: A Scale-variant Attention-based Network for Small Medical Object Segmen…

微博图片下载助手

开发的一款「微博图片下载助手」支持一键保存用户图片 / 原图保存 / 支持保存 live 动图&#xff0c;支持免登录&#xff0c;但是不支持去水印哦。另外软件是易语言编写的&#xff0c;一些杀毒软件可能会误报。 链接: https://pan.baidu.com/s/1ZwDuuS2AF0-nxGgYYPve_g?pwdwn…

LLM大模型从入门到精通(3)--LLM主流大模型类别

目录 1 ChatGLM-6B模型简介&#xff1a; 2 LLaMA模型简介&#xff1a; 3 BLOOM模型简介 4 Baichuan-7B模型 随着ChatGPT迅速火爆&#xff0c;引发了大模型的时代变革&#xff0c;国内外各大公司也快速跟进生成式AI市场&#xff0c;近百款大模型发布及应用。开源语言大模型种…

centos部署jar包

第一步&#xff1a; 将IDEA中的项目打包为jar,将这个jar文件放到centos服务器上的目录里&#xff0c;我在opt新建api目录&#xff0c;将jar文件放入&#xff0c;如下图&#xff1a; 第二步&#xff1a; 将需要读取的配置文件也放入此目录(其他目录也可以&#xff0c;和脚本中…

python:在同一视窗中画出三个函数的图形

编写 function_3.py 如下 # -*- coding: utf-8 -*- """ 在同一视窗中画出三个函数的图形 """ import numpy as np from matplotlib import pyplot as plt# 用于正常显示中文标题&#xff0c;负号 plt.rcParams[font.sans-serif] [SimHei] plt…

TypeError: Rule.__init__() got an unexpected keyword argument ‘method‘报错的解法

报错如图&#xff1a; 原代码&#xff1a; app.route(/query,method[get,post]) 解决办法很简单&#xff0c;method后加s app.route(/query,methods[get,post]) 重新执行代码&#xff0c;不报错了

Leetcode104.求二叉树的最大深度

题目描述 递归法 class Solution {public int maxDepth(TreeNode root) {if (root null) { //帮助下面的else语句判空return 0;} else {int leftHeight maxDepth(root.left);int rightHeight maxDepth(root.right);/*** 要注意的点* 1. 这个return是写在else语句里面的&am…

西邮计科嵌入式复习

西邮嵌入式复习 一、第一章复习二、第二章复习三、第三章复习四、第四章复习 一、第一章复习 二、第二章复习 三、第三章复习 四、第四章复习

MYSQL的面试题

目录 一.数据库的约束类型 一.创建数据库、修改数据库名、修改表名&#xff0c;修改列名、修改某个属性的语法 三.索引的类型、优缺点以及使用场景 四.索引的常见的索引数据结构 五.数据库中常用的锁 六.事务的四大特性 七.什么是脏读&#xff1f;幻读&#xff1f;不可重…