基于距离模型SE

news2024/11/28 12:49:32

知识表示

one-hot representation: 将研究对象表示为向量,该向量只有某一维度非零,其他维度上的值均为零。独热表示是信息检索和搜索引擎中广泛使用的词袋模型的基础,优点是无需学习过程。简单高效,在信息检索和自然语言处理中得到广泛应用。缺点是会丢失大量有用的信息。无法有效的表示短文本。容易受到数据稀疏问题的影响。
表示学习的目标:通过机器学习将研究对象的语义信息表示为稠密低维实质向量。将实体 e e e和关系 r r r表示为两个不同的向量。在向量空间中,通过欧氏距离和余弦距离等方式。计算任意两个对象之间的语义相似度。
传统的知识表示方法主要以RDF,资源描述框架的三元组 S P O SPO SPO(subject,property,object)来符号性的描述实体之间的关系。这种表示方法通常使用简单,受到广泛的认可。但在计算效率、数据稀疏方面受到存在诸多问题。近年来,以深度学习为代表的表示学习取得了重要的进展。可以将实体的语义信息表示为稠密低维实值向量。进而在低维空间中高效计算实体、关系及其之间的复杂语义关联。对知识库的构建、推理、融合以及应用均有重要的意义。

符号

使用 G = ( E , R , T ) G = (E,R,T) G=(E,R,T)来表示完整的知识图谱,其中 E E E = { e 1 , e 2 , ⋯   , e ∣ E ∣ e_1,e_2,\cdots,e_{|E|} e1,e2,,eE}表示实体集合。
R = ( r 1 , r 2 , ⋯   , r ∣ R ∣ ) R = (r_1,r_2,\cdots,r_{|R|}) R=(r1,r2,,rR)表示关系集合。 T T T表示三元组集合。 ∣ E ∣ |E| E ∣ R ∣ |R| R表示实体和关系的数量。
知识图谱以三元组 < h , r , t > <h,r,t> <h,r,t>的形式表示,其中 h ∈ E h \in E hE表示头实体, t ∈ E t \in E tE表示尾实体, r ∈ R r \in R rR表示 h 和 t h和t ht之间的关系集合。

SE

SE(Structured Embedding)会将每个实体投影到 d d d维空间向量。具体来说,SE会为每个关系设计两个矩阵 M r , 1 和 M r , 2 ∈ R d × d M_{r,1}和M_{r,2} \in R^{d \times d} Mr,1Mr,2Rd×d,然后使用这两个矩阵将头实体和尾巴实体投影到相同的语义空间中。并计算相似度,SE的评分函数为:
在这里插入图片描述
其中 h , t h,t h,t都会被投影到相应的关系空间中。
​ 不同于TransE 这样基于翻译的模型,SE 会将实体建模为嵌入向量,关系建模为投影矩阵
距离模型能够利用学习到的知识表示进行链接预测,即通过计算,找到让两实体距离最近的关系矩阵
距离模型的缺陷**:协同性差,无法精确刻画两个实体之间的语义联系**

论文中关于SE介绍

SE: 一种直观的基于距离的方法是计算实体在关系的对应空间中的投影向量之间的距离。结构表示为(structured embedding, SE[).中每个实体用 d d d维向量表示,SE为每个关系定义了两个投影矩阵, M r , 1 M r , 2 M_{r,1} M_{r,2} Mr,1Mr,2 利用这两个投影矩阵和 L 1 L_1 L1距离学习结构嵌入为:
在这里插入图片描述
该距离表明头实体 h h h和尾实体 t t t在关系 r r r的语义相关度。然而SE对头尾实体使用2个不同的矩阵进行投影,因此SE的协同性较差,无法精确的刻画画头、尾实体与关系之间语义联系的强弱.

经验,先大致总结以下,用到时候构建自己知识图谱时候在自己调用代码都行啦的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/345115.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

亚马逊云科技助力滴普科技,加速企业数据价值洞察

随着企业数字化转型的不断深入&#xff0c;数据对于业务的价值和重要性也逐渐凸显。越来越多企业意识到&#xff0c;只有不断提升底层数据基础平台的性能和能力&#xff0c;才能构建数据驱动的业务&#xff0c;增强企业核心竞争力。作为湖仓一体数据智能基础软件独角兽企业&…

开学必备数码清单,大学生开学必备数码好物分享

还有很多小伙伴不知道开学应该准备什么&#xff0c;在学校当中需要用到的数码产品&#xff0c;在宿舍娱乐使用的音箱、学习当中使用到的笔记本&#xff0c;这些都是我们可以准备的&#xff0c;还有一个小众的好物&#xff0c;能够让我们在学校当中提升生活的幸福感&#xff0c;…

MinIO-rpm离线安装

近日&#xff0c;由于客户的系统运行环境在一个封闭的网络内&#xff0c;不能与互联网联通&#xff0c;也不能提供yum库&#xff0c;所以运行环境只能采用rpm离线安装的方式&#xff0c;我总结了一下本次的安装经过&#xff0c;希望对需要的人有所帮助。一、单机安装1.下载http…

postgres 源码解析49 Btree节点分裂点确认流程--2

上篇讲解了分裂的规则和填充策略等内容&#xff0c;而本文着重讲解postgres Btree分裂点确认流程&#xff0c;接口函数为 _bt_findsplitloc。相关知识点见回顾&#xff1a;postgres源码解析48 Btree节点分裂点确认流程–1 执行流程 _bt_findsplitloc 该函数的功能是确定该分裂…

金三银四一线大厂常见Java面试题面试题总结 1000+ 面试题

Java 面试八股文有必要背吗&#xff1f; 我的回答是&#xff1a;很有必要。你可以讨厌这种模式&#xff0c;但你一定要去背&#xff0c;因为不背你就进不了大厂。现如今&#xff0c;Java 面试的本质就是八股文&#xff0c;把八股文面试题背好&#xff0c;面试才有可能表现好。…

2020年欧空局10米土地覆盖数据

土地覆盖数据是我们平时最常用的地理数据之一&#xff0c;土地覆盖数据的来源也有很多种&#xff0c;之前我们介绍共过两个的30米精度的土地覆盖数据&#xff0c;分别为GlobeLand30土地覆盖数据和CLCD土地覆盖数据&#xff0c;&#xff08;可查看之前推送的文章&#xff09;&am…

Linux:用户空间非法指针coredump简析

1. 前言 限于作者能力水平&#xff0c;本文可能存在谬误&#xff0c;因此而给读者带来的损失&#xff0c;作者不做任何承诺。 2. 背景 本文分析基于 ARM32 架构&#xff0c;Linux-4.14 内核代码。 3. 问题分析 3.1 测试范例 void main(void) {*(int *)0 8; }运行程序会 …

Seata-Server分布式事务原理加源码 (七) - TCC事务模式

TCC事务模式 首先我们先来了解常规的TCC模式。 什么是TCC TCC 是分布式事务中的二阶段提交协议&#xff0c;它的全称为 Try-Confirm-Cancel&#xff0c;即资源预留&#xff08;Try&#xff09;、确认操作&#xff08;Confirm&#xff09;、取消操作&#xff08;Cancel&#…

CV——day77 简读论文:视频中交通标志的跟踪检测

视频中交通标志的跟踪检测Detection-by-tracking of traffic signs in videos1 Introduction3 Methods3.1 Faster R-CNN3.2 Proposed shortest-path approach3.3 Tractor-based method3.4 IoU-based method6 ConclusionsDetection-by-tracking of traffic signs in videos 视频…

除了ChatGPT,还能用什么计划管理软件提高效率?

最近一段时间&#xff0c;人工智能工具ChatGPT成为互联网科技圈的热门话题。正如当年的阿尔法狗给世界带来的震动一样&#xff0c;人们讨论的最多的就是&#xff1a;ai智能会不会取代人工&#xff0c;因为ai的效率太高了&#xff0c;但再智能&#xff0c;也有ai永远也取代不了的…

ROS2机器人编程简述humble-第四章-IMPROVED DETECTOR .4

ROS2之TF2小练习-颜色随机器人和障碍物直接距离变化ROS2之TF2小练习-有哪些bug找找看里面给出了&#xff1a;ROS2机器人编程简述humble-第四章-BASIC DETECTOR .3需要改进哪些地方呢&#xff1f;检测之后&#xff0c;距离不变了……如何变化&#xff1f;这个问题可以问chatgpt吗…

【Linux】TCP并发网络编程

多线程网络编程 上一节我们讲到&#xff0c;当我们的多个客户端区连接同一个服务端的时候就会出现问题&#xff0c;这是因为一个返回值只能接收一个客户端传输的消息&#xff0c;那么我们想要多个客户端同时链接服务端&#xff0c;我们就要有这样一个思路&#xff0c;发过来一…

金三银四?铜三铁四才对吧......

往年的金三银四&#xff0c;今年被戏称为“铜三铁四”。知名的大厂HR们都在不断的裁员&#xff0c;能被保住不被裁掉可能就万事大吉了&#xff0c;赛道越来越窄&#xff0c;都在预测未来计算机行业是不是下一个土木工程&#xff1f; 我也算是软件测试岗位的老鸟了&#xff0c;…

2.6 尚品汇 day13 二级路由 饿了么ui 表单使用以及验证(不完整)、上线后的跨域代理(nginx)

二级路由 1.1路由结构 1.2 引入二级路由 1.2.2配置路由信息 1.3 声明导航 1.4配置路由出口 饿了么ui 表单使用以及验证 使用 1.1.1复制结构 1.1.2 在main.js 按需引入 引入首字母大写&#xff0c;-用大写替代&#xff0c;el省略&#xff0c;一定要引用完整 注意Vue.compon…

Smartbi观点 | ChatGPT还处于初级阶段?然而AI早已打入BI内部

最近&#xff0c;当我们还沉浸在电影《流浪地球2》MOSS所带来的震感时&#xff0c;ChatGPT又火爆社交媒体&#xff0c;成为全球“新顶流”。 官方数据显示&#xff0c;今年1月&#xff0c;平均每天约有1300万独立访客使用 ChatGPT&#xff0c;累计用户超1亿&#xff0c;创下了互…

Java 基础面试题——关键字

目录1.Java 中的关键字是指什么&#xff1f;有哪些关键字&#xff1f;2.instanceof 关键字的作用是什么&#xff1f;3.访问修饰符 public、private、protected、以及不写&#xff08;default&#xff09;时的区别&#xff1f;4.Java 中有没有 goto 关键字?5.在 Java 中&#x…

第一章SpringBoot简介

文章目录什么是SpringBoot了解我们的Spring能干什么Spring的生态为什么需要SpringBootSpringBoot优点SpringBoot缺点SpringBoot的大时代背景微服务分布式分布式的困难分布式的解决云原生上云的困难SpringBoot之Helloworld新添我们的maven相关的配置创建一个maven项目并导入依赖…

Seata-Server分布式事务原理加源码(二) - 分布式事务解决方案

分布式事务解决方案 2PC即两阶段提交协议&#xff0c;是将整个事务流程分为两个阶段&#xff0c;P是指准备阶段&#xff0c;C是指提交阶段。 准备阶段&#xff08;Prepare phase&#xff09;提交阶段&#xff08;commit phase&#xff09; 举例&#xff1a;比如说相亲对象两…

微服务项目【秒杀商品展示及商品秒杀】

登录方式调整 第1步&#xff1a;从zmall-common的pom.xml中移除spring-session-data-redis依赖 注意&#xff1a; 1&#xff09;本次不采用spring-session方式&#xff0c;改用redis直接存储用户登录信息&#xff0c;主要是为了方便之后的jmeter压测&#xff1b; 2&#xff09…

魔兽世界WOW私服架设详细教程

1. 写在前面&#xff1a;此教程是针对国服WOW3.3.5.13930版本的&#xff0c;因为目前魔兽单机在此版本下运行最正常。WOW4.0以上版本还有些许问题2. 准备文件&#xff08;1&#xff09;WOW3.3.5.13930客户端&#xff0c;没有的可以从这里下载WOW 3.3.2安装文件和WOW3.3.2-3.3.5…