论文浅尝 | Concept2Box:从双视图学习知识图谱的联合几何嵌入模型

news2024/11/18 6:22:10

e298364c8996eee81f156734d906a6e9.png

笔记整理:张钊源,天津大学硕士,研究方向为知识图谱

链接:https://virtual2023.aclweb.org/paper_P4210.html

动机

知识图嵌入(KGE)已被广泛研究,用于嵌入大规模关系数据以满足许多现实世界的应用。现有方法长期以来忽略了许多知识图谱包含两种根本不同视图的事实:高级本体视图概念和细粒度实例视图实体。它们通常将所有节点作为向量嵌入一个潜在空间。然而,单一的几何表示法无法捕捉两种视图之间的结构差异,也缺乏针对概念粒度的概率语义。本文提出了Concept2Box,这是一种使用双几何表示联合嵌入KG的两个视图的新方法。Concept2Box使用box嵌入对概念进行建模,box嵌入可以学习概念的层次结构和复杂关系,例如概念之间的重叠和不相交。方框体积可以解释为概念的粒度。与概念不同,Concept2Box将实体建模为向量。为了弥补概念box嵌入和实体向量嵌入之间的差距,提出了一种新的向量到box的距离度量,并联合学习这两种嵌入。

亮点

Concept2Box的亮点主要包括:

(1)提出了一种新的模型,通过将概念和实例与不同的几何对象联合嵌入来学习双视图KG表示。

(2)设计了一个新的度量函数来测量概念框和实体向量之间的距离,以连接两个视图。

(3)构建了一个新的工业配方相关KG数据集。

概念及模型

本文提出的Concept2Box的整体框架包括3个模块,具体如下图所示。首先使用概率box嵌入对本体视图的KG进行建模,捕捉分层结构并保留概念的粒度(左侧上图)。其次,通过应用基于向量的KG嵌入方法对实例视图KG进行建模(左侧下图)。第三,为了连接这两种视图设计了一种新颖的距离度量,定义了从方框到向量的距离(右图)。该模型通过联合优化每个相应模块的三个损失函数来学习。每个模块的具体技术实现如下:

(1) 基于本体视图的box式知识图谱嵌入模块,通过知识图谱完成损失训练捕获概念的层次结构和复杂关系;

(2) 基于实例视图的矢量知识图谱嵌入模块,通过知识图谱完成损失训练捕获概念的层次结构和复杂关系。

(3) 跨视图模块通过S上的概念链接损失进行训练。该模块依赖于一种新的距离度量,用于弥合向量和方框之间的语义。

a1cee655fbcc13f8743857b5259a7b2e.png图1  Concept2Box架构

  • 不同模块核心建模

本体视图KG嵌入模块的Loss函数如下所示,函数后半部分的三元组代表由真实三元组替换的负采样三元组。

e701efc7a17cddaacb5693204335928d.png

跨视图 KG 建模模块的距离函数定义如下,具体来说,给定一个概念 c 和一个实体 e,如果将概念框的最小和最大位置参数表示为 μm、μM ,将实体的向量定义为 e,将距离函数 fd 定义为。

2d5eea017ca818ced62c7475e94acf79.png

跨视图模块是通过负采样最小化以下损失来训练的:

ae7274564f3507ec17899d3c305f3e34.png

总体损失函数是实例视图和本体视图KG补全损失以及跨视图损失的线性组合,如下所示:

4ef93afec4431aa7aea03890f811ea26.png

实验

数据集的设置:实验在两个数据集上进行:一个是来自DBpedia的公开数据集,该数据集描述了从DBpedia抓取的一般概念和细粒度实体。此外本文还创建了一个新的食谱相关数据集,其中概念是食谱、一般配料和器皿名称等,实体是通过Amazon.com搜索到的烹饪每个食谱的具体产品,以及一些选定的属性(如品牌)。

针对Concept2Box模型进行了两种实验,分别是概念链路预测任务和模型泛化能力测试。

概念链路预测任务是给定实体的关联概念,其中每个实体可能被映射到多个概念,需要测试所学嵌入的质量。具体实验结果如下:

8212e7671bcb52ab4aee7e6a9ebc5f6f.png

由实验结果可知,能够在大多数情况下实现最高的性能,与实体和概念都被建模为box子的Box4ET相比,Concept2Box表现得更好,这表明实体和概念确实是两种根本不同类型的节点,理应用不同的几何模式进行建模。另外,通过实验结果可以观察到Box4ET和Concept2Box能够超越未使用box嵌入的方法,这表明box嵌入在学习不同粒度的实体(概念和实例)的层次结构和复杂行为等方面具有优势。

Diversity-Aware评估。为了验证Concept2Box学习得到的嵌入可以捕获概念之间的复杂关系和层次结构,本文在泛化实验中使用了多样性感知评估。具体实验结果如下:

4370a5f87c1c8adc493e6985910a1b36.png

可以看到,在不同的设置中,Concept2Box都能达到最好的效果,显示出它强大的泛化能力。注意,当改变类型的数量时,Concept2Box能够带来比JOIE更多的性能增益。这可以理解为概念的层次结构被box嵌入很好地捕获,当适当选择类型的数量时,首先将概念(配方)缩小到相关概念(成分)的集合,以便更好地理解,从而产生更好的结果。

总结

本文提出的Concept2Box是一种新颖的双视角知识图谱嵌入方法。将高级概念建模为方框,以捕捉它们之间的层次结构和复杂关系,并基于方框体积反映概念粒度。对于实例视图KG,Concept2Box将细粒度实体建模为矢量,并提出了一种新的度量函数来定义实体与实体之间的距离,从而弥合两种视图的语义。Concept2Box经过联合训练,可以对实例视图KG、本体视图KG和跨视图链接进行建模。在两个真实世界数据集(包括一个新创建的食谱数据集)上的经验实验结果验证了Concept2Box的有效性。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

bba57d38d19199f80303ba56a0904f42.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1117567.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring Security总体架构介绍

参考:架构 :: Spring Security Reference (springdoc.cn) 一、过滤器 Spring Security 框架对 Servlet 请求的处理是基于过滤器机制。 容器会提前创建好FilterChain对每一个请求进行过滤,FilterChain中包含Filter 实例和 Servlet(Spring MV…

编写后台登录滑动成功获取验证码 人机验证

vue-puzzle-vcode Vue 纯前端的拼图人机验证、右滑拼图验证 安装vue-puzzle-vcode npm install vue-puzzle-vcode --save使用vue-puzzle-vcode import Vcode from "vue-puzzle-vcode";<Vcode :show"isShow" success"onSuccess" close"…

ZooKeeper+HBase分布式集群环境搭建

安装版本&#xff1a;hadoop-2.10.1、zookeeper-3.4.12、hbase-2.3.1 一、zookeeper集群搭建与配置 1.下载zookeeper安装包 2.解压移动zookeeper 3.修改配置文件&#xff08;创建文件夹&#xff09; 4.进入conf/ 5.修改zoo.cfg文件 6.进入/usr/local/zookeeper-3.4.12/zkdat…

虚拟机与主机(win10之间的通信)

(201条消息) Ubuntu虚拟机不显示ip地址【已解决】_ubuntu没有ip_不爱赖床的懒虫的博客-CSDN博客 sudo /sbin/dhclient VMTool安装与卸载 (201条消息) ubuntu中vmtools的安装与彻底卸载_卸载vmtools_林麦安的博客-CSDN博客 (202条消息) 解决虚拟机安装 VMware Tools 灰色无法…

聊聊RocketMQ中的broker的TPS和QPS为何相差巨大,是如何统计的

这里是weihubeats,觉得文章不错可以关注公众号小奏技术&#xff0c;文章首发。拒绝营销号&#xff0c;拒绝标题党 最近在看RocketMQ的一些监控指标的时候&#xff0c;总觉得一些监控指标不太对&#xff0c;好像对不上。 所以打算研究下看看RocketMQ中的 broker TPS、broker QP…

嵌入式学习笔记(60)内存管理之堆

1.7.1.什么是堆&#xff08;heap&#xff09; 内存管理对OS来说是一件非常复杂的事&#xff0c;因为首先内存容量大&#xff0c;其次内存需求在时间和大小块上没有规律&#xff08;OS上运行着几十、几百、几千个进程随时都会申请或者释放内存&#xff0c;申请或者释放的内存块…

JavaWeb从入门到起飞笔记——导学课程

学完这一节&#xff0c;我不知道学Web开发究竟能干什么&#xff1f;你知道吗&#xff1f; 以下是黑马程序员Java从入门到起飞的笔记 一、学完Javaweb能干什么&#xff1f; 学完Java后我们可以独立开发一些后台管理系统&#xff0c;例如CRMER器&#xff0c;京东和淘宝&#x…

tuxera ntfs2024破解版mac电脑磁盘读写软件

大家都知道由于操作系统的原因&#xff0c;在苹果电脑上不能够读写NTFS磁盘&#xff0c;但是&#xff0c;今天小编带来的这款tuxera ntfs 2024 mac版&#xff0c;完美的解决了这个问题。这是一款在macOS平台上使用的磁盘读写软件&#xff0c;能够实现苹果Mac OS X系统读写Micro…

C++ 字符串编码转换封装函数,UTF-8编码与本地编码互转

简介 字符串编码转换封装函数&#xff0c;UTF-8编码与本地编码互转。 中文乱码的解决方法 有时候我们会遇到乱码的字符串&#xff0c;比如&#xff1a; 古文码 可能是用GBK方式读取UTF-8编码的中文导致的&#xff0c;用下面的Utf8ToLocal(string str)函数转换一下就可以了。…

RFID解决光伏难题

RFID解决光伏难题 RFID是无线射频识别&#xff08;Radio Frequency Identification&#xff09;的缩写&#xff0c;是一种通过无线电信号识别物体的技术。RFID系统由标签、读写器和主机系统组成。标签内置有微型芯片和天线&#xff0c;能够储存和传输数据。读写器通过射频信号…

EasyCVR视频智能分析系统如何助力广场流动摊贩监管手段升级

在很多公园广场地带&#xff0c;经常会有流动摊贩进行售卖&#xff0c;虽然国家大力支持“地摊经济”&#xff0c;但很多摊贩并未按照规定进行摆摊&#xff0c;甚至有一些摊贩为了位置、客源大打出手&#xff0c;大大增添了城市管理难度。为让广场摊贩更加规范地进行作业&#…

mybatisplus开启sql打印的三种方式

1、在application.yml文件中添加mybatisplus的配置文件 使用mybatisplus自带的log-impl配置&#xff0c;可以在控制台打印出sql语句、执行结果的数据集、数据结果条数等详细信息&#xff0c;这种方法适合再调试的时候使用&#xff0c;因为这个展示的信息详细&#xff0c;更便于…

Windows11系统安装WSL教程

WSL&#xff0c;全称Windows Subsystem for Linux&#xff0c;是微软官方提供的可以在Windows上直接运行的Linux环境&#xff0c;包括大多数命令行工具、程序和应用&#xff0c;由系统底层虚拟机平台支持。 开启相关服务 1、控制面板-启用或关闭Windows功能 2、勾选以下两个…

Dataspell快捷键更改为eclipse后,在.py文件中shift+回车自动换行冲突问题解决

1.问题描述 已经将Dataspell快捷键切换快捷键为eclipse&#xff0c;在.py文件中shiftenter没有自动换行&#xff0c;出现如下结果。 2.问题解决 进去keymap配置界面 搜索python 将如下快捷键删除。 测试后问题已经解决。

Yakit工具篇:中间人攻击(平替Burp)的相关技巧-01

简介(来自官方文档) 背景 “MITM” 是 “Man-in-the-Middle” 的缩写&#xff0c;意思是中间人攻击。 MITM攻击是一种网络攻击技术&#xff0c;攻击者通过欺骗的手段&#xff0c;让自己成为通信双方之间的中间人&#xff0c;从而可以窃取双方之间的通信内容、修改通信内容、…

ntfs读写工具Tuxera NTFS2023激活码

Tuxera NTFS for Mac是一款mac系统读写工具,Tuxera让Mac OS支持NTFS 格式文件读写,支持所有移动硬盘、U盘等外接设备,同时Tuxera用户可以简单直观的在Mac机上随意对NTFS文件修改、 在 Mac 上打开、编辑、复制、移动或删除存储在 Windows NTFS 格式 USB 驱动器上的文件。当您获…

关于硬件原理图

很多纯软工程师开始做嵌入式时觉得门槛很高&#xff0c;基本的硬件原理图也看不懂&#xff0c;没有学过电路、数电、模电、电路原理&#xff0c;对电子元器件&#xff0c;对电阻、电压、电流、电容、电感等没有很扎实的概念&#xff0c;觉得老虎吃天无从下嘴。打开硬件原理图&a…

在Qt中怎么操作MySQL数据库

一、安装驱动 &#xff08;1&#xff09;安装 在Qt中操作MySQL数据库首先要安装mysql的驱动文件&#xff0c;将MySQL下的libmusql.dll文件复制到Qt的安装路径下的bin文件夹下即可。 本文福利&#xff0c;莬费领取Qt开发学习资料包、技术视频&#xff0c;内容包括&#xff08;…

使用Chrome浏览器进行网页截图

在需要截图的网页上&#xff0c;按F12打开开发调试页面&#xff0c;再按下ShiftCtrlP&#xff0c;打开命令输入框&#xff0c;输入Capture&#xff0c; 此时会弹出4中截图模式&#xff0c;我个人比较喜欢用Capture full size screenshot Capture area screenshot&#xff0c;…

YB6502是一款5V输入支持两节串联磷酸铁锂电池的升压充电管理应用

5V输入、双节串联磷酸铁锂电池升压充电芯片 描述&#xff1a; YB6502是一款5V输入支持两节串联磷酸铁锂电池的升压充电管理应用。采用了开 关升压结构&#xff0c;带有散热片的S0P8封装与较少的外部元件数日使得YB6502成为便携式 应用的理想选择。YB6502输入电压为5V,内置自适应…