【知识图谱导论-浙大】第二章:知识图谱的表示

news2025/2/28 1:09:31

前文:

  1. 【知识图谱导论-浙大】第一章:知识图谱概论

本节内容的视频讲解如下:

【知识图谱理论】(浙大2022知识图谱课程)第二讲-知识图谱的表示

什么是知识表示

简而言之,知识表示(Knowledge Representation, KR)就是用易于计算机处理的方式来描述人脑知识的方法。KR不是数据格式,不等同于数据结构,也不是编程语言,对于人工智能而言,数据与知识的区别在于KR支持推理。一篇比较久远的论文:R. Davis, H. Shrobe, and P. Szolovits. What is a Knowledge Representation? AI Magazine, 14(1):17-33, 1993,对KR的作用是这样描述的。
在这里插入图片描述
说明:

  1. Role I,事务的名称
  2. Role II,事务有了名字之后,在此基础上进行一层层抽象,一群学生中,一些人是本科生,一些人是硕士生,一些人是博士生,他们哪些学校的学生,这种对事务的进行抽象,建立万事万物之间的联系,就是本体的构建(ontology);
  3. Role III,有了万事万物之间的联系,就可以利用这些联系做相关的推理;
  4. Role IV,这种表示易于计算机处理,例如自然语言就不适合
  5. Role V,这中表示要易于人类理解,具有可解释

知识的符号表示

传统的知识表示方法就是符号表示。
在这里插入图片描述

知识的向量表示

基于连续向量的知识表示。联想到word2vec,一个最大的好处就是易于捕获隐式的知识,可以将推理的过程转换成向量之间的计算,当然引入的弊端是:如何解释?

知识不仅存在与文本中,图片,视频中都会存在知识,使用向量化的处理可以融合图片、视频相关中的知识参与到相关推理中,也就是现在比较流行的多模态

知识图谱的符号表示

基于图的知识表示与建模

在知识图谱的具体实践中,不同的场景会对知识的建模采用不同表达能力的图表示方法。例如:

  1. 无向图,建模要求不高,偏向于数据挖掘领域场景
  2. 有向标记图:1.属性图(property graph) ;2. RDF图模型,3. 更为复杂的关系语言表示(对称关系、自反关系、传递关系等),就需要OWL这种本体描述语言

Property Graph——属性图

具有代表性的图数据库就是Neo4J,在工业界着中也有广泛的使用。

属性图的优点是表达方式灵活,如允许在边上增加属性,利于表示多元关系等。属性图在存储过程充分利用图的结构进行优化,在查询的过程中有较高的优势。

属性图的缺点是缺乏工业标准规范的支持,由于属性图不关注更深层次的语义表达,也不支持符号逻辑推理。
在这里插入图片描述
属性图是由顶点(Vertex)、边(Edge)、标签(Label)组成的有向图,其中关系类型中也还有属性(Property)。这里顶点也称为节点(Node),边也称为关系(Relationship)。属性图中,节点和关系都是比较重要的实体,节点上包含属性,属性可以以任何键值形式存在。

关系连接节点,每个关系都有一个方向、一个标签、一个开始节点和结束节点。关系的方向的标签使得属性图具有语义化特征

关系也可以有属性,即边属性。可通过在关系上增加属性给图算法提供边的元信息,如创建时间。此外还可以通过边属性为边增加权重和特性等其他的额外信息。
在这里插入图片描述

RDF——基于三元组的描述模型

RDF(Resource Description Framework,资源描述框架),由三个元素组成(S,P,O),即(subject(主),predicate(谓),object(宾));如:(subject(浙江大学),predicate(位于),object(杭州))。

一个RDF三元组代表关于客观世界的逻辑描述获客观事实。多个三元组头尾相连就构成了一个有向标记图——RDF图。

RDFS提供了基础的表达构建,用于定义类、属性等Schema术语,如:Class, subClassOf, type, Property, subPropertyOf, Domain, Range等,其中:

  1. Domain, Range: 用于定义某个关系的头尾节点类型
  2. subClassOf,subPropertyOf:用于定义类及属性之间的层次关系等

在这里插入图片描述

使用RDFS进行简单的符号推理:

在这里插入图片描述

OWL: Web Ontologies

rdf的表达能力还是比较有限的。在实际场景中需要定义更为复杂的概念、刻画更为复杂的概念关系,这时就需要用到OWL等本体表达语言。

本体ontology原来是一个哲学术语,在人工智能领域作为知识表示研究的对象。

OWL可以看成RDFS的拓展,增加了更多的语义表达构建。

在这里插入图片描述
那么OWL是如何表达的呢?下面了解一下OWL的表达构件:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

知识图谱的向量表示

向量化的表示在人工智能的很多领域得到了应用。

词的分布式向量表示

最初的词向量使用的one-hot的表示方法。每个词向量的大小都是词典点的大小,在词的向量中,除了该词对应位置为1以外,其他皆为0。
在这里插入图片描述
这种方法显著的缺点是:空间消耗大,数据稀疏,无法表示词的语义等。类似文档的表示方法Bag-of-words:
在这里插入图片描述
这种向量的大小也都是文档的大小,向量中词语对应位置的值就是词语在文档中出现的次数。

我们都知道词是有语义的,那么词的语义到底是由什么决定的呢?这个问题太复杂了,还涉及语言学。但是大家都认可的是:词的语义是由上下文决定的。人在运用语言时,其实是没有记住每个词的精确语义定义,大脑里也没有什么精确定义的词典,通常是类比一个词出现的上下文来理解这个词的语义。

word embedding(词向量学习模型得到)就是通过利用大料的语料数据,结合词语的上下文内容训练出词语的稠密、低维的向量化表示。例如word2vec的两种训练模式:
在这里插入图片描述
在这里插入图片描述
即使当前比较流行的预训练语言模型也都是利用词语的上下文信息来捕捉词的语义内容。

知识图谱嵌入模型:TransE

类似于word Embedding,我们可以利用主谓宾三元组结构来学习知识图谱中实体和关系的向量表示的模型,TransE就是一个比较有效的方式。
在这里插入图片描述
其中:

  1. h代表head,即关系中subject
  2. r代表relation,
  3. t代表tail,即关系中的object

那么h、r、t对应的向量应该满足h + r = t这个关系。评分函数、损失函数定义如下:
在这里插入图片描述
目标就是尽可能地让真实的三元组得分搞,负样本的得分低,然后使用梯度下降算法进行优化。当模型训练收敛之后,h + r 的结果与t应该是比较接近的。

知识图谱嵌入模型:DistMult

在这里插入图片描述
DistMult与TransE主要的区别是,h,r,t三者之间的关系。DistMult则使用的是乘法。

知识图谱嵌入模型:推理问题

嵌入的效果如何,最好的方式是通过推理去测试。即给定三元组中的两个元素,来推理第三个元素。例如:

在这里插入图片描述
在显示场景中有很多影响实体关系向量表示好坏的因素。一个比较大的问题是数据稀疏性问题:实体和关系的好坏取决于训练语料中,是否存在足够多的包含他们的三元组,如果某个实体是孤立实体,那么很自然地难以学习到好的效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/146160.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【HTML】纯CSS居然能做出这种效果,一款宝藏网页分享(超详细讲解 | 附源码)

💂作者简介: THUNDER王,一名热爱财税和SAP ABAP编程以及热爱分享的博主。目前于江西师范大学会计学专业大二本科在读,同时任汉硕云(广东)科技有限公司ABAP开发顾问。在学习工作中,我通常使用偏后…

【ASP.NET】家乡网站设计作业「历史」「人文」「自然」「美食」「高中」

文章目录作业描述结果展示代码MasterPage.master(母版页)首页历史页人文页美食页景观页高中页完整资源链接上学期其中ASP.NET网站设计老师布置的作业,在此记录一下;作业描述 为自己的家乡设计一个网站: 要求: 1.网站主要是展示和…

TYPE-C和USB-C接口有什么区别?

USB-C接口全称为USB Type-C,属于USB 3.0下一代接口,其亮点在于更加纤薄的设计、更快的传输速度(最高可达10Gbps)、更强的电力传输(最高100W),此外USB-C接口还支持双面插入,正反面随便…

【NCC】之三:FFT(DFT)加速协方差的计算

FFT加速计算两个图的协方差文章目录<center> FFT加速计算两个图的协方差1. 傅里叶变换和卷积1.1 卷积定理1.2 空域卷积和频域乘积的复杂度2. opencv中的DFT3. FFT用于NCC4. 测试结果部分代码1. 傅里叶变换和卷积 1.1 卷积定理 图片来源 在空域上的卷积就是上面的动图所展…

再学C语言27:输入和输出——缓冲区

I/O函数&#xff1a;输入/输出函数 I/O函数将信息传输至程序并从程序中传出信息&#xff0c;如printf()、scanf()、getchar()、putchar()等函数 getchar()和putchar()每次输入/输出一个字符 示例代码&#xff1a; #include <stdio.h> int main(void) {char c;// 输入回…

Vivado综合设置之-resource_sharing

-​resource_sharing用于对算数运算&#xff08;加法、减法和乘法&#xff09;实现资源共享&#xff0c;以节约LUT资源&#xff0c;有3个值&#xff1a;auto、off和on&#xff0c;默认是auto。 默认情况下&#xff0c;将resource_sharing设置为auto即可。 本文验证-resource_…

[Leetcode] 将二叉搜索树变平衡

将二叉搜索树变平衡&#xff1a;https://leetcode.cn/problems/balance-a-binary-search-tree/给你一棵二叉搜索树&#xff0c;请你返回一棵 平衡后的二叉搜索树&#xff0c;新生成的树应该与原来的树有着相同的节点值。如果有多种构造方法&#xff0c;请你返回任意一种。如果一…

Codeforces Round #842 (Div. 2)-C. Elemental Decompress

题目&#xff1a; 题目大意&#xff1a; 给定一个数列t&#xff0c;你构造两个数列a和b&#xff0c;使得max(a[i],b[i])t[i] 核心思想&#xff1a; 1、先根据给出的数组进行放置&#xff0c;优先放到a数组中&#xff0c;如果这个数已经在a数组中出现了&#xff0c;再去放到b数…

sentinel的使用

一、sentinel控制台的使用1、sentinel控制台jar包地址&#xff1a;Releases alibaba/Sentinel GitHub账号密码都为sentinel控制台访问地址&#xff1a;http://localhost:80802、sentinel的maven坐标<dependency><groupId>com.alibaba.cloud</groupId><a…

Android基础入门教程——2.2 LinearLayout(线性布局)

总结图片2. weight权重白色占总数量的2份&#xff0c;绿色占总数的1份。<?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"xmlns:app"http://schemas.android.co…

树莓派最新版系统烧写和网络配置

树莓派笔记1.树莓派烧写篇2.树莓派WIFI配置篇3.树莓派ping外网4.树莓派git篇5.参考1.树莓派烧写篇 目前烧写最新版本32位系统(2022-09-22发布的)&#xff0c;默认移除了pi用户&#xff0c;没有用户就无法SSH登录(无屏幕)&#xff0c;建议使用raspberry pi imager烧写工具&…

通过USB转TTL串口下载stm32程序

文章目录前言一、硬件及其接线二、使用步骤1.主芯片STM32F103C8T6开发板2.转串口模块接线3.CH340驱动及安装方法4.CH340驱动及安装方法4.下载测试5.0.91寸OLED 接口演示例程前言 前期我们下载程序都是使用STlink进行下载的&#xff0c;现在给大家提供一种新的程序下载方法&…

5G小基站国产化超五成,美国芯片仅占1%,难怪美国芯片难卖了

日前日媒拆解中国某科技企业的5G小基站&#xff0c;发现它的中国零部件占比达到55%&#xff0c;而来自美国的零部件占比仅为1%&#xff0c;显示出这家企业在去美化取得了重大进展&#xff0c;如此也就能理解为何如今美国芯片难卖了。日媒指出该科技企业的5G小基站国产化零部件占…

动态规划 完全背包问题

目录 LintCode 炼码完全背包问题 【解法一】 【解法二】 完全背包问题 【解法一】 解释&#xff1a; 第一个for循环表示从第一个物品开始遍历 第二个for循环表示逆向 从背包容量为m时开始处理&#xff08;滚动数组&#xff09; 第三个for循环表示装入k个该物品&#xff0c;装…

【前端】Vue项目:旅游App-(9)city:固定tab栏、内容中显示数据

文章目录目标过程与代码Tab一直显示的两种方法方法1&#xff1a;fixed定位方法2&#xff1a;设置height和overflow-y&#xff08;效果不好&#xff09;content显示数据效果总代码city.vue相关参考目标 上一篇获取了服务器中的数据&#xff1a;【前端】Vue项目&#xff1a;旅游…

【数据结构】完全二叉树——啊堆堆堆

一、树概念及结构树的概念树是一种非线性的数据结构&#xff0c;它是由n&#xff08;n > 0&#xff09;个有限节点组成的一个具有层次关系的集合。把它叫做树是因为他看起来像是一颗倒挂起来的树&#xff0c;也就是说它是根朝上&#xff0c;而叶子朝下的。-> 有一个特殊的…

Find My产品|Ember发布支持苹果Find My温控马克杯

在 CES2023 展会上&#xff0c;温控马克杯制造商 Ember 表示&#xff0c;计划在 2023 年 Q2 上市一款支持苹果 Find My 应用的全新 Travel Mug 2 马克杯。 这项新功能将使用户能够在 Find My 应用中追踪 Travel Mug 2 的位置&#xff0c;就像追踪iPhone、iPad、AirPods 或其他…

埃科光电在科创板IPO过会:拟募资11亿元,董宁为实际控制人

近日&#xff0c;上海证券交易所披露的信息显示&#xff0c;合肥埃科光电科技股份有限公司&#xff08;下称“埃科光电”获得科创板上市委会议通过。据贝多财经了解&#xff0c;埃科光电于2022年6月22日在科创板提交招股书&#xff0c;并于12月29日递交招股书&#xff08;上会稿…

图像分割笔记

图像分割笔记 目标&#xff1a; 实现图像中多个物体的分割&#xff0c;多个物体的标注方式为0,1,2,3,0表示背景&#xff0c;1表示一种物体&#xff0c;2表示另一种物体&#xff0c;假设我们现在的分割任务里面有5个目标需要&#xff0c;如肺叶分割&#xff0c;5个肺叶的标注方…

飞书开放平台-全新消息卡片搭建工具

前言你还在为需要手撕 JSON 代码而烦恼吗&#xff1f;消息卡片搭建工具全新升级&#xff0c;为你带来更优雅的卡片创作体验&#xff1a;&#x1f31f; 卡片编辑&#xff1a;纯可视化操作编辑消息卡片&#xff0c;再也不用碰代码&#x1f31f; 我的卡片&#xff1a;一键保存卡片…