【知识图谱】(task2)知识图谱表示

news2024/11/20 14:23:26

note

  • 知识图谱的符号表示方法:
    • 属性图是工业界最常见的图谱建模方法,属性图数据库充分利用图结构特点做了性能优化,实用度高,但不支持符号推理。
    • RDF是W3C推动的语义数据交换标准与规范,有更严格的语义逻辑基础,支持推理,并兼容更复杂的本体表示语言OWL。
    • 在三元组无法满足语义表示需要时,OWL作为一种完备的本体语言,提供了更多可供选用的语义表达构件。
  • 描述逻辑可以为知识图谱的表示与建模提供理论基础。描述逻辑之于知识图谱,好比关系代数之于关系数据库;在知识图谱的深度利用中,如复杂语义的表达、规则引擎的构建、推理的实现,会对更有丰富表达能力的知识表示方法有更多的需求。
  • 图模型是更加接近于人脑认知和自然语言的数据模型,RDF作为一种知识图谱表示框架的参考标准,向上对接OWL等更丰富的语义表示和推理能力,向下对接简化后的属性图数据库以及图计算引擎,仍然是最值得重视的知识图谱表示框架。
  • 知识(图谱)的表示学习是符号表示与神经网络相结合比较自然且有前景的方向。知识的向量表示有利于刻画那些隐含不明确的知识,同时基于神经网络和表示学习实现的推理一定程度上可以解决传统符号推理所面临的鲁棒性不高不容易扩展等众多问题。

文章目录

  • note
  • 零、回顾上一节
  • 一、知识表示
  • 二、AI历史的知识表示
  • 三、知识图谱的符号表示方法
    • 3.1 属性图
    • 3.2 RDF:Triple-based Assertion model
    • 3.3 OWL:Web Ontologies
  • 四、知识图谱的向量表示
    • 4.1 知识图谱嵌入模型
    • 4.2 推理问题
  • 时间安排
  • Reference

零、回顾上一节

知识图谱技术要素:

在这里插入图片描述

一、知识表示

知识表示:KR,knowledge representation,即KR时用易于计算机处理的方式来表示人脑的知识方法。
在这里插入图片描述

二、AI历史的知识表示

基于离散符号的知识表示(非主流了,简单了解下),共同缺点是知识的获取主要依靠专家和人工:
在这里插入图片描述

  • 基于连续向量的知识表示:tensor,各种embedding的学习。
  • 隐式知识、弱逻辑约束、不易解释、对接NN神经网络。
  • 知识的向量表示,促进多种模态的融合

在这里插入图片描述

三、知识图谱的符号表示方法

在这里插入图片描述

3.1 属性图

  • 属性图是图数据库Neo4J实现的图结构表示模型,在工业界有广泛应用。
  • 属性图的优点是表达方式非常灵活,例如,它允许为边增加属性,非常便于表示多元关系。
  • 属性图的存储充分利用图的结构进行优化,因而在查询计算方面具有较高优势。
  • 属性图的缺点是缺乏工业标准规范的支持,由于不关注更深层的语义表达,也不支持符号逻辑推理。

在这里插入图片描述

  • 在属性图的术语中,属性图是由 顶点(Vertex),边(Edge),标签(Label),关系类型还有属性(Property)组成的有向图。
  • 顶点也称为 节点(Node),边也称为 关系
    (Relationship)。在属性图中,节点和关系是最重要的实体。节点上包含属性,属性可以以任何键值形式存在。

3.2 RDF:Triple-based Assertion model

RDF: resource description framework 支持推理,也兼容更复杂的本体表示语言OWL。
RDF是国际万维网联盟W3C推动的面向Web的语义数据标准。
基于RDFS的简单推理:
在这里插入图片描述

3.3 OWL:Web Ontologies

三元组如果无法满足语义表示需求时,可以使用OWL。OWL的表达构件:等价性声明、声明属性的传递性、两个属性互反、属性的函数性、属性的对称性等,如下举例所示:
在这里插入图片描述
OWL语言家族:
在这里插入图片描述

四、知识图谱的向量表示

4.1 知识图谱嵌入模型

词向量最初我们会使用one-hot encoding每个词,但是词语义其实可符号化,由被使用场景的上下文确定(即词的分布式向量表示),像skip-gram一样根据中心词预测上下文,学习词向量。而相似词的embedding是靠近的:
在这里插入图片描述
(1)最基础的知识图谱嵌入模型TransE就是对每个三元组(h, r, t)构建如下目标函数进行优化,采用负例采样,用正负例的差距作为损失函数,从而学出实体和关系的embedding。 f r ( h , t ) = ∥ h + r − t ∥ L 1 / L 2 f_r(h, t)=\|h+r-t\|_{L_1 / L_2} fr(h,t)=h+rtL1/L2
在这里插入图片描述
(2)知识图谱嵌入模型DistMult
在这里插入图片描述

4.2 推理问题

评估向量实体的好坏,最简单的就是测试三元组(h, r, t),如通过h和r预测t,计算和真实t的距离。
在这里插入图片描述

时间安排

任务任务信息截止时间
-12月12日正式开始
Task01:CP1知识图谱概论(2天)12月12-13日 周日
Task02:CP2知识图谱表示 + CP3知识图谱的存储和查询(上)(6天)12月14-19日 周六
Task03:CP3知识图谱的存储和查询(下)(3天)12月20-22日 周二
Task04:CP4知识图谱的抽取和构建(3天)12月23-25日 周五
Task05:CP5知识图谱推理(4天)12月26-29日 周二

Reference

[1] 推荐系统前沿与实践. 李东胜等
[2] 自然语言处理cs224n-2021–Lecture15: 知识图谱
[3] 东南大学《知识图谱》研究生课程课件
[4] 2022年中国知识图谱行业研究报告
[5] 浙江大学慕课:知识图谱导论.陈华钧老师
[6] https://conceptnet.io/
[7] KG paper:https://github.com/km1994/nlp_paper_study_kg
[8] 北大gStore - a graph based RDF triple store
[9] Natural Language Processing Demystified
[10] 玩转Neo4j知识图谱和图数据挖掘

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/76907.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

dev_III笔记补充

1.在客户端显示form 思路: 想要在客户端显示form必须先把form放在 menu item中,然后通过url地址的方式打开form 步骤: 1.建立form 2.建立Menu Item (特别注意:是display类型, 不是action类型 不是action类型…

【分布式技术专题】「架构设计方案」盘点和总结秒杀服务的功能设计及注意事项技术体系

秒杀应该考虑哪些问题 超卖问题 分析秒杀的业务场景,最重要的有一点就是超卖问题,假如备货只有100个,但是最终超卖了200,一般来讲秒杀系统的价格都比较低,如果超卖将严重影响公司的财产利益,因此首当其冲…

python爱心源代码集锦

python爱心源代码集锦 本文目录: 一、代码效果预览索引图 二、爱心源代码集锦 (1)、爱心图形1(弧线型)(显示的文字写在代码里) (2)、爱心图形2(直线型&am…

MySQL 如何优化慢查询?

一、前言 在日常开发中,我们往往会给表加各种索引,来提高 MySQL 的检索效率。 但我们有时会遇到明明给字段加了索引,并没有走索引的Case。 进而导致 MySQL 产生慢查询。 严重场景下,甚至出现主从延迟、数据库拖垮的极端事故。 本…

微服务框架 SpringCloud微服务架构 28 数据同步 28.4 发送mq 消息

微服务框架 【SpringCloudRabbitMQDockerRedis搜索分布式,系统详解springcloud微服务技术栈课程|黑马程序员Java微服务】 SpringCloud微服务架构 文章目录微服务框架SpringCloud微服务架构28 数据同步28.4 发送mq 消息28.4.1 直接开干28 数据同步 28.4 发送mq 消…

《Linux运维实战:使用Percona Backup for MongoDB逻辑备份与恢复Mongodb数据》

一、备份与恢复方案 Percona Backup for MongoDB 是一个开源、分布式和低影响的解决方案,用于MongoDB分片集群和副本集的一致备份。从版本1.7.0开始,Percona Backup for MongoDB支持物理和逻辑备份和恢复,仅支持对逻辑备份进行时间点恢复。 …

UIAutomator测试框架介绍

uiautomator简介 UiAutomator是Google提供的用来做安卓自动化测试的一个Java库,基于Accessibility服务。功能很强,可以对第三方App进行测试,获取屏幕上任意一个APP的任意一个控件属性,并对其进行任意操作,但有两个缺点…

软件测试面试笔试习题参考,你都会了吗?

目录 一、 简答题和应用题: 二、 填空题: 三、 判断题: 四、 选择题: 总结 重点:配套学习资料和视频教学 一、 简答题和应用题: 1. 什么是软件测试? 2. 比较软件测试过程和软件开发过程&a…

基于JavaScript中AES和MD5加密,以及简单二维码的生成

一、加密技术 1、对称加密:单密钥加密。一个密钥可以用来加密也可以用来解密 —- AES 2、非对称加密:有两把密码,公钥(用于加密),私钥(用于解密) 3、摘要算法:把任意长度的输入,根据算法生成一串固定长度…

有环链表入口问题

有环链表入口问题 当快慢指针相遇时,我们可以判断到链表中有环,这时重新设定一个新指针指向链表的起点,且步长与慢指针一样为1,则慢指针与“新”指针相遇的地方就是环的入口。 图片来源:黑马程序员 证明: 设a为起点位置&#xff…

百变郁锦香,开创新典范,深化全球战略布局成就国际高端酒店品质之选

随着消费需求的不断升级,酒店消费场景也进行着多元化的发展,城市高端度假品牌正积极溯源消费需求,寻得品牌文化延伸的可靠路径。同时,各大酒店品牌也加快在市场布局的脚步,希望通过布局城市核心区域获得可持续发展的更…

Python绘制正二十面体

文章目录正二十面体的顶点绘制棱绘制面正二十面体的顶点 正20面体的12个顶点刚好可以分为三组,每一组都是一个符合黄金分割比例的长方形,而且这三个长方形是互相正交的。 所以,想绘制一个正二十面体是比较容易的 import numpy as np from …

大环配体配合物1407166-70-4,NODA-GA-NHS ester,NODA-GA-NHS 酯

●外观以及性质: NODA-GA-NHS ester产物呈固体或粘性液体,取决于PEG分子量,一般为白色固体,双功能大环化合物,大环配体配合物是指由多齿配体与环骨架上的O、N、P、S等多个配位原子形成的环配合物。 NODA-GA-NHS ester …

前端面试题2022-CSS篇

关于前端面试的题,最近整理了一些干货,经常被问到的一些问题,出现频率比较高的问题,如有不足之处,请高调指出,(⭐代表难度,星星越多越难,以次类推)&#xff0…

如何自动备份指定文件扩展名的文件?

关于文件扩展名 文件扩展名,一个点后跟几个字母,例如“.doc”或“.jpg”,构成计算机文档名称的结尾。保存文档时,请务必在单击“保存”之前输入文档名称和文件扩展名。 自动备份具有特定文件扩展名的文件 随着计算机的使用&…

第十章 鲁棒性检查(中)

文章目录10.5 时钟门控检查(Clock Gating Checks)高电平时钟门控(Active-High Clock Gating)10.5 时钟门控检查(Clock Gating Checks) 当一个门控信号(gating signal)可以控制逻辑单元中时钟信号(clock signal)的路径时&#xff…

最近面试遇到的面试题

先挖坑,有空再填坑! 迭代器 生成器 常用高阶函数 MySQL 建索引几大原则 浅拷贝 深拷贝 区别 实现 Linux 进程名字 查看进程号 Linux 杀死一个进程 python Linux shell 脚本 数据库 主从复制 配置 nginx 权限设置 python 去除空行 pandas 保留最后一个空…

深入浅出 Swift 中的 some、any 关键字以及主关联类型(primary associated types)

问题现象 从 Swift 5.1 开始,Apple 陆续引入 some、any 关键字,并且从 Swift 5.7 开始对 any 关键字的用法做了增强,并且引入了主关联类型(primary associated types)的概念。 那么它们到底是什么意思?使用它们又能如何改进我们书写代码的范儿呢? 在本篇博文中,您将学…

自动依据你的数据库生成SQL练习题及答案,宝藏软件鉴赏

原创软件不易,方面多点赞、收藏、加关注鼓励!后续领更多好用功能! 引言 各位好,相信看见这篇文章的朋友,应该也去体验过了chatGPT了吧~,确实chatGPT拉近了我们与未来科技的距离,所有别人火也是…

电脑技巧:Microsoft Edge浏览器技巧介绍

目录 1、导入浏览器数据 2、Edge边栏 3、实用的扩展功能 4、创建集锦列表 4.1 集锦的作用 4.2 使用方法 5、查找优惠券 6、Edge效率省电模式 Microsoft Edge是Windows10操作系统预装的一款非常棒的浏览器和之前的IE不同,采用了谷歌浏览器内核,相…