【8】知识加工

news2025/1/20 1:45:20

一、概述

信息抽取/知识融合后得到的“事实”进行知识推理拓展现有知识、得到新知识。

知识加工主要包括三方面内容:本体构建、知识推理和质量评估。

二、本体构建

1.本体

定义:本体是用于描述一个领域的术语集合,其组织结构是层次结构化的。简而言之本体是用于描述一个领域的数据集合,是知识库的骨架。

作用:获取、描述和表示相关领域的知识,提供对该领域知识的共同理解,确定领域内共同认可的词汇,提供该领域特定的概念定义和概念之间的关系,提供该领域中发生的活动以及该领域的主要理论和基本原理,达到人机交流的效果

2.领域本体

定义:领域本体(Domain ontology) 是描述指定领域知识的一种专门本体,它给出了领域实体概念及相互关系领域活动以及该领域所具有的特性和规律的一种形式化描述

作用: 明确专业术语、关系及其领域公理, 使其形式化;在人与人之间、人与机器之间达到共享;实现一定程度的领域知识复用。如:企业本体、医学概念本体、酶催化生物学本体、陶瓷材料机械属性本体等。

3.本体构建的意义:

知识图谱分为数据层和模式层,数据层是由一系列事实数据构成,而模式层则用来从数据中构建实体、属性、关系,是知识图谱的核心。本体库被广泛用于构建知识图谱数据层,由本体库构建的知识图谱冗余较小 ,结构层次强。

4.本体的构成:

由5个基本构成元素(建模元语),即

类(Classes)或概念(Concepts):是对象的集合;概念是广义的概念,除了可以是一般意义上的概念以外,也可以是任务、功能、行为、策略、推理过程等,其定义一般包括概念的名称,以及对该概念的自然语言描述。本体中的这些概念通常构成一个继承的分类层次。

 关系(Relations):是领域中概念之间的交互作用,形式上定义为n维笛卡儿积的子集:

 函数(Functions):是一种特殊的关系,关系的前n1个元素可以惟一确定第n个元素。一般地,函数采用FC1×C2×…×Cn-1→Cn的形式表示,如MotherOf就是一个函数,MotherOf(x,y)表示yx的母亲,即x确定y

 公理(Axioms):是一些永真式的描述。更具体地说,公理是领域中在任何条件下都成立的断言

 实例(Instances):代表属于某概念/类的基本元素,即某概念/类所指的具体实体。

5.本体的分类

根据本体应用主题,本体划分为五种类型:领域本体、通用或常识本体、知识本体、语言学本体和任务本体

根据本体对领域的依赖程度由高到低,可分为四个类别:顶级本体(top-level Ontologies)、领域本体(domain Ontologies)、任务本体(task Ontologies)和应用本体(application Ontologies)

6.本体的构建工程思想

(1)IDEF-5方法

IDEF5创建本体的5个主要步骤是:① 定义课题、组织队伍;② 收集数据;③ 分析数据;④本体初步开发;⑤ 本体优化与验证

(2)Skeletal Methodolody骨架法(Uschold方法)

Mike Uschold & Micheal Gruninger的骨架法(Skeletal Methodology),又称Enterprise法,专门用来创建企业本体(Enterprise ontology,是有关企业建模过程的本体)

(3)Methontology方法

Methontology方法是在结合了骨架法和GOMEZ-PEREZ方法后,提出的一种更为通用的本体建设方法。更接近软件工程开发方法。它将本体开发进程本体生命周期两个方面区别开来,并使用不同的技术予以支持。专用于创建化学本体(有关化学元素周期表的本体)

流程包括:

①管理阶段:这一阶段的系统规划包括任务的进展情况、需要的资源、如何保证质量等问题。

②开发阶段:分为规范说明、概念化、形式化、执行以及维护五个步骤。

③维护阶段:包括知识获取、系统集成、评价、文档说明、配置管理五个步骤。

(4)七步法

斯坦福大学医学院开发的七步法,主要用于领域本体的构建

7个步骤分别是: ① 确定本体的专业领域和范畴;② 考查复用现有本体的可能性;③ 列出本体中的重要术语;④ 定义类和类的等级体系(完善等级体系可行的方法有:自顶向下法、自低向上法和综合法);⑤ 定义类的属性;⑥ 定义属性的分面;⑦ 创建实例

(5)深度学习下的本体构建

a.领域概念识别。 训练领域内语料的字向量和词向量作为特征输入到深度神经网络,识别领域内概念,区分出领域内个体的概念。

b. 层级关系划分。BIRCH 算法用于聚类领域内概念,初步划分领域本体中各概念的层级关系。

c. 属性抽取。 输入词向量和词位置,采用卷积神经网络结合远程监督抽取实体关系模型,抽取领域本体类间关系,构成领域本体属性,划分出类与属性关系,完成领域本体基本框架。

三、知识推理

通过各种方法获取新的知识或者结论知识推理主要是利用现有知识图谱已存在的事实或者语料,运用算法工具,推理出实体之间的关联的关系,自动产生新的知识,补充缺失的事实,完善知识图谱。

知识推理的主要方法

1、基于符号逻辑的推理——本体推理

传统的符号逻辑推理中主要与知识图谱有关的推理手段是基于描述逻辑的本体推理。

描述逻辑主要被⽤来对事物的本体进⾏建模和推理,⽤来描述和推断概念分类及其概念之间的关系。

主要方法:

基于表运算(Tableaux)及改进的⽅法: FaCT++RacerPellet Hermit

基于Datalog转换的⽅法如KAONRDFox

基于产⽣式规则的算法(如rete): Jena SesameOWLIM

2、基于图结构和统计规则挖掘的推理

主要方法:
基于路径排序学习⽅法(PRAPath ranking Algorithm)
基于关联规则挖掘⽅法(AMIE)

3、基于知识图谱表示学习的关系推理

主要方法

将实体和关系都表示为向量

通过向量之间的计算代替图的遍历和搜索来预测三元组的存在,由于向量的表示已经包含了实体原有的语义信息,计算含有⼀定的推理能⼒。

可应⽤于链接预测,基于路径的多度查询等

4、基于概率逻辑的方法

概率逻辑学习有时也叫Relational Machine Learning (RML),关注关系的不确定性和复杂性。
通常使用
Bayesian networks or Markov networks

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1458107.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python数据科学:线性回归

4.5线性回归 线性回归是解决回归问题的常用模型。 实例:简单线性回归 def skLearn13():线性回归:return:#简单的一元一次方程#斜率为a,截距为b#yaxb#创建线性数据rng np.random.RandomState(0)x 10 * rng.rand(50)y 2*x - 5 rng.randn(50)#绘制数据集plt.sca…

osqp-eigen学习

OSQP文档学习 参考博客: (1)二次规划(QP)与OSQP求解器 (2)如何使用OSQP-Eigen osqp-eigen 1 osqp-eigen接口 以下列问题的求解为例: s.t. 1 ≤ x 1 ≤ 1.5 1≤x_1≤1.5 1≤x1​≤…

【C#】使用代码实现龙年春晚扑克牌魔术(守岁共此时),代码实现篇

欢迎来到《小5讲堂》 大家好,我是全栈小5。 这是《C#》系列文章,每篇文章将以博主理解的角度展开讲解, 特别是针对知识点的概念进行叙说,大部分文章将会对这些概念进行实际例子验证,以此达到加深对知识点的理解和掌握。…

Linux-目录I/O-004

学习重点: 1.目录I/O的函数接口 2.目录的遍历,目录的递归遍历 1.【mkdir】 1.1函数原型 【int mkdir(const char *pathname, mode_t mode);】1.2函数功能 创建目录文件1.3函数参数 1.3.1【pathname】 文件路径1.3.2【mode】 文件的权限1.4返回值 …

区块链 之 默克尔树

默克尔树简介 欢迎阅读 BTC网络 之 区块裁剪 什么是默克尔树? 默克尔树(Merkle Tree)是一种树状数据结构,被广泛用于比特币等区块链系统中,用于高效地组织和验证数据的完整性。这个树状结构由唯一的根哈希值标识&am…

matplotlib图例使用案例1.1:在不同行或列的图例上添加title

我们将图例进行行显示或者列显示后,只能想继续赋予不同行或者列不同的title来进行分类。比较简单的方式,就是通过ax.annotate方法添加标签,这样方法复用率比较低,每次使用都要微调ax.annotate的显示位置。比较方便的方法是在案例1…

PyTorch使用Tricks:Dropout,R-Dropout和Multi-Sample Dropout等 !!

文章目录 1、为什么使用Dropout? 2、Dropout的拓展1:R-Dropout 3、Dropout的拓展2:Multi-Sample Dropout 4、Dropout的拓展3:DropConnect 5、Dropout的拓展4:Standout 6、Dropout的拓展5:Gaussian Dropout …

微信小程序开发:通过wx.login()获取用户唯一标识openid和unionid

下面代码展示了 openid 的获取过程。 想获取 unionid 需要满足条件:小程序已绑定到微信开放平台账号下,不然只会返回 openid。 【相关文档】 微信小程序开发:appid 和 secret 的获取方法 wx.login({success (res) {if (res.code) {// 发起网…

十二:枚举与注解

文章目录 01、枚举类的使用1.1、枚举类的理解1.2、自定义枚举类1.3、使用enum关键字定义枚举类1.4、Enum类中的常用方法1.5、使用enum关键字定义的枚举类实现接口 02、注解的使用2.1、注解的理解2.3、如何自定义注解2.4、jdk中4个基本的元注解的使用12.5、jdk中4个基本的元注解…

解锁创意灵感,探索FlutterExampleApps项目的奥秘

解锁创意灵感,探索FlutterExampleApps项目的奥秘 项目简介 FlutterExampleApps项目是一个包含各种示例应用链接的仓库,旨在演示Flutter应用开发中的各种功能、特性和集成。 项目包含了以下几个部分,每个部分都涵盖了不同的内容和主题&…

VO、DTO、DO、BO、PO

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 VO、DTO、DO、BO1.概念阿里Java开发手册分层领域模型: 2. VO 和 DTO 使用场景以下是一个使用VO和DTO的典型案例: 3.BO和DTO的区别 案例 VO、…

分享两个版本的数字孪生技术栈,都是AI回答的,较为精准

版本一: 数字孪生应用到的技术栈包括但不限于: 3D建模:数字孪生需要建立虚拟的三维模型,因此需要使用3D建模软件如AutoCAD、SketchUp、3ds Max等。 数据采集:数字孪生需要采集大量实时的物理数据,如传感…

为什么从没有负值的数据中绘制的小提琴图(Violin Plot)会出现负值部分?

🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 小提琴图(Violin Plot) 是一种用于展示和比较数据分布的可视化工具。它结合了箱形图(Box Plot)和密度图(Kernel Density Plot)的特…

hive load data未正确读取到日期

1.源数据CSV文件日期字段值: 2.hive DDL语句: CREATE EXTERNAL TABLE test.textfile_table1(id int COMMENT ????, name string COMMENT ??, gender string COMMENT ??, birthday date COMMENT ????,.......) ROW FORMAT SERDE org.apache.…

QT中事件过滤器

Qt添加事件过滤器,设置拖放listWidget、TreeWidget、TableWidget控件。 #include "mainwindow.h" #include "ui_mainwindow.h"MainWindow::MainWindow(QWidget *parent): QMainWindow(parent), ui(new Ui::MainWindow) {ui->setupUi(this)…

UML---活动图

活动图概述 活动图(Activity Diagram)是UML(Unified Modeling Language,统一建模语言)中的一种行为建模工具,主要用于描述系统或业务流程中的一系列活动或操作。活动图通常用于描述用例中的行为&#xff0c…

SimpleDateFormat为什么是线程不安全的?

目录 在日常开发中,Date工具类使用频率相对较高,大家通常都会这样写:这很简单啊,有什么争议吗?格式化后出现的时间错乱。看看Java 8是如何解决时区问题的:在处理带时区的国际化时间问题,推荐使用…

[创业之路-88/管理者与领导者-128]:企业运行分层模型、研发管理全视野

目录 一、企业分层模型 1.1 愿景层 1.2 战略目标层 1.3 战术方法层 1.4 市场业务层 1.5 项目执行层 1.6 资源层 二、研发全视野、全流程 2.1 市场 2.2 战略规划 2.3 产品研发 2.3.1 概述 2.3.2 项目管理 2.3.3 研发业务管理(研发经理*N) – 管技术流程…

2024护眼大路灯哪个牌子好?6个挑选妙招助你选择优质落地灯!

如果大家平常关注大路灯,应该都会注意到一个情况——它确实大受众多用户的喜爱以及专业人士的认可,但是关于它的伤眼案例却从未减少。之所以如此矛盾,主要是因为市面上有太多的不专业大路灯,它们的选材用料以及品质非常糟糕&#…

Spring Boot 笔记 028 文章列表

1.1 导入中文语言包 1.2 显示文章分类 //回显文章分类 import { articleCategoryListService } from /api/article.js const articleCategoryList async () > {let result await articleCategoryListService();categorys.value result.data; }articleCategoryList() 1.3…