知识图谱认知智能理论与实战----------第二章 知识图谱模式设计

news2024/10/2 16:18:01

文章目录

      • 一. 知识图谱模式
      • 二. 模式与本体
      • 三. 本体概论
        • I. 模式与本体辨析
        • II.本体的构成要素
        • III.实体分类
        • IV.实体分类
      • 四. 六韬法
        • I. 场景
        • II. 复用
        • III. 事物
        • IV. 联系
        • V. 约束
        • VI. 评价

一. 知识图谱模式

在这里插入图片描述

  • 实体:eg:法国,巴黎…
  • 关系:eg:属于,基于…
  • 三元组:<主语,谓词,宾语> eg:<巴黎,属于,法国>
    请添加图片描述

二. 模式与本体

  • 本体的核心目标:定义一组领域内的概念和类别,以及它们之间的关系来组织信息和知识。
  • 本体与知识图谱的区别:
    • 本体更多地追求知识的本质;知识图谱模式偏向于产业应用
    • 本体不仅包含知识本身,还包含许多推理逻辑;知识图谱模式更关注知识本身,与推理逻辑相分离

三. 本体概论

I. 模式与本体辨析

  • 模式和本体是对相同事物的不同表达。在大多数情况下,可以忽略两者区别,将模式视为分离了推理规则的本体。
    • 知识图谱领域倾向于使用模式
    • 语义网和哲学领域更倾向于使用本体

II.本体的构成要素

  • 实例:也称个体,类似于知识图谱中的实体。eg:贝多芬。
  • 类:实例的父类,和java当中的定义一样,也类似于知识图谱模式中的实体类型。eg:人物。
  • 属性:类可能具有的属性、特征、特性、参数、描述等。eg:人物的生日、性别…
  • 关系:类与类、概念与概念之间可能存在的关系。eg:is - a 或 has - a
  • 规则:基于类、属性和关系等元素来描述逻辑推断的语句。eg:音乐家是男的。
  • 公理:采用某种逻辑的断言或规则所共同构成的理论。eg:八大恒星属于银河系。

III.实体分类

  • 应用范围角度:
    • 基础本体(Foundation Ontology,FO):收录了适用于多个不同领域的共有的或核心的概念或术语。eg:Schema和COSMO。
      • Schema:基于协作性社区(schema.org)活动构建的本体,CNSchema是Schema的中文翻译。
        请添加图片描述
        请添加图片描述
      • COSMO(Common Semantic Model):通用语义模型,旨在收录所有语义原语。(利用这些原语能够从逻辑上明确说明任何领域本体的元素的含义。语义原语:指那些不能从本体中已经存在的概念的组合来表示的概念。)
        在这里插入图片描述
    • 领域本体:对特定领域的或者现实世界的一部分的事物、知识进行建模。eg:生物学、遗传学、金融领域等。eg:GO(Gene Ontology,GO):提供一个框架和一组概念来描述来自所有生物体的基因产能等功能。
      在这里插入图片描述
  • 形式化角度:
    • 轻量级本体: 类似于知识图谱模式,侧重于概念化,即知识和知识的层次结构。
    • 重量级本体 :使用丰富且完善的公理和规则来建模知识。

IV.实体分类

  • 资源描述框架(Resource Description Framework,RDF):用来描述Web资源的特性,及资源与资源之间的关系,是一个基础且通用的数据模型。
<?xml version=“1.0”?>
    <RDF xmlns=http://www.w3.org/1999/02/22-rdf-syntax-ns#xmlna:DC=http://purl.org/metadata/dublin-core#>
        <Description about=http://www.dlib.org/dlib/may98/miller>
            <DC:title>
                An introduction to the Resource Description Framework
            </DC:title>
            <DC:creator>
                Eric Miller
            </DC:creator>
            <DC:date>
                1998-0501
            </DC:date>
        </Description>
    </RDF>

RDF详细内容,可以参考:https://blog.csdn.net/m0_37565948/article/details/81568054

四. 六韬法

  • 从场景、复用、事物、联系、约束、评价6个角度来设计知识图谱。
    在这里插入图片描述

I. 场景

  • “场景”:指所设计的知识图谱的服务范围,一般包括用于构建目标知识图谱的结构化数据和非结构化数据、知识存储的方式要求,以及基于目标知识图谱的各类应用。
  • 最关键的目标是对齐认知(清晰的描述动机,一致无歧义地理解环境,对齐参与各方对动机和环境的认知,并明确的表示出来,形成相应的文档)。具体如下图:
    在这里插入图片描述
  • 常见的方法:头脑风暴、问题清单、调查问卷、多方会议等。任何一种方法都是不完美的,不同的人往往会因为立场、背景、知识储备等原因发生分歧、产生冲突。

II. 复用

如果从零开始建立知识图谱,真的是太累了,可以复用别的数据,站在巨人的肩膀上。

  • 领域词汇表(实体名称)可以进行复用,eg:《外国音乐辞典》
  • 基础本体可以复用Schema、COSMO当中的一些内容。
  • 领域本体可以复用其他现成的知识图谱。eg:OpenKG(中文的开放知识图谱社区)

III. 事物

在知识图谱设计中,最核心和基础的就是设计好实体类型,用实体类型来清晰、明确和无歧义的描述一类事物,也包括了咋基本原则中所介绍的语义、外延、颗粒度等内容。

  • 定义类型,通常包括一下步骤:
    • 对事物的分类:厘清在场景中需要处理哪些类型的事物。
    • 对事物类别的命名:充分考虑命名的语义、外延和颗粒度。有些虽然类名、类别名、概念等说法不同,但是表示的却是一类事物。
    • 抽象出合适的特征:以属性名列表的方式来描述事物的多维特征。
    • “如无必要,勿增实体”:在满足需求的情况下,实体数量适量即可。
    • 事物是演化和发展的:实体类型和属性名列表并非是不变的、固定的,而是演化发展的。
  • 实体类型区分的越细,对下游应用的使用就越方便,但在构建知识图谱的时候遇到的困难就越多。需要权衡在场景的需求中是否需要划分为这几种类型。
    • eg:若研究的对象是音乐家在音乐领域的贡献,就对音乐家进行不断的细分,而对作品本身保证颗粒度大一些;
    • 若需要研究作品本身,作品本身就需要不断的细化,比如能够区分“大协奏曲”和“独奏协奏曲”等 。

IV. 联系

事物间是普遍联系的,即在任意两个实体间可以建立任意的关系。定义关系类型依赖于实体类型。

  • 定义关系类型的流程:
    • 依次选取实体类型列表中的每一个实体类型。
    • 梳理该实体类型和自身的关系
    • 梳理该实体类型和所有其他实体类型的关系
    • 对每个关系进行探讨,赋予一个适合的关系名称。(关系名称需要明确表达事物间的联系,并且在场景相关方中能能够有一致的表达)
    • 将定义好的关系类型可视化,并对每一个关系类型及其对应属性名列表进行评估,确定其必要性
  • 多用“继承”和“组合”这两种设计模式。
    • 继承:is a;has subclass;subclass of。
    • 组合:has a;part of;has part。

V. 约束

对模式的约束,包括数据类型、取值范围和权限控制三大部分内容。

  • 数据类型:
    • 基本数据类型: Character、Integer、Decimal、Complex、DateTime、SpatialDatatType、UUID、Binary等,书上P68页。
    • 复杂数据类型:list、set、map、tuple。
  • 取值范围:
    • 枚举类型约束(eg:国家列表、行政区列表)、数值类型的取值上下限、日期时间类型约束、文件类型(eg:对文件内容进行校验,区分JSON、XML等)、字符串约束规则(eg:手机号)、跨属性约束(eg:URL中的域名必须等于域名属性的值)等。
  • 权限控制:对广义资源的受众进行访问限制。
    • 通用方法;基于角色的访问控制。

VI. 评价

  • 复杂度、功能满足度、规范性、可读性、可扩展性、可运营性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/7441.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深度学习入门(三十六)计算性能——异步计算、自动并行

深度学习入门&#xff08;三十六&#xff09;计算性能——异步计算、自动并行前言计算性能——异步计算教材1 异步计算1.1 通过后端异步处理1.2 小结2 自动并行2.1 基于GPU的并行计算2.2 并行计算与通信3.3 小结前言 核心内容来自博客链接1博客连接2希望大家多多支持作者 本文…

一起Talk Android吧(第四百一十三回:使用三角函数绘制正弦波)

文章目录整体思路图形讲解示例程序注意事项各位看官们&#xff0c;大家好&#xff0c;上一回中咱们说的例子是"Math类常用方法介绍",这一回咱们介绍的例子是使用三角函数绘制正弦波。闲话休提&#xff0c;言归正转&#xff0c;让我们一起Talk Android吧&#xff01; …

leetcode-每日一题-1710-卡车上的最大单元数(简单,哈希,暴力)

今天的这道题其实很好读懂&#xff0c;因为很容易可以看出来暴力求解&#xff0c;但其实还是隐藏一个hash求解法很巧妙&#xff0c;因为我在很久之前就用过hash解答过这样类似的题&#xff0c;所以这个题也是可以使用的&#xff0c;可以看看我第二个hash解法 目录 暴力效率(效…

SBF vs. 火柴大王

生活中的一切都建立在自信之上。”Ivar Kreuger1929年10月28日&#xff0c;瑞典商人Ivar Kreuger出现在《时代》杂志的封面上。 他是当时美国最受关注的人物之一&#xff0c;因为他富有、有权势、神秘。Kreuger控制着四分之三的火柴生产和销售&#xff0c;在全球35个不同国家拥…

wy的leetcode刷题记录_Day43

wy的leetcode刷题记录_Day40 声明 本文章的所有题目信息都来源于leetcode 如有侵权请联系我删掉! 时间&#xff1a;2022-11-15 前言 今天时间比较多而且题目比较简单&#xff0c;应该能写三四道题。 目录wy的leetcode刷题记录_Day40声明前言1710. 卡车上的最大单元数题目介…

Spectacle源码编译方法

一、简介 Spectacle 是一个用于抓取桌面截图的简单应用程序。它可以抓取整个桌面、单个显示器、当前活动窗口、鼠标所在的窗口或是屏幕上的一块矩形区域的图像。截取的图像可被打印、发送到其他应用程序进行处理、或是直接保存下来。 Spectacle是archlinux wiki中推荐KDE使用…

刘二大人CNN

10.卷积神经网络&#xff08;基础篇&#xff09;_哔哩哔哩_bilibili 0、前一部分 卷积层 和 subsampling 叫做Feature Extraction特征提取器&#xff0c;后一部分叫做classification 1、每一个卷积核它的通道数量要求和输入通道是一样的。这种卷积核的总数有多少个和你输出通…

SpringBoot+Vue项目医院挂号系统的设计与实现

文末获取源码 开发语言&#xff1a;Java 使用框架&#xff1a;spring boot 前端技术&#xff1a;JavaScript、Vue 、css3 开发工具&#xff1a;IDEA/MyEclipse/Eclipse、Visual Studio Code 数据库&#xff1a;MySQL 5.7/8.0 数据库管理工具&#xff1a;phpstudy/Navicat JDK版…

2.6 自定义srv python

功能介绍 以自定义数据类型为基础&#xff0c;完成一个节点作为服务器&#xff0c;另一个节点接收传送两个数字到服务端&#xff0c;服务端计算后反馈到客户端进行打印输出 1、工作空间 1.1 创建工作空间lee_ws mkdir -p ~/lee_ws/src cd ~/lee_ws/src/ catkin_init_worksp…

leetcode134.加油站 贪心法求解 (c++版本)

题目描述 题目比较长&#xff0c;明确以下这点就可以 gas数组是当前下标i加油站所能加的油cost数组是从当前下标i加油站到下一加油站所消耗的油那么gas [i]与cost [i] 的大小就决定了车辆能否从当前加油站出发到达下一加油站 上面三点非常重要是能正确做出题目的必须要求 其实…

字符流,编码表,字符流写数据,字符流读数据

文章目录前言字符流编码表字符串中的编码解码问题字符流写数据字符流读数据总结前言 因为近期考试原因&#xff0c;还有自身惰性的问题&#xff0c;小编最近停更了一段时间&#xff0c;随之而来的罪恶感让我又开启了自学与创作之路&#xff0c;学习这么久&#xff0c;自己虽然…

来源稳定的l2逐笔接口数据去哪找?

l2逐笔接口的逐笔数据的最初来源均是从交易所获取&#xff0c;其授予了一些信息服务商L2非展示数据接口转发权限&#xff0c;其中包含了逐笔成交、逐笔委托等数据。使用时&#xff0c;通常是从信息商处购买&#xff0c;比如同花顺、万得、国泰安等等。那么小编认为通过交易所授…

mysql中find_in_set()函数的使用及in()用法详解

MySQL手册中find_in_set函数的语法解释&#xff1a; FIND_IN_SET(str,strlist) str 要查询的字符串 strlist 字段名 参数以”,”分隔 如 (1,2,6,8,10,22) 查询字段(strlist)中包含(str)的结果&#xff0c;返回结果为null或记录 假如字符串str在由N个子链组成的字符串列表strli…

Linux:rpm与yum(内含:1.rpm介绍+2.卸载rpm包+3.安装rpm(应用案例)+4.yum(应用案例))

1.rpm介绍使用: 实例&#xff1a;查看当前系统是否安装了 firefox &#xff0c;操作如下&#xff1a; 解释&#xff1a; 名称&#xff1a;firefox 版本号&#xff1a;91.11.0-2 使用操作系统&#xff1a;el7.centos.x86_64 表示centos.x的64位系统。 查询软件包是否安装&#…

跨境电商卖家必知的9个圣诞节营销技巧

关键词&#xff1a;跨境电商卖家、圣诞节营销 圣诞节——对跨境电商卖家来说是非常重要的促销节日。根据以往的经验&#xff0c;您或许已经有了初步的促销想法&#xff0c;想知道您今年的跨境电子商务营销策略是否正确&#xff1f;为您整理了跨境电商卖家必须注意的营销技巧&am…

TiDB数据库架构——TiDB Server

TiDB Server架构 TiDB Server 是SQL层&#xff0c;无状态&#xff0c;启动多个TiDBServer&#xff0c;均匀分摊&#xff0c;解析SQL&#xff0c;获取真实数据。 Protocol Layer、&#xff1a;负责客户端的连接。 Parse、Compile&#xff1a;负责SQL语句的解析和编译&#xff…

信息控制信息卷积

🍿*★,*:.☆欢迎您/$:*.★* 🍿 目录 背景

少儿编程 电子学会图形化 scratch编程等级考试四级真题答案解析(判断题)2022年9月

目录 2022年9月scratch编程等级考试四级真题 判断题(共10题,每题2分,共20分) 推荐资料

java学生作业带选课管理系统ssh

1.管理员具有对学校课程信息&#xff0c;教师信息&#xff0c;学生信息增删改查的权限 &#xff08;1&#xff09;可以录入学校所开课程&#xff0c;学生信息&#xff0c;教师信息&#xff1b; &#xff08;2&#xff09;可以对教师的开课信息进行增加&#xff0c;删除&#xf…

什么是 DeGods NFT 系列?

Nov. 2022, Vincy Data Source: Footprint Analytics - DeGods NFT Collection DeGods 系列有 10,000 个 Solana 铸造头牌的 NFT。 DeGods 持有者拥有访问 DeDAO 的权限和社区。 它在 1 月推出 DUST 协议&#xff0c;允许持有者质押他们的 DeGods NFT 并赚取 DUST。 10 月 …