【知识图谱导论-浙大】第一章:知识图谱概论

news2025/1/24 1:41:39

背景

2022年,随着在自然语言处理方向的深入,我逐渐开始对知识图谱在问答、搜索、推荐等领域的应用产生浓厚的兴趣。自己也通过书籍、博文、论文等对知识图谱有所了解,也通过中文开放知识图谱对中文知识图谱在各领域的发展有了深刻的认识。知识图谱在认知智能中承担着比较重要的角色,也让我对知识图谱及其相关技术(NLP、图神经网等)有了新的认识。

想了解某个领域的研究现状,有权威的书籍和课程是再好不过了,当然阅读对应领域的综述文章也是一个不错的选择。了解到浙江大学陈华钧有一本《知识图谱导论》。该书籍在中国大学MOOC还有相关课程:知识图谱导论。于是就展开了学习,现在对学习的内容进行复盘总结。

课程对应的课件可以在我的订阅号中回复:"知识图谱导论-浙大"获取,对应内容也可以看看我的总结。

对应讲解视频内容如下:

【知识图谱理论】(浙大2022知识图谱课程)第一讲-知识图谱概览

语言与知识

人的大脑依赖所学的知识进行思考、推理、理解语言。

早期的人工智能包含两个流派:

  1. 连接主义,要实现人工智能应该模拟人的生理结构,也就是使用计算机去模拟人脑的神经结构,其就是我们现在所说的深度学习
  2. 符号主义,要实现人工智能应该模拟人的心智,即用计算机的符号记录人脑的记忆,这些记忆就可以看作是人的知识,发展到现在就是知识工程,专家系统

知识图谱则可认为是符号主义流派中的内容。深度学习在视觉、听觉等感知任务中取得了不错的成就(感知智能),但是归根到底来说解决的是识别和判断的问题,其并不能够进一步的推理,联想到人的大脑,大脑依赖所学的知识进行思考、推理以及理解语言等(认知智能)。

语言+知识:实现认知智能的双翼

在认知智能中有两个核心的研究:

  1. 语言理解
  2. 知识表示

人类在认识世界的过程中不断积累知识,并使用语言来描述、记录和传承对世界的认识(知识)。当然,准确理解语言也极大依赖大脑中所习得的各种知识。这就为知识、语言架起来一个桥梁,语言作为知识最直接的载体。

看一下下面的案例:

在这里插入图片描述
这个人工智能小秘书应该在第一个案例中将“肯德基”识别成一种食品,在第二个案例中将“肯德基”识别出一个公司,需要知道百胜是肯德基的母公司,蚂蚁金服投资了百胜,马云是蚂蚁金服的实际控制人,这样才能正确判断马云和肯德基之间的关系。上面的案例中就是一个小小的知识图谱。

人们依赖大脑中这些形形色色的“知识图谱”作为理解语言、判断、推理、决策等行为的背景知识。

什么是知识

话说回来,什么是知识呢(what is knowledge)?针对这个哲学问题,柏拉图说:Knowledge is justified true belief。其实仔细一想,人类的自然语言、创作的绘画与音乐、数学语言、物理模型、化学公式等都是人类知识的表示形式和传承方式。具有获取、表示和处理知识的能力是人类心智区别于其它物种心智的最本质特征,也是人脑智能的最本质特征

传统人工智能的一种实现方式:知识工程和专家系统,建立一个能够从专家的大脑获取知识的系统(知识工程),再通过一个推理引擎为非专家用户提供服务,如:辅助诊断,判案等。

文本:知识的基础

语言是知识的自然描述方式和表达载体,人脑能够从文本获取和学习知识,要想实现机器的认知智能,那么机器也应该具备从文本中抽取知识的能力。摆在我们面前的一个问题是:机器处理文本字符串并不容易,理解文本中蕴含的意义更是步履维艰,这个可以看看当下的问答机器人微软小冰、苹果siri等,效果并不理想。为了实现机器能够更好地抽取文本中的知识,当前盛行的有两个技术路线:

  1. 抽取技术,从文本中识别出实体、关系以及复杂的逻辑结构;

  2. 文本预训练,通过大量的文本语料来训练,例如前端时间比较火的chat-gpt,使得文本中的知识被隐含在参数化的向量模型中;机器则更加善于处理这中向量化表示的神经网络 。

知识图谱:知识的基础

知识图谱利用图结构对知识进行建模以达到识别和推理事物之间的复杂关联关系和沉淀领域知识,是实现认知智能的重要基石。该技术已经被广泛应用与搜索引擎、智能问答、语言语义理解、大数据决策分析、智能物联等众多领域。

知识图谱利用图这种结构,将知识进行结构化表示。相比于纯文本来说,结构化的数据更容易被机器处理,其也更加能够表达丰富的语义和知识。

Embedding:知识的基础

计算机更擅长处理数字化的向量,表示学习也在文本相关任务上大放异彩。例如使用word2vec使用向量来表示词语。知识图谱引入了Embedding的技术,将实体和关系学习对应的向量表示,然后使用神经网络来实现逻辑推理等。

知识图谱的价值

了解了知识图谱的一些基本概念,那我们可以使用知识图谱干些什么事情呢?

搜索

谷歌在2012年推出了基于知识图谱的搜索引擎。 支持了事务级别的而非文本级别的搜索,使得搜索结构更加精准,用户的搜索体验也得到了大幅度的提升。

知识问答

对话式的信息获取更加需要精准度和可靠性,知识图谱在搜索引擎中提供了更高质量的结果,同理也可以将其应用与对话系统中,智能问答本质就是一种对话式的搜索。当前实现智能问答功能主要有三种形式:

  1. 问答对。例如常见的FAQ,这种实现方式简单,但无法支持精准的回答;
  2. 给定问句能够在大量文本中准确的定位答案,难度较大;
  3. 基于知识图谱的问答。

推荐系统

为了能够实现基于知识图谱的推荐,分别构建user kg和item kg。将知识图谱引入到推荐系统中,可以增强user和item的特征表示(增加信息),有利于挖掘更深层次的用户兴趣,关系多样性也有利于实现更加个性化的推荐,丰富的语义描述还可以增强推荐结果的可解释性。

在这里插入图片描述

其他

除了以上主流的应用之外,在垂直领域如:医疗拮抗,金融,电商,出版,农业,政府,电信,数字图书馆中都有其使用的身影。

知识图谱的技术内涵

知识图谱是一个典型的交叉领域。
在这里插入图片描述
细分的知识图谱技术要素:

在这里插入图片描述
知识图谱不是一个单一的技术,做知识图谱需要建立系统工程思维。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/144477.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

将非负整数num转换为对应的英文表达(C++实现)—— 力扣第273号题的加强。

【问题描述】 将非负整数num转换为对应的英文表达式。 (样例1) 输入:25 输出:Twenty Five (样例2) 输入:12,315 输出:Twelve Thousand Three Hundred (and) Fifteen 备注:and可省略 另备注:偶然发…

(八)devops持续集成开发——jenkins流水线发布一个docker版的后端maven项目

前言 本节内容我们使用jenkins的流水化工具发布一个后端docker项目,实现后端项目的容器化部署。在开始本节内容之前,我们需要在生产环境安装好docker环境并且能够联网下载镜像。通过jenkins的流水化工具,实现代码拉取,maven打包编…

【java篇】反射机制简单理解

学到JDBC后,使用到反射机制,所以回顾反射机制相关知识点; 文章目录 文章目录 什么是反射机制? 如何理解反射呢? 总结 一、Java反射机制是什么? 二、Java反射机制中获取Class的三种方式及区别? 三…

【目标检测】EfficientDet

1、论文 题目:《EfficientDet: Scalable and Efficient Object Detection》 论文地址: https://arxiv.org/pdf/1911.09070.pdf 代码地址: https://github.com/bubbliiiing/efficientdet-pytorch 2、摘要 Google Brain团队在CVPR 2020上提出…

Liunx 对函数库的理解

一、前言 我们的C程序中,并没有定义“printf”的函数实现,且在预编译中包含的“stdio.h”中也只有该函数的声明,而没有定义函数的实现,那么,是在哪里实“printf”函数的呢?最后的答案是:系统把这些函数实现都被做到名为 libc.so.6 的库文件中去了,在没有特别指定时…

PCB入门学习— CHIP类PCB封装的创建

目录 2.12 原理图PCB封装完整性的检查 3.1 CHIP类PCB封装的创建 学习目录 2.12 原理图PCB封装完整性的检查 然后点接受变更。 www.digikey.com搜索规格的网站。 3.1 CHIP类PCB封装的创建 放焊盘——确定大小——画丝印——确定原点EFC。 创建一个PCB元件库,Ct…

React(coderwhy)- 07(路由)

认识React-Router 认识前端路由 ◼ 路由其实是网络工程中的一个术语:  在架构一个网络时,非常重要的两个设备就是路由器和交换机。  当然,目前在我们生活中路由器也是越来越被大家所熟知,因为我们生活中都会用到路由器&#x…

红黑树:比AVL抽象、自由的、更广泛的近似平衡树

RBT与AVL树的比较 AVL:高度要求差不超过1红黑树:RBT要求最长路径不超过短路径的2倍,不需要像AVL一样太平衡,稍微自由,所以旋转较少。 AVL和RBT树性能比较: 插入同样的数据,AVL树旋转更多&…

本地生活配送行业黑马,带你一键读懂闪飞侠

电商的黄金十年已经过去,本地生活的黄金市场才刚刚开启,本地生活市场的增长对同城配送的影响得有多大?2020年的新冠疫情,爆发了同城即时配送的投资新机遇!即时配送用户已超5亿。而随着即时配送行业的广泛应用&#xff…

【 Vue3 + Vite + setup语法糖 + Pinia + VueRouter + Element Plus 第三篇】(持续更新中)

在第二篇我们主要学习了路径别名,配置.env环境变量,封装axios请求,以及使用api获取数据后渲染 Element Plus表格 本期需要掌握的知识如下: 封装列表模糊查询组件实现新增 编辑 删除 模糊查询 重置 功能实现表单校验功能实现组件间传值 下期…

Compose跨平台第一弹:体验Compose for Desktop

前言 Compose是Android官方提供的声明式UI开发框架,而Compose Multiplatform是由JetBrains 维护的,对于Android开发来说,个人认为学习Jetpack Compose是必须的,因为它会成为Android主流的开发模式,而compose-jb作为一…

TikTok三大流行趋势 钛动带你看懂TikTok

武汉瑞卡迪电子商务有限公司:近日,TikTok for Business发布了《Whats Next 2023 TikTok 全球流行趋势报告》,就2023年TikTok三大趋势主题进行了介绍。 钛动科技作为TikTok官方授权代理商,是TikTok生态服务最齐全的出海服务商,凭借出色的技术与服务能力,钛动斩获了T…

论 G1 收集器的架构和如何做到回收时间用户设定

目录G1 概念JVM的内存分代假设让用户设置应用的暂停时间G1 概念 G1其实是Garbage First的意思,它不是垃圾优先的意思,而是优先处理那些垃圾多的内存块的意思。 在大的理念上,它还是遵循JVM的内存分代假设。 JVM的内存分代假设 JVM的内存分代…

https如何加密解密?

背景 我们知道,https,在网络传输中,加密。具体来说是数据加密。//客户端和服务器,写数据的时候,都会加密。即1.客户端——》服务器 2.服务器——》客户端。 如何加密 解密? 加密解密 想要加密和解密&am…

【Mysql篇】数据库事务

目录 数据库事务数据库事务介绍 JDBC事务处理 事务的ACID属性 数据库的并发问题 数据库提供的4种事务隔离级别: 在MySql中设置隔离级别 数据库事务数据库事务介绍 事务:一组逻辑操作单元,使数据从一种状态变换到另一种状态。 事务处理(…

Day1. Spring

1 课程描述IoC基础容器,主要涉及Bean对象的管理。AOP面向切面编程,主要涉及切面配置,声明式事务控制Spring整合Web环境。Web层解决方案-SpringMVC.1.1 IoC、DI和AOP思想的提出由于传统的JavaWeb出现的问题:问题1:层与层…

【问题记录】Process finished with exit code -1073740791 (0xC0000409) 注:LSTM股票预测案例中

目录 1. 问题来源2. 问题解决1. 问题来源 在跑一段 LSTM&神经网络 股票预测的代码时,遇到了下述报错,报错提示为: Process finished with exit code -1073740791 (0xC0000409) 报错截图为: 下面是整个报错的内容,这里我也截取下来了: H:\Python学习专用\深度学习\LS…

ECMAScript基础入门

JavaScript(浏览器端)ECMAScript(语法API)DOMBOM es6开始let代替var声明变量(初始化后可重新赋值),而const声明常量(初始化后不可重新赋值,否则会报错) con…

Java调用百度OCR接口实现文字识别

博主在项目开发中需要完成一个文字识别功能,由于之前有过使用百度云平台接口进行身份证识别的经历,因此这次也是自然而然的再次选择了百度AI平台,首先需要开通百度通用文字识别功能。 然后我们需要创建一个应用: 然后我们就可以…

TensorFlow 基础(一)张量

文章目录BasicsAbout shapesIndexingSingle-axis indexingMulti-axis indexingManipulating ShapesMore on dtypesReferencesimport tensorflow as tf import numpy as npBasics 张量是具有统一类型(dtype)的多维数组。它和 NumPy 中的 np.arrays 是非常…