一、知识学习
声明:知识学习中本文主体按照浙江大学陈华钧教授的《知识图谱》公开课讲义进行介绍,并个别地方加入了自己的注释和思考,希望大家尊重陈华钧教授的知识产权,在使用时加上出处。感谢陈华钧教授。
(一)B站 《浙大知识图谱完整版》——4
学识时间:2023年5月5日09:15:25
4、知识图谱的抽取与构建
4.1重新理解知识工程与知识获取
4.1.1 知识工程
- 符号主义的核心思想
– 人工智能源于数理逻辑
– 智能的本质是符号的操作和运算 - 知识工程的诞生
- Knowledge is the power in AI
AI System=Knowledge + Reasoning
人工智能系统=知识+推理
知识工程是以知识为处理对象, 研究知识系统的知识表示、 处理和应用的方法和开发工具的学科 。
4.1.2 传统知识工程的特点
规模小——成本高——知识汤
上图展示了知识工程师和领域专家与帮助构建专家系统的软件工具的交互。箭头表示信息流。
4.1.3 知识获取的瓶颈
- 成年人脑包含近1000亿神经元, 每个神经元都可能有近1000的连接。 模拟这样的人脑需要约100TB的参数。
- 假设这100TB的参数能完整的存储人脑中的知识, 靠人工编码可以获取这样规模的知识吗?
- 单个人脑中的知识仍然是有限的, 如果需要获取全体人类知识, 靠人工编码是无法完成的
4.1.4 挑战机器自主获取知识的极限
人的五官可以将世界域中的大量复杂的信息拷贝到人脑中。
4.1.5 知识图谱工程
知识图谱工程就是简化的知识工程
重要的知识抽取环节:概念抽取、实体抽取、关系抽取、时间抽取、规则抽取。
从不同来源、 不同结构的数据中进行知识提取, 形成知识存入到知识图谱。
★从关系数据库获取知识
Example R2RML mapping:
@prefix rr: <http://www.w3.org/ns/r2rml#>.
eprefix ex: <http://example.com/ns#>.
<#TriplesMap1>
rr:logicalTable [ rr:tableName "EMP" ];
rr:subjectMap[
rr:template "http://data.example.com/employee/(EMPNO)";
rr:class ex:Employee;
];
rr:predicateObjectMap [
rr:predicate ex:name;
rr:objectMap [ rr:column "ENAME" ];
].
Example output data:
<http://data.example.com/employee/7369> rdf:type ex:Employee.
<http://data.example.com/employee/7369> ex:name "SMITH".
详细代码出处:从关系数据库获取知识
★从视觉数据获取知识
场景图构建
★从文本获取知识
● 命名实体识别
● 术语抽取( 概念抽取)
从语料中发现 多个单词组成的相关术语。
● 关系抽取
王思聪是万达集团董事长王健林的独子。 [王健林] <父子关系> [王思聪]
● 事件抽取
据路透社消息, 英国当地时间9月15日早8时15分, 位于伦敦西南地铁线District Line 的Parsons Green地铁站发生爆炸, 目前已确定有多人受伤, 具体伤亡人数尚不明确。目前, 英国警方已将此次爆炸与起火定性为恐怖袭击。
小结:
知识图谱 ≠ 专家系统,知识图谱就是新一代的知识工程
冯诺依曼曾估计单个个体的大脑中的全量知识需要 2.4*1020 字节存储, 知识工程的根本性
科学问题是知识完备性问题, 即规模化自动化知识获取与处理能力。
4.2 知识抽取——实体识别与分类
4.3 知识抽取——关系抽取与属性补全
4.4 知识抽取——概念抽取
4.5 知识抽取——事件识别与抽取
4.6知识抽取技术前沿
★☆●◆□◇▲△■
5、知识图谱推理
5.1什么是推理
5.2 知识图谱推理简介
5.3基于符号逻辑的知识图谱推理
5.3.1 基于Ontology的推理
5.3.2 规则的推理
5.4基于表示学习的知识图谱推理
5.4.1基于嵌入学习的知识图谱推理
5.4.2基于规则学习的知识图谱推理
5.4.3Ontology Embedding—本体概念层推理