note
- 知识图谱技术要素
文章目录
- note
- 一、语言与知识
- 二、知识图谱的起源
- 三、知识图谱的价值
- 四、知识图谱的技术内涵
- 4.1 知识图谱是交叉领域
- 4.2 技术内涵
- (1)基于图的表示学习
- (2)图数据存储和查询
- (3)知识图谱推理
- (4)知识图谱问答—KBQA
- 4.3 建立知识图谱的系统工程观:
- 时间安排
- Reference
一、语言与知识
- AI主要分为连接主义和符号主义两大学派,知识图谱可以归为后者。
- 语言是知识的最主要表示载体,即语言与知识是实现认知只能最重要的两个方面。而知识图谱是一种结构化的知识表示方法,相比于文本更易于被机器查询和处理,在搜索引擎、智能问答、大数据分析中被广泛应用。
- 语言和知识的embedding化表示,是当前NN的发展趋势。
二、知识图谱的起源
- 知识图谱起源于world wide web万维网,万维网是以链接为中心的信息系统,万维网的创始人Sir Tim Berners-Lee也在16年获得图灵奖。
- 溯源:各种语义网项目
- 谷歌知识图谱:Things, Not Strings (2012)
- Freebase项目
- WikiData项目
- Schema.org项目
- DBPEDIA项目
- 中文领域开放知识图谱:OpenKG.CN
- 知识图谱的两个核心基因:AI+互联网
三、知识图谱的价值
- 语义搜索:web的理想是链接万物,搜索的理想是万物搜索
- 知识问答
- 辅助推荐系统:丰富user和item的embedding表示,挖掘更深层次的用户兴趣;增强推荐的可解释性。
- 辅助大数据分析:
- 语义集成:Dynamic Ontology
- 语义搜索:围绕Ontology来搜索发现结果和关系;
- 知识管理:所有的知识是有权限控制的 ;
- 协作:知识可以在不同的用户之间共享,协同工作;
- 算法引擎:对于通用领域问题,提供了通用算法来发现趋势
- 辅助语言理解、视觉理解、设备互联等。
- 领域应用栗子:华为自动驾驶知识图谱:
四、知识图谱的技术内涵
4.1 知识图谱是交叉领域
(1)知识图谱是交叉领域
(2)知识图谱技术要素
4.2 技术内涵
(1)基于图的表示学习
(2)图数据存储和查询
图数据库充分利用图的结构建立微索引,这种微索引比起关系数据库的全局索引在处理图遍历查询时更加廉价,其查询复杂度与数据集整体大小无关,仅正比于相邻子图的大小。因此
在很多涉及复杂关联和多跳的场景中得到广泛应用。
(3)知识图谱推理
- 基于符号逻辑的推理方法: OWL Reasoners、Datalog、Rete等
- 基于图结构或表示学习的推理方法: PRA、AMIE、TransE、Analogy、DeepPath、NeuralLP等
(4)知识图谱问答—KBQA
4.3 建立知识图谱的系统工程观:
时间安排
任务 | 任务信息 | 截止时间 |
---|---|---|
- | 12月12日正式开始 | |
Task01: | CP1知识图谱概论(2天) | 12月12-13日 周日 |
Task02: | CP2知识图谱表示 + CP3知识图谱的存储和查询(上)(6天) | 12月14-19日 周六 |
Task03: | CP3知识图谱的存储和查询(下)(3天) | 12月20-22日 周二 |
Task04: | CP4知识图谱的抽取和构建(3天) | 12月23-25日 周五 |
Task05: | CP5知识图谱推理(4天) | 12月26-29日 周二 |
Reference
[1] 推荐系统前沿与实践. 李东胜等
[2] 自然语言处理cs224n-2021–Lecture15: 知识图谱
[3] 东南大学《知识图谱》研究生课程课件
[4] 2022年中国知识图谱行业研究报告
[5] 浙江大学慕课:知识图谱导论.陈华钧老师
[6] https://conceptnet.io/
[7] KG paper:https://github.com/km1994/nlp_paper_study_kg
[8] 北大gStore - a graph based RDF triple store
[9] Natural Language Processing Demystified
[10] 玩转Neo4j知识图谱和图数据挖掘