摘要
*知识图谱为实现语义化智能搜索以及知识互联打下了基础,。,
*随着知识的发展,传统的基于模板和规则构建的知识图谱已经被深度学习所替代。
- 知识组织得原则中:知识的充分性、有序性和标准化规则。
- 深度学习的效果在很大程度上依赖大规模的样本、缺乏先验知识。导致某些结果可能背离人类知识和先验知识。
- 深度学习不具备因果推理性,缺乏可解释性。
- 端到端学习,人们无法清楚的解释每一个参数的意义。
- 知识图谱用于深度学习时候的可解释性、因果推断性、指导性。
知识图谱的定义和架构
- 知识图谱旨在从多种类型的复杂数据中抽取概念、实体和关系。是事物关系的可计算模型。
知识图谱的体系架构
- 第一部分:源数据的获取:即在各个类型的数据中获取最有用的资源信息。
- 第二部分:知识融合:用于关联多数据源的知识,扩大知识范围。
- 第三部分:知识的计算和知识的应用。
知识图谱的构建技术
- 知识图谱从多种数据源中提取知识并存入知识图谱,是构建大规模知识图谱的基础。
- 知识融合可以解决不同知识图谱异构问题。
- 知识计算是知识图谱的主要输出能力。
知识抽取
- 命名实体识别
- 关系抽取
关系抽取
- 基于传统规则和模板的方法
- 基于传统机器学习的方法
- 有监督
- 半监督
- 无监督三类。
- 基于深度学习的方法
- 流水线方法:CNN、RNN及其改进模型
- 实体关系联合抽取
- 基于参数共享的实体关系联合抽取
- 基于序列标注的实体关系联合抽取。
知识融合
- 本体融合
- 本体集成和本体映射两大类。
- 本体集成和本体映射两大类。
本体映射
-
基于NLP的方法
-
基于结构的方法
-
基于实例的方法
-
综合方法
- 数据融合
- 实体合并
- 实体对齐
- 实体属性融合等方面
- 数据融合
-
知识图谱的对齐算法可以分为3类:
- 成对实体对齐
- 局部实体对齐
- 全局实体对齐。
知识推理
- 知识推理根据已经有得实体关系信息来推断新得事实结论,从而进一步丰富知识图谱,满足上游任务得需求。
- 基于逻辑规则的推理
- 谓词逻辑推理
- 本体推理
- 随机推理
- 本体寻路算法: 该算法通过一系列并行优化技术实现大规模的知识图谱。
- 双层随机游走算法:利用无向图来表示知识图谱
- 在全局模式和局部模式2中角度下对路径特征进行评估。提高了算法的准确率和召回率。
- 基于分布式特征表示的推理
- 基于翻译模型的知识推理
- 基于张量分解的知识推理。
- 基于语义匹配模型的知识推理。
- 提出 DistMult模型
- 基于深度学习的推理。
深度学习指导
深度学习推理
- 图网络相对于普通的神经网络具有归纳推广和组合概括能力。
存在困难和挑战
- 对于知识抽取技术,现有的实体关系联合抽
取技术并未解决关系重叠问题,算法准确率和召回率都较低。 - 基于开放域的关系抽取还处于初级阶段,多语种、大范围的多元实体关系抽取是当前面临的主要困难之一
- 无监督关系抽取具有较高的可移植性,和泛化性,为开发域关系抽取任务提供了新的思路。
- 对于知识融合技术,实体对齐是最主要的手段,如何实现高质量的实体对齐、共指消解是一项巨大的挑战,开放领域下的实体对齐、共指消解以及多源数据库融合是当前主要的研究重点
- ,如何在短文本情况下准确地将实体链接到知识库中亟需解决
- 将小样本学习应用到实体对齐是重要的研究方向。
- 对于知识推理技术,现有的知识推理技术大多只关注静态数据,忽略了时间信息,知识图谱的信息应该随着时间的推移而变化,因此,动态知识图谱推理还需要进行研究探索
- ,将知识图谱应用于深度学习还处于起步阶段
结束语
经验
到此为止,慢慢的沿着综述将各种模型都给建立一波,并将其全部都搞通搞精通,完全理解透彻。
- 经验,找到解决关系重叠有没有好的方法,根据啥进行重叠以下都行的样子与打算。
- 给代码敲打熟悉,然后给综述性文章看个四五篇,然后开始自己找两三个自己现成的方法,自己搞研究,将其全部都搞定都行啦的样子域打算。