事理知识图谱能够有力第建模各类事件之间的演化关联关系为事理逻辑推理提供更好的数据基础。
事理图谱定义
- 事理知识图谱可以将文本中对事件以及事件之间的关系抽取并抽象出来,构建成一个有向图形式的事理知识库。
- 在结构上,事理知识图谱是一个有向有环图,其节点表示事件,有向边表示事件之间的演化关系,比如顺承、因果、条件和上下位等逻辑关系。
- 事理知识图谱是描述事件之间演化规律和模式的事理逻辑知识库。
事理图谱的表示
- 事理图谱中的事件,用抽象、泛化、语义完备的谓词短语或句子来表示,其中含有事件触发词,以及其他必须的成分保持该事件的语义完备性。(其中,抽象和泛化指不关注事件的具体发生时间、地点和具体实施者,语义完备指人类能够理解该短语传达出的意义不至于过度抽象。)
- 事理图谱中事件的表示必须至少包含一个事件词标志事件的发生。
事理知识图谱与传统知识图谱对比
事理逻辑关系
下面列举了事理逻辑关系的几种类型:
- 因果事理:前因后果联系,前一事件导致后一事件发生
- 条件事理:条件结果关系,是一种预设与结果逻辑
- 反转事理:互斥逻辑关系,是一种真假值逻辑
- 顺承事理:时间上的偏序关系,先后动作逻辑
- 上下位事理:事件在分类体系中的一个钟逻辑
- 组成事理:事件之间整体与部分的逻辑
- 并发事理:事件在时间上的共生关系,一个事件发生时另一个事件一定发生
事理图谱与事件抽取
1、事件抽取需要从一段文本中抽取出预定义的事件触发词和事件要素。
在实际使用的过程当中,我们可以把除了关系以外的所有复杂信息全部拆解成关系抽取来解决事件抽取问题。
事件抽取是信息抽取的难点问题;
事件抽取依赖实体抽取和关系抽取;
目前对事件还没有统一的定义,在不同领域针对不同应用不同人对事件有不同的描述;
2、信息抽取中事件的定义:
事件:是发生在某个特定的时间段、某个特定的地域范围内,由一个或者多个角色参与的一个或者多个动作组成的事件或者状态的改变。(与事理图谱定义的事件一致)
事件类型: 不同动作或者状态的改变代表不同类型的事件;
事件元素: 同一类型的事件中不同的时间、地点、元素代表了不同的时间实例;
3、事件抽取包含的子任务有:
- 识别事件触发词及事件类型
- 抽取事件元素的同时判断其角色
- 抽出描述事件的词组或句子
- 事件属性标注
- 事件共指消解
4、事件抽取已有方法可分为两大类
- 流水线方法
- 联合抽取方法
5、事件抽取流水线方法
流水线方法将事件抽取任务分解为一系列基于分类的子任务,包括事件识别、元素抽取、属性分类和可报告性判别;每个任务由一个机器学习分类器负责实施。一个基本的事件抽取流水线需要的分类器包括:
- 事件触发词分类器。判断词汇是否为事件触发词,并基于触发词信息对事件类别进行分类
- 元素分类器。判断词组是否为事件的元素。
- 元素角色分类器。判定时间元素的角色类别。
- 属性分类器。判定事件的属性。
- 可报告性分类器。判定是否存在值得报告的事件实例。
5、事件的联合抽取方法
事件抽取流水线方法各阶段的误差累积起来会影响最终的性能。在联合方法中,事件的所有相关信息会通过一个模型同时抽取出来。
具有代表性的一个联合建模方法是QiLi等人在ACL2013论文中提出的模型。该模型将事件触发词、元素抽取的局部特征和捕获任务之间关联的结构特征结合进行事件抽取。
参考资料
1、知识图谱导论【陈华钧著】
2、NLP学习——信息抽取