自然语言处理重点 第11章 机器阅读理解 复习

news2025/1/11 11:15:22

机器阅读理解复习

  • 机器阅读理解概述
    • 机器阅读(MRC)理解与问答系统(QA)的区别:
    • 本章内容:
  • MRC 任务分类:
    • 完形填空形式(cloze-style)
    • 选项形式
    • 片段抽取形式(span extraction)
    • 文本生成形式(free-answer/generation)
    • 阅读理解实现方法
      • 传统特征工程
      • 深层语义图匹配
      • 深度神经网络
  • 神经网络机器阅读理解基本框架
    • 嵌入编码:
    • 特征提取:
    • 文章-问题交互:
    • 答案预测:
  • 神经网络机器阅读理解典型模型

本章复习重点:
阅读理解的方法,和问答系统的方法 基本过程上有哪些典型的区别,它的基本过程是什么样的,和问答系统的核心区别是什么,大致的技术思路概念就可以

机器阅读理解概述

在这里插入图片描述
机器阅读理解其实和人阅读理解面临的问题是类似的,不过为了降低任务难度,很多目前研究的机器阅读理解都将世界知识排除在外,采用人工构造的比较简单的数据集,在给定的文本或相关内容(事实)的基础上,要求机器根据文本的内容,对相应的问题作出回答;一般回答的是一些非事实性的、高度抽象的需要对语言理解的问题 。
在这里插入图片描述

机器阅读(MRC)理解与问答系统(QA)的区别:

  • 问答系统(QA)考察系统的文本匹配、信息抽取能力;
  • MRC考察系统对于文本细致化的语言理解能力和推理能力;
    在这里插入图片描述
  • 机器阅读理解核心问题:理解和推理,并不是简单的文本匹配或者相似度计算
  • 机器阅读理解研究特点: 任务导向 + 数据驱动
    在机器阅读理解任务当中,问题的答案是给定的,是有监督学习任务

本章内容:

  1. 任务分类及评价指标
  2. 数据集
  3. 实现方法
  4. 主要挑战

MRC 任务分类:

传统的MRC任务可以分为四种类型:完形填空、多项选择、片段抽取、自由回答

考虑到目前方法的局限性,MRC出现了新的任务,如,knowledge-based MRC, MRC with unanswerable questions, multi-passage MRC,conversational question answering

完形填空形式(cloze-style)

  • 提供:文本C,且一个词或实体 a ( a∈C ) 被移除
  • 任务:使用正确的词或实体进行填空(最大化条件概率 P(a |C - {a} )
  • 数据集:CNN & Daily Mail 、 Children’s Book Test (CBT)、LAMBADA、Who-did-What、CLOTH
  • 答案类型: 客观
    评价指标: Accuracy 准确率:衡量正确预测出答案占测试集合的比例
    A c c u r a c y = 预测答案正确的个数 测试集合的大小 Accuracy=\frac{预测答案正确的个数}{测试集合的大小} Accuracy=测试集合的大小预测答案正确的个数
    在这里插入图片描述

选项形式

  • 提供:文本C,问题Q ,候选答案列表 A={a1, a2 ,…. an }
  • 任务:从A中选择正确的答案ai (最大化条件概率 P(ai |C ,Q ,A )
  • 数据集: MCTest、RACE
  • 答案类型: 客观
  • Accuracy 准确率:衡量正确预测出答案占测试集合的比例
    A c c u r a c y = 预测答案正确的个数 测试集合的大小 Accuracy=\frac{预测答案正确的个数}{测试集合的大小} Accuracy=测试集合的大小预测答案正确的个数
    在这里插入图片描述

片段抽取形式(span extraction)

  • 提供:文本C,问题Q ,其中 C = {t1, t2 ,…. tn }
  • 任务:从C中抽取连续的子序列 {ti, ti+1 ,…. ti+k } (1 ≤i ≤i+k≤ n) 做为正确答案
    (最大化条件概率 P(a |C ,Q )
  • 数据集: SQuAD、NewsQA、TriviaQA、DuoRC
  • 答案类型: 半客观
    • Exact Match 精确匹配:衡量预测答案是否与标准答案完全一致
    • u F1 值:衡量预测答案与标准答案的相似度
      在这里插入图片描述

文本生成形式(free-answer/generation)

  • 提供:文本C,问题Q
  • 任务:根据文本内容和问题生成答案 a ,a可以是C的子序列,也可以不是C的子序列。
    (最大化条件概率 P(a |C ,Q )
  • 数据集: bAbI、MS MARCO 、SearchQA、NarrativeQA、DuReader
  • 答案类型: 主观
  • 评价指标:
    • BLEU
    • ROUGE-L(自动摘要任务当中的常用指标)
      在这里插入图片描述

阅读理解实现方法

机器阅读理解通常是有监督的,实现方法有三类

  • 传统的特征工程方法
  • 深层语义图匹配方法
  • 深度神经网络方法

传统特征工程

优点:解释性强,每一部分的结果都能直观的展现出来
缺点:需要大量人工构建的特征,特征本身具有局限性;

  • 大多数特征都是基于离散的串匹配的,无法很好地解决表达的多样性问题;
  • 大多数特征是基于窗口的,很难处理多个句子之间的长距离依赖问题;
    • 由于窗口或者是n-gram并不是一个有效的表达语义的单元,存在语义缺失
      或引入噪声等问题;
  • 基于 词汇重叠程度 或 文本相似程度 在很多情况下会失效;
    • 错误答案和正确答案都在文档中出现;
  • 不具备推理能力:在计数、处理时间、比较等问题上

深层语义图匹配

优点:引入了深层次的语义结构,能够捕捉深层面的语义信息;

  • 语义建模方式解释性好,每一部分的语义都能很直观地表示出来;

缺点:语义结构的定义与问题相关;

  • 语义结构的定义十分依赖于人工特征的干预;
  • 属于领域相关的方法,应用范围有很大的局限性;

深度神经网络

优点:各种语义单元被表示为连续的语义空间上的向量,可以有效地解决语义稀疏性以及复述的问题。

  • 建立一种End-to-End的网络模型;改善了传统方法中的错误级联和语义匹配问题;
  • 自动学习文本的语义表示、语义组合以及问答的过程;

缺点:缺乏引入外部知识进行更深层次推理机制;

  • 需要更加复杂的网络模型对MRC过程进行建模与刻画;

神经网络机器阅读理解基本框架

一般由四个模块组成

  1. 嵌入编码 Embeddings
  2. 特征提取 Feature Extraction / Encoding
  3. 文章-问题交互 Context-Question Interaction
  4. 答案预测 Answer Prediction

嵌入编码:

将模型的输入(自然语言形式的文章和问题)编码成固定维度的向量
输入:

  1. 文档token序列(词表中的id构成的序列)
  2. 问题token序列

输出:

  1. 文档token序列的词向量表示(分布式向量表示)
  2. 问题token序列的词向量表示

注: 如果存在候选答案选项,也要进行Embedding

特征提取:

接收由嵌入编码层编码得到的文章和问题的词向量表示,对其进行处理,抽取更多上下文信息

输入:

  • 文档和问题token序列的词向量表示

输出:

  • 文档和问题token序列的上下文表示

文章-问题交互:

利用文章和问题之间的交互信息来推测出文章中哪些部分对于回答问题更为重要(常用单向或双向的注意力机制来实现) 两者之间的交互过程有时可能会执行多次–模拟人类的推理过程。
输入:

  • 文档和问题token序列的上下文表示

输出:

  • 文档和问题token序列的注意力感知更新后的序列表示

答案预测:

基于前述三个模块累积得到的信息进行最终的答案预测

输入:

  • 经过交互操作后的融合表示(通常是更新后的文档表示)
    输出:
  • 预测的答案分布,不同的任务类型有不同答案结果形式

神经网络机器阅读理解典型模型

  1. 基于完形填空的机器阅读理解
  2. 基于选项的机器阅读理解
  3. 基于片段抽取的机器阅读理解
  4. 基于文本生成的机器阅读理解

仍然是上面这四种类型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/137468.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

uCharts柱状图横向排列及不同条件下得数据颜色不同,雷达图的使用及各个参数的配置讲解

一:雷达图 1,建立一个盒子,内部存放uCharts图表 在data数据中return内部配置如下数据: chartData: {},//您可以通过修改 config-ucharts.js 文件中下标为 [radar] 的节点来配置全局默认参数,如都是默认参数,此处可以不传 opts 。实际应用过程中 opts 只需传入与全局默认…

【台式机DIY】我的第一台台式机电脑配置清单

文章目录[toc]【第一台台式机】一、电脑配置清单【电脑小白我科普】一.CPU1.选购:主流品牌2.选购:如何选择3.参数:接口4.参数:频率5.参数:核心和线程6.参数:功耗7.参数:缓存二.主板1.选购&#…

Django开发员工管理系统(Part I)

文章目录1. 准备工作1.1 创建django项目1.2 创建app1.3 配置settings.py文件,完成app注册2. 设计数据库表结构3. 在MySQL中生成表3.1 创建数据库3.2 修改配置文件,连接MySQL数据库3.3 通过django命令生成数据库表4. 编写部门列表4.1 (前段页面…

报表开发工具FastReport.NET的十大常见问题及解决方法(二)

Fastreport是目前世界上主流的图表控件,具有超高性价比,以更具成本优势的价格,便能提供功能齐全的报表解决方案,连续三年蝉联全球文档创建组件和库的“ Top 50 Publishers”奖。慧都科技是Fast Reports在中国区十余年的友好合作伙…

php宝塔搭建部署实战海洋cms视频内容管理系统源码

大家好啊,我是测评君,欢迎来到web测评。 本期给大家带来一套php开发的海洋cms视频内容管理系统源码,感兴趣的朋友可以自行下载学习。 技术架构 PHP7.2 nginx mysql5.7 JS CSS HTMLcnetos7以上 宝塔面板 文字搭建教程 下载源码&#…

在动态规划的海洋中遨游(一)

前言:\textcolor{Green}{前言:}前言: 💞本专栏用于本人刷算法的过程。主要包含刷题中的感受以及知识点缺陷。对于学习者来说可以作为参考。 目前更新的算法内容会比较多,很多都是通过刷题来进行知识点的总结&#xff0…

计算机SCI论文,很难发表吗?应该如何发表? - 易智编译EaseEditing

首先,找题目需要符合国际标准,但不要缺少创新的探究题目。这个题目可以是最新的技术,也可以是最新的领域; 也可以是探索过很多次的课题。但是如果我们想成功交付,如何创新是我们需要思考的。 其次,因为英语…

为什么有的电源不是从0V开始上电的

大家可以看下,这张图片是测试XILINX 的FPGA 325T的上电时序图,其中绿色的线是FPGA 核心电源VCCINT 1.0V的波形,黄色的是BANK的电源2.5V的波形,蓝色的是辅助电源1.8V 的波形大家有没有发现这个时序图中黄色的波形,也就是…

Java之多线程详解

目录 一、线程简介 进程(Process )与 线程(Thread) 二、线程创建 1、线程Thread 1.1. 步骤 1.2 应用 1.3 案例:下载图片 2、实现Runnable接口 2.1 步骤 2.2 应用 3.小结 3. 实现Callable接口(了解…

java开发的考研系统大学生考研推荐网站考研网站源码

简介: 考研信息推荐查询。主要是管理发布管理考研的知识文章,或者上传资料,发布考研的视频。学生可以注册后下载资料,查看考研文章视频等。文章分为vip文章和普通文章,学生查看vip文章需要消耗积分。 演示视频 https…

FX5U 原点回归指令 DSZR

上一篇文章中转述了网友的文章,因回原点实在重要,再详细描述DSZR指令。 DSZR是具有自动搜索功能的原点回归指令。它对当前位置没有要求,在任意位置哪怕是停止在限位开关位置上都能完成原点回归操作。 1.指令格式 S1 原点回归速度或存储了数…

linux虚拟机搭建kafka(单节点、使用kafka自带zookeeper)

本文使用kafka单节点安装及配置,并使用kafka自带的zookeeper。一般kafka需要起三个kafka构成集群,可以连单独的zookeeper,本文不涉及。一、kafka下载解压安装包下载地址:https://archive.apache.org/dist/kafka/2.5.0/kafka_2.12-…

MyPerf4J结合Grafana和InfluxDB采集JVM以及QPS指标

MyPerf4J结合Grafana和InfluxDB采集JVM以及QPS指标 背景 ​ 需要采集现场java程序运行的状态数据(包括JVM指标以及QPS,RPS指标等)。需要采集的方式尽可能轻量化 ​ 结合实际情况采用MyPerf4J作为Java探针,InfluxDB作为数据存储端,Grafana作为数据展示…

15---整合Echarts和完善头像上传

1、完善头像上传功能 上次写的头像上传功能&#xff0c;不能实现上传保存后立刻刷新右上角头像&#xff0c;这里做一个完善。首先是在Manage.vue中&#xff08;父&#xff09;&#xff0c;写刷新User的方法 //传一个user过去到header <Header :collapseBtnClass"col…

【信息论与编码 沈连丰】第三章:离散信源

【信息论与编码 沈连丰】第三章&#xff1a;离散信源第三章 离散信源3.1 离散信源的分类及其描述3.2 离散信源的熵3.3 信源的冗余度3.4 信源符号序列分组定理3.5 平稳离散信源及其性质第三章 离散信源 3.1 离散信源的分类及其描述 信源分类&#xff1a;本质上主要基于两方面来…

fastai教程学习笔记

这几天对着fastai教程读了下&#xff0c;大部分写得已经很不错。这里做点知识精炼的笔记。 安装fastai 推荐在conda环境内执行以下命令。它 pip install fastaifastai架构 fastai的编程架构如下图所示&#xff1a; fastai提供了高、中、低三层的API&#xff0c;用户可以根…

73、【哈希表】leetcode——15. 三数之和(C++版本)

题目描述 原题链接&#xff1a;15. 三数之和 解题思路 本题的难点在于去重&#xff0c;针对两种不同的方式&#xff1a;双指针和Hash采用不同的去重判定条件。 1、去重的目标 要明确&#xff0c;去重的是重复三元组&#xff0c;而不是三元组里重复的数。 2、去重初步思路 …

商业与数据生态议题解读,Doris Summit 2022 分论坛议程介绍|即刻报名

Doris Summit 2022 将于1 月 6 -7 日在线上正式举办&#xff0c;本次峰会共分2 天进行&#xff0c;首日上午为主论坛&#xff1a;核心技术解析&#xff0c;下午为商业与数据生态分论坛&#xff0c;7 日全天为行业用户最佳实践案例。大会汇聚了来自全球顶尖云厂商、一线互联网企…

CoMER论文翻译

文章目录Abstract1、Introduction2、Related Work2.1 HMER Methods2.2 Coverage Mechanism3、Methodology3.1、Background3.2、CNN Encoder3.3、Positional Encoding3.4、Attention Refinement Module3.5、Coverage4 Experiments论文链接&#xff1a;https://arxiv.org/abs/220…

数字图像处理 图像对比度增强算法概览

一、图像对比度增强 图像对比度增强又叫作图像对比度拉伸或者直接称为点运算。图像亮度和对比度调整的目的之一是在合适的亮度上提供最大的细节信息&#xff0c;细节纹理的沟纹越深&#xff0c;图像越清晰。在图像处理中&#xff0c;图像对比度增强是最基本的、原理比较简单却很…