NLP论文阅读记录 - 2021 | WOS 基于动态记忆网络的抽取式摘要

news2024/11/17 2:25:30

文章目录

  • 前言
  • 0、论文摘要
  • 一、Introduction
    • 1.1目标问题
    • 1.2相关的尝试
    • 1.3本文贡献
  • 二.前提
  • 三.本文方法
  • 四 实验效果
    • 4.1数据集
    • 4.2 对比模型
    • 4.3实施细节
    • 4.4评估指标
    • 4.5 实验结果
      • 4.6 细粒度分析
  • 五 总结
  • 思考


前言

在这里插入图片描述

Extractive Summarization Based on Dynamic Memory Network(21)

0、论文摘要

我们提出了一种基于 Bert 和动态记忆网络的提取摘要模型。基于 Bert 的模型使用 Transformer 提取文本特征,并使用预训练模型构建句子嵌入。基于 Bert 的模型自动标记句子,无需使用任何手工制作的特征,并且数据集是对称标记的。我们还提出了一种用于提取摘要的动态记忆网络方法。在几个摘要基准数据集上进行了实验。与其他提取摘要方法相比,我们的模型显示出可比的性能。

一、Introduction

1.1目标问题

摘要是自然语言理解和信息检索的一个重要问题。摘要的目的是压缩输入文本并保留输入文本的核心含义。概括的方法分为两类:抽取式概括法和抽象式概括法。这两种方法的对称性很重要。提取摘要方法从文档中选择显着内容,而抽象摘要方法解释文档内容。早期的研究主要集中在抽取式摘要方法,近期的研究主要集中在神经抽取式摘要和神经抽象式摘要。在本文中,我们只关注提取摘要方法。

1.2相关的尝试

Edmundson [1] 的早期工作是通过考虑标题词、线索词和句子位置来对句子进行评分。 Lin[2]使用一些规则来查找主题句,并训练一个模型来根据位置预测主题句。
随着深度学习的发展,研究人员主要集中于利用神经网络方法来解决提取摘要问题。特别是神经网络语言模型[3]和文本表示方法[4]的发展使得自然语言处理腾飞。曹[5]将神经网络应用于提取式查询集中摘要,这是一种信息检索任务。在他们的模型中,他们使用 CNN(卷积神经网络)将文档的句子和查询投影到潜在空间。为了获得文档表示,他们对句子嵌入使用加权和池化。最后,他们在比较句子嵌入和文档嵌入之间的相似性后,对文档的句子进行排序和选择。
由于RNN(循环神经网络)在机器翻译中的成功[6],Rush[7]首先采用基于注意力机制的RNN进行抽象摘要。
Nallapati [8]使用基于RNN的序列模型来提取单个文档的摘要,这是我们关注的问题。在他们的模型中,他们将提取摘要任务视为二元分类任务,并使用 RNN 模型作为句子分类器。最近,Zhou[9]将Carbonell和Goldstein[10]提出的MMR(最大边际相关性)选择策略集成到评分模型中。在他们的模型中,他们采用 BiGRU(双向门控循环单元)[4] 作为编码器来获取句子表示和文档表示,并通过最大化 ROUGE-2 F1 分数 [2] 构建标记训练数据。上面提到的这些神经抽取摘要方法都是使用RNN作为编码器,并且标记数据构建方法的计算量很大。 Narayan [11] 使用 CNN [12] 作为句子编码器,并使用 RNN 作为文档编码器。由于提取文本特征的能力很强,我们将像 Bert [14] 一样使用 Transformer [13] 作为编码器。

1.3本文贡献

总之,我们的贡献如下:

1.我们提出了一种提取摘要模型,该模型可以实现与其他基线可比较的结果。 2.我们提出了一种用于提取摘要问题的简单有效的句子标签方法。 3.我们将位置编码合并到动态记忆网络中。 4.我们建议使用动态记忆网络方法进行提取摘要。

二.前提

三.本文方法

四 实验效果

4.1数据集

4.2 对比模型

4.3实施细节

4.4评估指标

4.5 实验结果

4.6 细粒度分析


五 总结

在这项工作中,我们提出了一种基于 Bert 和动态记忆网络的提取摘要模型。在我们的模型中,我们使用简单的语义匹配方法来标记训练集并使用预训练的 Bert 模型来训练我们的模型。强大的文本特征提取能力使得模型有效。实验结果表明,基于 Bert 和动态记忆网络的模型在数据集上取得了与其他提取系统相当的结果。我们用于提取摘要问题的带有双 LSTM 编码器的动态记忆网络取得了良好的结果。以后我们会把这种抽取式概括的方法融入到抽象方法中。

思考

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1390640.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【学习iOS高质量开发】——熟悉Objective-C

文章目录 一、Objective-C的起源1.OC和其它面向对象语言2.OC和C语言3.要点 二、在类的头文件中尽量少引用其他头文件1.OC的文件2.向前声明的好处3.如何正确引入头文件4.要点 三、多用字面量语法,少用与之等价的方法1.何为字面量语法2.字面数值3.字面量数组4.字面量字…

chrome浏览器开启硬件加速无法打开提示“此设置有你的管理员管理“

chrome浏览器开启硬件加速无法打开提示"此设置有你的管理员管理" winR 输入regedit 打开注册表注册表搜索 计算机\HKEY_LOCAL_MACHINE\SOFTWARE\Policies\Google\Chrome删除 HardwareAccelerationModeEnabled重启Chrome浏览器。打开Chrome浏览器,查看设置…

【Java数据结构 -- 实现双链表的接口方法】

双链表 1.双链表2.双链表的创建3.双链表的头插节点4.双链表尾插5.双链表根据索引找节点6.双链表根据索引插入节点7.双链表删除值为key的节点8.删除所有值为key的节点9.双链表是否包含值为key节点10.双链表大小11.清空双链表12.打印双链表 1.双链表 双链表是一种数据结构&#…

【MATLAB】 SSA奇异谱分析信号分解算法

有意向获取代码,请转文末观看代码获取方式~ 1 基本定义 SSA奇异谱分析(Singular Spectrum Analysis)是一种处理非线性时间序列数据的方法,可以对时间序列进行分析和预测。 它基于构造在时间序列上的特定矩阵的奇异值分解&#…

部署YUM仓库及NFS共享存储

引言: 学习YUM 软件仓库,可以完成安装、卸载、自动升级 rpm 软件包等任务,能够自动 查找并解决 rpm 包之间的依赖关系,而无须管理员逐个、手工地去安装每个 rpm 包,使管理员在维护大量 Linux 服务器时更加轻松自如。特…

20240116-【UNITY 学习】增加滑动功能

替换脚本PlayerMovement_02.cs using System.Collections; using System.Collections.Generic; using UnityEngine;public class PlayerMovement_03 : MonoBehaviour {private float moveSpeed; // 玩家移动速度public float walkSpeed 7; // 行走速度public float sprintSpee…

竞赛保研 基于深度学习的水果识别 设计 开题 技术

1 前言 Hi,大家好,这里是丹成学长,今天做一个 基于深度学习的水果识别demo 这是一个较为新颖的竞赛课题方向,学长非常推荐! 🧿 更多资料, 项目分享: https://gitee.com/dancheng-senior/pos…

图像处理:孤立点的检测

图像处理-孤立点的检测 孤立点的检测在图像处理中通常涉及到检测图像中的突变或者边缘,而使用二阶导数是一种常见的方法。一阶导数可以帮助找到图像中的边缘,而二阶导数则有助于检测边缘上的峰值,这些峰值可能对应于孤立点或者特殊的图像结构…

2024美赛数学建模思路 - 案例:FPTree-频繁模式树算法

文章目录 算法介绍FP树表示法构建FP树实现代码 建模资料 ## 赛题思路 (赛题出来以后第一时间在CSDN分享) https://blog.csdn.net/dc_sinor?typeblog 算法介绍 FP-Tree算法全称是FrequentPattern Tree算法,就是频繁模式树算法&#xff0c…

帆软笔记-决策表报对象使用(两表格联动)

效果描述如下: 数据库中有个聚合商表,和一个储能表,储能属于聚合商,桩表中有个字段是所属聚合商。 要求帆软有2个表格,点击某个聚合商,展示指定的储能数据。 操作: 帆软选中表格单元&#xf…

Windows Server 2019配置DNS服务器

正文共:1234 字 31 图,预估阅读时间:1 分钟 我们在给Windows Server添加角色和功能时,会发现有一项“远程桌面服务安装”,它的介绍为“为虚拟桌面基础结构(Virtual Desktop Infrastructure,VDI&…

PyTorch Tutorial 2.0

这里是对于PyTorch Tutorial-CSDN博客的补充,但是与其相关的NLP内容无关,只是一些基础的PyTorch用法的记录,主要目的是能够自己生成一些模拟的数据集。先介绍随机数的目的是因为based on随机数方法。 当然在看随机数的方法的时候&#xff0c…

Python 最新版本 3.12.1 环境配置(windows)

文章目录 python 3.12.1环境安装3.12.1 网盘下载3.12.1 官网下载 python 安装完成测试第一个 python 程序Hello Python python 3.12.1环境安装 3.12.1 网盘下载 python 3.12.1 百度网盘地址:https://pan.baidu.com/s/1SAcH_uH0T3DiERn6AZeQlg?pwd4242 提取码&a…

java-Lambda 语法总结

文章目录 Lambda 语法概览Lambda 表达式语法1.Lambda 表达式与函数接口2.Lambda 遇上 this final Lambda 语法概览 String(] names {”Justi n ”,”caterpillar”,”Bush " }; Arrays . sort (names, new Compara tor<String> () { publ int compare (String na…

伪装目标检测模型论文阅读之:Zoom in and out

论文链接&#xff1a;https://arxiv.org/abs/2203.02688 代码;https://github.com/lartpang/zoomnet 1.摘要 最近提出的遮挡对象检测&#xff08;COD&#xff09;试图分割视觉上与其周围环境融合的对象&#xff0c;这在现实场景中是非常复杂和困难的。除了与它们的背景具有高…

布隆过滤器四种实现(Java,Guava,hutool,Redisson)

1.背景 为预防大量黑客故意发起非法的时间查询请求&#xff0c;造成缓存击穿&#xff0c;建议采用布隆过滤器的方法解决。布隆过滤器通过一个很长的二进制向量和一系列随机映射函数&#xff08;哈希函数&#xff09;来记录与识别某个数据是否在一个集合中。如果数据不在集合中…

两个方法实现echarts散点图的高光圆点

一、效果图&#xff1a; 二、代码 方法一&#xff1a;通过series的itemStyle进行设置&#xff0c;type为scatter 在 ECharts 中&#xff0c;要在二维散点图上实现看似 3D 的高光圆点效果&#xff0c;可以通过自定义散点图的 itemStyle 属性来实现。虽然无法直接创建真正的 3D…

Flume 之自定义 Source

1、简介 Flume 自带 Source 有 Avro、Thrift、Netcat、Taildir、Kafka、Http等&#xff0c;有些场合比如我们指定访问接口获取数据当做 Flume 的 Source&#xff0c;像这种定制化的 Source 需要我们自己实现&#xff0c;下面我将介绍如何自定义实现 Source。 2、自定义实现 Fl…

Linux中放大字体

环境&#xff1a;VMware17Pro&#xff0c;Ubuntu22.04 在显示设置外观中只看到图标放大的调整&#xff0c;没看到字体大小设置 不按照常规设置&#xff0c;点开下面的辅助功能->大号文本&#xff08;没有设置具体字号的选项&#xff0c;但是可以放大&#xff09; 效果图如下…

五、带登录窗体的demo

做了一个简单的带登录窗体的demo&#xff0c;有用户名和密码不能为空的验证&#xff0c;原理是在main.cpp的主函数入口处&#xff1a; 1、将默认的MainWindow主窗体注释。 2、新建一个formlogin登录窗体&#xff0c;在主函数中先运行登录窗体。 3、在登录窗体中引用MainWind…