【论文精读】基于历史抽取信息的摘要抽取方法

news2024/12/24 21:12:18

前言

论文分享 今天分享的是来自2018ACL的长文本抽取式摘要方法论文,作者来自哈尔滨工业大学和微软,引用数369
Neural Document Summarization by Jointly Learning to Score and Select Sentences

摘要抽取通常分为两个部分,句子打分和句子选择。句子打分的方法有基于特征的,比如字概率,TF-IDF权重,句子位置和句子长度特征,基于图的方法比如TextRank和LexRank。在句子选择阶段,有基于最大边际相关性(maximal marginal relevance)的方法,选择分数最高,冗余最小的摘要;以摘要长度为限制,基于整数线性规划(Integer Linear Programming)的方法;用于发现最优句子子集的优化方法子模块方程(submodular function);基于神经网络的方法等

这些方法都是将句子打分和句子选择分为两个步骤,即先打分后选择,论文提出一种将打分和选择进行联合学习的模型。作者的创新点在于构建的模型在每一次选择句子的时候,会同时考虑句子的重要性和之前已选择的句子。

模型

在这里插入图片描述
作者提出的模型一共包括3个GRU,第一个GRU用于编码字级别特征,将GRU的最后一层作为句子编码,第二个GRU对所有句子进行学习,得到文档级的句子编码,第三个GRU用于学习历史抽取信息,前两个GRU的公式比较简单,这里就不详细描述了,学习历史信息,得到隐层状态,然后利用历史信息的隐层状态,去影响剩余句子的打分过程,方式如下
在这里插入图片描述
s t − 1 s_{t-1} st1为上一时刻采集的句子向量, h t − 1 h_{t-1} ht1为上一时刻隐层状态,GRU得到当前时刻的隐层状态,然后通过当前隐层状态对剩余的句子进行打分,得到分数 δ ( S i ) \delta(S_i) δ(Si),需要注意的是,在抽取第一个句子的时候, s 0 s_0 s0向量为0,隐层状态计算如下
在这里插入图片描述
用于计算隐层状态的 s 1 ← \mathop{s_1}\limits ^{\leftarrow} s1为文档级向量的最后一个反向隐层向量
目标函数 目标函数为预测段落的得分和添加每一个句子可获得的ROUGE分数提升之间的KL-Divergence
在这里插入图片描述

预测段落的得分
在这里插入图片描述
添加每一个句子可获得的ROUGE分数提升,MinMax归一化后进行softmax
在这里插入图片描述
在这里插入图片描述

实验

在这里插入图片描述
作者比较了几个当时最好的抽取式模型,NEUSUM均优于baseline
在这里插入图片描述
作者比较了NN-SE和NeuSum抽取的句子和贪婪算法(ORACLE)得到的参考句子,在抽取的前3个句子的准确性,NeuSum是要优于NN-SE,并且发现越往后抽取,准确率是越下降的,如何高效的利用历史抽取是一个可提升的点
在这里插入图片描述
作者还比较了抽取句子位置的统计信息,得出NN-SE抽取的句子80.91%的概率来自前三个句子,而NeuSum只有58.64%,NeuSum利用历史抽取信息的方法能够避免依赖前面的段落。ORACLE中句子的分布是比较均匀的,而算法倾向于抽取前几个句子

总结

NeuSum提出了一种基于历史抽取信息的摘要抽取方法,其只能抽取固定数量的段落和目标函数在MemSum中得到了优化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/821150.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

04 编写自己的破解补丁

本章摘要: 1、提高od当中汇编可读性 当我们遇到push offset Console.dasgasuigicashi这种阅读性不高的汇编代码的时候 在od当中,点击:选项》调试设置 逆向微软提供的内核dll也会出现阅读性不高的情况出现 跳转到这个地址 2、为什么写成全局…

【暑期每日一练】 day11

目录 选择题 (1) 解析: (2) 解析: (3) 解析: (4) 解析: (5) 解析: 编程题 题一 描…

使用curl和postman调用Azure OpenAI Restful API

使用curl在cmd中调用时,注意:json大括号内的每一个双引号前需要加上\ curl https://xxxopenai.openai.azure.com/openai/deployments/Your_deployid/chat/completions?api-version2023-05-15 -H "Content-Type: application/json" -H "…

C++ 对象的生存期详解

1.局部对象 &#xff08;1&#xff09;对于局部定义的对象&#xff0c;每当程序控制流到达该对象定义处时&#xff0c;定义构造函数。当程序走出该局部域时&#xff0c;调用析构函数。 这种普通的局部对象具有动态生存期。 #include<iostream> using namespace std;cl…

学习C#编写上位机的基础知识和入门步骤:

00001. 掌握C#编程语言基础和.NET框架的使用。 00002. 学习WinForm窗体应用程序开发技术&#xff0c;包括控件的使用和事件驱动编程。 00003. 熟悉基本的数据结构和算法知识&#xff0c;如链表、栈、队列等。 00004. 理解串口通信协议和通信方法&#xff0c;用于与底层硬件设…

增强for循环原理详解

增强for循环 本质是采用了迭代器&#xff0c;并使用局部变量指向迭代器当前遍历到的元素&#xff0c;使用增强for循环时&#xff0c;无法修改集合当前索引位置的引用&#xff0c;但是如果元素是引用数据类型&#xff0c;那么是可以修改这个元素的信息的&#xff08;String除外…

PSP - HHblits 算法搜索 BFD 与 UniRef30 的结果分析 (bfd_uniref_hits.a3m)

欢迎关注我的CSDN&#xff1a;https://spike.blog.csdn.net/ 本文地址&#xff1a;https://spike.blog.csdn.net/article/details/132047940 MMseqs2 与 HHblits 的算法比较&#xff1a; 蛋白质序列搜索算法 MMseqs2 与 HHblits 的搜索结果差异HHblits 算法搜索 BFD 与 UniRef…

Vulnhub: Wayne Manor:1靶机

kali&#xff1a;192.168.111.111 靶机&#xff1a;192.168.111.172 信息收集 端口扫描 nmap -A -sC -v -sV -T5 -p- --scripthttp-enum 192.168.111.172 根据提示修改hosts文件 访问目标80&#xff0c;在主页发现三组数字&#xff0c;结合端口扫描的结果中21端口被过滤&am…

Java 线程的多种状态

前言 在前文中详细介绍了线程的启动、中断、休眠、等待。本文详细介绍线程的多种状态。 获取线程的当前状态代码是&#xff1a; 线程对象.getState(); 目录 前言 一、NEW 二、RUNNABLE 三、BLOCKED 四、WAITNG 五、TIMED_WAITNG 六、TERMINATED 结语 一、NEW Thread 对…

Your local changes to the following files would be overwritten by checkout

Git 之 Your local changes to the following files would be overwritten by checkout 今天在切换分支时遇到了这样一个问题&#xff1a; 首先翻译下&#xff1a; Your local changes to the following files would be overwritten by checkout 大致意思就是&#xff1a; 当…

中海油集团,建设与中国特色国际一流能源公司相匹配的供应管理体系

近日&#xff0c;由中国物流与采购联合会主办、北京筑龙承办的主题为“数智赋能创新发展”的“第四届国有企业数智化采购与智慧供应链论坛”在北京盛大举行。中国海油工程与物装部供应商管理处处长张彬出席论坛并发表讲话。 张彬处长出席在国有企业数字化采购与供应链论坛&…

电子邮件模板?如何做EDM邮件营销模板?

制作EDM电子邮件推广模板的方法&#xff1f;怎么写EDM电子邮件推销模板&#xff1f; 随着数字化时代的来临&#xff0c;EDM邮件营销模板已成为企业推广和客户沟通的重要工具。在本文中&#xff0c;我将分享一些关于如何制作高效的EDM邮件营销模板的技巧和建议&#xff0c;希望…

Kafka的安装和使用(Windows中)

1.安装Kafka 1.1下载安装包 通过百度网盘分享的文件&#xff1a;复制链接打开「百度网盘APP 即可获取」 链接&#xff1a;https://pan.baidu.com/s/1vC6Di3Pml6k1KMbnK0OE1Q?pwdhuan 提取码&#xff1a;huan 也可以访问官网&#xff0c;下载kafka2.4.0的安装文件 1.2解压…

Linux:shell脚本:基础使用(1)

Shell的作用 命令解释器&#xff0c;“翻译官”&#xff0c;介于系统内核与用户之间&#xff0c;负责解释命令行 用户的登录Shell 登录后默认使用的Shell程序&#xff0c;一般为 /bin/bash 不同Shell的内部指令、运行环境等会有所区别 cat /etc/shells 编写第一个Shell脚本 …

装饰器模式(Decorator)

装饰器模式是一种结构型设计模式&#xff0c;用来动态地给一个对象增加一些额外的职责。就增加对象功能来说&#xff0c;装饰器模式比生成子类实现更为灵活。装饰器模式的别名为包装器(Wrapper)&#xff0c;与适配器模式的别名相同&#xff0c;但它们适用于不同的场合。 Decor…

P1219 [USACO1.5] 八皇后 Checker Challenge

题目 思路 非常经典的dfs题&#xff0c;需要一点点的剪枝 剪枝①&#xff1a;行、列&#xff0c;对角线的标记 剪枝②&#xff1a;记录每个皇后位置 代码 #include<bits/stdc.h> using namespace std; const int maxn105; int a[maxn];int n,ans; bool vis1[maxn],vis…

如何使用无线通信设备实现室内外精准定位管理?

巡更功能的意义 电子巡更系统的建立&#xff0c;使巡逻安防工作更加科学合理&#xff0c;使安全管理更加规范化、标准化制度化。例如&#xff0c;当管理人员设置巡更线路&#xff0c;在巡更线路上设置巡更点&#xff0c;通过巡更管理系为巡更人员排班在巡更区域内形成了一张防范…

《Java-SE-第二十三章》之单例模式

文章目录 单例模式概述饿汉模式懒汉模式单线程版懒汉单例多线程版枚举实现单例 单例模式概述 单例模式是设计模式中的一种,其作用能保证某个类在程序中只存在唯一一份实例,而不会创建多份实例。单例模式具体的实现方式, 分成 “饿汉” 和 “懒汉” 两种.。饿汉模式中的饿不并不…

R语言【Tidyverse、Tidymodel】的机器学习方法

机器学习已经成为继理论、实验和数值计算之后的科研“第四范式”&#xff0c;是发现新规律&#xff0c;总结和分析实验结果的利器。机器学习涉及的理论和方法繁多&#xff0c;编程相当复杂&#xff0c;一直是阻碍机器学习大范围应用的主要困难之一&#xff0c;由此诞生了Python…

深入浅出对话系统——大规模开放域对话模型PLATO

引言 今天主要介绍百度退出的大模型开放领域对话模型PLATO的三篇论文&#xff0c;分别对应三个模型。 PLATO 132M parameters8M samples问题&#xff1a;训练稳定性和效率 PLATO-2 1.6B, 314M and 93M parameters684M samples PLATO-XL 11B parameters811M samples for en1.2…