Gsum: A General Framework for Guided Neural Abstractive Summarization 论文笔记

news2025/1/26 15:51:40

Gsum: A General Framework for Guided Neural Abstractive Summarization 论文笔记

Year: 2021 Venue: NAACL Institution: CMU Code: https://github.com/neulab/guided_summarization

Overview

这篇文章力求解决的问题是如何控制文本摘要生成,尤其注重可信度方面。作者提出相比于抽取式摘要,生成式摘要是不受限制的,这会导致两个问题:

  1. 生成出的摘要可信度不高,甚至会包含一些事实错误或虚构的内容
  2. 摘要生成不可控,我们无法提前选择哪些方面模型应该更重视

针对现有的问题,作者提出了Guided Summarization Framework (Sum)。Gsum会给语言模型提供guided signal,而这个guided signal可以起到控制摘要的作用。

之前的工作其实已经涉及过控制摘要生成的很多方面,例如控制长度,控制关键词等等,这篇文章更像是一个聚合,在同一个模型中加入不同的signal来从多角度对摘要生成进行控制。
请添加图片描述

通过Figure 1,我们可以对这篇文章方法做一个总览。作者将guided signal与source document一同传入Encoder进行编码,而对于guided signal的提取,训练阶段与测试阶段有所区别。

因此本文的核心部分在于guided signal的设计。

Methodology

请添加图片描述

Model Architecture

虽然本文模型总体与现今的PLM区别不大,但在Decoder部分,由于guided signal的加入,作者对模型结构做一点小改动。在Decoder的Self-Attention Block之后,作者先将guided signal与上一层结果进行Cross Attention,得到的representation再去与原文章的encoding进行Cross Attention。
y ( 1 ) = L N ( y + S e l f A t t e n t i o n ( y ( 0 ) ) ) y ( 2 ) = L N ( y + C r o s s A t t e n t i o n ( y ( 1 ) , g ) ) y ( 3 ) = L N ( y + S e l f − A t t e n t i o n ( y ( 2 ) , x ) ) y ( 4 ) = L N ( y + F e e d F o r w a r d ( y ( 3 ) ) ) \begin{aligned} &y^{(1)} = LN(y + SelfAttention(y^{(0)})) \\ &y^{(2)} = LN(y + CrossAttention(y^{(1)}, g)) \\ &y^{(3)} = LN(y + Self-Attention(y^{(2)}, x)) \\ &y^{(4)} = LN(y + FeedForward(y^{(3)})) \end{aligned} y(1)=LN(y+SelfAttention(y(0)))y(2)=LN(y+CrossAttention(y(1),g))y(3)=LN(y+SelfAttention(y(2),x))y(4)=LN(y+FeedForward(y(3)))
作者认为这样做的好处是由guided signal得到的representation可以指导模型关注source document中应该关注的部分。

Guided Signal Design

这一部分是本文的重点。对于如何生成guided signal,作者提出了三种方式:

  1. Oracle Extraction。作者后面通过实验证明这种方式效果是最好的
  2. Automatic Prediction。通过其他模型来根据原文本生成相应的signal
  3. Manal Definition。手工打造,只在test阶段比较现实,user可以设计自己喜欢的signal

在训练阶段,作者使用oracle extraction。在测试阶段,作者使用automatic prediction。

Guided Signal包含一下四种:

  1. Highlighted Sentence:对于oracle extraction,作者使用greedy search,用source document的句子与剩余文本计算ROUGE得分,选出得分最高的一些句子作为highlighted sentences。对于automatic prediction,作者使用其他预训练模型进行预测。
  2. Keyword:整个句子可能会包含一些noise信息,因此得到highlighted sentence以后,作者再用TextRank提取出一些candidate keywords,再过滤掉target summary中没有出现的keywords。对于automatic prediction,作者依然是使用其他的预训练模型进行预测。
  3. Relation:用三元组的形式表示<subject, relation, object>,提取的工具是Stanford OpenIE。得到一些candidate以后还是通过计算ROUGE得分然后选取分数最高的。
  4. Retrieved Summary:直觉来看,相似文章的summaries之间应该可以起到互相促进的作用。因此对于每个样本 ( x , y ) (x, y) (x,y),作者用Elastic Search抽取出前5个与 y y y最相似的summary { y i } i = 1 5 \{y_i\}_{i=1}^{5} {yi}i=15。在测试阶段,由于不知道target summary,作者抽取的是与source document最相似的5个document。

Experiment

Baselines:BertExt、BertAbs、MatchSum、BART

作者在6个数据集上进行了实验,在其中的四个上都取得了SOTA的成绩。

请添加图片描述

Relation of Different Signals

为了比较四种guided signal对于概要生成的影响,作者在CNN/DN数据集上进行了比较试验,得到的结果如下:
请添加图片描述

可以看出,Highlighted Sentence对于模型效果的提升是最为显著的,其次是Keywords。为了进一步比较四种signal,作者又做了以下两个实验:

  1. 作者在下表中展示了四种signal优于其他signal的比例,可以看到Sentence虽然对模型提升是最显著的,但还是有将近60%的情况下其他signal表现更好。作者将四种signal最优的结果combine起来作为一个signal之后,得到了比单一signal更好的结果。请添加图片描述

  2. 作者还做了pairwise signal实验,结果表明不同signal之间可以起到complement的作用请添加图片描述

Oracle vs Auto

实验结果表明,用Automatic Prediction的效果远远低于Oracle Extraction的效果

请添加图片描述

作者分析了一个可能的原因:automatic prediction所使用的的预训练模型预测效果不佳,signal质量偏低,导致后续结果低。

Future Work

作者提出了几个未来可研究的方向:

  1. 对不同signal下的模型进行ensemble
  2. 加入更复杂的技术,例如对source document或guided signal进行copy和coverage
  3. 设计其他guided signal

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/413531.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

floyed 4.9

今天是周末,也就不为难自己了,学习了一下floyed算法(确实简单哈哈),这个算法也是最短路的一种 在一副图中,a到b的距离可能不是直接的ab边最短,这时候就要用到floyed的思想了,可能是a到c到b比直接a到b最短.所以我们要枚举一边才可以知道a到b的最短的路线 这就是floyed的大概 …

7年测试,从功能测试到测试开发,我总算证明了自己

我感觉我是一个比较有发言权的人吧&#xff0c;我在测试行业爬模滚打7年&#xff0c;从点点点的功能测试到现在成为测试开发工程师&#xff0c;工资也翻了几倍&#xff1b; 个人觉得&#xff0c;测试的前景并不差&#xff0c;只要自己肯努力&#xff1b;我刚出来的时候是在鹅厂…

FL Studio21中文版D编曲数字音乐工作软件

随着现在人们的生活水平不断提高&#xff0c;我们的精神生活也越来越丰富&#xff0c;对于现在的年轻人来说&#xff0c;DJ舞曲是一个较受欢迎的领域&#xff0c;有许多年轻人对DJ这个职业感兴趣&#xff0c;想要深入了解DJ编曲这份工作&#xff0c;那么今天我们就来说一说DJ编…

聊聊ChatGPT无法取代的7个工作

ChatGPT——全世界都在谈论的非常流行的人工智能工具。自从 2022 年 11 月 30 日推出以来&#xff0c;ChatGPT 就被证明是执行复杂任务并简化它们的一体式工具。无论是通过 UPenn 的沃顿商学院 MBA 考试&#xff0c;撰写常春藤盟校入学论文&#xff0c;还是完成简单的任务&…

Django自带的Admin后台中如何获取当前登录用户

需求背景 在使用Django快速开发一个IT 电脑、显示器资产管理小系统的时候&#xff0c;遇到一个问题是&#xff0c;当变更资产设备&#xff08;新增、修改、删除&#xff09;的时候&#xff0c;能记录是谁在什么时间进行的变更。 确认的是肯定是登录状态&#xff0c;但是在使用…

算法学习|动态规划 LeetCode 647. 回文子串、516.最长回文子序列

动态规划一、回文子串思路实现代码二、最长回文子序列思路实现代码&#xff08;希望自己能总结出做过的动态规划题&#xff01;要开始回顾之前刷过的题了&#xff09; 一、回文子串 给定一个字符串&#xff0c;你的任务是计算这个字符串中有多少个回文子串。具有不同开始位置或…

回收站数据恢复的方法技巧

​最近有网友反映将一些不经常使用的文件放入回收站后忘记了&#xff0c;清空回收站后想要再次使用文件却怎么都还原不了&#xff0c;想利用回收站数据恢复软件经恢复&#xff0c;咨询有哪些回收站数据恢复软件推荐&#xff0c;下面就给大家推荐回收站数据恢复软件使用方法。 …

数据库开发重点存档

2023春数据库开发复习 T1 视图可以用的几个场景&#xff1f; 不同表字段聚合、信息重组&#xff1a;当某个查询涉及多表连接、次数频繁时&#xff0c;可以创建视图隐藏底层表的复杂性&#xff0c;简化查询。 控制权限&#xff1a;根据不同用户的权限&#xff0c;可以建立不同…

星巴克创始人第三次重出江湖

星巴克创始人第三次出山&#xff0c;与中国有关 中国咖啡连锁竞争白热化 星巴克诞生于1985年&#xff0c;爷爷级的公司 趣讲大白话&#xff1a;百年老店不容易 【趣讲信息科技135期】 **************************** 将心注入 星巴克创始人自传 创始人的激情、执行力、团队建设很…

HttpRunner3.x 源码解析(5)-runner.py

首先看下生成的pytest文件 from httprunner import HttpRunner, Config, Step, RunRequest, RunTestCaseclass TestCaseLogin(HttpRunner):config (Config("登录成功").variables(**{"password": "tester", "expect_foo2": "co…

17_I.MX6ULL_内部RTC

目录 I.MX6U RTC简介 相关寄存器 实验源码 I.MX6U RTC简介 实时时钟是很常用的一个外设,通过实时时钟我们就可以知道年、月、日和时间等信息。因此在需要记录时间的场合就需要实时时钟,可以使用专用的实时时钟芯片来完成此功能,但是现在大多数的MCU或者MPU内部就已经自带了…

一、Locust快速 入门

1 . 介绍 Locust 是一种易于使用、可编写脚本且可扩展的性能测试工具。 您可以在常规 Python 代码中定义用户的行为&#xff0c;而不是被困在 UI 或限制性领域特定语言中。 这使得 Locust 可以无限扩展并且对开发人员非常友好。 用普通的旧 Python 编写测试场景 如果您希望…

【华为OD机试】1038 - 学英语

文章目录一、题目&#x1f538;题目描述&#x1f538;输入输出&#x1f538;样例1二、代码参考作者&#xff1a;KJ.JK&#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x…

基于价值认同的需求侧电能共享分布式交易策略(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

惊喜开箱!品牌可以从 Ledger 引领的顶级体验之一中学到什么?

Ledger 是加密货币硬件钱包的领先供应商&#xff0c;它通过进入 The Sandbox 并创建游戏化体验来扩大其教育计划&#xff0c;从而在虚拟世界中掀起波澜。通过在这个令人兴奋的新空间打造自己的品牌&#xff0c;Ledger 正在接触更广泛的受众&#xff0c;并以有趣的方式与人们互动…

回收站清空了怎么恢复?快来get实用方法!

案例&#xff1a;回收站清空了怎么恢复&#xff1f; 【真的栓Q了&#xff0c;我刚点击回收站&#xff0c;不知道按错了什么&#xff0c;回收站被清空了&#xff0c;大家有什么方法可以恢复回收站里的文件吗&#xff1f;请大家给我出出主意吧&#xff01;谢谢啦&#xff01;】 …

不愧是比亚迪!

最近这段时间&#xff0c;因为我自己准备买车嘛&#xff0c;然后先后去试驾了比亚迪汉、小鹏P7i、蔚来ET5、智己LS7这几辆车&#xff0c;接下来想分4篇文章依次给大家分享一下这四个品牌的车试驾体验。比亚迪汉小鹏P7i蔚来ET5这四个品牌总共花了三天时间&#xff0c;也算是比较…

STC89C52定时器的简介

一、序言 针对于STC89C52RC而言&#xff0c;这个芯片内部包含了三个定时器——T0、T1和T2&#xff0c;他们的中断优先级分别是1、3和5。 怎么还有一个定时器2呢&#xff1f;博主也是今天整理这篇博客的时候&#xff0c;翻阅芯片手册才发现的。如果说&#xff0c;我们经常用的…

00后面试华为软件测试工程师,竭尽全力拿到15K。。。。。

不废话&#xff0c;直接重点 一般软件测试的面试分为三轮&#xff1a;笔试&#xff0c;HR面试&#xff0c;技术面试。 前两轮&#xff0c;根据不同企业&#xff0c;或有或无&#xff0c;但最后一个技术面试是企业了解你“行不行”的关键环节&#xff0c;每个企业都会有的。 在…

从C语言到C++(第一章_C++入门_中篇)缺省参数+函数重载+引用

目录 1.缺省参数 1.1缺省参数概念 1.2缺省参数的使用&#xff1a; 1.3缺省参数的分类 1.3.1 全缺省参数 1.3.2 半缺省参数 1.4缺省参数的应用场景 2. 函数重载 2.1函数重载的概念 2.2不支持函数重载的情况 3.引用 3.1引用的概念 3.2引用的特性 3.3引用做参数 3…