【论文】SimCLS:一个简单的框架 摘要总结的对比学习(1)

news2025/1/23 11:53:36

SimCLS:摘要总结的对比学习(1)

  • 写在最前面
    • 模型框架
  • 摘要
  • 1 简介

写在最前面

SimCLS: A Simple Framework for Contrastive Learning of Abstractive Summarization(2021ACL会议)

https://arxiv.org/abs/2106.01890
论文:https://arxiv.org/pdf/2106.01890.pdf
在这里插入图片描述
预期写几篇博客详细展示该论文

模型框架

在这里插入图片描述
SimCLS框架进行两阶段抽象摘要 ,其中Doc、S、Ref分别表示文档、生成摘要和引用。
第一阶段,使用Seq2Seq生成器(BART)生成候选摘要。
第二阶段,使用评分模型(RoBERTa)来预测基于源文档的候选摘要的性能。评分模型通过对比学习进行训练,其中训练示例由Seq2Seq模型提供。

摘要

提出了一个概念上简单而经验上强大的抽象摘要框架SIMCLS,它可以通过将文本生成制定为一个无参考的评估问题(即质量估计),通过对比学习来弥补目前主导的序列到序列学习框架所产生的学习目标和评估指标之间的差距

实验结果表明,SimCLS对现有的顶级评分系统进行了少量的修改,可以大大提高现有顶级评分模型的性能。特别是,在CNN/DailyMail数据集上,相对于BART (Lewis et al., 2020)的2.51绝对提升,相对于PEGASUS (Zhang et al., 2020a)w.r.t ROUGE-1的2.50绝对提升,将最先进的性能提升到一个新的水平。

代码和结果:https://github.com/yixinL7/SimCLS
模型的结果已经部署到EXPLAINABOARD(Liuet al., 2021a)平台上,该平台允许研究人员以更细粒度的方式理解系统。

1 简介

序列到序列(Seq2Seq)神经模型(Sutskever et al.,2014)已广泛用于语言生成任务,如抽象摘要(Nallapati et al., 2016)和神经机器翻译(Wu et al., 2016)。
虽然抽象模型(Lewis et al., 2020; Zhang et al., 2020a)在总结任务中显示出了很好的潜力,但它们分享了Seq2Seq模型训练中广泛承认的挑战
具体来说,Seq2Seq模型通常在最大似然估计(MLE)框架下进行训练,在实践中通常使用teacher-forcing算法(Williams and Zipser, 1989)进行训练。这引入了目标函数和评价指标之间的差距,因为目标函数基于局部的令牌级预测,而评价指标(例如ROUGE (Lin, 2004))将比较黄金参考资料和系统输出之间的整体相似性。
此外,在测试阶段,模型需要自回归地生成输出,这意味着在前面步骤中所犯的错误会累积起来。这种训练和测试之间的差距在以前的工作中被称为exposure bias 暴露偏差(Bengio et al., 2015; Ranzato et al., 2016)。

方法的主线(Paulus et al., 2018; Li et al., 2019)建议使用强化学习(RL)的范式来缓解上述差距。虽然RL训练可以根据全局预测和与评估指标密切相关的奖励来训练模型,但它引入了深度RL的共同挑战。
具体来说,基于rl的训练存在噪声梯度估计(Greensmith et al., 2004)问题,这通常会使训练不稳定并且对超参数敏感
Minimum risk training最低风险培训,作为一种替代方案,也已用于语言生成任务(Shen et al., 2016; Wieting et al., 2019)。
然而,估计损失的准确性受到采样输出数量的限制。其他方法(Wiseman and Rush, 2016; Norouzi et al., 2016; Edunov et al., 2018)旨在扩展MLE的框架,将句子水平分数纳入目标函数。虽然这些方法可以减轻MLE训练的局限性,但评估指标和在其 方法中使用的目标函数之间的关系可以是间接的和隐含的。

在此背景下,本文将对比学习((Chopra et al., 2005))的范式进行了推广,引入了一种抽象总结的方法,从而实现了用相应的评价指标直接优化模型的目标,从而缩小了MLE训练中训练阶段和测试阶段之间的差距。
虽然一些相关工作(Lee et al., 2021; Pan et al., 2021)建议引入对比损失作为条件文本生成任务的MLE训练的增强,但本文选择通过在提出的框架的不同阶段引入对比损失和MLE损失来分离它们的功能。

具体来说,受到Zhong et al. (2020); Liu et al. (2021b)最近在文本摘要方面的工作的启发,我们建议使用一个两阶段模型进行抽象摘要,
其中首先训练Seq2Seq模型来生成带有MLE损失的候选摘要,
然后训练一个参数化评估模型来对生成的候选进行对比学习排名。
通过在不同阶段优化生成模型和评估模型,我们能够用监督学习来训练这两个模块,绕过基于rl方法的具有挑战性和复杂的优化过程。
我们在这项工作中的主要贡献是通过提出一个带有对比学习的生成-然后评估两阶段框架来接近面向度量的抽象总结训练,这不仅将CNN/DailyMail上的最新性能提升到一个新的水平(2.2 ROUGE-1对基线模型的改进),也展示了这个两阶段框架的巨大潜力。呼吁今后努力使用最大似然估计以外的方法优化Seq2Seq模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/500023.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【c语言小demo】登录demo | 账号密码验证功能

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞 关注支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; 给大家跳段街舞感谢支持&#xff01;ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ ኈ ቼ …

postgresql insert ddl执行流程分析

专栏内容&#xff1a;postgresql内核源码分析个人主页&#xff1a;我的主页座右铭&#xff1a;天行健&#xff0c;君子以自强不息&#xff1b;地势坤&#xff0c;君子以厚德载物&#xff0e; 目录 前言 总体流程 调用堆栈 执行接口说明 详细流程分解 ExecInsert对于普通表…

Java9

Java9 &#xff08;一&#xff09;、stream流1.1 Stream流的中间方法和终结方法 &#xff08;二&#xff09;、方法引用2.1 方法引用的分类 &#xff08;三&#xff09;、异常3.1 编译时异常和运行时异常3.2 异常的作用3.3 异常的处理方式3.4 异常中的常见方法3.5 自定义异常 &…

麒麟设置分辨率

为什么要设置------额。。。。虚拟机启动的&#xff0c;直接满屏了。。。。也不能移动 命令设置法 1、可以通过xrandr命令来设置屏幕分辨率。先查询当前分辨率&#xff0c;及当前支持的分辨率。 xrandr 2、可以通过-s参数来设置为1920x1440 xrandr -s 1920x1440 这就好…

Midjouney prompt优化

Midjouney prompt优化 总述1. Midjouney1.1 常见出图方式1.2 图片参数 2. prompt2.1 prompt关键词框架逻辑2.2 关键词技巧2.3 分类关键词2.3.1 媒体类型、介质和渲染引擎2.3.2 艺术风格2.3.2.1常见风格关键词2.3.2.2 艺术风格介绍2.3.2.3 绘画风格关键词和作品 2.3.3 相机镜头和…

面试官从这些方面考察你的Android开发水平!

View基础(25题) 什么是ViewView的位置参数MotionEventViewRootDecorViewMeasureSpec View三大流程(28题) measure过程ViewViewGrouplayout过程draw过程获取View的宽高Activity启动到加载ViewRoot的流程 自定义View(26题) 四种实现方法直接继承View自定义属性直接继承ViewG…

C++三大特性—继承“复杂的菱形继承及菱形虚拟继承”

C的一个大坑&#xff1a;菱形继承 希望这篇文章能让你理解什么是菱形继承&#xff0c;以及菱形继承的注意事项 单继承与多继承 单继承&#xff1a;一个子类只有一个直接父类时称这个继承关系为单继承 多继承&#xff1a;一个子类有两个或以上直接父类时称这个继承关系为多继承…

【半监督学习】Match系列.2

本文简单介绍半监督算法中的Match系列方法&#xff1a;CoMatch&#xff08;ICCV2021&#xff09;&#xff0c;CRMatch&#xff08;GCPR2021&#xff09;&#xff0c;Dash&#xff08;ICML2021&#xff09;&#xff0c;UPS&#xff08;ICLR2021&#xff09;&#xff0c;SimMatch…

ajax、fetch、axios三者的异同

同&#xff1a;都是发送网络请求 异&#xff1a; 1.ajax ajax是异步的javascript和xml&#xff0c;用于创建快速的动态网页的技术。&#xff08;用js发送异步的网络请求&#xff09; 特点&#xff1a;局部刷新页面&#xff0c;无需重载整个页面。 很多小伙伴会误以为ajax是…

2023年的深度学习入门指南(12) - PEFT与LoRA

2023年的深度学习入门指南(12) - PEFT与LoRA 大家都知道&#xff0c;大模型的训练需要海量的算力。其实&#xff0c;即使是只对大模型做微调训练&#xff0c;也是需要大量的计算资源的。 有没有用更少的计算资源来进行微调的方法呢&#xff1f;研究者研发出了几种被Hugging F…

fastCGI使用

1.http解释 在使用fastCGI之前需要先了解什么是http&#xff0c;以及静态请求和动态请求。 1.什么是http HTTP是超文本传输协议&#xff0c;它定义了客户端和服务器端之间文本传输的规范。HTTP通常运行在TCP之上&#xff0c;使用80端口。HTTP是一种简单的请求-响应协议&#x…

GUN C编译器拓展语法学习笔记(二)属性声明

一、属性声明 1、存储段&#xff1a;section 1.1 GNU C编译器扩展关键字&#xff1a;__attribute__ GNU C增加了一个__attribute__关键字用来声明一个函数、变量或类型的特殊属性。主要用途就是指导编译器在编译程序时进行特定方面的优化或代码检查。例如&#xff0c;我们可以…

C语言三子棋小游戏

哈喽&#xff0c;大家好&#xff0c;今天我们要利用之前所学习的C语言知识来写一个三子棋小游戏。 目录 1.游戏 2.函数部分 2.1.菜单 2.2.初始化棋盘 2.3.打印棋盘 2.4.玩家下棋 2.5.电脑下棋 2.6.判断输赢 2.7.判断棋盘是否已满 3.完整代码展示 1.游戏 今天我们写的…

未知时间信息下雷达运动目标的计算高效重聚焦与估计方法

论文背景 在雷达成像中&#xff0c;回波信号在接收到之前可能已经被多次反射或散射&#xff0c;这样会导致回波信号的时间和频率发生变化。其中&#xff0c;距离向维度上的变化称为距离单元迁移&#xff08;range cell migration&#xff0c;RCM&#xff09;&#xff0c;频率向…

Spring笔记

文章目录 1、什么是Spring&#xff1f;2、如何创建Spring3、Spring简单的读和取操作1.直接在spring-config.xml里面放置对象2.通过配置扫描路径和添加注解的方式添加Bean对象3.为什么需要五个类注解4.从spring中简单读取 Bean对象5.Resource和Autowired的异同 1、什么是Spring&…

Transformer结构细节

一、结构 Transformer 从大的看由 编码器输入、编码器、解码器、解码器输入和解码器输出构成。 编码器中包含了词嵌入信息编码、位置编码、多头注意力、Add&Norm层以及一个全连接层&#xff1b; 解码器中比编码器多了掩码的多头注意力层。 二、模块 2.1 Input Embeddi…

canvas学习之华丽小球滚动电子时钟

教程来自 4-3 华丽的小球滚动效果 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>华丽小球滚动时钟…

【AVL树的模拟实现】

1 AVL树的概念 二叉搜索树虽可以缩短查找的效率&#xff0c;但如果数据有序或接近有序二叉搜索树将退化为单支树&#xff0c;查找元素相当于在顺序表中搜索元素&#xff0c;效率低下。因此&#xff0c;两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明了一种解决…

人工智能基础部分14-蒙特卡洛方法在人工智能中的应用及其Python实现

大家好&#xff0c;我是微学AI&#xff0c;今天给大家介绍一下人工智能基础部分14-蒙特卡洛方法在人工智能中的应用及其Python实现&#xff0c;在人工智能领域&#xff0c;蒙特卡洛方法&#xff08;Monte Carlo Method, MCM&#xff09;被广泛应用于各种问题的求解。本文首先将…

wvp-GB28181-pro录像功能开发环境搭建、配置、使用

开发环境、调试环境搭建 开发wvp平台搭建 离线安装脚本&#xff1a;https://gitcode.net/zenglg/ubuntu_wvp_online_install.git 下载离线安装脚本&#xff0c;完成wvp平台的部署 开发环境要求 操作系统&#xff1a;包管理工具是apt ky10桌面版uos桌面版deepin桌面版ubuntu桌面…