NLP论文阅读PALM

news2024/9/21 22:41:27

NLP论文阅读PALM

  • 模型构成
    • Joint Modeling of Autoencoding and Autoregression
    • Input&Output Representations
    • Copying Tokens from Context
      • 扩展词汇的分布
      • 复制分布
      • 最终分布

PALM: Pre-training an Autoencoding&Autoregressive Language Model for Context-conditioned Generation
预训练自编码和自回归语言模型用于上下文条件生成
(在完成文本摘要生成任务时,遇到这个模型:PALM 2.0摘要生成模型-中文-base是PALM通用预训练生成模型在中文LCSTS数据集上进行finetune得到的文本摘要生成模型。)

模型构成

Joint Modeling of Autoencoding and Autoregression

采用了自编码和自回归联合建模的方式

  • 基于自编码的预训练旨在从损坏的输入中重建原始文本,例如BERT及其变体RoBERT、ALBERT等,利用双向上下文从mask的文本中恢复。这种编码方式不适用于没有双向上下文的文本生成
  • 自回归模型(例如GPT)仅训练来编码单向上下文,当前的输出作为下一步的输入(自回归)。虽然适用于文本生成,但自回归方法在建模深度双向上下文方面并不有效。

基于此,PALM以双向自编码的方式理解给定的上下文,以自回归的方式生成文本序列。

在这里插入图片描述

  1. GPT只生成,并且是自回归的
  2. MASS只对MASK的部分进行还原
  3. BART对原始句子进行还原,输入句与生成句是等长的
  4. PALM使用双向autoencoder对输入句进行编码,采用自回归的方式生成句子

Input&Output Representations

输入和输出表示
在模型预训练阶段,输入和输出表示经过定制,以尽量减少自监督预训练和监督微调之间的差异。在典型的下游生成任务(例如抽象摘要和生成式问答)中,上下文以一段相当长的文字给出,并要求模型根据对上下文的理解生成一段较短的文本

Copying Tokens from Context

从上下文复制tokens
后续文本通常会引用前面文本出现的实体和标记。因此,将复制机制纳入未标记语料库的预训练中将提高下游生成的文本的连贯性。这允许模型从预训练中学习何时以及如何在生成文本中复制标记,并将知识转移到下游微调。
PALM通过在transformer解码器中插入指针生成器网络来整合复制机制。指针生成器网络运行每个token要么从词汇表中生成,要么从生成文本的上下文中复制。

扩展词汇的分布

复制分布

最终分布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1982748.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[flink]部署模式

部署模式 在一些应用场景中,对于集群资源分配和占用的方式,可能会有特定的需求。 Flink为各种场景提供了不同的部署模式,主要有以下三种:会话模式(Session Mode)、单作业模式(Per-Job Mode&…

Linux系统驱动(四)自动创建设备节点

自动创建设备节点 (一)创建设备节点的机制 1. mknod 将驱动编译到内核中,在内核启动时驱动自动被安装执行 2.devfs(2.4内核) 3. udev(2.6内核至今) 注:hotplug — 热插拔 &…

KamaCoder 101. 孤岛的总面积

题目描述 给定一个由 1(陆地)和 0(水)组成的矩阵,岛屿指的是由水平或垂直方向上相邻的陆地单元格组成的区域,且完全被水域单元格包围。孤岛是那些位于矩阵内部、所有单元格都不接触边缘的岛屿。 现在你需…

Bugku -----Web-----全题目解析 (二) 超详细步骤

————————————————————分割线———————————————————— 6.矛盾 这一行从 URL 查询字符串中获取名为 num 的参数值,并将其赋值给 $num 变量。如果 URL 中没有提供 num 参数,或者参数值不是有效的字符串,则…

Modbus-RTU详解

目录 Modbus-RTU协议 帧结构示例 CRC16校验算法 CRC16算法的过程 modbus-rtu的使用 发送数据 接收数据 tcp网口完整实现modbus-rtu协议 使用NModbus4实现modbus-rtu协议 安装NModbus4库。 串口实现NModbus4 Modbus-RTU协议 Modbus RTU 协议是一种开放的串行协议,广…

基于51单片机的无线模块PWM电机调速设计

一、概述 为了实现对直流电机无极调速的需求,提出了一种基于STC 89C52微控制器的直流PWM可调速系统设计方案。根据系统所需达到的控制目的,UL2003驱动芯片作为电动机驱动电路,实现对电机的驱动。控制算法采用经典PWM脉宽调制算法作为控制策略…

充电宝哪个牌子好?学生党适合哪种充电宝?推荐四款性价比充电宝

对于学生党而言,保持手机电量充足是学习、社交和娱乐的基本保证。然而,面对频繁的使用,手机电量常常不够用,这时一款性能优良的充电宝就显得尤为重要。那么,充电宝哪个牌子好呢?对于学生党来说,…

番茄钟工作法

目录 1.使用番茄钟的注意事项和技巧: 2.番茄工作法的优点: 3.番茄钟案例: 从棉花糖实验说起 我得了什么「病」? 外界的诱惑 失效的 Deadline 永远停留在纸上的计划 番茄土豆大作战:番茄工作法简明教程 计划 执行 记录与分析 番茄工作法怎么…

可视化图表与源代码显示的动态调整

可视化图表与源代码显示的动态调整 页面效果描述:本篇代码实现了通过拖动一个可调整大小的分隔符,用户可以动态地调整图表显示区域和源代码显示区域的大小。通过监听鼠标事件,当用户拖动分隔符时,会动态计算并更新两个区域的大小 …

俄组织Fighting Ursa利用虚假汽车销售广告传播HeadLace后门

最近,Palo Alto Networks的科研人员揭露了有一个与俄罗斯有关联的威胁行动者——Fighting Ursa(亦称APT28、Fancy Bear或Sofacy)。该组织通过散布虚假的汽车销售广告,特别是针对外交官群体,散播名为HeadLace的后门恶意…

6款打印刻录监控与审计系统 | 一键解锁器功能探析

信息高度敏感的社会环境,企事业单位对于文档的安全传输、打印与刻录过程的监控与审计需求日益迫切。 然而,为了全面满足读者对安全工具的了解需求,这篇文章小编将首先概述几款领先的打印刻录监控与审计系统,随后简要提及“一键解…

【Java】Collection中自定义类重写contains方法。

如果集合中存储的是自定义对象,也想使用contaisn方法来判断是否包含,那么在javabean类中,一定要重写equals方法。 因为contains方法的底次是使用equals方法实现的,所以重写equals方法。 Main类: package demo;import…

SQL注入(闯关游戏)

目录 关卡1 关卡2 关卡3 关卡4 关卡5 关卡6 关卡7 关卡8 关卡9 关卡10 关卡11 关卡12 关卡13 关卡14 关卡15 关卡16 关卡17 关卡18 关卡19 关卡20 关卡21 关卡22 关卡23 关卡24 关卡1 (联合查询) ?gid1 第一件事情就是逃脱单引号的控制——》为了闭…

vue+element 根据父容器动态设置table高度出滚动条

可以通过CSS样式来控制表格的高度&#xff0c;并使用JavaScript动态地设置这个高度。 HTML: <template><el-table:data"tableData":height"tableHeight"style"width: 100%"><!-- 列配置 --></el-table> </template&…

【Kubernetes】Deployment 的清理策略

Deployment 的清理策略 在 Deployment 中配置 spec.revisionHistoryLimit 字段&#xff0c;可以指定其 清理策略。该字段用于指定 Deployment 保留旧 ReplicaSet 的个数&#xff0c;即更新 Pod 前的版本个数。该字段的默认值是 10。 创建 revisionhistory-demo.yaml 文件&…

一文了解K8S(Kubernates)

一、K8S 1. 概述 Kubernetes 是一个可移植、可扩展的开源平台&#xff0c;用于管理容器化的工作负载和服务&#xff0c;可促进声明式配置和自动化。 Kubernetes 拥有一个庞大且快速增长的生态&#xff0c;其服务、支持和工具的使用范围相当广泛。 Kubernetes 这个名字源于希腊…

Unity 功能 之 创建 【Unity Package】 Manager 自定义管理的包使用配置URL,使用 git URL加载的简单整理

Unity 功能 之 创建 【Unity Package】 Manager 自定义管理的包使用配置URL&#xff0c;使用 git URL加载的简单整理 目录 Unity 功能 之 创建 【Unity Package】 Manager 自定义管理的包使用配置URL&#xff0c;使用 git URL加载的简单整理 一、简单介绍 二、Unity Package …

【你也能从零基础学会网站开发】SQL Server 2000中的数据类型之String字符串类型

&#x1f680; 个人主页 极客小俊 ✍&#x1f3fb; 作者简介&#xff1a;程序猿、设计师、技术分享 &#x1f40b; 希望大家多多支持, 我们一起学习和进步&#xff01; &#x1f3c5; 欢迎评论 ❤️点赞&#x1f4ac;评论 &#x1f4c2;收藏 &#x1f4c2;加关注 SQL Server 中…

c++ | vector

前言 本篇博客讲解cSTL中的vector &#x1f493; 个人主页&#xff1a;普通young man-CSDN博客 ⏩ 文章专栏&#xff1a;C_普通young man的博客-CSDN博客 ⏩ 本人giee: 普通小青年 (pu-tong-young-man) - Gitee.com 若有问题 评论区见&#x1f4dd; &#x1f389;欢迎大家点赞…

珠江电缆,顺应全球变化,实现高质量出海

在全球经济快速变化的今天&#xff0c;越来越多的企业将目光投向了国际市场。特别是对于线缆行业来说&#xff0c;顺应全球变化、应对机遇与挑战&#xff0c;实现高质量出海已成为长期发展的战略目标之一。珠江电缆作为一家集研发、制造和销售为一体的大型专业电线电缆企业&…