【论文阅读】通过解缠绕表示学习提升领域泛化能力用于主题感知的作文评分

news2025/4/26 2:59:29

摘要

本文工作聚焦于从领域泛化的视角提升AES模型的泛化能力，在该情况下，目标主题的数据在训练时不能被获得。
本文提出了一个主题感知的神经AES模型（PANN）来抽取用于作文评分的综合的表示，包括主题无关（prompt-invariant）和主题相关（prompt-specific）的特征。
为了提升表示的泛化能力，我们进一步提出了一个新的解缠绕表示学习框架（disentangled representation learning）。在这个框架中，设计了一个对比的模长-角度对齐策略（norm-angular alignment）和一个反事实自训练策略（counterfactual self-training）用于解开表示中主题无关和主题相关的特征信息。

引言

本文提出一个主题感知的神经AES模型，它能够基于一篇作文的编码器（比如说预训练的BERT）来抽取作文的质量特征，并且基于一个文本匹配模块来抽取主题遵循度特征。
存在两个问题：
- 从编码器中抽取到的作文质量特征，比如BERT，可能编码了质量和内容信息，并且它们在特征中是相互缠绕的。怎样从特征中解开独立的质量信息是第一个问题；
- 主题关联特征和作文质量特征都是基于作文抽取得到的。因此，从因果的角度看，作文是两种特征的混淆因素，导致主题关联度和作文质量间的有误导性的关联。比如，一篇作文可能有不同的主题关联性但是一样的质量，在不同的主题下。所以，怎样解开这种误导性的关联，使得这两种特征独立得贡献于最终的分数是第二个问题。

方法

解缠绕表示学习框架（DRL）是基于预训练和微调的范式进行设计的。
- 在预训练阶段，设计了一个对比的norm-angular对齐策略来预训练文章质量特征，目的是解绑特征中的质量和内容信息。
- 在微调阶段，应用了一个反事实自训练策略来微调整个PANN模型，目的是解绑文章质量特征和主题相关特征之间的误导性的关联。
- 最后，使用完全训练好的PANN来评分目标主题的作文。

PANN的模型架构

三个主要组成：
- 作文质量网络（EQ-net）：只把作文作为输入，抽取主题无关的作文质量特征。
- 主题关联网络（PA-net）：把作文和主题都作为输入，抽取主题特定的主题遵循度特征。因为这样的基于交互的文本匹配模型能够只关注作文和主题的词级的相似度，它能够避免编码到和作文质量相关的信息，比如句法和内聚力，从而使得特征只特定于主题遵循度。
- 作文评分预测器（ESP）：结合两种特征来预测整体分数。
解缠绕表示学习DRL
- EQ-net可能会编码主题无关的质量信息和主题相关的内容信息，并且内容信息会在不同主题间切换，它会阻止EQ-net的泛化能力。
- 并且，PA-net和EQ-net都把作文作为输入，这使得作文变成主题关联度特征和作文质量特征的混淆因素，导致他们之间具有误导性的关联。

质量-内容解缠（Quality-Content Disentanglement）

我们提出了一个对比的模长-角度对齐策略（Contrastive Norm-Angular Alignment，CNAA）来在作文质量特征中的质量和内容信息。
这个策略的设计是基于模长不变性（norm invariant）和角度切换（angular shift）的假设，它假设质量和内容信息能够通过分别对齐就模长和角度而言的特征来被解绑。
对于模长不变性，我们假设相似质量的作文能够本分布具有相似的模长，并且这些模长可能是各个主题都不变的。
对于角度切换，我们假设具有相似内容的作文（i.e.,主题）能够被分布具有相似的角度，但是这些角度应该在不同的主题上切换。

数据增强

在这里插入图片描述

为了准备数据用于对比的模长-角度对齐，我们首先从训练集中抽取所有的高分和低分作文来组成原始数据 $D_o$ 。
通过两两拼接这些作文来构建衍生的数据 $D_d$ 。
随机降低分数给拼接后的作文的原因是：
- 拼接两篇文章可能会降低那篇更高分数的作文的质量（比如，内聚力和组织）。
- 拼接来自不同主题的两篇文章可能会降低作文的主题遵循度（对两个主题都是）。

模长不变性&角度切换对齐

基于成对的对比学习，包括模长不变的质量对齐和角度切换的内容对齐。

质量-遵循度解缠（Quality-Content Disentanglement）

本文尝试提出和回答以下问题：“如果一篇文章的质量保持不变，但它的题目符合度不同，那么最终得分会是多少？”

预评分指导的自训练

本文把每个反事实实例的预打好的预分数和模型预测的伪分数结合作为它的最终分数。以这种方式，在预分数中提供的先验知识和编码在伪分数中的模型知识能够被很好得融合。

实验

ASAP数据集和TOEFL11数据集

实验结果

我们和主题泛化设置的方法进行比较，包括三类方法：基于手工特征的，基于神经网络的和混合的。
可以看到，我们的PANN模型能够超过大多数的基准方法，在两个数据集上都达到最好的整体性能。这表明我们的方法对于主题泛化的作文评分是有用的。

在这里插入图片描述

结合PA-net和EQ-net两个部分比单独的PA-net或者EQ-net的性能好。这表明PA-net和EQ-net都能够为作文评分提供有用的信息。
当EQ-net被用NIA和ASA预训练，EQ-net的性能被提升。但是当EQ-net被只有他们中的一个预训练的时候，在TOEFL11数据集上性能下降了。相似的现象也可以在PA-net+EQ-net上观察到。这可能是由于两个损失需要被同时使用来解开质量和内容信息的缠绕。
并且，CTS也需要和CNAA策略一起使用来获得更好的性能。

进一步分析

在这里插入图片描述

数据增强的影响：可以发现PANN和EQ-net能够从数据增强中受益，特别是在ASAP的P3上，和TOEFL11数据集的P5上。

在这里插入图片描述

PA-net的影响：是否PA-net能够独立的影响最终的分数预测。可以看到，PANN为在不匹配的主题下的高分作文预测了平均更低的分数；由于EQ-net在两种设置下输出的特征是不变的，所以PA-net能够感知主题上的变化，能够独立影响分数预测。
数据大小的影响：在数据大小增大时，我们的PANN的预测性能相应提升，但是BERT的性能先上升后下降。这表明我们的表示解缠绕策略能够处理主题个数增长时带来的缠绕的信息的问题，所以模型能够从数据增长中获益。

特征可视化

在这里插入图片描述

展示了EQ-net有和没有CNAA策略时的特征分布。
(a)图三个等级的分数相对很好的分开了（left），但是不同主题的作文没有完全分开，特别时低分和中等分数的作文。
(b)图中使用了本文的CNAA策略，分数能够很好的分开根据不同的模长，主题能够很好的分开根据不同的角的方向。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/804739.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Lambda表达式常见的Local variable must be final or effectively final原因及解决办法

Lambda表达式常见的Local variable must be final or effectively final原因及解决办法

目录 Local variable must be final or effectively final错误原因解决办法按照要求定义为final（不符合实情，很多时候是查库获取的变量值）使用原子类存储变量，保证一致性AtomicReference常用原子类其它 Local variable must be …

阅读更多...

(树) 剑指 Offer 07. 重建二叉树 ——【Leetcode每日一题】

(树) 剑指 Offer 07. 重建二叉树 ——【Leetcode每日一题】

❓剑指 Offer 07. 重建二叉树难度：中等输入某二叉树的前序遍历和中序遍历的结果，请构建该二叉树并返回其根节点。假设输入的前序遍历和中序遍历的结果中都不含重复的数字。示例 1: Input: preorder [3,9,20,15,7], inorder [9,3,15,20,7] …

阅读更多...

8.11 PowerBI系列之DAX函数专题-TopN中实现N的动态

8.11 PowerBI系列之DAX函数专题-TopN中实现N的动态

需求实现 1 ranking by amount rankx(allselected(order_2[产品名称]),[total amount]) 2 rowshowing_boolean var v_ranking [ranking by amount] var v_topN-no [topN参数值] var v_result int( v_ranking < v_topN_no) return v_result 3 将度量值2放入视觉对象筛…

阅读更多...

spinal HDL语法学习

spinal HDL语法学习

1 赋值语句用来声明变量 : 用来对变量进行赋值 2 when otherwise前面是否有"."与otherwise是否换行有关系 3 case class 对Bundle进行扩展时，需要case class case class和class主要有两点区别： （1）case class不需…

阅读更多...

会议OA项目之会议发布（一）

会议OA项目之会议发布（一）

目录前言： 会议发布的产品原型图： 1.会议发布 1.1实现的特色功能： 1.2思路： 使用的数据库： 我们要实现多功能下拉框的形式选择可以参考原文档：https://hnzzmsf.github.io/example/example_v4.html#down…

阅读更多...

运算放大器--------加减运算电路

运算放大器--------加减运算电路

反向求和运算电路电路公式同向加法运算电路电路公式加减运算电路分别求正向输入的输出和反相输入的输出，然后求和就可以得到到最终的输出。切记，虚短虚断不是真正的断路和短路。

阅读更多...

antDesign的a-select数据回显选中initialValue问题解决方法

antDesign的a-select数据回显选中initialValue问题解决方法

在开发过程中表单中的【学习专业】下拉列表项需要数据回显，设置了initialValue，但只显示下拉选项的majorId值, 没有显示具体的专业名称，经排查发现是majorId数据类型导致的，下拉选项majorList数组中的id是数值类型，而在…

阅读更多...

LeetCode｜backtracking｜review：40. 131. 93. 47. 332. | 37. Sudoku Solver

LeetCode｜backtracking｜review：40. 131. 93. 47. 332. | 37. Sudoku Solver

复习： 40. Combination Sum II [1,1,2,3]中，答案里有[1,1,2], 但是不能有两个[1,2,3] 131. Palindrome Partitioning 每个for都是在给定的start之后找一个palindrome。当start 93. Restore IP Addresses forloop每次loop都是在给定的start的后三个数…

阅读更多...

Redis三种模式——主从复制，哨兵模式，集群

Redis三种模式——主从复制，哨兵模式，集群

目录一、主从复制 1.1主从复制的概念 1.2Redis主从复制作用 1.2.1数据冗余 1.2.2故障恢复 1.2.3负载均衡 1.2.4高可用基石 1.3Redis主从复制流程 1.4部署Redis 主从复制 1.4.1.环境部署 1.4.2.所有服务器都先关闭防火墙 1.4.3.所有服务器都安装Redis 1.4.4修改Master主节点R…

阅读更多...

IFIX5.8安装教程

IFIX5.8安装教程

管理员身份运行： 安装： 下次安装的时候选择SCADA服务器，独立。然后下图就不会出现了。重启电脑：

阅读更多...

【2050. 并行课程 III】

【2050. 并行课程 III】

来源：力扣（LeetCode） 描述： 给你一个整数 n ，表示有 n 节课，课程编号从 1 到 n 。同时给你一个二维整数数组 relations ，其中 relations[j] [prevCoursej, nextCoursej] ，表示课程…

阅读更多...

SkyEye与Jenkins的DevOps持续集成解决方案

SkyEye与Jenkins的DevOps持续集成解决方案

在技术飞速发展的当下，随着各行各业的软件逻辑复杂程度提升带来的需求变更，传统测试已无法满足与之相对应的一系列测试任务，有必要引入一个自动化、可持续集成构建的DevOps平台来解决此类问题。本文将主要介绍SkyEye与Jenkins的持续集成解决方…

阅读更多...

MySQL基础扎实——Like声明中的%什么意思

MySQL基础扎实——Like声明中的%什么意思

语意讲解在MySQL的LIKE语句中，%是一个通配符，用于匹配任意长度（包括零长度）的字符序列。具体来说，当使用%放置在LIKE语句中的模式中时，它表示可以匹配任意字符的序列。这个字符序列可以是零个字符、一个…

阅读更多...

VOC 格式与 YOLO 格式的相互转换

VOC 格式与 YOLO 格式的相互转换

目录数据集介绍VOC 格式转换为 YOLO 格式YOLO 格式转换为 VOC 格式数据集介绍本文使用的数据集是自制的安全帽数据集，共含有 6696 张图片，部分图片如下： 以及对应的 6696 个 VOC 格式的 xml 标注文件，部分文件如下&#xff1a…

阅读更多...

[Linux]进程间通信

[Linux]进程间通信

[Linux]进程间通信文章目录 [Linux]进程间通信进程间通信什么是进程间通信进程间通信的目的进程间通信的本质为什么存在进程间通信进程间通信的分类管道什么是管道匿名管道本质pipepipe的使用匿名管道读写情况匿名管道的特征命名管道本质命令行创建命名管道创建和删除命名管…

阅读更多...

SolidWorks绘制Maxwell仿真用带桥接的三维平板螺旋线圈

SolidWorks绘制Maxwell仿真用带桥接的三维平板螺旋线圈

文章目录前言一、建立涡状线二、拉伸方法1（建立工作面，较复杂）三、拉伸方法2（穿透，较简单）四、建立桥接前言在使用Maxwell进行电磁场仿真时，经常需要绘制各种异形线圈，由于Maxwel…

阅读更多...

5.定时器-间歇函数

5.定时器-间歇函数

网页中经常会需要一种功能：每隔一段时间需要自动执行一段代码，不需要我们手动去触发例如：网页中的倒计时 ●要实现这种需求，需要定时器函数 5.1开启定时器语法 setInterval(函数,间隔时间)作用：每隔一段时间调用这…

阅读更多...

Spring 6【单例设计模式、bean标签的scope属性、Spring 循环注入问题】(八)-全面详解（学习总结---从入门到深化）

Spring 6【单例设计模式、bean标签的scope属性、Spring 循环注入问题】(八)-全面详解（学习总结---从入门到深化）

目录十五、单例设计模式十六、bean标签的scope属性十七、Spring 循环注入问题十五、单例设计模式设计模式：根据面向对象五大设计思想衍生出的23种常见代码写法，每种写法可以专门解决一类问题。单例设计模式：保证某个类在整个应用程…

阅读更多...

一文搞懂加密和接口签名小知识

一文搞懂加密和接口签名小知识

最近在做的接口自动化测试工程中，一些接口需要签名，涉及到了加解密的一些知识，顺手梳理了下，分享给大家。主要分为四个部分介绍： 一、基础概念二、加密算法介绍三、接口签名四、实例分析一、基础概念加密是…

阅读更多...

Leetcode 27 移除元素代码逐行讲解

Leetcode 27 移除元素代码逐行讲解

Leetcode 27 移除元素给你一个数组 nums 和一个值 val，你需要原地移除所有数值等于 val 的元素，并返回移除后数组的新长度。不要使用额外的数组空间，你必须仅使用 O(1) 额外空间并原地修改输入数组。元素的顺序可以改变。你不需要考…

阅读更多...

推荐文章

最新文章