相似度_对抗学习：SimCSE: Simple Contrastive Learning of Sentence Embeddings

news2026/2/9 6:05:48

SimCSE: Simple Contrastive Learning of Sentence Embeddings

这篇论文，我觉得有意思。在创造对抗学习的正负例时，正例直接使用它本身。将同一个句子传递给预先训练好的编码器两次：通过应用两次dropout，我们可以得到两个不同的嵌入作为 “正实例”。然后，我们把同一小批中的其他句子作为 “负实例”。
我们首先描述了一种无监督的方法，它采用输入句子并在对比性目标中预测自己，只用dropout 的size大小作为噪音。

以语义相关的正实例之间的一致性和整个表示空间的均匀性来衡量所学嵌入的质量

alignment and uniformity

在这里插入图片描述

无监督训练过程

在无监督学习中，采用对抗学习增强实例语义表征能力。
训练目标：两个相同的实例采用不同的dropout mask。

在这里插入图片描述

监督训练过程

训练目标是预测两个句子之间的关系：是连带的、中性的还是矛盾的——entailment, neutral or contradiction.
在语料中，有positive instance，negative instance，original instance。

在这里插入图片描述

所以，做对抗学习的目的，也是为了解决了词向量表征的各项异性问题。

实验

STS任务:semantic textual similarity 任务

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/310.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相似度_对抗学习：SimCSE: Simple Contrastive Learning of Sentence Embeddings

SimCSE: Simple Contrastive Learning of Sentence Embeddings

无监督训练过程

监督训练过程

实验

相关文章

云计算基础：云计算越来越广泛，我们应该如何去学习云计算

非科班程序员被裁员后反而涨薪了200%，这两个月他都经历了哪些？

数据仓库建模（四）：维度表的设计

趣学算法(2)

Vue项目的记录（十三）

拓端tecdat|R语言辅导配对检验分析案例

C-文件操作实现数据持久化，帮你快速了解文件操作函数

Redis 主从安装-Centos

计算机网络--传输层

操作系统真相还原_第4章：进入保护模式

计算机等级考试Python二级

子串和子序列问题-动态规划向

Java开发手册解析_编程规约-集合处理

服务与发现

整型数据是如何在内存中存储的

Vue2生命周期详细图解和代码

C语言数据结构——链表

（46）STM32——FATFS文件系统实验

大学科目网课搜题接口

【1024社区大奖】让你一小时内狂揽大奖[保姆级教程①]