goldfish loss：减少训练数据泄漏，提高大语言模型输出的多样性

goldfish loss：减少训练数据泄漏，提高大语言模型输出的多样性

news2026/2/15 2:57:59

LLMs（大型语言模型）能够记忆并重复它们的训练数据，这可能会带来隐私和版权风险。为了减轻记忆现象，论文作者引入了一种名为"goldfish loss"的微妙修改，在训练过程中，随机抽样的一部分标记被排除在损失计算之外。这些被舍弃的标记不会被模型记忆，从而防止模型完整复制训练集中的一整个标记序列。

论文行了广泛的实验，训练了十亿规模的 Llama-2 模型，包括预训练模型和从头开始训练的模型，并展示出在几乎不影响下游基准测试的情况下，可显著减少记忆现象。

goldfish loss

llm通常使用因果语言建模(CLM)目标进行训练，该目标表示令牌的平均对数概率，以所有先前的令牌为条件。对于包含L个训练标记的序列x = {xi}，可以写成:

当模型以高置信度正确预测序列{xi}时，该目标最小化，从而使由下一个标记预测训练的模型易于记忆。而goldfish loss仅在令牌的一个子集上计算，因此阻止了模型学习整个令牌序列。选取goldfish mask G∈{0,1}L，定义损失为

当某些段落在不同文档中多次出现时，我们应该每次掩盖相同的标记，因为不一致的掩盖最终会泄露整个段落。

作者首先在序列中每隔 k 个标记丢弃一个标记，称之为静态掩码。这种静态掩码的方式在上面说的重复段落的情况下失败了，因为掩码对齐于预训练序列长度，而不是文本内容。

所以作者提出了新的局部哈希掩码来解决这个问题。对于确定哈希上下文宽度的正整数 h，如果应用于前 h 个标记的哈希函数 f : |V|^h → R 的输出小于 1/k，则掩盖标记 xi。

i) 处理重复段落的稳健性处理与哈希

当某些段落在不同文档中多次出现时，我们应该每次掩盖相同的标记，因为不一致的掩盖最终会泄露整个段落。

静态掩码基线在这里失败，因为掩码对齐于预训练序列长度，而不是文本内容。

作者们提出了新的局部哈希掩码来解决这个问题。对于确定哈希上下文宽度的正整数 h，如果应用于前 h 个标记的哈希函数 f : |V|^h → R 的输出小于 1/k，则掩盖标记 xi。通过这种策略，掩码在每个位置上仅依赖于前 h 个标记。每当相同的 h 个标记序列出现时，第 (h + 1) 个标记都会以相同的方式被掩盖。

验证记忆保留

因为进行了掩码的遮蔽，所以还需要验证LLM是否会丢掉记忆

作者首先将训练集中的每个测试序列切成长度为n个token的前缀和后缀。以前缀为条件，它们渐进式地生成温度为零的文本。使用两个指标将生成的后缀与真实后缀进行比较:

RougeL score: [Lin, 2004]，它量化了最长公共(非连续)子序列的长度。得分为1.0表示记忆力很好。

精确匹配率:衡量与真实文本相比，正确预测的标记的百分比。

作者在仅包含 100 篇英文维基百科文章的数据集上，对 LLaMA-2–7B 模型进行了 100 个周期的训练。

上图为哈利·波特的结果显示，标准训练导致了对 84/100 篇文章的逐字记忆，而使用goldfish loss模型（k = 4）则没有记忆任何一篇文章。

RougeL 指标表明，使用goldfish loss损失训练的模型重复的非连续 n-gram 子序列长度大约是从未见过数据的模型的两倍。

针对于训练数据的重复：

作者预先训练了一个包含 1.1B 个参数和 32k 词汇量的语言模型。构建了来自两个来源数据集：RedPajama 2 的一个子集；混合了来自维基百科语料库的 2000 个目标序列，每个序列长度为 1024 到 2048 个标记。

下图绘制了训练后目标文档的 RougeL 记忆化分数分布。

当k = 3和k = 4时，RougeL值的分布与未在目标文档上训练的模型的分布大多重叠。对于较低的k值，可提取的记忆化接近于控制模型，并且标准损失中观察到的精确重复现象得到了有效缓解。

产生分歧的位置：

作者的直觉是，当损失放弃了标记时，模型不会记住这些标记，这会导致模型与基本事实偏离，或者说模型不会产生出与训练数据一模一样的输出

下图显示了 k = 4 的模型在每个序列位置上放弃标记的数量和与事实偏离的标记数量。

下表显示了在放弃标记处发生分歧的可能性。

可以看到大多数序列在第一个放弃的标记之后很快就会发生分歧，即使这些序列已经连续训练了 50 次，并且分歧位置几乎与被掩盖的位置完全重合。

对于静态掩码，观察到最大的对应率为 94.1%，随着损失中 k 的增加，这种对应关系逐渐减弱。而基于哈希的方法遵循类似的趋势，但由于此方法按照概率 1/k 丢弃任何标记，大多数分歧发生在第 k 个标记之前。

对模型性能的影响

对评估基准性能的影响

预训练的模型在整体表现上与使用标准因果语言建模（CLM）目标在相同数据上训练的模型表现类似。

下图显示，标准损失模型以及任何goldfish 模型的整体表现之间似乎没有系统性差异

由于goldfish 模型在某种程度上训练过的标记数量较少，可能会想到它们的原始标记预测能力会落后于看过更多数据的标准模型。

为了量化这种影响，作者跟踪模型在训练过程中的验证损失以及每个模型语义连贯性的能力进行对比

损失曲线

下图显示了在 RedpajamaV2 数据的 1200 万个标记上，模型的验证损失曲线，其中一个是使用标准损失训练的模型，另外两个是使用 4-GL 训练的模型。

所有模型收敛到几乎相同的验证损失值。随着批量大小的增加，损失遵循相同的验证曲线

Mauve分数：

Mauve分数是一个用来评估生成文本质量的指标，通过衡量生成文本与真实文本之间的多样性和自然性相似性来进行评估。

下图显示了使用模型在Slimpajama数据集样本上的Mauve分数。

对于贪婪解码，与使用因果语言建模（CLM）质量几乎没有明显下降。

当使用温度为0.7的多项式采样生成时，随着 k 增加和模型看到更多标记，分数略微有上升的趋势。

另外攻击者可能会尝试通过搜索序列的多种可能解码来提取数据，而最直接的实施方式是使用Beam Search。下图展示了使用30个束进行激进Beam Search的结果。

当k = 3时，goldfish loss仍然可以抵抗这种攻击，但当k值较大时，Beam Search抽样实现的可提取性增加。

总结

goldfish loss由于其简单性、可扩展性以及对模型性能影响相对较小，可以成为工业环境中的有用工具。不仅可以让模型不重复产生训练数据，这样可以规避训练数据泄露的风险，也可以让模型产生更多样的结果，丰富模型的输出。

但是更大的模型会记住更多的训练数据，因此研究goldfish loss对数十亿或数百亿参数规模模型带来的益处如何扩展，是一个有趣的开放问题。

最后金鱼的记忆只有7秒，虽然7秒记忆已经被研究证实是错的了，但是这个名字起的挺好，比哪些凑字的名字强多了，比如：谷歌的那个Lion (EvoLved SIgn MOmeNtum).

https://avoid.overfit.cn/post/d24d133b5c9e4b109f990783a1661c16

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1840276.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

阿里云ECS（CentOS/Alibaba Cloud Linux）安装最新 Docker 方法

阿里云ECS（CentOS/Alibaba Cloud Linux）安装最新 Docker 方法

最近（6月份）我发现 docker 官方无法正常访问，docker pull 命令也执行失败，用 TZ 也一样😔。以下步骤适用于 CentOS 7/8或Alibaba Cloud Linux 系统。 1. 更新系统包首先，确保您的ECS实例系统软件包是最…

阅读更多...

《Linux运维总结：基于ARM64架构CPU使用docker-compose一键离线部署alertmanager v0.27.0高可用集群》

《Linux运维总结：基于ARM64架构CPU使用docker-compose一键离线部署alertmanager v0.27.0高可用集群》

总结：整理不易，如果对你有帮助，可否点赞关注一下？ 更多详细内容请参考：《Linux运维篇：Linux系统运维指南》一、部署背景由于业务系统的特殊性，我们需要面对不同的客户部署业务系统&#xff0…

阅读更多...

ansible 模块进阶及变量

ansible 模块进阶及变量

yum 模块进阶 - name: install pkgs hosts: webservers tasks: - name: install web pkgs # 此任务通过yum安装三个包 yum: name: httpd,php,php-mysqlnd state: present # 根据功能等，可以将一系列软件放到一个组中，安装软件包组，将会把很…

阅读更多...

代码随想录第28天|回溯算法

代码随想录第28天|回溯算法

491. 非递减子序列思路: 不可以排序, 否则会改变元素的顺序对收获的结果有要求, num.size() > 2, 且 num[i - 1] < num[i]需要进行去重, 不能使用排序后的方法去重每一层可用 unordered_set 去重组合问题, for 遍历需要标记起始位置 bug: 一定要先判断元素是否重复, …

阅读更多...

进阶篇06——锁

进阶篇06——锁

概述全局锁表级锁表锁元数据锁元数据锁是系统自动加的，不需要我们手动执行命令添加。意向锁意向锁和元数据锁一样，也是在加行锁的时候自动给表加上相应的意向锁，不需要我们手动添加。行级锁行锁读锁和读锁兼容，写锁…

阅读更多...

【决战欧洲杯巅峰】AI模型预测[走地数据]初步准备工作

【决战欧洲杯巅峰】AI模型预测[走地数据]初步准备工作

数据准备首先，我们需要收集一些与欧洲杯比赛相关的历史数据。这些数据可能包括球队的历史战绩、球员的能力评分、比赛场地信息、历史交锋记录等。这些数据可以从公开来源获取，并进行适当的预处理和清洗。特征提取接下来，我们需要从收集…

阅读更多...

项目实施经理岗位的工作内容（合集）

项目实施经理岗位的工作内容（合集）

项目实施经理岗位的工作内容1 职责： (1)负责协调软件团队对软件产品的研发工作(包括代码开发，测试，部署实施等); (2)引导和解析客户需求，根据产品特点及用户个性化需求制定解决方案，完成客户宣讲等售前技术支持工作; (…

阅读更多...

【机器学习】第5章朴素贝叶斯分类器

【机器学习】第5章朴素贝叶斯分类器

一、概念 1.贝叶斯定理： （1）就是“某个特征”属于“某种东西”的概率，公式就是最下面那个公式。 2.朴素贝叶斯算法概述 （1）是为数不多的基于概率论的分类算法，即通过考虑特征概率来预测分类。 …

阅读更多...

时序预测 | KAN+Transformer时间序列预测（Python）

时序预测 | KAN+Transformer时间序列预测（Python）

预测效果基本描述 KANTransformer时间序列预测 KAN作为这两年最新提出的机制，目前很少人用，很适合作为时间序列预测的创新点，可以结合常规的网络加上个优化方法做创新。适合功率预测，负荷预测，流量预测，浓…

阅读更多...

接口联调测试脚本优化

接口联调测试脚本优化

工作中，或者面试中，人家会问有没有什么优势？ 你可以说我不光会写接口脚本，还能对接口脚本的结构进行了优化。接口无非就是输入参数、发送请求、对响应结果进行比对，这些过程都是一样的。如果不做一个通用的方法。1…

阅读更多...

【Java并发编程之美 | 第一篇】并发编程线程基础

【Java并发编程之美 | 第一篇】并发编程线程基础

文章目录 1.并发编程线程基础1.1什么是线程和进程？1.2线程创建与运行1.2.1继承Thread类1.2.2实现Runnable接口1.2.3实现Callable接口（与线程池搭配使用）1.2.4小结 1.3线程常用方法1.3.1线程等待与通知1.3.2线程睡眠1.3.3让出CPU执行权1.3.4线…

阅读更多...

【JS重点16】对象原型

【JS重点16】对象原型

目录一：对象原型是什么二：对象原型作用三：constructor属性四：如何赚钱一：对象原型是什么每个对象都有一个属性__proto__(称为原型对象),该属性是一个对象 __proto__是JS非标准属性在实例对象中，…

阅读更多...

【leetcode37-51】二叉树

【leetcode37-51】二叉树

94. 二叉树的中序遍历 # Definition for a binary tree node. # class TreeNode: # def __init__(self, val0, leftNone, rightNone): # self.val val # self.left left # self.right right class Solution:def inorderTraversal(self, root: O…

阅读更多...

Certificate数字证书的有效性验证

Certificate数字证书的有效性验证

1.证书相关概念在讲证书有效性验证的逻辑之前，先了解几个概念。证书颁发机构：一般为运营数字证书的机构，该机构负责证书的签发、吊销等生命周期管理。证书链：证书颁发机构一般会由多个组成，为树状层级，第…

阅读更多...

产品Web3D交互展示有什么优势？如何快速制作？

产品Web3D交互展示有什么优势？如何快速制作？

智能互联网时代，传统的图片、文字、视频等产品展示方式，因为缺少互动性，很难引起用户的兴趣，已经逐渐失去了宣传优势。 Web3D交互展示技术的出现，让众多品牌和企业找到了新的方向，线上产品展示不在枯燥无趣…

阅读更多...

大屏适配方案汇总

大屏适配方案汇总

1. 适配方案1：rem font-size 我们都知道，在 css 中 1rem 等于 html 根元素设定的 font-size 的 px 值，通过动态的修改html 根元素的 font-size 大小就能动态的改变 rem 的大小，从而实现适配。原理动态设置 HTML 根字体大小将…

阅读更多...

大模型上下文实验之大海捞针和数星星

大模型上下文实验之大海捞针和数星星

大模型上下文实验之大海捞针和数星星大海捞针和数星星大海捞针大海捞针测试简介Greg Kamradt 的“大海捞针”实验实验步骤实验预期 ChatGPT-4 128K的实验结果Claude-2.1 200K的实验结果数星星数星星简介多证据获取多证据推理实验结果多证据获取任务示例多证据推理任务示例数…

阅读更多...

Adobe Premiere 视频编辑软件下载安装，pr 全系列资源分享！

Adobe Premiere 视频编辑软件下载安装，pr 全系列资源分享！

Adobe Premiere以其强大的功能、灵活的操作和卓越的性能，成为视频编辑领域的佼佼者。在剪辑方面，Adobe Premiere提供了强大而灵活的工具集。用户可以在直观的时间线上对视频进行精细的裁剪、剪辑和合并操作。无论是快速剪辑短片，还是精心打造…

阅读更多...

洗地机哪个品牌比较好？四款好用靠谱的优质洗地机推荐

洗地机哪个品牌比较好？四款好用靠谱的优质洗地机推荐

随着现代生活节奏的加快，家庭清洁成了一项耗时且繁琐的任务。洗地机凭借其智能化和高效的清洁能力，越来越受到大家的青睐。然而，市场上各种品牌和型号琳琅满目，让人眼花缭乱。为了帮助大家在众多选择中找到心仪的产品，…

阅读更多...

真人模特+虚拟模特：阿里通义万相带你体验全新的卖家秀！

真人模特+虚拟模特：阿里通义万相带你体验全新的卖家秀！

哈喽，大家好，我是木头左，致力于程序服务生活！ 一、引言在数字化和虚拟化的时代，正在经历一场由人工智能驱动的革命。这场革命不仅改变了的生活，也正在改变的商业环境。阿里巴巴集团是这场革命的重要参与者…

阅读更多...

推荐文章

最新文章