大模型（LLMs）LLM生成SFT数据方法面

大模型（LLMs）LLM生成SFT数据方法面

news2025/4/28 15:45:25

一、SFT数据集如何生成？

SFT数据集构建通常有两种方法：人工标注和使用LLM（比如GPT-4）来生成的，人工标注对于构建垂直领域比较合适，可以减少有偏数据，但是成本略高；使用LLM生成，可以在短时间内生成大量数据。 SFT数据集构建以及SFT微调Pipeline如下图所示：

二、Self-Instruct 篇

2.1 什么是 Self-Instruct ？

SELF-INSTRUCT，一个通过引导自己的生成来提高预训练语言模型指令跟从能力的框架。其流水线从生成指令、输入和输出语言模型的样本、过滤掉无效或相似的样本、到最后微调原始模型。应用于普通 GPT3，证明在SUPER-NATURALINSTRUCTIONS上比原始模型有 33% 的绝对改进，与使用私人用户数据和人工注释进行训练的 InstructGPT00的性能相当。

为了进一步评估，为新任务策划了一组专家编写的指令，并通过人工评估表明，使用 SELF-INSTRUCT 调整 GPT3 的性能大幅优于现有公共指令数据集，仅与 InstructGPT001 相比有 5% 的绝对差距。 SELF-INSTRUCT 提供了一种几乎无需标注的方法，用于将预训练语言模型与指令对齐，并且发布了大型综合数据集以促进未来指令调优的研究。

2.2 Self-Instruct 处理思路？

步骤1：作者从 175个种子任务中随机抽取 8 条自然语言指令作为示例，并提示InstructGPT生成更多的任务指令。
步骤2：作者确定步骤1中生成的指令是否是一个分类任务。如果是，他们要求 InstructGPT 根据给定的指令为输出生成所有可能的选项，并随机选择特定的输出类别，提示 InstructGPT 生成相应的“输入”内容。对于不属于分类任务的指令，应该有无数的“输出”选项。作者提出了“输入优先”策略，首先提示 InstructGPT根据给定的“指令”生成“输入”，然后根据“指令”和生成的“输入”生成“输出”。
步骤3：基于第 2 步的结果，作者使用 InstructGPT 生成相应指令任务的“输入”和“输出”，采用 “输出优先”或“输入优先”的策略。
步骤4：作者对生成的指令任务进行了后处理(例如，过滤类似指令，去除输入输出的重复数
据)，最终得到52K条英文指令

三、Backtranslation 篇

3.1 什么是 Backtranslation ？

回译在传统的机器学习中是一种数据增强方法，比如从中文翻译成英文，再从英文翻译会中文，这

样生成的中文与原来的中文在语义上是一致的，但是文本不同；然而SFT数据生成的回译则是通过输出来生成指令，具体步骤如下图所示：

四、结语

大模型的时代已经到来，我们打开了一扇通往更深层次AI应用的大门。希望通过本文的分享，能够激发你对大模型技术的兴趣，并在你的技术道路上提供帮助和启发。欢迎在评论区交流讨论，共同探索AI技术的无限可能。

👉AI大模型学习路线汇总👈
大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈
光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。
在这里插入图片描述

👉学会后的收获：👈
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：
😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1992458.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【算法设计题】计算有向图G中每个结点的入度和出度，第4题（C/C++）

【算法设计题】计算有向图G中每个结点的入度和出度，第4题（C/C++）

目录第4题计算有向图G中每个结点的入度和出度得分点（必背） 题解：计算有向图G中每个结点的入度和出度数据结构定义边表结点顶点表结点图的邻接表存储表示计算图G中每个结点的入度和出度详细解释 1. 初始化入度和出度数组 2…

阅读更多...

容器适配器的介绍和模拟实现

容器适配器的介绍和模拟实现

💗 💗 博客:小怡同学 💗 💗 个人简介:编程小萌新 💗 💗 如果博客对大家有用的话，请点赞关注再收藏 🌞 Stack的介绍 stack是一种容器适配器，专门用在具有后进先出操作的上…

阅读更多...

如何看到公司所有员工的收发件，并以员工名义一键发信

如何看到公司所有员工的收发件，并以员工名义一键发信

对于企业管理层来说, 了解并监控员工的企业邮箱成为了日常工作中的一部分。这不仅可以帮助企业更好地掌握业务进展, 还能够提高工作效率。本文将详细介绍如何通过Zoho邮箱实现这一目标, 包括相关的技术原理、实现的好处以及具体的实施步骤。一、实现的技术: POP3 和 IMAP 要…

阅读更多...

C++类和对象（2）——构造函数和析构函数

C++类和对象（2）——构造函数和析构函数

###前言：此文主要介绍C中的六种默认成员函数；默认的意思就是我们不写编译器会自动生成；这些函数在类里面自动生成；但是我们也可以自己写；学习这几种默认成员函数从两个方面入手： （1&#xff09…

阅读更多...

“AI大语言模型+”助力大气科学相关交叉领域实践技术应用

“AI大语言模型+”助力大气科学相关交叉领域实践技术应用

查看原文>>>“AI大语言模型”助力大气科学相关交叉领域实践技术应用目录专题一、预备知识专题二、科研辅助专题专题三、可视化专题——基于GPT实现专题四、站点数据处理专题五、WRF专题——基于GPT和Python实现专题六、遥感降水专题——基于GPT和Python…

阅读更多...

#java学习笔记(面向对象)----(未完结)

#java学习笔记(面向对象)----(未完结)

一基础相关知识点： 1. 一个对象的调用首先我们创建一个Phone类 public class Phone {//成员变量String name;int age;String favourite;//成员方法public void myName(){System.out.println(name);}public void myAge(){System.out.println(age);}public void m…

阅读更多...

免费写作神器，自动生成高质量文章

免费写作神器，自动生成高质量文章

在当今数字化的时代，信息的传播和创作变得前所未有的重要。无论是企业的营销推广、个人的博客写作，还是学术研究报告，优质的文章都能发挥巨大的作用。而随着人工智能技术的飞速发展，免费的ai写作工具应运而生，为我们带…

阅读更多...

虚拟内存惹

虚拟内存惹

二、理解虚拟内存虚拟内存存在的原因物理地址和虚拟地址虚拟内存的其他介绍虚拟内存存在的原因计算机系统有两种地址：1、物理地址 2、虚拟地址物理地址：是指真实的地址，是物理存在的，比如RAM、flash等虚拟地址：…

阅读更多...

使用相同模型相同数据集，为什么每次运行得到的损失值都不一样？

使用相同模型相同数据集，为什么每次运行得到的损失值都不一样？

今天小编在学习 PyTorch 时,突然发现咋每次运行所得损失绘制的曲线都不一样呢？即使小编使用torch.manual_seed()函数固定 torch 的随机数种子每次运行的结果还是不一样，因此小编就写一篇文章记录一下。数据集本次使用的数据集是小编自定义的小型数据…

阅读更多...

MySQL数据管理 - 查询语句

MySQL数据管理 - 查询语句

文章目录查询数据1 查询指定列2 条件查询3 合并查询4 模糊查询5 聚合函数查询6 对值进行排序7 分组查询8 分页查询9 数据库关联查询1 内连接 INNER JOIN2 LEFT JOIN3 右连接 10 数据库子查询参考查询数据数据库最常用的操作就是查询，也是数据操作的基础&#xf…

阅读更多...

MySQL基础练习题23-门店处理

MySQL基础练习题23-门店处理

目录题目准备数据分析数据方法一方法二题目从分店明细表中获取门店面积。准备数据 -- 创建库 drop database if exists db_1; create database db_1; use db_1;-- 创建门店面积表 tb_store_area CREATE TABLE tb_store_area (store_no VARCHAR(50),area…

阅读更多...

[器械财讯]TRiCares完成近4亿融资，推动Topaz三尖瓣置换系统发展

[器械财讯]TRiCares完成近4亿融资，推动Topaz三尖瓣置换系统发展

一、融资成功助力临床研究法国医疗器械公司TRiCares近期宣布，其D轮融资成功筹集5000万美元，所得资金将专用于支持其核心产品——经导管三尖瓣置换系统（TTVR）Topaz的临床研究和开发。这笔资金将用于在美国和欧盟开展临床研究&…

阅读更多...

手持红外热成像仪的使用方法_鼎跃安全

手持红外热成像仪的使用方法_鼎跃安全

手持红外热成像仪是一种便携设备，方便在现场进行温度检测和成像。他们能将物体发出的不可见红外能量转化为可见的热图像，直观展示物体表面的温度分布情况；广泛应用于电气设备维修、环保检查、应急救援等领域。接下来，我们一起来了…

阅读更多...

行业原型：智慧教育线上平台-学院原型

行业原型：智慧教育线上平台-学院原型

行业原型预览链接： 文件类型：.rp 支持版本：Axrure RP 8 文档名称：智慧教育线上平台-学院文件大小：1.80 MB 目录内容介绍文档内容介绍回复“211110” 领取

阅读更多...

《最新出炉》系列小成篇-Python+Playwright自动化测试-66 - 等待元素至指定状态(出现、移除、显示和隐藏)

《最新出炉》系列小成篇-Python+Playwright自动化测试-66 - 等待元素至指定状态(出现、移除、显示和隐藏)

1.简介在我们日常工作中进行UI自动化测试时，保证测试的稳定性至关重要。其中一个关键方面是正确地定位和操作网页中的元素。在网页中，元素可能处于不同的状态，有些可能在页面加载完成之前不在DOM中，需要某些操作后才会出现&…

阅读更多...

视频剪辑sdk，跨平台部署，助力企业差异化竞争

视频剪辑sdk，跨平台部署，助力企业差异化竞争

在这个内容为王的时代，视频已成为连接用户、传递价值的核心媒介。无论是社交媒体、在线教育、短视频平台还是新闻资讯，高质量的视频内容都是吸引用户、提升用户体验的关键。然而，对于众多企业而言，如何高效、专业地处理视频内容&a…

阅读更多...

字节跳动春节抖音视频红包系统设计与实现--图文解析

字节跳动春节抖音视频红包系统设计与实现--图文解析

字节跳动春节抖音视频红包系统设计与实现–图文解析原作者：字节跳动技术团队原文链接：https://www.toutiao.com/article/7114224228030841374 原标题：2022 春节抖音视频红包系统设计与实现我们做了什么业务背景在春节活动期间&…

阅读更多...

洛谷 P10034 「Cfz Round 3」Circle

洛谷 P10034 「Cfz Round 3」Circle

[Problem Discription] \color{blue}{\texttt{[Problem Discription]}} [Problem Discription] [Solution] \color{blue}{\texttt{[Solution]}} [Solution] 这是道好题。建图，对每一个 i → p i i \to p_{i} i→pi 都建立一个有向边，就可以得到一个…

阅读更多...

记一次学习--[网鼎杯 2018]Comment二次注入

记一次学习--[网鼎杯 2018]Comment二次注入

目录本文章只展示二次注入过程，后续获取flag并不展示靶场网站流程、密码的破解和目录的查询以及对于源代码获取密码暴力破解网站目录扫描网站源代码获取网站流程尝试注入注入代码本文章只展示二次注入过程，后续获取flag并不展示靶场…

阅读更多...

IntelliJ IDEA 2024.2 夏季大版本发布，不得不说，更强了！

IntelliJ IDEA 2024.2 夏季大版本发布，不得不说，更强了！

因 CSDN 上传大小限制，本文推荐微信中阅读，动图更完整，微信中阅读，请欢迎关注公众号：CodeFit 创作不易，如果你觉得这篇文章对您有帮助，请不要忘了点赞、分享和关注，为我的持续创…

阅读更多...

推荐文章

最新文章