LLaMA模型微调版本：斯坦福 Alpaca 详解

LLaMA模型微调版本：斯坦福 Alpaca 详解

news2026/3/10 2:05:13

项目代码：https://github.com/tatsu-lab/stanford_alpaca

博客介绍：https://crfm.stanford.edu/2023/03/13/alpaca.html

Alpaca 总览

Alpaca 是 LLaMA-7B 的微调版本，使用Self-instruct[2]方式借用text-davinct-003构建了52K的数据，同时在其构建策略上做了一些修改。

性能上作者对Alpaca进行了评估，与openai的text-davinct-003模型在self-instruct[2]场景下的性能表现相似。所以比起成本来看，Alpaca更便宜。

text-davinct-003 与 chatGPT 同为 gpt3.5模型之一，比GPT-3模型 curie、babbage、ada 模型更好的质量、更长的输出和一致的指令遵循来完成任何语言任务

整体思路如下图

基于 Self-instruct 的数据生成

Self-instruct

Self-instruct是一个利用LLM来生成指令遵循数据来指令微调模型的框架，核心贡献是生成指令遵循数据。

指令数据由指令、输入、输出组成。作者的数据生成piple包含四个步骤：

1）生成任务指令，

2）确定指令是否代表分类任务，方便3区别

3）正常任务使用输入优先方法，分类任务使用输出优先的prompt指令方法生成实例

4）过滤低质量的数据。

详细的Self-instruct可以看我别的文章。

Alpaca

Alpaca基于self-instruct，

改用GPT-3.5：text-davinci-003来生成指令数据（self-instruct使用的GPT-3：davinci）
指令生成时使用新的prompt，直接一次性生成20个任务的指令（self-instruct是迭代生成的，更费钱）
指令生成不区分分类/非分类任务，可能是GPT3.5更好，不需要区别了。
每个指令只生成1个实例。

最终的结果是以少于$500的便宜价格获得了52K的数据，下图反映了其数据多样性，内圈是词根是动词的指令，外圈是表示目标的指令。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/695067.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

三相一次重合闸程序逻辑原理（二）

三相一次重合闸程序逻辑原理（二）

在手动合闸至故障线路或手动分闸及保护或自动装置要求不允许重合闸（如母线、变压器保护及低频减载动作）等情况下，闭锁重合闸的输入开关量触点接通，H4输出“1”，非门Z4输出“0”，计数器清零（CD0&…

阅读更多...

健身戴哪种耳机好、适合健身运动的耳机推荐

健身戴哪种耳机好、适合健身运动的耳机推荐

随着越来越多的人加入运动健身的行列，市场上涌现出越来越多适用于跑步的运动耳机。对于喜欢运动的朋友们来说，一副优秀的运动耳机成为了必不可少的装备。当进行力量训练时，佩戴耳机可以帮助提升训练的专注度；而在进行有氧运动时&a…

阅读更多...

部署 kubeadm 1.20

部署 kubeadm 1.20

目录一、环境准备二、所有节点安装docker三、所有节点安装kubeadm，kubelet和kubectl四、部署K8S集群硬件准备 master（2C/4G，cpu核心数要求大于2） 192.168.154.10 docker、kubeadm、kubelet、kubectl、flannel node01&#xff08…

阅读更多...

oracle dblink mysql查询text无法显示问题

oracle dblink mysql查询text无法显示问题

帮客户做了一个oracle到mysql的dblink之后，客户反馈发现有的表查询字段不全，通过select * 查询，mysql中有个字段INTERVENTION字段没有显示，首先想到的就是可能不支持查询，检查这个字段类型为text，猜测可能是…

阅读更多...

LeetCode刷题 | 139. 单词拆分

LeetCode刷题 | 139. 单词拆分

139. 单词拆分给你一个字符串 s 和一个字符串列表 wordDict 作为字典。请你判断是否可以利用字典中出现的单词拼接出 s 。注意：不要求字典中出现的单词全部都使用，并且字典中的单词可以重复使用。示例 1： 输入: s "leetcode"…

阅读更多...

直播预约|湘江公益直播大讲堂：以低代码助力中小企业数字化转型

直播预约|湘江公益直播大讲堂：以低代码助力中小企业数字化转型

在当今数字时代，中小企业面临着前所未有的机遇和挑战。在激烈的商业竞争环境中，如何快速、高效地实现数字化转型并提升企业的竞争力成为中小企业亟需解决的关键问题。低代码平台的兴起，为中小企业的数字化转型带来了全新的解决方案。 6月29日…

阅读更多...

企业级ChatGPT开发的三大核心内幕及案例实战(二)

企业级ChatGPT开发的三大核心内幕及案例实战(二)

2.2 企业级ChatGPT开发的三大核心剖析 Gavin老师：NLP_Matrix_Space 本节讲解LangChain官方提供的一个项目，跟大家展示企业级开发的核心元素，如图2-1所示，是项目的架构示意图。图2- 1 LangChain项目架构示意图一个基本原则是你的提示词和模型进行交互，作为和模型交互的…

阅读更多...

如何用rust实现一个异步channel

如何用rust实现一个异步channel

目录前言思路实现功能代码实现测试先引测试版包测试代码结果与分析思考尾语前言使用通信来共享内存，而不是通过共享内存来通信上面这句话，是每个go开发者在处理多线程通信时的座右铭，go甚至把实现这个理念的channel直接焊在编译器里&…

阅读更多...

台灯太亮会影响视力吗?选灯一定要注意这几个点！

台灯太亮会影响视力吗?选灯一定要注意这几个点！

灯太亮对眼睛有没有影响，取决于灯“亮”的程度和使用的时间。如果是偶尔有需求，灯过于亮，使用时间不长的话对眼睛倒是没有太大的影响。但如果是长时间使用的，就不能使用过亮的灯了，容易导致睫状肌代偿性收缩、导致眼睛…

阅读更多...

RISC-V处理器的设计与实现（三）—— 上板验证

RISC-V处理器的设计与实现（三）—— 上板验证

文章目录 RISC-V处理器的设计与实现（一）—— 基本指令集_Patarw_Li的博客-CSDN博客 RISC-V处理器的设计与实现（二）—— CPU框架设计_Patarw_Li的博客-CSDN博客 RISC-V处理器的设计与实现（三）—— 上板验…

阅读更多...

人机混合智能概述

人机混合智能概述

人机混合智能是指将人类的智能和计算机的智能结合起来，实现更加智能化的决策和行动。人机混合智能的发展历史可以追溯到20世纪50年代早期，当时计算机还是庞大的机器，只能由专业人员操作。但随着计算机技术的不断发展，出现了更为普…

阅读更多...

JavaScript之鼠标事件、坐标轴、定位、clientXY、offsetXY、layerXY、pageXY、screenXY

JavaScript之鼠标事件、坐标轴、定位、clientXY、offsetXY、layerXY、pageXY、screenXY

文章目录 MouseEvent的事件类别阻止鼠标的默认事件去除单击右键菜单阻止图像默认拖拽阻止文字的拖拽和选择阻止表单提交及重置打印输出MouseEvent对象内容clientX和clientY与x和yoffsetXYlayerXYpageXYscreenXY总结 MouseEvent的事件类别序号事件描述1mousedown鼠标按下2mouse…

阅读更多...

多元回归预测 | Matlab鲸鱼算法(WOA)优化极限学习机ELM回归预测,WOA-ELM回归预测，多变量输入模型

多元回归预测 | Matlab鲸鱼算法(WOA)优化极限学习机ELM回归预测,WOA-ELM回归预测，多变量输入模型

文章目录效果一览文章概述部分源码参考资料效果一览文章概述多元回归预测 | Matlab鲸鱼算法(WOA)优化极限学习机ELM回归预测,WOA-ELM回归预测，多变量输入模型评价指标包括:MAE、RMSE和R2等，代码质量极高，方便学习和替换数据。要求2018版本及以上。部分源码 %% 清空环…

阅读更多...

【C/C++】使用类和对象设计立方体案例

【C/C++】使用类和对象设计立方体案例

创作不易，本篇文章如果帮助到了你，还请点赞关注支持一下♡>𖥦<)!! 主页专栏有更多知识，如有疑问欢迎大家指正讨论，共同进步！ 🔥c系列专栏：C/C零基础到精通 🔥 给大…

阅读更多...

6.2.2 复制、删除与移动： cp, rm, mv

6.2.2 复制、删除与移动： cp, rm, mv

要复制文件，使用cp(copy)指令，移动目录与文件，使用mv(move)，这个指令直接拿来作更名的动作（rename），移除是rm(remove)。 cp （复制文件或目录） 复制（cp&#…

阅读更多...

(07)装拆箱,自定义泛型,泛型约束,foreach,枚举器,迭代器,文件目录操作,TreeView,递归

(07)装拆箱,自定义泛型,泛型约束,foreach,枚举器,迭代器,文件目录操作,TreeView,递归

一、作业问题 1.CompareTo是按什么规则标准进行比较的？ 当前区域性执行单词 (区分大小写和区分区域性) 比较。有关单词、字符串和序号排序的详细信息，请参阅 System.Globalization.CompareOptions。并不是按照…

阅读更多...

每天一点Python——day42

每天一点Python——day42

#第四十二天 #判断字典中关键字是否存在in 存在返回Ture；反之为False not in 不存在返回True；反之为False#例： b{师傅:1000,师祖:10000,徒弟:500} print(师傅in b) print(师傅 not in b) #字典元素的删除del 字典名[健名]#例 a{张三:100,李四…

阅读更多...

为什么现代的低代码开发平台都不支持导出源代码？

为什么现代的低代码开发平台都不支持导出源代码？

摘要：本文由葡萄城技术团队于CSDN原创并首发。转载请注明出处：葡萄城官网，葡萄城为开发者提供专业的开发工具、解决方案和服务，赋能开发者。初次接触低代码的程序员大多会纠结一个问题，为什么功能越强大的低代码开发平…

阅读更多...

C语言进阶--自定义类型详解

C语言进阶--自定义类型详解

目录一.结构体 1.1.结构的声明 1.2.结构的自引用 1.3.结构体变量的定义和初始化 1.4.结构成员的访问 1.5.结构体内存对齐 1.6.修改默认对齐数 1.7.offsetof宏 1.8.结构体传参 1.9.位段二.枚举 2.1.枚举的定义 2.2.枚举的使用 2.3.枚举的优点三.联合(共用体) …

阅读更多...

ODrive电路设计中的接地环路

ODrive电路设计中的接地环路

对于要进行通信的电气设备，大多数时候它们需要公共接地连接。最佳实践是将接地连接回一个点，称为“星形接地”。如果有多个接地路径，则会形成“接地环路”。接地环路和导线电感可能会导致 ODrive 等大电流电子设备出现问题。作为可能出错的示例，请查看下图。问题：问题在…

阅读更多...

推荐文章

最新文章