大模型微调4：Alpaca模型微调、Adalora、Qlora

大模型微调4：Alpaca模型微调、Adalora、Qlora

news2025/4/27 10:27:24

Alpaca模型微调：

整个pipeline

1. 主流底座：Candidate

中文：YI-34B

英文：LLama，mistral

2. 验证：

我们自己的Instructoin data

通用的Instruction data（适合我们场景的）

3. 收集大量的Finetune Data：一万到十万，高质量7K>一般质量30K

人工
半人工
全自动

4. Fine Tune: Lora等

5. Inference-->server-->API-->APP/PC

Instruction Tuning可以尝试的使用方法

1. training on Instruction data

2. 通用Instruction data和私有 Instruction data混合，可以解决某些能力的遗忘

3. 混合比例，根据关注度确定，混合后做sample，构成minibatch

4. pre-train的时候加入Instruction data，接着在SFT上再使用Instruction Data

llama模型

开源模型

Transformer Decoder架构

结构上与Transformer经典结构差距很小

7B、13B、33B、65B四种基座模型（一般从小的开始训）

使用的通用数据：

位置编码-->循环位置编码
Relu激活函数-->SwiGlu激活函数
Efficient Implementation (reduce time and memory)

Alpaca是llama的fundation model，不具备chat能力，

instruction data 示例：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2175471.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

kubernetes存储入门（kubernetes）

kubernetes存储入门（kubernetes）

实验环境依旧是三个节点拉取镜像，然后在master节点拉取资源清单： 然后同步会话，导入镜像； 存储入门 ConfigMap volume卷--》volumemount（挂载卷） Glusterfs NFS ISCSI HostPath ConfigMap Secret E…

阅读更多...

acw(树的重心)

acw(树的重心)

给定一颗树，树中包含 n𝑛 个结点（编号 1∼n1∼𝑛）和 n−1𝑛−1 条无向边。请你找到树的重心，并输出将重心删除后，剩余各个连通块中点数的最大值。重心定义：重心是指树…

阅读更多...

基于SSM的“在线汽车交易系统”的设计与实现（源码+数据库+文档+开题报告)

基于SSM的“在线汽车交易系统”的设计与实现（源码+数据库+文档+开题报告)

基于SSM的“在线汽车交易系统”的设计与实现（源码数据库文档开题报告) 开发语言：Java 数据库：MySQL 技术：SSM 工具：IDEA/Ecilpse、Navicat、Maven 系统展示系统总体设计图首页新闻信息用户注册后台登录界面…

阅读更多...

从0学习React（2）

从0学习React（2）

经过上一篇的文章，对index.tsx文件的每行代码进行了一个简单的分析之后，我大概对React有了一个简单的了解。虽然也是一知半解，但是起码在心里已经对React有了一个基本的概念。这篇文章，我就讲一下关于React中index.tsx的大致框架。…

阅读更多...

Metahuman sdk官方 AI驱动口型蓝图优化

Metahuman sdk官方 AI驱动口型蓝图优化

combo stream ATL stream ( audio to lip sync) 以上时实时驱动口型非实时驱动口型可以在metahuman blueprint里直接加上talk component，实现聊天/回复功能。 Talk sound可以放自己的声音/ talk chat是回复你输入的message和你聊天/ talk text是念出你输入的me…

阅读更多...

828华为云征文｜部署个人知识管理系统 SiyuanNote

828华为云征文｜部署个人知识管理系统 SiyuanNote

828华为云征文｜部署个人知识管理系统 SiyuanNote 一、Flexus云服务器X实例介绍二、Flexus云服务器X实例配置2.1 重置密码2.2 服务器连接2.3 安全组配置2.4 Docker 环境搭建三、Flexus云服务器X实例部署 SiyuanNote3.1 SiyuanNote 介绍3.2 SiyuanNote 部署3.3 Siyua…

阅读更多...

Awcing 799. 最长连续不重复子序列

Awcing 799. 最长连续不重复子序列

Awcing 799. 最长连续不重复子序列解题思路: 让我们找到一个数组中，最长的不包含重复的数的连续区间的长度。最优解是双指针算法： 我们用 c n t [ i ] cnt[i] cnt[i]记录 i i i 这个整数在区间内出现的次数。(因为每个数的大小为 1 0 5 10^5 105, …

阅读更多...

报数游戏 - 华为OD统一考试(E卷)

报数游戏 - 华为OD统一考试(E卷)

2024华为OD机试（E卷D卷C卷）最新题库【超值优惠】Java/Python/C合集题目描述 100个人围成一圈，每个人有一个编号，编号从1开始到100。他们从1开始依次报数，报到为M的人自动退出圈圈，然后下一个人接着从1开始…

阅读更多...

数据链路层 ——MAC

数据链路层 ——MAC

目录 MAC帧协议 mac地址以太网帧格式 ARP协议 ARP报文格式编辑 RARP 其他的网络服务或者协议 DNS ICMP协议 ping traceroute NAT技术代理服务器网络层负责规划转发路线，而链路层负责在网络节点之间的转发，也就是"一跳"的具体传输…

阅读更多...

ubuntu18.04 Anconda安装及使用

ubuntu18.04 Anconda安装及使用

1、安装Anaconda 1)下载： 下载链接：https://www.anaconda.com/download#downloads 点击图中Free Download，登录并下在下载对应版本 2）安装 sudo bash Anaconda3-2024.06-1-Linux-x86_64.sh输入后，直接回车安装。出…

阅读更多...

NSSCTF [HNCTF 2022 WEEK2]e@sy_flower

NSSCTF [HNCTF 2022 WEEK2]e@sy_flower

将文件拖入ida 就看到很显眼的花指令对着jmp指令nop掉将main函数按p定义 F5查看伪c代码思路就是输入的flag先互换位置，再与0x30异或。 int __cdecl __noreturn main(int argc, const char **argv, const char **envp) {signed int v3; // 存储临时值int i; // 循…

阅读更多...

栏目二：Echart绘制动态折线图+柱状图

栏目二：Echart绘制动态折线图+柱状图

栏目二：Echart绘制动态折线图+柱状图配置了一个ECharts图表，该图表集成了数据区域缩放、双Y轴显示及多种图表类型（折线图、柱状图、象形柱图）。图表通过X轴数据展示，支持平滑折线展示比率数据并自动添加百分比标识，柱状图以渐变色展示评论数量，而象形柱图则以矩形形式展…

阅读更多...

基于baidu的云函数实现隐藏c2真实地址

基于baidu的云函数实现隐藏c2真实地址

参考云函数利用&Profile混淆可能是大家都用的腾讯云搞得现在腾讯云下架那个api网关了。。。所以只能找其他的云函数使用在网上只找到了一片不是腾讯云的云函数，使用的是百度云函数，那么也尝试的使用一下百度云函数。百度云：函数计…

阅读更多...

C++里的随机数

C++里的随机数

想用C做最基础的猜数字,肯定少不了随机数; srand(unsigned(time(NULL))); rand() //是生成一个随机数 rand()%1001//就是一个从一到一百的随机数合体: #include <iostream> #include <cstdlib> #include <time.h> int main() { int g 0; while (g < …

阅读更多...

Redis缓存双写一致性笔记(上)

Redis缓存双写一致性笔记(上)

Redis缓存双写一致性是指在将数据同时写入缓存（如Redis）和数据库（如MySQL）时，确保两者中的数据保持一致性。在分布式系统中，缓存通常用于提高数据读取的速度和减轻数据库的压力。然而，当数据更新…

阅读更多...

NetAssist测试TCP和UDP

NetAssist测试TCP和UDP

由于在Windows下经常使用NetAssist.exe这款网络调试工具进行TCP、UDP的服务端、客户端的监听，对于需要编写各种通信协议的TCP服务端、客户端以及UDP通信程序来说是很方便的。下载地址：http://free.cmsoft.cn/download/cmsoft/assistant/netassist5.0.14.…

阅读更多...

Docker容器的使用

Docker容器的使用

前提条件 Linux环境安装好Docker，可参考Rocky Linux9下安装Docker和卸载Docker Docker命令图帮助命令帮助命令，查看有哪些命令可以用 [rootlocalhost ~]# docker --help 查看某个命令的帮助，例如：run [rootlocalhost ~]# …

阅读更多...

MySQL递归查询笔记

MySQL递归查询笔记

目录一、创建表结构和插入数据二、查询所有子节点三、查询所有父节点四、查询指定节点的根节点五、查询所有兄弟节点（同级节点） 六、获取祖先节点及其所有子节点七、查询每个节点之间的层级关系八、查询指定节点之间的层级关系一、创建表…

阅读更多...

一款辅助渗透测试过程，让渗透测试报告一键生成

一款辅助渗透测试过程，让渗透测试报告一键生成

《网安面试指南》http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247484339&idx1&sn356300f169de74e7a778b04bfbbbd0ab&chksmc0e47aeff793f3f9a5f7abcfa57695e8944e52bca2de2c7a3eb1aecb3c1e6b9cb6abe509d51f&scene21#wechat_redirect 《Java代码审…

阅读更多...

动态顺序表的增删改查（数据结构）

动态顺序表的增删改查（数据结构）

目录一、顺序表二、静态顺序表三、动态顺序表 3.1、动态顺序表的实现 3.2、动态顺序表的实现 3.3.1、结构体创建 3.3.2、初始化 3.3.3、销毁数据 3.3.4、增容空间 3.3.5、尾插数据 3.3.6、头插数据 3.3.7、删除尾数据 3.3.8、打印数据 3.3.9、删除头数据 3.3…

阅读更多...

推荐文章

最新文章