书生大模型全链路开源开放体系

news2024/10/1 15:33:25

L1-书生大模型全链路开源体系

  • 基于反馈的数据生成可以用开源项目标注——label LLM的开源项目
  • 大海捞针测试
    • 之前需要Rag《分块-量化-匹配-理解》![[Pasted image 20241001144531.png]]
  • 复杂问题
    • ![[Pasted image 20241001144635.png]]
  • 谱系
    • ![[Pasted image 20241001144840.png]]
  • 全链
    • ![[Pasted image 20241001144927.png]]
    • ![[Pasted image 20241001145106.png]]
    • ![[Pasted image 20241001145138.png]]

1. 全量参数微调(Full Parameter Fine-Tuning)

全量参数微调指的是对预训练模型的所有参数进行调整。这意味着所有的权重都在训练过程中参与更新,以适应新的数据或任务。

  • 优点
    • 适应性强:可以针对特定任务进行精细的优化。
    • 可以最大化模型的性能提升。
  • 缺点
    • 计算开销大:需要大量计算资源,尤其是对于大规模模型,显存占用高。
    • 存储需求大:微调后的模型需要重新保存所有参数,这在大模型场景下会带来存储挑战。

2. LoRA 微调(Low-Rank Adaptation of Large Language Models)

LoRA 是一种高效的微调方法,它通过在预训练模型的某些特定层插入 低秩矩阵(Low-Rank Matrices) 来进行微调,而不调整原模型的全部参数。具体来说,它冻结了预训练模型的所有权重,只对低秩矩阵进行训练。这大大减少了需要微调的参数数量。

  • 工作原理

    • LoRA 在某些特定层添加了两个小型的可训练的低秩矩阵,用来捕捉模型新的任务相关信息。
    • 这些低秩矩阵的参数远少于原始模型的参数,因此训练速度快,占用资源少。
  • 优点

    • 节省计算资源:只训练少量参数,大幅减少显存需求和计算开销。
    • 高效存储:保存的模型权重很小,适合资源有限的场景。
  • 缺点

    • 在某些场景下,LoRA 的性能可能不如全量参数微调,因为它只调整了部分参数。

3. QLoRA(Quantized Low-Rank Adaptation)

QLoRA 是 LoRA 的扩展版本,它结合了量化和低秩微调技术,进一步提高了效率。QLoRA 首先将预训练模型进行 4-bit 量化,以减少显存占用,然后在这个量化后的模型上应用 LoRA 微调。

  • 工作原理

    • 首先使用4-bit量化来减少模型的权重表示大小,减少显存占用。
    • 然后在量化模型上应用 LoRA 进行低秩矩阵微调,只对低秩矩阵进行训练,原始模型的权重保持不变。
  • 优点

    • 极大降低显存占用:通过量化和低秩微调,QLoRA 可以在大幅减少显存需求的同时保持较高的性能。
    • 更适合大模型微调:适合资源有限但需要微调大型语言模型的场景。
  • 缺点

    • 由于使用了量化,性能可能会有轻微的损失,尤其是在非常精确的任务上。

总结:

  • 全量参数微调:所有参数都被微调,计算和存储开销大,适用于资源充足且需要最大化模型性能的场景。
  • LoRA:通过插入低秩矩阵,减少了训练参数数量,显著节省资源,适合资源有限的场景。
  • QLoRA:在 LoRA 的基础上增加了4-bit量化,进一步减少显存和计算开销,适合极大规模模型的高效微调。

  • 部署
    • ![[Pasted image 20241001145502.png]]
    • ![[Pasted image 20241001145545.png]]
    • ![[Pasted image 20241001145629.png]]
    • ![[Pasted image 20241001145654.png]]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2182624.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

初步认识产品经理

产品经理 思考问题的维度 1️⃣为什么要抓住核心用户? 所有和产品有关系的群体就是用户,存在共性和差异了解用户的付费点,更好的优化产品是否使用:(目标用户-已使用产品:种子用户-尝鲜;核心用…

【Golang】深入解读Go语言中的错误(error)与异常(panic)

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

【Pyecharts】时间线柱状图x轴坐标重复出现并重叠

问题描述 如图右侧显示多的一列坐标 解决方案 降低pyecharts版本:pip install pyecharts2.0.5

ChatGPT与R语言融合技术在生态环境数据统计分析、绘图(回归和混合效应模型、多元统计分析)

自2022年GPT(Generative Pre-trained Transformer)大语言模型的发布以来,它以其卓越的自然语言处理能力和广泛的应用潜力,在学术界和工业界掀起了一场革命。在短短一年多的时间里,GPT已经在多个领域展现出其独特的价值…

vue2接入高德地图实现折线绘制、起始点标记和轨迹打点的完整功能(提供Gitee源码)

目录 一、申请密钥 二、安装element-ui 三、安装高德地图依赖 四、完整代码 五、运行截图 六、官方文档 七、Gitee源码 一、申请密钥 登录高德开放平台,点击我的应用,先添加新应用,然后再添加Key。 ​ 如图所示填写对应的信息&…

第十九章(自定义类型:结构体)

1. 结构体类型的声明 2. 结构体变量的创建和初始化 3. 结构成员访问操作符 4. 结构体内存对⻬ 5. 结构体传参 一、结构体类型的声明 1.1结构体的声明 struct student {int age;int id[10];char name[10]; };1.2 结构体变量的初始化 struct student {int age;char id[10…

YOLOv1代码复现(论文复现)

YOLOv1代码复现(论文复现) 本文所涉及所有资源均在传知代码平台可获取 文章目录 YOLOv1代码复现(论文复现)论文介绍主要内容实验部分卷积网络结构计算损失核心代码 缺点 论文介绍 该论文就是YOLOv1,YOLOv1是YOLO系列目…

大模型部署——NVIDIA NIM 和 LangChain 如何彻底改变 AI 集成和性能

DigiOps与人工智能 人工智能已经从一个未来主义的想法变成了改变全球行业的强大力量。人工智能驱动的解决方案正在改变医疗保健、金融、制造和零售等行业的企业运营方式。它们不仅提高了效率和准确性,还增强了决策能力。人工智能的价值不断增长,这从它处…

Ubuntu网卡配置

一、低阶版本配置网卡步骤:(如Ubuntu 16.04.2 LTS) 编辑配置文件interfaces,添加网卡配置信息 我这边以root用户登录进服务器,就不需要普通用户每次在命令前添加sudo vim /etc/network/interfaces 1.动态获取ip设置: auto ens3 # 网卡设备名称ens3 iface ens3 ine…

Tdesign TreeSelect 树形选择 多选

这里写自定义目录标题 小程序原生开发 Tdesign TreeSelect 树形选择 多选可以选择不同一级分类下的数据 小程序原生开发 Tdesign TreeSelect 树形选择 多选可以选择不同一级分类下的数据 TreeSelect 树形选择 在原demo基础上修改 const chineseNumber 一二三四五六七八九十.…

音视频入门基础:FLV专题(9)——Script Tag简介

一、SCRIPTDATA 根据《video_file_format_spec_v10_1.pdf》第75页到76页,如果某个Tag的Tag header中的TagType值为18,表示该Tag为Script Tag(脚本Tag,又称Data Tag、SCRIPTDATA tag)。这时如果Filter的值不为1表示未加…

昇思MindSpore进阶教程--使能图算融合

大家好,我是刘明,明志科技创始人,华为昇思MindSpore布道师。 技术上主攻前端开发、鸿蒙开发和AI算法研究。 努力为大家带来持续的技术分享,如果你也喜欢我的文章,就点个关注吧 正文开始 图算融合是MindSpore特有的网络…

十二生肖国庆姓氏专属头像

关注▲洋洋科创星球▲领取十二生肖国庆姓氏专属头像定制! 庆祝祖国75周年华诞,在这个举国欢庆的国庆节时刻,我们特别为您准备了一份独特的礼物——十二生肖国庆姓氏专属头像定制。 十二生肖,又称属相,是中国传统文化中…

Linux 安装redis主从模式+哨兵模式3台节点

下载 https://download.redis.io/releases/ 解压 tar -zxvf redis-7.2.4.tar.gz -C /opt chmod 777 -R /opt/redis-7.2.4/安装 # 编译 make # 安装, 一定是大写PREFIX make PREFIX/opt/redis-7.2.4/redis/ install配置为系统服务 cd /etc/systemd/system/主服务…

盒子是什么? -- 第四课

文章目录 前言一、盒子是什么?二、元素介绍1.边框 - border2.内边距 - padding3. 外边距属性 -- margin 三、拓展知识1.块元素垂直外边距的合并2. 嵌套块元素垂直外边距的合并 四、背景属性五、元素的浮动1.浮动2.清除浮动3.元素定位4. 特殊定位 -- 黏性定位5. z-in…

Python selenium库学习使用实操二

系列文章目录 Python selenium库学习使用实操 文章目录 系列文章目录前言一、模拟登录二、表单录入 前言 在上一篇文章中,我们完成Selenium环境的搭建,和简单的自动化。今天继续深入学习。今天的目标是完成模拟登录,和表单录入。 一、模拟登…

什么是网络准入控制系统?2024年有哪些好用的网络准入控制系统?

网络准入控制系统(Network Access Control, NAC)是一种网络安全解决方案,旨在确保只有符合特定安全策略的设备和用户才能访问网络资源。NAC系统通过在设备连接到网络之前对其进行身份验证、授权和健康状态检查,从而防止未经授权的…

YOLOv11改进 | 注意力篇 | YOLOv11引入GAM注意力机制

1.GAM介绍 摘要:为了提高各种计算机视觉任务的性能,人们研究了各种注意机制。然而,现有的方法忽略了保留通道和空间信息以增强跨维交互的重要性。因此,我们提出了一种通过减少信息减少和放大全球交互表示来提高深度神经网络性能的…

vue3 实现拖拽排序效果 sortablejs

效果图 依赖安装 npm i sortablejs -S <template><div class"warp"><div class"parent-box" v-for"pItem in sortData" :key"pItem.name"><h2 class"parent-name">{{ pItem.name }}</h2>&l…

程序计数器(学习笔记)

程序计数器是一块较小的内存空间&#xff0c;它的作用可以看做是当前线程所执行的字节码的信号指示器&#xff08;偏移地址&#xff09;&#xff0c;Java编译过程中产生的字节码有点类似编译原理的指令&#xff0c;程序计数器的内存空间存储的是当前执行的字节码的偏移地址 因为…