【LLM】大模型微调,压缩,量化,部署(还在缓慢更新

news2024/11/17 7:55:14

前段时间很忙一直没时间follow最近的大模型工作,最近几天闲一点了…这个可能会出现整理不全或者是结果没跑完的情况,我尽量快一点(如果最近没啥事的话),有啥想法可以在评论区d一下我。
LLM排行榜 : https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
可能有一些解读有些的不清楚的地方,这一篇也可以当做是评论帖(轻点骂

一. 微调

1.1 Adapter Tuning

Parameter-Efficient Transfer Learning for NLP
【代码参考】https://github.com/Adapter-Hub/adapter-transformers
【论文】Adapter Tuning
【论文解读】https://zhuanlan.zhihu.com/p/626819173

1.2 Prefix Tuning

【官方代码】https://github.com/XiangLi1999/PrefixTuning
【论文】https://aclanthology.org/2021.acl-long.353.pdf
【代码解读】https://blog.csdn.net/weixin_50862344/article/details/133947019

1.3Prompt Tuning

【官方代码】https://github.com/kipgparker/soft-prompt-tuning
【论文】https://aclanthology.org/2021.emnlp-main.243.pdf
【代码解读】https://blog.csdn.net/weixin_50862344/article/details/133953048

1.4 P-Tuning

P-Tuning一共是两篇工作

1.4.1 GPT Understands, Too

【官方代码】https://github.com/THUDM/P-tuning
【论文】https://arxiv.org/pdf/2103.10385v1.pdf
【代码解读】

1.4.2 P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Tasks

【官方代码】https://github.com/thudm/p-tuning-v2
【论文】https://arxiv.org/pdf/2110.07602v3.pdf
【代码解读】来自知乎 : https://zhuanlan.zhihu.com/p/423902902

1.5 LoRA

【论文解析】https://blog.csdn.net/weixin_50862344/article/details/130450277

1.6 AdaLoRA

1.7 BitFit

1.8 MAM Adapter

1.9 UniPELT

【知乎解析】https://zhuanlan.zhihu.com/p/618894319

二. 量化

2.1 量化基础知识
2.1.1 常见数值表示方式

  • Float32 (FP32) :标准的 IEEE 32 位浮点表示,指数 8 位,尾数 23 位,符号 1
    位,可以表示大范围的浮点数。大部分硬件都支持 FP32 运算指令。
  • Float16 (FP16) :指数 5 位,尾数 10 位,符号 1 位。 FP16 数字的数值范围远低于 FP32,存在上溢 (当用于表示非常大的数时) 和下溢 (当用于表示非常小的数时) 的风险,通过缩放损失 (loss scaling) 来缓解这个问题。
  • Bfloat16 (BF16):指数 8 位 (与 FP32相同),尾数 7 位,符号 1 位。这意味着 BF16 可以保留与 FP32 相同的动态范围。但是相对于 FP16,损失了 3位精度。因此,在使用 BF16 精度时,大数值绝对没有问题,但是精度会比 FP16 差。
  • TensorFloat-32(TF32) :使用19 位表示,结合了 BF16 的范围和 FP16的精度,是计算数据类型而不是存储数据类型。目前使用范围较小。
    【参考】https://zhuanlan.zhihu.com/p/627436535
    在这里插入图片描述
  1. Quant

  2. INT8
    【代码仓库】https://github.com/TimDettmers/bitsandbytes
    【代码测试】使用int8训练bert

  3. QLoRA
    【论文解读】https://blog.csdn.net/weixin_50862344/article/details/133917723
    【测试】

  4. GPTQ
    【代码仓库】官方代码 和 Llama上使用GPTQ

https://paperswithcode.com/paper/bitnet-scaling-1-bit-transformers-for-large
6.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1117963.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Labview2023安装教程 (最新最详细保姆级教程)

目录 一 .简介 二.安装步骤 软件:Labview版本:2023语言:简体中文大小:2.73G安装环境:Win11/Win10/Win8/Win7硬件要求:CPU2.6GHz 内存8G(或更高)下载通道①百度网盘丨下载链接: htt…

【趣味随笔】盘点国内外做双足机器人的公司

📢:如果你也对机器人、人工智能感兴趣,看来我们志同道合✨ 📢:不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 📢:文章若有幸对你有帮助,可点赞 👍…

大数据精准营销告诉你如何找到对的人?

如今,朋友圈广告已经“稀松平常”,而用户接收到什么样的商品广告,则基本取决于平日里对微信的使用习惯。无独有偶,淘宝、京东等电商平台在网页中弹出的定向品类广告,也是大数据基于用户对于某一商品的搜索行为。 可见&…

RK3568驱动指南|第七期-设备树-第58章 实例分析:时钟

瑞芯微RK3568芯片是一款定位中高端的通用型SOC,采用22nm制程工艺,搭载一颗四核Cortex-A55处理器和Mali G52 2EE 图形处理器。RK3568 支持4K 解码和 1080P 编码,支持SATA/PCIE/USB3.0 外围接口。RK3568内置独立NPU,可用于轻量级人工…

laravel框架介绍(一)

laravel框架是一套简洁,优雅的PHPWeb开发框架。

蓝鹏精准测量系统 助力圆钢负公差轧制

关键字: 钢材下差生产, 负公差轧制, 负公差带肋钢筋, 盘螺负公差率, 成品负公差范围 负公差轧制是指很多产品是按照尺寸公差交货。如果产品公差标或厂标,则可认为产品尺寸精度满足交货要求。 根据国家标准GB/T702-2008《钢材冷拔、冷拉和冷拔锻造用圆钢》的规定&…

免费旋转视频

上一篇:安卓开发测试用视频链接分享了几个免费的视频链接。 平时解bug,测试同事拍的视频,方向可能是倒着的。怎么把视频旋转到正确的方向了?分享一种免费的方法。 下载windows movie maker,下载地址:https://www.top…

JAVA基础-String StringBuffer 和 StringBuilder 类(9)

目录 String创建字符串字符串长度连接字符串创建格式化字符串String 方法 **StringBuilder**StringBuffer String 创建字符串 String s1 "Runoob"; // String 直接创建 String s2 "Runoob"; // String 直接创建 String s3 s…

王道计算机考研 操作系统学习笔记 + 完整思维导图篇章三: 内存管理

目录 内存管理概念 内存的基础知识 什么是内存?有何作用? 补充知识:几个常用的数量单位 指令的工作原理 三种装入方式 绝对装入 可重定位装入 动态重定位 从写程序到程序运行 链接的三种方式 总结 内存管理的概念 内存保护 内存空间的扩充 覆盖技…

创新智能环境带来无线通信与感知的新视角

编者按:2023年是微软亚洲研究院建院25周年。25年来,微软亚洲研究院探索并实践了一种独特且有效的企业研究院的新模式,并以此为基础产出了诸多对微软公司和全球社会都有积极影响的创新成果。一直以来,微软亚洲研究院致力于创造具有…

【java零基础入门到就业】第三天:HelloWorld程序的常见问题和java环境变量的配置

1、java编写程序的常见问题 1.1、 BUG的由来 BUG的由来: "Bug"一词最初是用来形容计算机系统中的硬件故障或软件错误的。据说这个词最早出现在1947年,由于一只飞蛾飞进了哈佛大学的马克Ⅱ计算机中,导致计算机出现故障。后来&#…

仿第八区2023年app免签封装/苹果签名/分发平台系统

描述 封装应用程序直接通过访问数据来操作,直接像网页直接打开一样被访问,这与h5连接访问相同,所以封装应用程序的大部分也在网页端被h5系统封装,从而控制了网页访问手机的硬件参数和手机的权限控制。封装app基本上是以h5页面的格…

(零基础学习)Neo4j+Spring boot 自行定义属性

前置知识 1.Neo4j :属性 节点和关系都可以设置自己的属性。 属性是由Key-Value键值对组成,键名是字符串。属性值是要么是原始值,要么是原始值类型的一个数组。比如String,int和iint[]都是合法的。 注意 null不是一个合法的属性值。 Nulls能…

建筑模板的厚度对价格有多大影响?

建筑模板的厚度对价格有一定的影响,以下是关于建筑模板厚度对价格影响的一些信息: 1. 厚度与价格的关系: - 建筑模板的厚度越大,通常价格也会相应增加。这是因为生产厚度较大的模板需要更多的原材料和工艺成本。 - 厚度较薄的建筑…

Virtualbox Manjaro kde虚拟机系统闪烁

过程 https://blog.csdn.net/weixin_44220976/article/details/133954801 有次更新了Manjaro虚拟机系统之后发生闪烁 • 不操作不闪烁 • 鼠标光标悬浮到桌面的文件、文件夹上,所有文件、文件夹图标消失,变成: 只有悬浮位置有个半透明的框 …

股票价格预测 | Python实现基于LSTM的股票预测模型(keras)

文章目录 效果一览文章概述模型描述源码设计参考资料效果一览 文章概述 今儿举一个案例,围绕 LSTM(Long Short-Term Memory)神经网络的原理,展示如何使用Python和深度学习库Keras构建LSTM模型,以及如何使用这个模型来预测时间序列数据。 以股票价格预测为例,这是LSTM在金…

LABVIEW 安装教程(超详细)

目录 LabVIEW2017(32/64位)下载地址: 一 .简介 二.安装步骤: LabVIEW2017(32/64位)下载地址: 链接: https://pan.baidu.com/s/1eSGB_3ygLNeWpnmGAoSwcQ 密码:gjrk …

DataX-web安装部署和使用

DataX-web的环境准备 MySQL (5.5) 必选,对应客户端可以选装, Linux服务上若安装mysql的客户端可以通过部署脚本快速初始化数据库 JDK (1.8.0_xxx) 必选 DataX 必选 Python (2.x) (支持Python3需要修改替换datax/bin下面的三个python文件,替换文件在do…

图书教材经营小程序商城的作用是什么

线下图书教材店非常多,在以前线下店是学生、学者们经常去的场所,每到周末人流不绝,但随着互联网发展以及客户消费升级,如今线下书店人流量非常少,除了头部品牌可以支撑外,中小品牌几乎很难生存。 同时加之…

智慧公厕:打造无人值守的公共厕所运营管理服务

智慧公厕是在"厕所革命"的背景下产生的物联网应用解决方案,结合物联网高精尖技术的中期科技智慧厕所,是智慧城市公共厕所应用解决方案的代表。它提供了一系列监测应用功能,包括监测公厕内部人体活动状态、人体存在状态、空气质量情…