大模型入门

news2025/4/26 13:10:04

大模型

一般指1亿以上参数的模型，目前万亿级参数以上的模型也有了。

参数大小

175B、60B、540B等，这些一般指参数的个数，B是Billion/十亿的意思，175B是1750亿参数，这是ChatGPT大约的参数规模。

显存占用

6B的大模型，FP16精度进行微调大约需要14GB显存，而INT4量化后只需要7GB显存。
34B的大模型需要20GB以上的显存才能部署和推理，因此34B这个大小差不多是单机能部署的最大上限的模型。

模型精度

格式	符号位	指数位	小数位	总数位
FP64	1	11	52	64
FP32	1	8	23	32
TF32	1	8	10	19
BF16	1	8	7	16
FP16	1	5	10	16
FP8 E4M3	1	4	3	8
FP8 E5M2	1	5	2	8
FP4	1	2	1	4

浮点数精度：双精度（FP64）、单精度（FP32、TF32）、半精度（FP16、BF16）、8位精度（FP8）、4位精度（FP4、NF4）
量化精度：INT8、INT4 （也有INT3/INT5/INT6的）
多精度：是指用不同精度进行计算，在需要使用高精度计算的部分使用双精度，其他部分使用半精度或单精度计算。
混合精度：是在单个操作中使用不同的精度级别，从而在不牺牲精度的情况下实现计算效率，减少运行所需的内存、时间和功耗

大模型综述：

https://arxiv.org/abs/2303.18223
在这里插入图片描述

大模型结构

在这里插入图片描述

大模型显卡需求

在这里插入图片描述

大模型优化参数

在这里插入图片描述

LLaMA训练

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1451419.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

大模型入门

大模型

参数大小

显存占用

模型精度

大模型综述：

大模型结构

大模型显卡需求

大模型优化参数

LLaMA训练

相关文章

多模态基础--- word Embedding

[java基础揉碎]二维数组

第5个-模糊加载

Java 基于 SpringBoot+Vue 的校园交友网站，附源码

同学，请实现一个扫码登录

optee imx8mm

Istio复习总结：xDS协议、Istio Pilot源码、Istio落地问题总结

不同AI分析错误代码的差异：谁更胜一筹？谁才是最强者？结果出乎意料！

制作怎么自己搭建一个网站

Java 和 JavaScript 的奇妙协同：语法结构的对比与探索（上）

FuckIt.py库让你的代码从此远离bug

无心剑中译莎士比亚《劝君缔结连理枝》

BUGKU-WEB bp

scIMC：scRNA-seq插补方法基准

彻底理解无刷电机

ch3-homework-基于InternLM和LangChain搭建自己的知识库

【Day42】代码随想录之动态规划0-1背包_416. 分割等和子集

Android---Jetpack Compose学习006

C++数据结构与算法——双指针法

0901多元函数的基本概念-多元函数微分法及其应用