8.transformers量化

8.transformers量化

news2025/6/29 21:52:18

Transformers 核心设计Auto Classes

Transformers Auto Classes 设计：统一接口、自动检索

AutoClasses 旨在通过全局统一的接口 from_pretrained() ，实现基于名称（路径）自动检索预训练权重（模
型）、配置文件、词汇表等所有与模型相关的抽象。

请添加图片描述

灵活扩展的配置AutoConfig

transformers.AutoConfig 类实例化通常由from_pretrained(pretrained_model_name_or_path, ) 方法完成。
Transformers 根据配置中的 model_type 加载预定义配置，兜底方案是基于模型名称/路径自动推断。

自动化模型管理 AutoModel

transformers.AutoModel 类实例化通常由from_pretrained() 或 from_config() 方法完成。
换句话说，Transformers 可以从预训练模型文件或配置中完成模型加载。

请添加图片描述

通用分词器 AutoTokenizer

transformers.AutoModel 类实例化通常由from_pretrained(pretrained_model_name_or_path) 方法完成。
Transformers 同样是优先基于 model_type 来自动匹配 Tokenizer，兜底方案是基于模型名称/路径自动推断

Transformers 模型量化 Quantization

模型量化技术

量化（Quantization）技术专注于用较少的信息表示数据，同时尽量不损失太多准确性。
具体来说，量化会将模型参数使用的数据类型，转换为更少位数表示，并尽可能达到相同信息的效果。
例如，假设您的模型权重原始以32位（32-bit）浮点数（Float32）存储。

如果将它们量化为16位（16-bit）浮点数（Float16），则可以将模型大小减半。换句话说，仅需要一半的 GPU 显存即可加载量化后的模型。
如果将模型量化为8位（8-bit）整数（Int8），则大约只需要四分之一的显存开销。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1813629.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

uniapp地图自定义文字和图标

uniapp地图自定义文字和图标

这是我的结构： <map classmap id"map" :latitude"latitude" :longitude"longitude" markertap"handleMarkerClick" :show-location"true" :markers"covers" /> 记住别忘了在data中定义变量…

阅读更多...

pip 配置缓存路径

pip 配置缓存路径

在windows操作平台，默认情况，pip下使用的系统目录 C:\Users\用名名称\AppData\Local\pip C盘是系统盘，如果常常使用pip安装会占用大量的空间很快就满，这时候就有必要变更一下缓存保存路径了。 pip 配置缓存路径： Win…

阅读更多...

【NoSQL数据库】Redis Cluster集群（含redis集群扩容脚本）

【NoSQL数据库】Redis Cluster集群（含redis集群扩容脚本）

Redis Cluster集群 Redis ClusterRedis 分布式扩展之 Redis Cluster 方案功能数据如何进行存储 redis 集群架构集群伸缩向集群中添加一个新的master节点，并向其中存储 num10 .脚本对redis集群扩容缩容，脚本参数为redis集群，固定从6001移动200…

阅读更多...

创建第一个Springboot项目HelloWorld

创建第一个Springboot项目HelloWorld

目录一、准备工作一、创建springboot项目三、使用git上传到代码仓库gitee 四、git使用过程问题总结一、准备工作安装jdk：8u201（可以使用高一点的版本） jdk所有版本下载：Java Archive | Oracle 安装maven：不用…

阅读更多...

Kafka生产者消息发送流程原理及源码分析

Kafka生产者消息发送流程原理及源码分析

Kafka是一个分布式流处理平台，它能够以极高的吞吐量处理数据。在Kafka中，生产者负责将消息发送到Kafka集群，而消费者则负责从Kafka集群中读取消息。本文将探讨Kafka生产者消息发送流程的细节，包括消息的序列化、分区分配、记录提交等关键步骤。先看一个生产者发送消息的代…

阅读更多...

【五】Linux软件仓库Yum源--SSH远程控制--SCP远程传输

【五】Linux软件仓库Yum源--SSH远程控制--SCP远程传输

RPM（红帽软件包管理器） RPM建立统一的数据库文件，记录软件信息并分析依赖关系。目前RPM的优势已经被公众所认可，使用范围也已不局限在红帽系统中了。常见RPM命令如下： 安装软件 rpm -ivh file…

阅读更多...

$数据结构（DS）学习笔记（二）：数据类型与抽象数据类型$

数据结构（DS）学习笔记（二）：数据类型与抽象数据类型

参考教材：数据结构C语言版（严蔚敏，杨伟民编著） 工具：XMind、幕布、公式编译器正在备考，结合自身空闲时间，不定时更新，会在里面加入一些真题帮助理解数据结构目录 1.1数据…

阅读更多...

【DevOps】什么是容器 - 一种全新的软件部署方式

【DevOps】什么是容器 - 一种全新的软件部署方式

目录引言一、什么是容器二、容器的工作原理三、容器的主要特性四、容器技术带来的变革五、容器技术的主要应用场景六、容器技术的主要挑战七、容器技术的发展趋势引言在过去的几十年里,软件行业经历了飞速的发展。从最初的大型机时代,到后来的个人电脑时代,…

阅读更多...

neo4j 3.5.5版本创建新的数据库

neo4j 3.5.5版本创建新的数据库

neo4j 3.5.5版本创建新的数据库 1.找到neo4j的conf文件点进去 2.点击neo4j.conf 选择记事本打开 3.把graph.db换成自己想要创建的数据库名称 4.打开neo4j服务出现新的数据库

阅读更多...

信息系统项目管理师0151：输出（9项目范围管理—9.4收集需求—9.4.3输出）

信息系统项目管理师0151：输出（9项目范围管理—9.4收集需求—9.4.3输出）

点击查看专栏目录文章目录 9.4.3 输出9.4.3 输出需求文件需求文件描述各种单一需求将如何满足项目相关的业务需求。一开始可能只有高层级的需求，然后随着有关需求信息的增加而逐步细化。只有明确的（可测量和可测试的）、可跟踪的、完整的、相互协调的，且主要干系人愿意认…

阅读更多...

FreeRTOS学习笔记-基于stm32（14）内存管理

FreeRTOS学习笔记-基于stm32（14）内存管理

一、FreeRTOS 内存管理简介 FreeRTOS有两种方法来创建任务，队列，信号量等，一种动态一种静态。静态方法需要手动定义任务堆栈。使用动态内存管理的时候 FreeRTOS 内核在创建任务、队列、信号量的时候会动态的申请 RAM。我们在移植FreeRTOS时可…

阅读更多...

采用java+springboot+vue+uniapp自主研发的智慧城管源码，城管综合执法平台源代码

采用java+springboot+vue+uniapp自主研发的智慧城管源码，城管综合执法平台源代码

智慧城管执法平台源码，PCAPP端全套源码，城管综合执法系统源码。智慧城管系统拥有自主版权，项目落地案例，有演示，适合二次开发项目使用。智慧城管执法系统旨在提高城市管理效率，涵盖了城市管理中的很多业务…

阅读更多...

RabbitMQ从入门到入土

RabbitMQ从入门到入土

同步与异步同步调用优势： 时效性强，等到结果后就返回问题： 扩展性差性能下降级联失败问题异步调用优势： 耦合度低，扩展性强无需等待，性能好故障隔离，下游服务故障不影响上游缓…

阅读更多...

探索乡村振兴新模式：发挥科技创新在乡村振兴中的引领作用，构建智慧农业体系，助力美丽乡村建设

探索乡村振兴新模式：发挥科技创新在乡村振兴中的引领作用，构建智慧农业体系，助力美丽乡村建设

随着科技的不断进步，乡村振兴工作正迎来前所未有的发展机遇。科技创新作为推动社会发展的重要力量，在乡村振兴中发挥着越来越重要的引领作用。本文旨在探讨如何发挥科技创新在乡村振兴中的引领作用，通过构建智慧农业体系，助力美丽…

阅读更多...

汉语翻译藏语的软件，有3款宝藏软件！

汉语翻译藏语的软件，有3款宝藏软件！

在数字化飞速发展的今天，语言不再是沟通的障碍。对于想要学习藏语或需要与藏区人民交流的朋友们来说，一款优质的汉语翻译藏语的软件无疑是一大福音。那么，市面上究竟有哪些值得推荐的汉语翻译藏语的软件呢？接下来，就让…

阅读更多...

PostgreSQL 快速入门与实战

PostgreSQL 快速入门与实战

1、概述前面2篇博客给大家详细的介绍了PostgreSQL的安装和配置，本篇文章就带着大家一起学习一下PostgreSQL的用法，主要内容包括基本的数据库操作、用户管理、数据备份、SCHEMA(模式)以及和MySQL的区别。 2、数据库基本操作 PostgreSQL是严格遵守SQL规…

阅读更多...

C# Winform内嵌窗体(在主窗体上显示子窗体)

C# Winform内嵌窗体(在主窗体上显示子窗体)

在开发Winform项目中，经常会要切换不同的窗体。通常程序都有一个主窗体，在切换窗体时往往需要关闭其他子窗体，这个实例就来介绍MDI主窗体内嵌子窗体的实现方法。 MDI主窗体要设置一个比较重要的属性，IsMdiContainertrue。子窗体的…

阅读更多...

boost asio异步服务器（3）增加发送队列实现全双工通信

boost asio异步服务器（3）增加发送队列实现全双工通信

增加发送节点构造发送节点，管理发送数据。发送节点的类如下。这个发送节点用于保证发送和接收数据的有效性。增加发送队列前边实现的是一个简单的echo服务器，也就是服务器将收到的内容发送给对应的客户端。但是在实际的服务器设计中，服务…

阅读更多...

苹果WWDC 2024 带来的 AI 风暴：从生产力工具到个人助理，AI 将如何融入我们的生活？

苹果WWDC 2024 带来的 AI 风暴：从生产力工具到个人助理，AI 将如何融入我们的生活？

2024年6月5日，苹果WWDC 2024全球开发者大会如约而至，带来了众多令人兴奋的新功能和新产品。其中，AI 技术的全面融入无疑是最引人注目的亮点。从 iOS、iPadOS 到 macOS，再到 Siri 和开发者工具，苹果正在将 AI 融入到其生…

阅读更多...

数字孪生技术推动希腊水务系统的技术进步

数字孪生技术推动希腊水务系统的技术进步

OpenFlows 提供的数字孪生技术将科扎尼供水渗漏的响应时间缩短了 50% 引领希腊供水管理改革新冠疫情之后，希腊制定国家经济复苏计划，旨在推动能源改革、数字化和现代化，作为计划的一部分，希腊正试图实现可持续的给排水管理&…

阅读更多...

推荐文章

最新文章