模型量化——NVIDIA——QAT

模型量化——NVIDIA——QAT

news2026/2/12 21:30:00

概述

QAT 截止目前（20230418）的CUDA 实现并不在pytorch 原生包中（不等同于pytorch 的QAT，它主要支持CPU），需要引入NVIDIA 的第三方包“pytorch-quantization”。需要TRT8+ 、 pytorch 1.8 +。主要流程如下：

工具流转方向如下：

所以目前我的理解+咨询了NVIDIA官方人员，当前仅仅下面支持的算子是INT8的：

QuantConv1d, QuantConv2d, QuantConv3d,

QuantConvTranspose1d, QuantConvTranspose2d, QuantConvTranspose3d

QuantLinear

QuantAvgPool1d, QuantAvgPool2d, QuantAvgPool3d,

QuantMaxPool1d, QuantMaxPool2d, QuantMaxPool3d

QuantAdaptiveAvgPool1d, QuantAdaptiveAvgPool2d, QuantAdaptiveAvgPool3d

C

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1996856.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【代码随想录】螺旋矩阵II

【代码随想录】螺旋矩阵II

本博文为代码随想录的学习笔记，原文链接：代码随想录题目原题链接：59. 螺旋矩阵 II 给你一个正整数 n ，生成一个包含 1 到 n^2 所有元素，且元素按顺时针顺序螺旋排列的 n x n 正方形矩阵 matrix 。示例 1&#xf…

阅读更多...

【Linux】lvm被删除或者lvm丢失了怎么办

【Linux】lvm被删除或者lvm丢失了怎么办

模拟案例接下来模拟lvm误删除如何恢复的案例： 模拟删除： 查看vg名： vgdisplayvgcfgrestore --list uniontechos #查看之前的操作例如我删除的，现场没有删除就用最近的操作文件： 还原： vgcfgrestore…

阅读更多...

1Panel应用推荐：KubePi开源Kubernetes管理面板

1Panel应用推荐：KubePi开源Kubernetes管理面板

1Panel（github.com/1Panel-dev/1Panel）是一款现代化、开源的Linux服务器运维管理面板，它致力于通过开源的方式，帮助用户简化建站与运维管理流程。为了方便广大用户快捷安装部署相关软件应用，1Panel特别开通应用商店&am…

阅读更多...

扩展02：Haporxy+Keepalived+Mysql高可用集群实战

扩展02：Haporxy+Keepalived+Mysql高可用集群实战

由于这个架构和扩展01的大致步骤都相同，就不讲解了。看如下图再参考扩展01即可。

阅读更多...

用C语言实现链式存储结构万字

用C语言实现链式存储结构万字

各位同学，大家好，我叫小敖。今天给大家分享数据结构之一链式存储结构，下面是对链表简单介绍，希望大家能理解。链表介绍链表是一种物理存储单元上非连续、非顺序的存储结构**，数据元素的逻辑顺序是通过链表中的指针链…

阅读更多...

大模型快速部署，以浪潮源2.0为例

大模型快速部署，以浪潮源2.0为例

step1: 申请PAI-DSW试用 step2：魔塔社区授权由于本地授权一直失败，于是采用了魔塔免费平台实例进行学习。搭建好之后，打开就有相关页面了： demo搭建： 按照官方提示的步骤进行搭建，内容如下：…

阅读更多...

第二十一节、敌人追击状态的转换

第二十一节、敌人追击状态的转换

一、物理检测中的Boxcast 1、检测敌人Bool 当不知道一个函数的返回值是什么的时候定义一个var变量就知道了二、状态切换 1、switch用法 2、新的语法糖写法

阅读更多...

ubuntu2004上的glib编译教程

ubuntu2004上的glib编译教程

最近因为工作需要编译glib，写文章记录一下编译流程。从launchpad上下载源码：链接根据control文件的提示安装对应的依赖然后尝试debuild，这里会编译不过出去，不过debuild会自动生成一些编译文件，不要删除。接下来…

阅读更多...

2024云南导游资格证题库

2024云南导游资格证题库

1、释迦三圣是( )。 A、药师佛 B、文殊菩萨 C、释迦牟尼 D、普贤菩萨 E、观音菩萨答案：BCD 2、下列女士套裙穿法中，错误的是（ ）。 A、上衣的袖长不超过着装者的手腕，裙子不盖过脚踝 B、女士在正式场合穿…

阅读更多...

八、MyBatis

八、MyBatis

一、MyBatis介绍 MyBatis 是持久层框架，它支持自定义 SQL、存储过程以及⾼级映射。MyBatis 去除了几乎所有的 JDBC 代码以及设置参数和获取结果集的工作。MyBatis 可以通过简单的 XML 或注解来配置和映射原始类型、接口和 Java POJO（Plain Old Java Obj…

阅读更多...

数据结构--第七天

数据结构--第七天

递归 -递归的概念递归其实就是一种解决问题的办法，在C语言中：递归就是函数自己调用自己 -递归的思想递归的思考方式就是把大事化小的过程递归的递就是递推的意思，归就是回归的意思 （递归是少量的代码完成大量的运算&#xff09…

阅读更多...

数据结构(5.5_2)——并查集

数据结构(5.5_2)——并查集

逻辑结构——数据元素之间的逻辑关系并查集： 并查集（Union-Find）是一种树型的数据结构，用于处理一些不交集的合并及查询问题。它支持两种操作： 用双亲表示存储并查集首先将所有根节点数组值设为-1，其…

阅读更多...

[Android] [解决]Bottom Navigation Views Activity工程带来的fragment底部遮盖的问题

[Android] [解决]Bottom Navigation Views Activity工程带来的fragment底部遮盖的问题

创建了Bottom Navigation Views Activity之后，在fragment_home.xml，加了一个RecyclerView， 后来添加了item之后发现底部会被盖住一部分。解决：在layout里面加两句： android:paddingBottom"?attr/actionBarSize&…

阅读更多...

C#获取Network的相关信息

C#获取Network的相关信息

1，获取网络的通断。 //方法1：无效果，并不能反映当前网络通断 bool availableSystem.Windows.Forms.SystemInformation.Network//方法2：通过VB获取网络状态，可反映当前网络通断 Microsoft.VisualBasic.Devices.Network…

阅读更多...

Qt QML 使用QPainterPath绘制弧形曲线和弧形文本

Qt QML 使用QPainterPath绘制弧形曲线和弧形文本

Qt并没有相关api直接绘制弧形文字，但提供了曲线绘制相关类，所以只能另辟蹊径，使用QPainterPath先生成曲线，然后通过曲线上的点来定位每个文字并draw出来。 QML具体做法为从QQuickPaintedItem继承，在派生类中实现paint…

阅读更多...

Linux 系统框架分析（一）

Linux 系统框架分析（一）

一、linux内核结构框图对内核结构框图有个总体的把握，有助于理解为什么驱动要这样写，为什么写的应用程序所用的C库接口能够产生这么多的事情。框图可以看出来，linux系统，包括五个系统一、Linux内核结构介绍 Linux 内核是操作…

阅读更多...

【机器学习基础】线性回归

【机器学习基础】线性回归

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈Python机器学习 ⌋ ⌋ ⌋ 机器学习是一门人工智能的分支学科，通过算法和模型让计算机从数据中学习，进行模型训练和优化，做出预测、分类和决策支持。Python成为机器学习的首选语言，…

阅读更多...

Flutter 生成图表（fl_chart）

Flutter 生成图表（fl_chart）

Flutter 图表使用fl_chart 先看最终效果实现抖音’使用管理助手’效果需求分析：统计每个用户近7天每天的使用时长（从当天往后推导，假设今天周二），单位为分钟或者小时，根据平均时长决定技术选型&…

阅读更多...

Python基于TensorFlow实现卷积神经网络-双向长短时记忆循环神经网络回归模型(CNN-BiLSTM回归算法)项目实战

Python基于TensorFlow实现卷积神经网络-双向长短时记忆循环神经网络回归模型(CNN-BiLSTM回归算法)项目实战

说明：这是一个机器学习实战项目（附带数据代码文档视频讲解），如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景随着深度学习技术的发展，尤其是卷积神经网络（Convolutional Neural Networks, …

阅读更多...

Android Studio 连接手机进行调试

Android Studio 连接手机进行调试

总所周知，Android Studio里的虚拟手机下载后又大又难用。不如直接连手机用。本篇文章主要内容为Android Studio怎么连接手机进行程序调试。 1. 在AndroidSDK中下载google USB Driver: 2. 连接手机： 进入电脑设备管理器界面。并点开便携设备&#xff0c…

阅读更多...

推荐文章

最新文章