2.1 对称量量化和非对称量化

news2025/1/11 18:02:55

前言

int8的数据范围可以表示为-128到127之间的整数
uint8的数据范围可以表示为0到255之间的整数
注释:int8就是用8个比特位来保存整数,第一位用来表示符号。uint8表示无符号整数,没有符号位,8个比特位全部用来表示整数。

1.问题

1.1 引出问题

截断的数值最后反量化与原数值相差较大(1.62与1.1062843),如何解决该问题?
方法一:偏移–非对称量化
方法第二:最大绝对值对称法–对称量化

1.2 非对称量化

原理分析

动态范围量化(Dynamic Range Quantization)中的校准过程(Calibration)。它属于非对称量化的一种形式。由于量化参数(比如量化因子Scale)是通过数据集的统计量来估计的,因此称之为动态范围量化。它能够减少量化误差的原因是,引入了一个偏移量Z,使得量化后的数值在更小的范围内,进而减小量化误差。同时,偏移量Z的计算使得量化后的最大值Rmax落在了Qmax上,保证了最大值的精度。

动态范围量化

通过引入偏移量Z可以解决。具体公式如下:
在这里插入图片描述
其中,为什么偏移量Z的公式是这样定义呢?
可以看TensorRT量化第二课:对称量化与非对称量化的2.3.2 偏移量Z

代码

import numpy as np

def saturete(x, int_max, int_min):
    return np.clip(x, int_min, int_max)

def scale_z_cal(x, int_max, int_min):
    scale = (x.max() - x.min()) / (int_max - int_min)
    z = int_max - np.round((x.max() / scale))
    return scale, z

def quant_float_data(x, scale, z, int_max, int_min):
    xq = saturete(np.round(x/scale + z), int_max, int_min)
    return xq

def dequant_data(xq, scale, z):
    x = ((xq - z)*scale).astype('float32')
    return x

if __name__ == "__main__":
    np.random.seed(1)
    data_float32 = np.random.randn(3).astype('float32')
    int_max = 127
    int_min = -128
    print(f"input = {data_float32}")

    scale, z = scale_z_cal(data_float32, int_max, int_min)
    print(f"scale = {scale}")
    print(f"z = {z}")
    data_int8 = quant_float_data(data_float32, scale, z, int_max, int_min)
    print(f"quant_result = {data_int8}")
    data_dequant_float = dequant_data(data_int8, scale, z)
    print(f"dequant_result = {data_dequant_float}")
    
    print(f"diff = {data_dequant_float - data_float32}")

输出如下:

input = [ 1.6243454 -0.6117564 -0.5281718]
scale = 0.008769026924582089
z = -58.0
quant_result = [ 127. -128. -118.]
dequant_result = [ 1.62227    -0.6138319  -0.52614164]
diff = [-0.00207543 -0.00207549  0.00203013]

首先输入数组不变为[ 1.6243454 -0.6117564 -0.5281718],还是需要将其量化到int8范围即[-128 127],scale还是0.008769,z根据公式计算为-58,量化后的结果为[127 -128 -118],反量化后的结果为[ 1.62227 -0.6138319 -0.52614164],偏差为[-0.00207543 -0.00207549 0.00203013],可以看到加入了Z偏移量后的误差明显减小了。

通过引入偏移量Z,我们可以将量化后的数值范围向中心偏移,从而在整个量化数值范围内分布得更加均匀,减小了误差得积累。虽然最终仍然会有截断操作,但是这种偏移可以在整个数值分布上起到更好得平衡作用,从而减小了误差的影响。

1.3 对称量化

相关知识

对称量化是一种量化方法,其中量化步长在正负之间对称,即使得所有值域范围内的数据点都在对称轴的两侧,这样可以避免出现由于量化导致的误差。

在之前的非对称量化中我们通过引入偏移量Z的方式解决量化过程中值域截断的问题,那么还有没有其它的方式呢?
还是考虑原始数组[1.6243454 -0.6117564 -0.5281718],需要将其量化到int8范围即[-128,127],考虑对称量化,我们在原始数组中虚拟添加一个值,该值的大小为原始数组R中绝对值最大值的那个数的相反数,为了实现对称嘛,例如上述数组中添加的值就是-1.6243454,那么现在的输入数组就变成了[-1.6243454 -0.6117564 -0.5281718 1.6243454],同时考虑对称,我们将其量化到[-127,127]范围内(实际工程量化用的时候不会考虑-128),对称量化的计算公式如下:
在这里插入图片描述

代码

import numpy as np

def saturete(x):
    return np.clip(x, -127, 127)

def scale_cal(x):
    max_val = np.max(np.abs(x))
    return max_val / 127

def quant_float_data(x, scale):
    xq = saturete(np.round(x/scale))
    return xq

def dequant_data(xq, scale):
    x = (xq * scale).astype('float32')
    return x

if __name__ == "__main__":
    np.random.seed(1)
    data_float32 = np.random.randn(3).astype('float32')
    print(f"input = {data_float32}")

    scale = scale_cal(data_float32)
    print(f"scale = {scale}")

    data_int8 = quant_float_data(data_float32, scale)
    print(f"quant_result = {data_int8}")
    data_dequant_float = dequant_data(data_int8, scale)
    print(f"dequant_result = {data_dequant_float}")

    print(f"diff = {data_dequant_float - data_float32}")

输出如下:

input = [ 1.6243454 -0.6117564 -0.5281718]
scale = 0.012790121431425801
quant_result = [127. -48. -41.]
dequant_result = [ 1.6243454 -0.6139258 -0.524395 ]   
diff = [ 0.         -0.00216943  0.00377679]

对称量化方法不用计算偏移量Z,计算量小,是一种非饱和量化。在对称量化中还存在一个问题,比如目前原始数组中有1000个点分布在[-1,1]之间,突然有个离散点分布在100处,此时做对称量化时Scale会被调整得很大,使得上下限超出[-127,127]的范围,从而导致量化误差增大,对精度的影响也会相应增大。

因此,在对称量化中,需要谨慎处理数据中的极端值,以免对量化精度造成不利影响。因此,需要动态选择范围来去除离散点,让max的选取更加的合理。

1.4 对称量化 vs 非对称量化

对称量化的优点:

  • 没有偏移量,可以降低计算量
  • 分布在正负半轴的权值数值均可被充分利用,具有更高的利用率;
  • 对于深度学习模型,可以使用int8类型的乘法指令进行计算,加快运算速度;
  • 能够有效的缓解权值分布在不同范围内的问题。

对称量化的缺点:

  • 对于数据分布在0点附近的情况,量化的位数可能不够;
  • 数据分布的范围过于分散,如果缺乏优秀的统计方法和规律,会导致量化效果不佳。

非对称量化的优点:

  • 通过偏移量可以保证量化数据分布在非负数范围内,可以使得分辨率更高;
  • 适合数据分布范围比较集中的情况。

非对称量化的缺点:

  • 对于偏移量的计算需要额外的存储空间,增加了内存占用;
  • 偏移量计算需要加减运算,会增加运算的复杂度;
  • 对于深度学习模型,要使用int8类型的乘法指令进行计算,需要进行额外的偏置操作,增加了运算量。

在tensorRT中的INT8量化使用的方法就是对称量化。

参考链接:
TensorRT量化第二课:对称量化与非对称量化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/602179.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Nginx的优化与防盗链

目录 一. 隐藏版本号方法一:配置文件隐藏版本号方法二:源代码隐藏版本号 修改用户与组缓存时间日志切割连接超时更改进程数配置网页压缩配置防盗链fpm参数优化 一. 隐藏版本号 可以使用 Fiddler 工具抓取数据包,查看 Nginx版本,也…

1162 Postfix Expression(29行+超详细注释)

分数 25 全屏浏览题目 切换布局 作者 陈越 单位 浙江大学 Given a syntax tree (binary), you are supposed to output the corresponding postfix expression, with parentheses reflecting the precedences of the operators. Input Specification: Each input file c…

scalar3 idea导入源码后仍然无法显示源码问题解决

最近心血来潮想要学习scala,直接选了最新的scala3.2.2,安装过程没啥好说的但是到了看源码的时候却死活加载不进去,话不多说,先看看网上大部分人给的过程(这个过程也是导入源码必须的) 1、进入scala官网选择…

Node.js详解(三):Node.js的安装及基本使用

文章目录 一、Node.js 安装配置二、nvm介绍及使用(推荐使用node版本管理工具)1、介绍2、安装3、基本使用安装/管理nodejs4、命令提示 三、第一个Node.js程序:Hello World!脚本模式交互模式 一、Node.js 安装配置 Node.js支持在 Windows 、Linux以及在Ma…

数据为基 成峰化海 | GBASE南大通用openGauss Developer Day 2023精彩看点一览

5月26日,面向数据库开发者的年度技术盛会 「openGauss Developer Day 2023」 在北京圆满召开。本届大会以“聚数成峰,共赢未来”为主题,汇集产学研用各层面技术专家、企业领军,分享openGauss社区前沿技术创新、优秀实践和生态成…

今天穿什么香?小红书气味人群和热门趋势分析

“高倍速增长”,近年嗅觉赛道趋势有目共睹,可谓当下一大新势力。 “小众香”、“伪体香”、“人间扳手香”等,频现小红书热门词条,行业巨头入局、诸多新秀崛起,前景美丽。本期千瓜将通过气味人群和热门趋势分析&#x…

nginx限流熔断

一、令牌桶算法 算法思想是: 令牌以固定速率产生,并缓存到令牌桶中; 令牌桶放满时,多余的令牌被丢弃; 请求要消耗等比例的令牌才能被处理; 令牌不够时,请求被缓存。 二、漏桶算法 算法思想…

fengmap地图上小图标缺失

目录 一、问题 二、原因 三、总结 一、问题 1.使用蜂鸟地图,发现在线地图能够正常加载地图编辑器中绘制的小图标;但是离线地图中的小图标却无法正常显示。如下图1-1所示。 二、原因 1.不明白呀,network检查了,离线和在线加载的资源也是一…

使用docker部署多个nginx站点并配置负载均衡

项目前端部署在docker。该前端有时会出现无法访问,重启docker容器后又可以。猜测是不是单个docker容器压力过大,就想引入负载均衡试试效果。 一、负载均衡的好处 负载均衡跟集群结合效果才好,docker容器分布于不同的服务器。但我们没有这个…

Vue.js 中的 Vuex 是什么?如何使用 Vuex?

Vue.js 中的 Vuex 是什么?如何使用 Vuex? 在 Vue.js 中,Vuex 是一种状态管理模式。它可以帮助我们在应用程序中管理共享状态,使得我们的代码更加可维护和可扩展。本文将深入探讨 Vuex 的概念和使用方法,并提供一些相关…

基于DAC0832的信号发生器设计与实现(源码+原理图+PCB)

摘要: 本课题设计了一个基于DAC0832的信号发生器,使之输出不同频率的正弦波、三角波、锯齿波和方波,并通过按键切换不同的波形,也可以改变频率以及频率变化的步进。本方案选择了DAC0832作为核心芯片,并与51单片机结合…

nginx系统优化

nginx系统优化 一:隐藏nginx版本号 方法一:修改配置文件 vim /usr/local/nginx/conf/nginx.confnginx -t systemctl restart nginx curl -I http://192.168.52.108方法二:修改源代码 vim /opt/nginx-1.24.0/src/core/nginx.h ##配置文件里…

Redis面试-高频常考30题(面试突击,建议收藏)

1.BigKey问题,多大算big?你如何发现?如何删除?如何处理? 关于bigkey的面试题,已经在博客 Redis7实战加面试题-高阶篇(Redis线程与IO多路复用,BigKey,缓存双写) 里详细说明 2.手机登录某App&#xff0…

接口测试用例怎么写?一文1600字教你写一个优秀的接口测试的测试用例

一、用例设计1 1、接口测试概念 接口测试:测试系统间接口的一种测试,测试的对象主要是接口,主要是测试外部系统与所测系统之间以及内部系统之间的交互点 2、接口测试方法 a、可以通过开发脚本代码进行测试 b、可以通过开源免费的接口调用…

使用HHDBCS的SSH通道登陆数据库

传统远程登录或文件传输方式,例如Telnet、FTP,使用明文传输数据,存在很多的安全隐患。 随着人们对网络安全的重视,SSH协议已经越来越被用户所青睐。 SSH协议通过对网络数据进行加密和验证,在不安全的网络环境中提供了…

Spring Cloud Alibaba 快速上手搭建公司项目(三)GateWay

Gateway是Spring Cloud生态系统中的一个组件,它是一个基于Spring Cloud Gateway的API网关。它提供了一种简单、快速和可扩展的方式来管理微服务之间的请求流量。 它是一个轻量级的API网关,它可以轻松地与Spring Cloud集成,并提供了一些高级功…

你是外包,麻烦不要偷吃零食,注意素质..

我自己没经历过外包,靠自己的所见所闻可能写出来的东西会很主观,所幸我有不少外包的读者,还有几个在外包工作或工作过的朋友,在跟她们深度交流之后,这这里聊一下我自己的一些看法。 注:本文不代表所有外包公…

libtorch教程(一)开发环境搭建:VS+libtorch和Qt+libtorch

前言 事实上,在前面的pytorch部署博客和libtorch的QT部署中笔者已经分享了自己搭建libtorch开发环境的记录。其余并无太多要赘述的。 本教程禁止转载。同时,本教程来自知识星球【CV技术指南】更多技术教程,可加入星球学习。 Transformer、目…

苹果CMS仿T5资源站影视资源分享网站模板

简介: 苹果cms仿T5资源站影视资源分享网站模板,包括首页、详情页、留言页、和播放弹窗!适合拿去做资源站! 云盘地址: http://zijieyunpan.cn/eF3crCQyWVO 演示:

Android Input子系统 - PhoneWindowManager

基本概念 PhoneWindowManager也是运行于systemserver线程中,在Event事件分发之前处理,比如电源键。Event事件分发后,仅有包含Activity的apk线程才可以处理,如果apk中没有activity但是想处理Event事件怎么办呢?可以在PhoneWindowManager做做文章了。 在SystemServer中, inputM…