英文论文（sci）解读复现【NO.5】让RepVGG再次变得更强大：一种量化感知方法

英文论文（sci）解读复现【NO.5】让RepVGG再次变得更强大：一种量化感知方法

news2025/7/16 3:35:31

此前出了目标检测算法改进专栏，但是对于应用于什么场景，需要什么改进方法对应与自己的应用场景有效果，并且多少改进点能发什么水平的文章，为解决大家的困惑，此系列文章旨在给大家解读发表高水平学术期刊中的 SCI论文，并对相应的SCI期刊进行介绍，帮助大家解答疑惑，助力科研论文投稿。解读的系列文章，本人会进行创新点代码复现，有需要的朋友可关注私信我获取。

一、摘要

性能和推理速度之间的折衷对于实际应用是至关重要的。结构重新参数化获得了更好的折衷，并且它正在成为现代卷积神经网络中越来越受欢迎的成分。尽管如此，当需要INT 8推断时，其量化性能通常太差而无法部署（例如，ImageNet上的top-1精度下降超过20%）。在本文中，我们深入研究了这种失效的潜在机制，即原始设计不可避免地增大了量化误差。我们提出了一个简单、健壮、有效的补救措施，以获得一个量化友好的结构，同时也享有重新参数化的好处。我们的方法极大地弥补了RepVGG的INT 8和FP 32精度之间差距。在没有花里胡哨的情况下，通过标准的训练后量化，ImageNet上排名前1的精度下降减少到2%以内。

二、网络模型及核心创新点

揭示了在量化RepVGG 等基于重新参数化的架构时性能崩溃的根本原因。

设计了RepVGG的量化友好替代品（即QARepVGG），其在权重和激活分布方面具有根本差异，同时保留了速度和性能权衡突出的优势。

我们提出的方法在不同的模型尺度和不同的视觉任务上都有很好的泛化能力，实现了出色的后量化性能，可以随时部署。此外，我们的模型在FP32精度方面与RepVGG相当。

三、实验效果（部分展示）

我们的实验主要集中在ImageNet数据集上。最后，基于最近流行的检测器YOLOv6 验证了该方法的通用性，该检测器广泛采用了重新参数化设计。

1.所有模型均经过120个时期的训练，全球批量为256。我们使用的SGD优化器动量为0.9，权重衰减为10−4。学习速率初始化为0.1，然后按照余弦策略衰减到零。我们还遵循简单的数据扩充，如[11]。所有实验均在8个Tesla-V100 GPU上完成。

我们观察到具有群卷积的RepVGG的表现要差得多。PTQ后RepVGG-B2 g4的准确度从78.5%下降至13.7%（64.8%↓）。然而，我们的QARepVGG-B2 g4仅损失0.7%的准确度，表明其对其他规模和变体的稳健性。

2.消融研究-变体架构设计。我们研究了不同设计的量化性能，结果如表5所示。

注意，当BN被完全移除时，模型不能收敛。虽然BN后的设置只有71.1%的INT8 top-1精度，但其FP32精度较低。量化间隙随着模型容量的增长（从A0到B0）而增大，这不赞成这种方法。

五、实验结论

通过理论和定量分析，我们剖析了著名的基于重参数化的结构RepVGG的量子化失败.它的结构缺陷不可避免地放大了量化误差，并且累积地产生较差的结果。我们重新设计了QARepVGG，它可以生成有利于量化的权重和激活分布。QARepVGG大大简化了最终部署的量化过程。强调建筑设计中的量化意识应引起重视。

注：论文原文出自本文仅用于学术分享，如有侵权，请联系后台作删文处理。

解读的系列文章，本人已进行创新点代码复现，有需要的朋友欢迎关注私信我获取 ❤ 。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/351557.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

2023年可见光通信（LiFi）研究新进展

可见光无线通信Light Fidelity（LiFi）又称“光保真技术”，是一种利用可见光进行数据传输的全新无线传输技术。LiFi是一种以半导体光源作为信号发射源，利用无需授权的自由光谱实现无线连接的新型无线通信技术，支持高密度…

阅读更多...

内网渗透(三十六)之横向移动篇-Password Spraying密码喷洒攻击和域内用户枚举横向移动

内网渗透(三十六)之横向移动篇-Password Spraying密码喷洒攻击和域内用户枚举横向移动

系列文章第一章节之基础知识篇内网渗透(一)之基础知识-内网渗透介绍和概述内网渗透(二)之基础知识-工作组介绍内网渗透(三)之基础知识-域环境的介绍和优点内网渗透(四)之基础知识-搭建域环境内网渗透(五)之基础知识-Active Directory活动目录介绍和使用内网渗透(六)之基…

阅读更多...

【原创】java+swing+mysql宿舍报修管理系统设计与实现

【原创】java+swing+mysql宿舍报修管理系统设计与实现

本文主要想利用javaswingmysql等开发技术设计一个高校宿舍报修管理系统，方便广大学生对宿舍中损坏的物品进行报修处理，提高报修效率。功能分析： 宿舍报修管理系统的使用角色，一般分为管理员和学生，管理员主要进行学…

阅读更多...

深入理解顺序io和随机io(全网最详细篇)

深入理解顺序io和随机io(全网最详细篇)

MySql系列整体栏目内容链接地址【一】深入理解mysql索引本质https://blog.csdn.net/zhenghuishengq/article/details/121027025【二】深入理解mysql索引优化以及explain关键字https://blog.csdn.net/zhenghuishengq/article/details/124552080【三】深入理解mysql的索引分类&a…

阅读更多...

汽车如何实现制动

汽车如何实现制动

汽车如何实现制动汽车如何实现制动难点答疑：汽车刹车时，四个车轮是如何制动的？制动机理是什么？ 第一步：驾驶员踩下制动踏板，推动制动主缸第二步：制动主缸将制动液的压力通过制动管道传递到四…

阅读更多...

数据结构代码总结（C语言实现）

数据结构代码总结（C语言实现）

目录如何应对数据结构的代码题？采取的学习流程①首先对C语言的语法的熟悉②学习掌握基本代码的写法，做到熟练2.1插入排序2.2快速排序2.3二分查找2.4树的遍历③跟着网上视频开始熟悉对一些问题的解答④结合真题的代码，寻找其中的结题规律如何应…

阅读更多...

CasEE：一种用于重叠事件抽取的级联解码联合学习框架论文解读

CasEE：一种用于重叠事件抽取的级联解码联合学习框架论文解读

CasEE: A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction (用于重叠事件抽取的级联解码联合学习框架) 论文：CasEE: A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction (aclanthology.org) 代…

阅读更多...

通俗易懂理解三次握手、四次挥手（TCP）

通俗易懂理解三次握手、四次挥手（TCP）

文章目录1、通俗语言理解1.1 三次握手1.2 四次挥手2、进一步理解三次握手和四次挥手2.1 三次握手2.2 四次挥手1、通俗语言理解 1.1 三次握手 C:客户端 S：服务器端第一次握手： C：在吗？我要和你建立连接。第二次握手&#xff…

阅读更多...

设计模式之门面模式与装饰器模式详解和应用

设计模式之门面模式与装饰器模式详解和应用

目录1 门面模式定义1.1 门面模式的应用场景1.2 门面模式的通用写法1.3 门面模式业务场景实例1.4 门面模式在源码中的应用1.5 门面模式的优缺点2 装饰器模式2.1 装饰器模式定义2.2 装饰器模式的应用场景2.3 装饰器模式在源码中的应用2.4 装饰器模式和代理模式对比2.5 装饰器模式…

阅读更多...

git命令篇（持续更新中）

git命令篇（持续更新中）

首先介绍这个网页：https://learngitbranching.js.org/?localezh_CN --提交命令 git commit --创建分支 git branch <分支名> --切换分支 git checkout <分支名> --合并分支 (合并到主分支去，把我合并到谁的身上去) 自己写的分支合并到主线…

阅读更多...

Unity—游戏设计模式+GC

Unity—游戏设计模式+GC

每日一句："少年一贯快马扬帆道阻且长不转弯要盛大要绚烂要哗然要用理想的泰坦尼克去撞现实的冰川要当烧赤壁的风而非借箭的草船要为一片海就肯翻万山。" 目录状态模式： 外观模式组合模式， 单例模式命令模式观察者模…

阅读更多...

FPGA开发软件（vivado + modelsim）环境搭建（附详细安装步骤+软件下载）

FPGA开发软件（vivado + modelsim）环境搭建（附详细安装步骤+软件下载）

本文详细介绍了vivado软件和modelsim软件的安装，以及vivado中配置modelsim仿真设置，每一步都加文字说明和图片。一、软件安装包下载1、vivado vivado版本很多，目前最新的已更新到vivado2022.2，版本越高，安装包越大&…

阅读更多...

90后阿里P7技术专家晒出工资单：狠补了这个，真香...

90后阿里P7技术专家晒出工资单：狠补了这个，真香...

最近一哥们跟我聊天装逼，说他最近从阿里跳槽了，我问他跳出来拿了多少？哥们表示很得意，说跳槽到新公司一个月后发了工资，月入5万多，表示很满足！这样的高薪资着实让人羡慕，我猜这是税后…

阅读更多...

全局快门和卷帘快门(Global shutter and Rolling shutter)

全局快门和卷帘快门(Global shutter and Rolling shutter)

全局快门和卷帘快门 “果冻效应”是什么？用相机拍下扇叶，为什么会发生扭曲变形？ 相机两种曝光方式的优劣：全局曝光和卷帘曝光卷帘快门和全局快门的区别全局曝光和卷帘曝光是常见的相机曝光方式一般来说，CCD相机是全…

阅读更多...

【3D目标检测】Fastpillars-2023论文

【3D目标检测】Fastpillars-2023论文

论文：fastpillars.pdf https://arxiv.org/abs/2302.02367 作者：东南大学，美团代码：https://github.com/StiphyJay/FastPillars （暂未开源） 讲解：https://mp.weixin.qq.com/s/ocNH2QBoD2AeK-…

阅读更多...

「JVM 编译优化」javac 编译器源码解读

「JVM 编译优化」javac 编译器源码解读

Java 的编译过程前端编译: 编译器的前端，将 Java 文件转变成 Class 文件的过程；如 JDK 的 javac、Eclipse JDT 中的增量式编译器 ECJ；即使编译: JIT，Just In Time Compiler，在运行期将字节码转变成本地机器码的过程&…

阅读更多...

COSELF 次元秀场伦敦时装周预告 #虚拟时尚

COSELF 次元秀场伦敦时装周预告 #虚拟时尚

在虚拟世界里的未来服装，能自由变化自己的样貌和服饰。或许未来会作为人类皮肤的第二表征，极大解放人们的精神自由。COSELF 次元秀场「预告」数字高定系列时间：本月 17 - 21 日地点：当季伦敦时装周「COSELF 次元秀场-数字高定系列…

阅读更多...

excel图片技巧：如何为报表配上节日祝福动画

excel图片技巧：如何为报表配上节日祝福动画

偶尔跳跃一下，改变一下，哪怕被说成是“拍马屁”也行，因为，快乐、传递快乐是一种幸福，是内心本身就有的欲望。提升自己在同事和领导心里的形象只是传递快乐的附加值。圣诞节就快到了，发送报表的时候附带一个…

阅读更多...

vue的组件通信

vue的组件通信

文章目录3. 组件通信3.1 父组件-->子组件3.3组件自定义事件（子->父）3.4.全部事件总线（两代以上）3.5消息的订阅与发布3. 组件通信 3.1 父组件–>子组件 <Student name"张三" :age"18"></St…

阅读更多...

Java Excel的数据导入导出

Java Excel的数据导入导出

引入依赖  <dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>2.2.7</version> </dependency> <dependency><groupId>n…

阅读更多...

推荐文章

最新文章