【RT-DETR有效改进】带你分析如何确定改进的基础模型,解决模型无法收敛精度很差的问题(ResNet官方一比一复现)

news2024/12/22 23:41:38

一、本文介绍

Hello,各位读者,距离第一天发RT-DETR的博客已经过去了接近两个月,这段时间里我深入的研究了一下RT-DETR在ultralytics仓库的使用,旨在为大家解决为什么用v8的仓库训练的时候模型不收敛,精度差的离谱的问题,我也是成功的找到了解决方案,对于ultralytics仓库进行多处改进从而让其还原RT-DETR官方的实验环境从而达到一比一的效果。

其次我也将RT-DER的官方版本ResNet18、ResNet34、ResNet50、ResNet101集成在ultralytics仓库(不同于现在仓库里更新的R50和R101我是根据RT-DETR官方的代码一比一移植过来的参数量基本保持一致,网上发的都是ResNet的本身,但这和RT-DETR官方实验的版本其实是有很大的出入的)所以从今天开始正式开始更新RT-DETR的改进了,下面来教大家选取自己的baseline也就是你改进的基础模型,后面会说到如何解决模型为何不收敛的问题,以及我用我复现模型训练的结果。 

本专栏旨在打造全网最好的RT-DETR专栏!

目录

一、本文介绍

二、RT-DETR发表论文的方向 

三、Baseline的选择 

四、模型无法收敛的问题 

五、专栏链接


二、RT-DETR发表论文的方向 

开始之前先来给大家聊一下RT-DETR发论文的方向,我们发论文的两个大方向一个就是轻量化另一个就是提高mAP精度,针对于RT-DETR这个模型我认为其无论选取这两个方向的任意一个都是非常好的选择,但总有一个更容易,我下面分别来讲一下。

选择轻量化的理由(十分推荐):RT-DETR的模型都是非常大的,其最小的版本RT-DETR-R18都有2kw的参数量GFLOPs达到了60,这是一个非常大的参数了,我们如果想在其基础上做一个轻量化的操作,我们拿市面上的任意一个主干基本上都可以减少其参数量,所以我认为如果大家想在RT-DETR领域发一遍论文轻量化是一个非常好的选择,尤其是在一些实时检测领域上。

提高mAP精度的理由(推荐):从RT-DETR的实验对比上来看,其精度其实是不如YOLO系列的,所以我们就有很多的借鉴模块来使用,来提高mAP,不过提高mAP肯定不如轻量化的方向毕竟其打的旗号就是在实时检测领域超越YOLO的存在。

其它方向就不介绍了,我觉得都不如这两个好发。


三、Baseline的选择 

下面来给大家说一下如何选取你的baseline

第一考虑的肯定是大家的算力,RT-DETR的模型非常大,我移植到ultralytics仓库的R18版本RT-DETR参数量基本和官方一致为2kw但GFLOps稍微有点差别为58.6和官方差了1.4(为YOLO版本自带的误差)。

( 此版本大家在网上任意一个地方都找不到为我本人按照官方的内容一比一移植过来的)

上面说到了算力,我自己的电脑是3070-8G的显卡跑R18只能跑到4batch_size,如果更高的版本我的batch_size就需要往下降低。

然后先讲解我们选择Baseline的两个大的方向一个是ResNet版本,另一个是PPHGNetV2版本的,这里我建议大家选择的是ResNet版本,我来说一下理由

ResNet好像是2015年提出的,其效果早已被如今的各种网络模型超越,所以其改进空间非常大,无论是从轻量化的角度还是提高精度的角度出发都更容易一些。

PP-HGNetV2是百度今年新提出来的网络模型,其无论是精度还是成熟度上都已经很完美了,如果大家选择这个可能就会陷入像YOLOv8一样提高精度和轻量化都不好做,所以我推荐的是ResNet系列的版本(个人见解)。

我们再来说一下ResNet的多个版本。

其中首先pass掉的就是R101了模型太大改进成本太高了。

其次是R18、R34、R50

一开始我想推荐R50了但是觉得其不如R18首先R18作为最基础版本的模型,其精度远不如哪几个,然后其参数量也是一个绝大多数人可以接受的范围内2kw和计算量60GFLOPs,所以我个人推荐的就是最基础的R18版本,其可以被绝大多数人接受的同时也更能容易改进,同时现在ultralytics仓库里面还没有集成ResNet18(这也是因素之一),如果大家和我学习改进的话就相当于快人一步了,下面给大家看一下完整网络结构的打印。


四、模型无法收敛的问题 

这里再给大家说一下大家训练模型不拟合的问题是因为有些参数没有按照官方版本的进行设置,因为 ultralytics首先是要为了YOLO系列服务的,而RT-DETR对于参数是非常的敏感的其有一些代码设置的也和YOLO系列相不符合,所以现在的ultralytics仓库的RT-DETR只能说有了RT-DETR的外壳内部确是不符的,所以这些问题导致大家训练模型不能够拟合,无论怎么换数据集效果都一样。

所以想要学习RT-DETR的您可以关注本专栏(我会教大家如何调参数,然后修改模型中的代码适配RT-DETR还原RT-DETR的环境),相信本专栏一定会让您有所收获,本专栏本次旨在打造全网最好的RT-DETR专栏,订阅专栏之后您也可以像我的YOLOv8用户一样获得官方的交流群和完整的项目文件(包含我所有的改进机制,均可完美运行),以及我的视频讲解教大家一些发论文过程种我本人的各种经验。

下面是按照我修改完以后RT-DETR模型的拟合图片,这还仅仅是R18的版本,所以想要和我学习RT-DETR发论文的读者可以关注一下本专栏的动态。

以下为训练完成的结果图。


下面介绍一下我以后的博客必备的内容就是实验对比图,该图会给大家放在最前侧展示改进机制的效果,可能是轻量化的也可能是提点的。


五、本文总结

从今天开始正式开始更新RT-DETR剑指论文专栏,本专栏的内容会迅速铺开,在短期呢大量更新,价格也会乘阶梯性上涨,所以想要和我一起学习RT-DETR改进,可以在前期直接关注,本文专栏旨在打造全网最好的RT-DETR专栏为想要发论文的家进行服务。

官方链接:RT-DETR剑指论文专栏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1376003.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Maven 依赖管理项目构建工具 教程

Maven依赖管理项目构建工具 此文档为 尚硅谷 B站maven视频学习文档,由官方文档搬运而来,仅用来当作学习笔记用途,侵删。 另:原maven教程短而精,值得推荐,下附教程链接。 atguigu 23年Maven教程 目录 文章目…

Skywalking UI页面中操作的各种实用功能汇总

刚刚接触skywalking不久,在这里总结一下在UI页面中操作的各种实用功能,随着使用的不断深入,我也会对文章进行持续补充。 本文skywalking 的ui入口是官方demo ,版本是10.0.0-SNAPSHOT-593bd05 http://demo.skywalking.apache.org…

【GO语言依赖】Go语言依赖管理简述

在运行环境中,遭遇报错,显示找不到函数 经过研究后发现需要进行依赖管理,进行如下操作后解决: 起源 最早的时候,Go所依赖的所有的第三方库都放在GOPATH这个目录下面。这就导致了同一个库只能保存一个版本的代码。如…

vite 搭建vue3 TS项目初始框架

目录 仓库地址: 一.搭建项目 1.安装 Vite: 2.创建 Vue 3 项目: 3.进入项目目录: 4.安装依赖: 5.运行项目: 6.流程实操 二.修改项目结构,显示自定义的页面 1.整理静态样式文件 1.1.在 sr…

安泰电子功率放大器在设计电路时应该注意什么

在设计功率放大器电路时,有几个重要的因素需要特别注意。这些因素包括功率放大器的线性度、效率、稳定性、保护功能和适当的散热设计。下面将详细介绍每个因素,并说明在设计功率放大器电路时应该注意的要点。 线性度: 功率放大器的线性度是指…

OpenHarmony4.0Release系统应用常见问题FAQ

前言 自OpenHarmony4.0Release发布之后,许多小伙伴使用了配套的系统应用源码以及IDE作为基线开发,也遇到了各种各样的问题,这篇文档主要收录了比较常见的一些问题解答。 FAQ 系统应用源码在哪 目前OpenHarmony系统应用分为3种模式&#x…

Realm Management Extension领域管理扩展之调试跟踪分析

现代 Arm 系统包含大量功能以支持调试和性能分析。我们必须确保这些功能不能被用于危害系统安全。Arm 架构中,搭载 RME,提供了控制来限制系统的哪些部分可以进行调试。 本节假定读者熟悉 Armv9-A 中的基本功能,并总结了 RME 引入的变化。 外部调试 外部调试是指通过位于处…

RPCMS跨站脚本漏洞(xss)

CNVD-ID: CNVD-2024-01190 漏洞描述: RPCMS是一个应用软件,一个网站CMS系统。 RPCMS v3.5.5版本存在跨站脚本漏洞,该漏洞源于组件/logs/dopost.html中对用户提供的数据缺乏有效过滤与转义,攻击者可利用该漏洞通过注入精心设计的有效载荷执行…

深信服态势感知一体机SIP-1000 Y2100 3.0.1Y升级3.0.3Y步骤

当前版本:3.0.1Y 升级后版本:3.0.3Y PS:3.0.1Y不能直升3.0.3Y,需要先通过升级工具升级到3.0.2Y,再安装前置补丁从3.0.2Y升级到3.0.3Y;每一次升级时间为20-30分钟,设备升级会重启,需提…

Black Hole Alliance发展蓝图:从数字化到生态建设

Black Hole Alliance 以WEB3.0生态产业为核心,以强大的技术及社区为依托,确立了 " 区块链 生态产业 AI与Web3融合​ " 的底层架构,将区块链技术与全球生态产业有机融合,以价值交换网络为切入点及立足点,链…

【JAVA基础】JVM之类加载--双亲委派机制

目录 1. 类加载的过程描述:看图:解释: 2. 那么类加载器都有哪些呢3. 双亲委派机制3.1 双亲委派机制的过程3.2 图看委派过程3.3 为什么要设计双亲委派机制 4. 自定义类加载器4.1 如何定义自己的类加载器? 1. 类加载的过程 描述&am…

kylin集群反向代理(健康检查)

前面一篇文章提到了使用nginx来对kylin集群进行反向代理, kylin集群使用nginx反向代理-CSDN博客文章浏览阅读349次,点赞8次,收藏9次。由于是同一个集群的,元数据没有变化,所以,直接将原本的kylin使用scp的…

21道Java Spring MVC综合面试题详解含答案(值得珍藏)

1.概述 1.1 什么是Spring MVC?简单介绍下你对Spring MVC的理解? Spring MVC是一个基于Java的实现了MVC设计模式的请求驱动类型的轻量级Web框架,通过把模型-视图-控制器分离,将web层进行职责解耦,把复杂的web应用分成…

2023年全国职业院校技能大赛软件测试赛题—单元测试卷⑩

单元测试 一、任务要求 题目1:根据下列流程图编写程序实现相应处理,程序根据两个输入参数iRecordNum和IType计算x的值并返回。编写程序代码,使用JUnit框架编写测试类对编写的程序代码进行测试,测试类中设计最少的测试数据满足基路…

Windows安装Rust环境(详细教程)

一、 安装mingw64(C语言环境) Rust默认使用的C语言依赖Visual Studio,但该工具占用空间大安装也较为麻烦,可以选用轻便的mingw64包。 1.1 安装地址 (1) 下载地址1-GitHub:Releases niXman/mingw-builds-binaries GitHub (2) 下载地址2-W…

C#编程-实现线程声明周期

实现线程声明周期 当System.Threading.Thread类的对象被创建的时候,线程的生命周期开始。线程的生命周期在完成任务时结束。在线程的生命周期中有各种状态。这些状态是: 未启动状态可运行状态不可运行状态死亡状态下图显示了线程的各种状态和引起线程从一个状态变为另一个状…

上市路上,如何打好合规与增长的双赢之战? |CFO x CIO 专刊

经济发展的新旧动能转化之下,企业需要找到可持续的高质量发展之路。以数字化智能化为推动力,做好内控与合规,不仅能保证企业的发展不偏离航道,还能有效激发数字资产价值,帮企业获得新发展动能。不管是拟上市企业还是已…

STM32F107VCT6官方原理图和PCB

资料下载地址:STM32F107VCT6官方原理图和PCB STM32F107VCT6是STMicroelectronics公司推出的一款高性能的32位微控制器芯片。它采用了ARM Cortex-M3架构,工作电压范围为2.0V-3.6V,主频速度高达72MHz,能够运行多重模式的程序。 在存…

二叉树题目:完全二叉树插入器

文章目录 题目标题和出处难度题目描述要求示例数据范围 解法思路和算法代码复杂度分析 题目 标题和出处 标题:完全二叉树插入器 出处:919. 完全二叉树插入器 难度 6 级 题目描述 要求 完全二叉树是每一层(除最后一层外)都…

线索系统性能优化实践

引言 在京东家居事业部,线索CRM系统扮演着至关重要的角色,它作为构建家居场景核心解决方案集的首要环节,肩负着获客和拓展业务的重要使命。然而,随着业务的不断扩张和市场需求的日益增长,系统原有的架构开始显露出诸多…