DetNet论文速读

news2024/11/17 10:40:04

paper:DetNet: A Backbone network for Object Detection

存在的问题

最近的目标检测模型通常依赖于在ImageNet分类数据集上预训练的骨干网络。由于ImageNet的分类任务不同于目标检测,后者不仅需要识别对象的类别,而且需要对边界框进行空间定位。由于VGG16和Resnet等标准网络的特征图的空间分辨率逐渐降低,因此图像分类的设计原则不利于定位任务。

本文的创新点

本文提出了一个专门为检测模型设计的骨干网络DetNet,具有以下特征:(1)阶段的数量是直接为目标检测而设计的。(2)尽管和传统的分类网络相比DetNet包含了更多的stage(比如stage 6和stage 7),但保持了高分辨率的特征图,同时保持了较大的感受野。

与ResNet相比,DetNet在目标检测方面有几个优势。首先,DetNet与检测模型使用的stage数量完全相同,因此额外的stage比如P6可以在ImageNet数据集上进行预训练。其次,由于最后阶段是高分辨率的特征图,DetNet在定位大物体的边界和寻找缺失的小物体方面更为强大。

方法介绍

下面介绍一下DetNet的具体结构。我们采用ResNet-50作为baseline,它被广泛用于各种检测模型的backbone。为了公平比较,前4个stage与原始的ResNet-50保持一致。

为目标检测设计一个有效的骨干网络存在两个挑战。一方面,保持深度神经网络的空间分辨率会消耗大量的时间和内存。另一方面,减少降采样比例等价于减少有效的感受野,这对许多视觉任务,如图像分类和语义分割都是有害的。

DetNet 经过精心设计,以解决这两个挑战。具体来说,DetNet从第一阶段到第四阶段遵循与ResNet相同的设置。区别从第五阶段开始,用于分类的DetNet如图2d所示。DetNet59是基于ResNet50进行的扩展。类似地,DetNet可以很容易地用像ResNet101这样的深层网路进行扩展。DetNet59的设计细节如下:

  • 我们在backbone中引入了额外的stage,如P6,后续将会像FPN一样用于检测。同时,stage 4之后的阶段分辨率都固定为16倍的降采样率。
  • 由于stage 4之后的分辨率是固定的,为了引入一个新的stage,在每个stage的开始我们采用了一个带有1x1卷积映射的dilated bottleneck,如图2B所示。我们发现图2B中的模型对于像FPN这样的multi-stage detector是很重要的
  • 我们使用膨胀卷积的bottleneck作为网络的basic block,以有效地扩大感受野。由于膨胀卷积仍然很耗时,stage5, 6的通道数保持和stage 4一样(256通道)。这与传统的backbone设计不同,其中每经过一个stage通道数都会翻倍。

实验结果

采用FPN检测模型,不同backbone在分类和检测任务上的对比如表1。可以看出DetNet-59与ResNet-50相比,mAP超过了2个点,与ResNet-101相比,FLOPs更低的情况下,mAP更高。

和其它SOTA检测模型相比,采用DetNet-59作为backbone的FPN取得了最高的mAP。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1501561.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

几种常见的python开发工具

​ Python是一种功能强大且易于学习的编程语言,被广泛应用于数据科学、机器学习、Web开发等领域。随着Python在各个领域的应用越来越广泛,越来越多的Python开发工具也涌现出来。但是,对于新手来说,选择一款合适的Python开发工具可…

SPSS直接输出三线表

STEP1 下载三线表.stt至安装目录的Looks文件夹 STEP2 在SPSS菜单栏中找到 编辑-选项-透视表 表外观下拉到最底,选择三线表(如果第一步没保存对是不会出现的),然后点击确定 效果:

穿越牛熊,股市的春天还有多远?

2023年,资本市场的严冬令无数投资者和机构投资者都感受到了前所未有的压力。VC/PE、公募基金、股权投资类公司等机构,在这一年里业绩普遍不佳,寒意弥漫。VC/PE机构的营业收入普遍呈现负增长,公募基金更是历史上首次连续两年亏损&a…

牛客网 华为机试 合唱队

本题抽象出来,我们需要找到最长递增子序列,还需要一个最长递减子序列,然后两个子序列的长度相加减去1就是我们这个合唱队的最大长度。然后我们用所有的人数减去合唱队最大长度,就是我们要求的最少需要几位同学出列。 这个题和上一…

JavaWeb - 3 - JavaScript(JS)

JavaScript(JS)官方参考文档:JavaScript 教程 JavaScript(简称:JS)是一门跨平台、面向对象的脚本语言,是用来控制网页行为的,它能使网页可交互(脚本语言就不需要编译,直接通过浏览器…

Java数组常用操作

创建数组 int[] a {1,2,3};int[] a new int[]{1,2,3};int[] a new int[3];ArrayList<Integer> arr new ArrayList<>(); 添加元素 arr.add(99); //将99加入到数组末尾arr.add(3,99); //将99加入到指定索引3处访问元素 int c1 c[1]; int arr1 arr.get(1); …

基于PHP的汽车能耗优化系统设计与实现

目 录 摘 要 I Abstract II 引 言 1 1 相关技术 3 1.1 ThinkPHP框架 3 1.2 MySQL数据库 3 1.3 Vue框架 3 1.4 Bootstrap 3 1.5 Highcharts 3 1.6 本章小结 4 2 系统分析 5 2.1 功能需求 5 2.2 用例分析 6 2.3 非功能需求 8 2.4 本章小结 8 3 系统设计 9 3.1 系统总体设计 9 3.…

C++的类与对象(二):this指针

目录 结构体内存对其规则 相关面试题 this指针 相关面试题 右箭头选择运算符-> C语言和C实现Stack的对比 结构体内存对其规则 1、第一个成员在与结构体偏移量为0的地址处 2、其它成员变量要对齐到某个数字&#xff08;对齐数&#xff09;的整数倍的地址处 对齐数 编…

Jumpserver 使用

目录 1、邮箱设置 2、用户管理 创建用户组 创建用户 3、资产管理 创建被管理机器的账号 添加资产 测试资产联通 推送账号 4、权限管理 资产授权 建命令过滤器 测试 使用 Xshell 登录 5、查看命令记录 查看回放 1、邮箱设置 修改当前站点的URL为本机IP或者jumps…

3.8题目练习

1.数的计算 题目其他部分&#xff1a; 这道题目可以先试着自己推一下找一下规律&#xff0c;题目给出的数字是一个小于等于一千的数字&#xff0c;这里我们不妨考虑一下从小往大推&#xff0c;我们从1开始&#xff0c;用f[i]来表示对应i共有几个合法的序列&#xff1a; 当n为1…

设计模式大题做题记录

设计模式大题 09年 上半年&#xff1a; 09年下半年 10年上半年 10年下半年 11年上半年 11年下半年 12年上半年 12年下半年 13年上半年 13年下半年

MindOpt优化器: 浅谈版本0.x和1.x之间API的差异

Mindopt 是一个优化求解器&#xff0c;如果它有两个主要版本——0.xx和1.x.x&#xff08;最新版本1.1.1&#xff09;&#xff0c;它们代表着软件开发的两个不同阶段。版本1.0.0表示软件的一个大的里程碑&#xff0c;代表着软件第一个正式的“成熟”发布版本&#xff0c;而0.25是…

用开发CesiumJS模拟飞机飞行应用(一,基本功能)

本部分向您展示如何构建您的第一个 Cesium 应用程序&#xff0c;以可视化模拟从旧金山到哥本哈根的真实航班&#xff0c;并使用 FlightRadar24收集的雷达数据。您将学习如何&#xff1a; 在网络上设置并部署您的 Cesium 应用程序。 添加全球 3D 建筑物、地形和图像的基础图层。…

高校水电预付费系统有什么作用?

Hey小伙伴们&#xff0c;今天来聊聊咱们大学里的一个超级实用的设施——水电预付费系统&#xff01;你是不是还在为每个月的水电账单烦恼呢&#xff1f;别担心&#xff0c;这个系统就是你的生活小帮手&#xff01; 首先&#xff0c;想象一下这 样的场景&#xff1a;开学初&…

Python通过SFTP实现网络设备配置备份

一、背景 为了防止网络设备意外损坏&#xff0c;导致配置文件无法恢复&#xff0c;可以通过将网络设备的配置文件备份到本地电脑上。 一般情况下&#xff0c;设备支持通过FTP、TFTP、FTPS、SFTP和SCP备份配置文件。其中使用FTP和TFTP备份配置文件比较简单&#xff0c;但是存在…

JAVA实现图像取模

JAVA对图像取模 就是图片变成点阵 原图 取模效果图 代码如下&#xff1a; public static void main(String[] args) throws IOException {try {// 读取图像文件BufferedImage image ImageIO.read(new File("C:/Users/xiaol/Desktop/img/0.jpg"));// 定义阈值&am…

模拟实现strlen函数

一、逐个计数法 #include<assert.h> #include<stdio.h>size_t my_strlen(const char* p) {int count 0;assert(p);//断言while (*p ! \0){p;count;}return count; }int main() {char str[] "hello world";size_t len my_strlen(str);printf("%d…

听 GPT 讲 client-go 源代码 (23)

分享更多精彩内容&#xff0c;欢迎关注&#xff01; File: client-go/kubernetes/scheme/register.go 在client-go项目中&#xff0c;client-go/kubernetes/scheme/register.go文件的作用是进行Kubernetes API对象的Scheme注册。 Scheme是一个用于序列化和反序列化Kubernetes A…

抖音视频评论采集工具|短视频批量下载软件

《抖音视频评论采集工具——解放双手的智能助手》 在数字化时代&#xff0c;抖音视频已成为人们获取信息、娱乐放松的重要来源之一。针对抖音视频评论的采集需求&#xff0c;我们推出了一款功能强大的软件&#xff0c;让您轻松实现评论批量提取&#xff0c;QQ:290615413提高工作…

stm32学习笔记:SPI通信协议原理(未完)

一、SPI简介(serial Peripheral Interface&#xff08;串行 外设 接口&#xff09;) 1、电路模式&#xff08;采用一主多从的模式&#xff09;、同步&#xff0c;全双工 1 所有SPI设备的SCK、MOSI、MISO分别连在一起 2 主机另外引出多条SS控制线&#xff0c;分别接到各从机的S…