[神经网络]DETR目标检测网络

news2025/4/12 14:39:06

一、概述

相较于传统目标检测，DETR是一种纯端到端的网络。它不再需要NMS(非极大值抑制，用于去除多余的预测框)和生成anchor。

DETR提出了一个新的目标函数（二分图匹配），这个函数可以强制网络输出一个独一无二的预测值（没有冗余的预测框）。

二、网络结构

DETR的前向流程如上图所示：①使用一个CNN抽取图片的特征；②将这个特征拉平；③将拉平后的特征送入Transformer的encoder-decoder单元；④由decoder输出预测框的信息（出框的信息是一个超参数，原文为100）⑤利用二分图匹配的方式将Ground Truth与预测结果进行匹配，对于匹配成功的框才会进一步计算loss（没有匹配成功的框将会被标记为no object<背景类>）

1.基于集合的目标函数

DETR的输出是一个固定集合（固定数目）。为了在这些集合中找到正确的预测框，DETR采用了一个二分图匹配的方法来解决这个问题。具体做法是：将n个预测框和x个Ground Turth构建成一个cost matrix（代价矩阵），通过算法在其中找出代价最小的排列。

矩阵中的内容为损失函数（分类Loss和框体Loss），公式即可写为：

这个公式的意义是：在二分图匹配的基础上计算两个loss（分类Loss和框体Loss），其中对于第一个loss，由于要与第二个loss取值范围一致，其log被去除且实验表明并不会影响结果；对于第二个loss，由于L1-Loss会对大物体敏感，所以采用generalized iou loss来计算（与物体大小无关）。

2.整体网络框架

①默认图片输入大小为1066x800x3，经过卷积网络提取特征，得到输出2048x25x34；然后经过一个1x1卷积进行通道调整（降维）得到256x25x34。

②将特征拉平（850*256），并为其叠加位置编码（256x25x34）

③将序列输入Encoder中，计算自注意力

④将结果输入Decoder，进行解码输出；这里引入一个object query（一个可学习，维度为100*256），在每个decoder会先做一次object query的自注意力操作用于移除冗余框（第一个decoder可以不做）

⑤将特征输入检测头（FFN-MLP），进行预测。

三、代码

出自原文的DETR42最简结构

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/393304.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【Unity大气渲染】Unity Shader中实现大气散射（半成品）

【Unity大气渲染】Unity Shader中实现大气散射（半成品）

写在前面这是之前在做天空盒的时候同步写的分析博客，结果后面写到一半就忘了继续了，这里先贴出当时写的半成品，有小伙伴问我怎么做的，这里只能尽力把之前的半成品先放出来了（写得很乱，勿怪orz&#xff09…

阅读更多...

用C语言实现一个任意类型的队列

用C语言实现一个任意类型的队列

下面是一个简单的无类型队列的实现： #include <stdio.h> #include <stdlib.h>typedef struct Node {void *data;struct Node *next; } Node;typedef struct Queue {Node *front;Node *rear;int size; } Queue;void enqueue(Queue *queue, void *data);…

阅读更多...

[蓝桥杯] 枚举、模拟和排列问题

[蓝桥杯] 枚举、模拟和排列问题

文章目录一、连号区间数 1、1 题目描述 1、2 题解关键思路与解答二、递增三元组 2、1 题目描述 2、2 题解关键思路与解答三、错误票据 3、1 题目描述 3、2 题解关键思路与解答四、回文日期 4、1 题目描述 4、2 题解关键思路与解答五、归并排序标题：蓝桥杯——…

阅读更多...

windows和linux出现timewait过多的解决方法

windows和linux出现timewait过多的解决方法

一、timewait出现在客户端还是服务端以及什么情况下出现我是做性能测试的。在压测过程中遇到了timewait过多的情况，下面来看一下timewait产生的原因及解决办法，我自己在服务器起了一个很简单的springboot应用来验证自己的猜想及解决办法。说到产生原…

阅读更多...

基于docker部署prometheus

基于docker部署prometheus

1、prometheus架构 Prometheus Server: 收集指标和存储时间序列数据，并提供查询接口 ClientLibrary:客户端库 Push Gateway: 短期存储指标数据。主要用于临时性的任务 Exporters:采集已有的第三方服务监控指标并暴露 metrics Alertmanager:告警 Web UI :简单的…

阅读更多...

VS插件CodeRush全新发布v22.2.4——改进对VS 17.5的支持

VS插件CodeRush全新发布v22.2.4——改进对VS 17.5的支持

CodeRush是一个强大的Visual Studio .NET 插件，它利用整合技术，通过促进开发者和团队效率来提升开发者体验。CodeRush能帮助你以极高的效率创建和维护源代码。Consume-first 申明，强大的模板，智能的选择工具，智能代码分…

阅读更多...

【C++升级之路】第九篇：vector

【C++升级之路】第九篇：vector

🌟hello，各位读者大大们你们好呀🌟 🍭🍭系列专栏：【C学习与应用】 ✒️✒️本篇内容：vector的基本概念、vector的使用（构造，迭代器，空间增长，增删…

阅读更多...

小樽C++ 单章③ 一维数组

小樽C++ 单章③ 一维数组

目录一、一维数组认识与使用 1.4 数组的输入与输出 1.5 最大值与最小值的求解二、一维数组的操作用法 2.1 数组的插入与删除 2.2 数组某个值的查找 2.3多个数组的合并 2.4多个数组的有序合并三、一维数组的应用 3.1 斐波那契数列 3.2 淘淘摘苹果 3.3 翻纸牌游戏…

阅读更多...

RTOS中互斥量的原理以及应用

RTOS中互斥量的原理以及应用

互斥量的原理 RTOS中的互斥量是一种同步机制，用于保护共享资源，防止多个任务同时访问该资源，从而避免数据竞争和不一致性。互斥量的原理是通过对共享资源进行加锁和解锁操作来实现的。在RTOS中，互斥量通常是一个数据结构&…

阅读更多...

为什么说要慎用BeanUtils，因为性能真的拉跨

为什么说要慎用BeanUtils，因为性能真的拉跨

1 背景之前在专栏中讲过“不推荐使用属性拷贝工具”，推荐直接定义转换类和方法使用 IDEA 插件自动填充 get / set 函数。不推荐的主要理由是：有些属性拷贝工具性能有点差有些属性拷贝工具有“BUG”使用属性拷贝工具容易存在一些隐患（后面例子…

阅读更多...

九龙证券|磷酸亚铁锂是什么？磷酸亚铁锂的特点和性能介绍

九龙证券|磷酸亚铁锂是什么？磷酸亚铁锂的特点和性能介绍

磷酸亚铁锂是一种新式锂离子电池电极资料，化学式：LiFePO4，磷酸亚铁锂为近来新开发的锂离子电池电极资料，首要用于动力锂离子电池，作为正极活性物质运用，人们习气也称其为磷酸铁锂。磷酸亚铁锂的特色和功能…

阅读更多...

【计算机网络】随机访问介质访问控制中的ALOHA协议、CSMA协议、CSMA/CD协议和CSMA/CA协议

【计算机网络】随机访问介质访问控制中的ALOHA协议、CSMA协议、CSMA/CD协议和CSMA/CA协议

二、随机访问介质访问控制信道上的所有用户可随机发送信息 1. 简单ALOHA协议解决信息发送时的冲突问题。其特点是不监听信道，不按时间槽发送，随机重发。思想：在超时后，等随机一段时间后再重传 2. 时隙ALOHA协议时隙ALOH…

阅读更多...

送给她最最浪漫的表白（Python代码实现）

送给她最最浪漫的表白（Python代码实现）

目录I 最美的浪漫 II 昨日浪漫的表白III 关于“美”的哲思 IV Python代码实现 I 最美的浪漫 II 昨日浪漫的表白她问:有一个问题，我只问一遍，为什么是我?我微微一笑答道:笞案很长，我要用一生来回答。我：图书馆旁边的星空真美&…

阅读更多...

Linux面试总结

Linux面试总结

一.常用命令1.目录切换cd / 切换到根目录cd ../ 切换到上级目录cd ~ 切换到home目录2.查看目录ls 列出当前目录下所有的文件ls [路径]ls / 查看根目录 ls -l 相当于 ll 最常用的命令,用了表的方式列出当前目录的内容3.查看当前目录pwd-4.创建一组空文件touch5.显示文件内容cat6…

阅读更多...

Maven打包操作

Maven打包操作

对于企业级项目，无论是进行本地测试，还是测试环境测试以及最终的项目上线，都会涉及项目的打包操作。对于每个环境下的项目打包，对应的项目所需要的配置资源都会有所区别，实现打包的方式有很多种，可以通过an…

阅读更多...

【Linux】进程理解与学习（Ⅰ）

【Linux】进程理解与学习（Ⅰ）

环境：centos7.6，腾讯云服务器Linux文章都放在了专栏：【Linux】欢迎支持订阅🌹相关文章推荐：【Linux】冯.诺依曼体系结构与操作系统进程概念什么是进程？进程是什么？我们打开任务管理器可以看到有…

阅读更多...

Flex弹性布局一文通【最全Flex教学】

Flex弹性布局一文通【最全Flex教学】

文章目录一.Flex布局1.1 传统布局和flex布局1.1.1 传统布局1.1.2 flex弹性布局1.2 flex初步体验1.3 布局原理二.常见Flex属性2.1 常见父项属性2.2 flex-direction主轴的方向2.3 justify-content设置主轴上的子元素排列方式2.4 设置子元素是否flex-wrap换行2.5 align-itmes设置侧…

阅读更多...

数列的极限

数列的极限

数列的极限的定义： 当正多边形的边数越来越多时，正多边形的面积越来越接近于圆的面积。这个过程就叫做极限。数列的形式： 数列的每一个下标对应一个数列元素值。认识数列这就是4个数列的表现形式。当数列的下标无限增长时&#xff0c…

阅读更多...

记录--uni-app中安卓包检查更新、新版本下载、下载进度条显示功能实现

记录--uni-app中安卓包检查更新、新版本下载、下载进度条显示功能实现

这里给大家分享我在网上总结出来的一些知识，希望对大家有所帮助需求描述如果想要做一个app的话，可以有很多种选择方案，uni-app是其中的一个性价比高一些(坑多一些)的方案。本文记录一下，uni-app打安卓包以后，需要检查…

阅读更多...

【操作系统】如何避免预读失效和缓存污染的问题？

【操作系统】如何避免预读失效和缓存污染的问题？

【操作系统】如何避免预读失效和缓存污染的问题？ 文章目录【操作系统】如何避免预读失效和缓存污染的问题？Linux 和 MySQL 的缓存Linux 操作系统的缓存MySQL 的缓存传统 LRU 是如何管理内存数据的？预读失效，怎么办？什么…

阅读更多...

推荐文章

最新文章