【计算机视觉 | 目标检测】干货:目标检测常见算法介绍合集(二)

news2025/1/20 18:06:56

文章目录

    • 十六、EfficientDet
    • 十七、Deformable DETR
    • 十八、YOLOX
    • 十九、Sparse R-CNN
    • 二十、Contour Proposal Network
    • 二十一、VarifocalNet
    • 二十二、Libra R-CNN
    • 二十三、Stand-Alone Self Attention
    • 二十四、ThunderNet
    • 二十五、Hierarchical Transferability Calibration Network
    • 二十六、PP-YOLO
    • 二十七、YOLOv1
    • 二十八、Grid R-CNN
    • 二十九、RTMDet: An Empirical Study of Designing Real-Time Object Detectors
    • 三十、TridentNet

十六、EfficientDet

EfficientDet 是一种对象检测模型,它利用多种优化和主干调整,例如使用 BiFPN,以及统一缩放所有主干、特征网络和框/类预测的分辨率、深度和宽度的复合缩放方法 同时网络。

在这里插入图片描述

十七、Deformable DETR

可变形 DETR 是一种目标检测方法,旨在缓解 DETR 收敛速度慢和复杂度高的问题。 它结合了可变形卷积的稀疏空间采样和 Transformers 的关系建模功能的最佳性能。 具体来说,它引入了一个可变形注意模块,该模块关注一小组采样位置,作为所有特征图像素中突出关键元素的预过滤器。 该模块可以自然地扩展到聚合多尺度特征,而无需借助 FPN。

在这里插入图片描述

十八、YOLOX

YOLOX 是一种单级目标检测器,它对具有 DarkNet53 主干的 YOLOv3 进行了多项修改。 具体来说,YOLO的头部被替换为解耦的头部。 对于每个级别的 FPN 特征,我们首先采用 1 × 1 卷积层将特征通道减少到 256,然后添加两个并行分支,每个分支具有两个 3 × 3 卷积层,分别用于分类和回归任务。

其他变化包括将 Mosaic 和 MixUp 添加到增强策略中以提高 YOLOX 的性能。 锚定机制也被移除,因此 YOLOX 是无锚定的。 最后,用于标签分配的 SimOTA——其中标签分配通过 top-k 策略被表述为最优传输问题。

在这里插入图片描述

十九、Sparse R-CNN

稀疏 R-CNN 是一种用于图像中对象检测的纯粹稀疏方法,无需在所有(密集)图像网格上枚举对象位置候选,也无需与全局(密集)图像特征交互的对象查询。

如图所示,候选对象由一小组固定的可学习边界框(由 4 维坐标表示)给出。 以 COCO 数据集为例,总共需要 100 个框和 400 个参数,而不是从区域提议网络(RPN)中数十万个候选者中预测的参数。 这些稀疏候选被用作建议框,通过 RoIPool 或 RoIAlign 提取感兴趣区域(RoI)的特征。

在这里插入图片描述

二十、Contour Proposal Network

轮廓提议网络 (CPN) 检测图像中可能重叠的对象,同时拟合像素精确的闭合对象轮廓。 CPN 可以将最先进的对象检测架构作为骨干网络合并到可以进行端到端训练的快速单阶段实例分割模型中。

在这里插入图片描述

二十一、VarifocalNet

VarifocalNet 是一种旨在对目标检测中的大量候选检测进行准确排名的方法。 它由一个名为 Varifocal Loss 的新损失函数组成,用于训练密集目标检测器来预测 IACS,以及一个用于估计 IACS 和细化粗边界框的新高效星形边界框特征表示。 将这两个新组件和边界框细化分支相结合,在 FCOS 架构上产生密集目标检测器,作者将其简称为 VarifocalNet 或 VFNet。

在这里插入图片描述

二十二、Libra R-CNN

Libra R-CNN 是一种目标检测模型,旨在实现平衡的训练过程。 作者的动机是,过去的检测器的训练在训练过程中存在不平衡,一般分为三个级别:样本级别、特征级别和目标级别。 为了减轻不利影响,Libra R-CNN 集成了三个新颖的组件:IoU 平衡采样、平衡特征金字塔和平衡 L1 损失,分别用于减少样本、特征和目标级别的不平衡。

在这里插入图片描述

二十三、Stand-Alone Self Attention

独立自注意力 (SASA) 将所有空间卷积实例替换为应用于 ResNet 的自注意力形式,从而生成完全独立的自注意力模型。

二十四、ThunderNet

ThunderNet 是一个两阶段目标检测模型。 ThunderNet 的设计针对的是最先进的两级探测器中计算量大的结构。 主干网络采用了受 ShuffleNetV2 启发的网络(称为 SNet),专为目标检测而设计。 在检测部分,ThunderNet沿用了Light-Head R-CNN中的检测头设计,并进一步压缩了RPN和R-CNN子网。 为了消除小主干和小特征图引起的性能下降,ThunderNet 使用了两个新的高效架构模块:上下文增强模块(CEM)和空间注意力模块(SAM)。 CEM 结合了多个尺度的特征图以利用局部和全局上下文信息,而 SAM 使用 RPN 中学到的信息来细化 RoI 扭曲中的特征分布。

在这里插入图片描述

二十五、Hierarchical Transferability Calibration Network

分层可转移性校准网络(HTCN)是一种自适应目标检测器,可分层(局部区域/图像/实例)校准特征表示的可转移性,以协调可转移性和可辨别性。 所提出的模型由三个部分组成:(1)具有输入插值的重要性加权对抗训练(IWAT-I),它通过重新加权插值图像级特征来增强全局可辨别性; (2)上下文感知实例级对齐(CILA)模块,通过捕获实例级特征与全局上下文信息之间的互补效果进行实例级特征对齐,从而增强局部可辨别性; (3)局部特征掩模,用于校准局部可转移性,为以下判别模式对齐提供语义指导。

在这里插入图片描述

二十六、PP-YOLO

PP-YOLO是基于YOLOv3的目标检测器。 它主要尝试结合现有的各种几乎不增加模型参数数量和FLOPs的trick,以达到在保证速度几乎不变的情况下尽可能提高检测器精度的目标。 其中一些变化包括:

使用 ResNet50-vd 更改 DarkNet-53 主干网。 ResNet50-vd中的一些卷积层也被替换为可变形卷积层。
使用更大的批量大小 - 从 64 更改为 192。
参数使用指数移动平均值。
DropBlock 应用于 FPN。
使用 IoU 损失。
添加 IoU 预测分支来测量定位的准确性。
使用Grid Sensitive,与YOLOv4类似。
使用矩阵NMS。
CoordConv用于FPN,取代了1x1卷积层,也是检测头中的第一个卷积层。
空间金字塔池用于顶部特征图。

在这里插入图片描述

二十七、YOLOv1

YOLOv1 是一个单阶段目标检测模型。 对象检测被视为空间分离的边界框和相关类概率的回归问题。 单个神经网络在一次评估中直接从完整图像预测边界框和类别概率。 由于整个检测管道是单个网络,因此可以直接在检测性能上进行端到端优化。

该网络使用整个图像的特征来预测每个边界框。 它还同时预测图像所有类别的所有边界框。 这意味着网络对完整图像和图像中的所有对象进行全局推理。

在这里插入图片描述

二十八、Grid R-CNN

Grid R-CNN 是一个目标检测框架,其中传统的回归公式被网格点引导的定位机制取代。

Grid R-CNN 将对象边界框区域划分为网格,并采用全卷积网络(FCN)来预测网格点的位置。 由于全卷积架构的位置敏感特性,Grid R-CNN 保持了明确的空间信息,并且可以在像素级获得网格点位置。 当指定位置上一定数量的网格点已知时,相应的边界框就确定了。 在网格点的引导下,Grid R-CNN 可以比缺乏显式空间信息引导的回归方法确定更准确的对象边界框。

在这里插入图片描述

二十九、RTMDet: An Empirical Study of Designing Real-Time Object Detectors

三十、TridentNet

TridentNet 是一种目标检测架构,旨在生成具有统一表示能力的特定比例特征图。 构建了并行多分支架构,其中每个分支共享相同的变换参数但具有不同的感受野。 尺度感知训练方案用于通过采样适当尺度的对象实例进行训练来专门化每个分支。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1007366.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

垃圾收集算法

1.如何判断对象是否存活? 1.1引用计数算法 基本思路: 在对象中添加一个引用计数器每当有一个地方引用它的时候,计数器就加1每当有一个引用失效的时候,计数器就减-1当计数器的值为0的时候,那么该对象就是可被GC回收的…

leetcode 2366. Minimum Replacements to Sort the Array(数组排序的最少替换数)

数组nums中的元素nums[ i ] 可以替换为任意两个数a, b, 前提是ab nums[ i ]. 把数组nums变为升序&#xff08;可以有相等&#xff09;数组需要多少次替换。 思路&#xff1a; 排序数组是左边的元素<右边元素&#xff0c;以右边元素为边界。 所以从右到左遍历数组&#xf…

第二章 网络应用

第一节 计算机网络应用体系结构 三种类型&#xff1a; 1. 客户/服务器&#xff08;c/s&#xff09;结构 最主要的特征是通信只在客户与服务器之间进行&#xff0c;客户与客户之间不进行直接通信。 2. P2P(Peer to Peer) 结构 每个对等端都同时具备C/S应用的客户与服务器的…

Python算法练习 9.12

leetcode 643 子数组最大平均数 给你一个由 n 个元素组成的整数数组 nums 和一个整数 k 。 请你找出平均数最大且 长度为 k 的连续子数组&#xff0c;并输出该最大平均数。 任何误差小于 10-5 的答案都将被视为正确答案 输入&#xff1a;nums [1,12,-5,-6,50,3], k 4 输出…

buuctf web [极客大挑战 2019]Secret File

纯网页&#xff0c;看一下源码。 这一块源码中有个隐藏的超链接&#xff0c;点击后跳转到了新页面。 新页面的源码里&#xff0c;也有一处可以跳转的超链接。 点进新页面啥也没有了。 单看网页&#xff0c;什么也没有&#xff0c;尝试用burp抓包试试。 在/Archive_room.php跳…

循环语句详解

文章目录 循环语句详解1. 循环使用 v-for 指令2. v-for 还支持一个可选的第二个参数&#xff0c;参数值为当前项的索引3. 模板template 中使用 v-for4. v-for 迭代对象-第一个参数为value5. v-for的第二个参数为键名6. v-for的第三个参数为索引7. v-for迭代整数8. computed计算…

运营商大数据精准营销获客?

多年来&#xff0c;大数据运营商一直致力于为企业提供互联网大数据精准营销的新项目&#xff0c;并以确保自身信息安全为前提。例如&#xff0c;如果移动用户查看了任何网站&#xff0c;在网页上搜索了任何关键词&#xff0c;登录了应用程序&#xff0c;给任何人打了电话&#…

【Linux】多线程互斥与同步

文章目录 一、线程互斥1. 线程互斥的引出2. 互斥量3. 互斥锁的实现原理 二、可重入和线程安全三、线程和互斥锁的封装1. 线程封装1. 互斥锁封装 四、死锁1. 死锁的概念2. 死锁的四个必要条件3. 避免死锁 五、线程同步1. 线程同步的理解2. 条件变量 一、线程互斥 1. 线程互斥的…

kaggle近三年NLP比赛top方案汇总及新赛推荐

NLP的赛题任务主要有文本分类、情感分析、关系抽取、文本匹配、阅读理解、问答系统等&#xff0c;自Google开发的NLP处理模型BERT被广泛应用后&#xff0c;目前解决NLP任务的首选方案就是深度学习方法&#xff08;textCNN、LSTM、GRU、BiLSTM、Attention等&#xff09;&#xf…

CSS 纵横比属性:aspect-ratio

CSS 属性 aspect-ratio 为盒子规定了纵横比&#xff08;宽高比&#xff09;&#xff0c;这个纵横比可以用于计算 auto 尺寸以及其他布局函数。

《算法竞赛·快冲300题》每日一题:“点灯游戏”

《算法竞赛快冲300题》将于2024年出版&#xff0c;是《算法竞赛》的辅助练习册。 所有题目放在自建的OJ New Online Judge。 用C/C、Java、Python三种语言给出代码&#xff0c;以中低档题为主&#xff0c;适合入门、进阶。 文章目录 题目描述题解C代码Java代码Python代码 “ 点…

如何通过局域网共享文件

需求环境&#xff1a;公司有多个部门&#xff0c;不同用户与部门使用不同文件 业务背景&#xff1a;一台windows服务器,若干客户端 需要技能&#xff1a; 熟悉windows系统管理&#xff0c; 包含计算机管理、 硬盘硬件、 用户管理、 share and storage management 项目方案…

系统架构设计专业技能 · 软件工程之UML建模设计

现在的一切都是为将来的梦想编织翅膀&#xff0c;让梦想在现实中展翅高飞。 Now everything is for the future of dream weaving wings, let the dream fly in reality. 点击进入系列文章目录 系统架构设计高级技能 软件工程之UML建模设计 一、需求分析 - UML图二、用例图2.…

黑马JVM总结(六)

&#xff08;1&#xff09;常量池 方法区的组成中都由一个叫做运行时常量池的部分&#xff0c;内部包含一个叫做StringTable的东西 反编译二进制字节码&#xff1a; 类的基本信息&#xff1a; 常量池&#xff1a; 方法定义&#xff1a; 构造方法 main方法 &#xff1a;方法中…

NS6326 4-30V 输入 5V/3A 输出同步降压稳压器芯片

NS6326 4-30V 输入 5V/3A 输出同步降压稳压器芯片 1 特性  宽输入电压范围&#xff1a;4V-30V  效率可高达 92%以上  超高恒流精度&#xff1a;5%  恒压精度&#xff1a;5%  无需外部补偿  开关频率&#xff1a;130kHz  输入欠压/过压、输出短路和过热保护  SO…

驱动开发--自动创建设备节点udev机制的实现过程

一、udev的认识 udev:自动创建设备节点的机制&#xff0c;创建设备节点的逻辑在用户空间 二、udev机制创建设备节点的过程分析 三、目录信息创建和删除类函数 #include<linux/device.h> 1.向上提交目录信息 struct class * class_create(struct module *owner,const c…

牛客:小美的01串翻转

小美的01串翻转 #include<iostream> #include<cstring> #include<string> #include<vector>using namespace std; typedef long long ll; const int N 1100; string s; ll res 0;int main() {cin>>s;int n s.size();vector<vector<in…

spice VDAgent简介

vdagent分为linux和windows&#xff0c;其中Linux分为vdagent守护进程和vdagent客户端进程&#xff0c;而windows主要为vdagent服务。 在windows中&#xff0c;通过服务方式自启动&#xff0c;并控制windows显示等。 在linux中&#xff0c; 守护进程通过 Sys-V initscript 或 s…

ChatGPT追祖寻宗:GPT-2论文要点解读

论文地址&#xff1a;Language Models are Unsupervised Multitask Learners 上篇&#xff1a;GPT-1论文要点解读 在上篇&#xff1a;GPT-1论文要点解读中我们介绍了GPT1论文中的相关要点内容&#xff0c;其实自GPT模型诞生以来&#xff0c;其核心模型架构基本没有太大的改变&a…

线程安全问题(3)--- wait(),notify()

前言 在多线程的环境下&#xff0c;我们常常要协调多个线程之间的执行顺序&#xff0c;而为了实现这一点&#xff0c;Java提供了一些方法来帮助我们完成这一点。 一&#xff0c;wait() 作用&#xff1a; 使当前线程进入等待状态 释放当前的锁 (即该方法必须和 synchrnized 关键…