小目标检测闲谈

news2025/1/11 11:12:01

  • 学术界在小目标检测领域的研究进展似乎已经相对缓慢,这一趋势在年度顶级学术会议的相关论文中也有所体现。这部分停滞可能与深度学习领域整体的发展趋势有关。然而,小目标检测仍然是一个具有重要应用潜力的领域,尤其在实际部署中,常常会面临小目标检测的挑战性情况,例如自动驾驶中的红绿灯检测和远距离车辆检测。 这些挑战性问题使小目标检测领域依然具备巨大的实际价值。解决这些问题可以直接提高自动驾驶、监控、遥感等领域的性能,因此小目标检测的研究仍然吸引了研究者的关注。虽然进展可能相对较慢,但在实际应用中,小目标检测问题的解决仍然具有重要意义。或许未来会出现新的方法和技术,以推动小目标检测领域的进一步发展和改进。
  • 在COCO Benchmark这种多尺度数据集上,专注于小目标检测可能并不明智。因为大尺度和小尺度物体之间存在相互影响,如果过于聚焦于小物体的检测,大物体的检测性能可能会因缺乏关注而受到负面影响,这一观点已在QueryDet论文中有所体现(QueryDet的实验结果,AP_S比过了其他方法,但AP_M和AP_L却比不上)。这也解释了为什么在COCO数据集上很少有专门针对小目标的检测方法。提高小物体的平均精度(AP)需要同时保持大中尺度物体的AP不下降,这意味着总体AP必须提高。从这个角度来看,全面优化整体AP似乎更为合理,而不是仅仅专注于解决小物体检测这个难题。这也是COCO数据集上最先进的方法所采用的思路,它们致力于提高整体AP,而小物体AP的提升则是自然而然的,无需专门开发方法来提高小物体AP。
  • 当然,需要强调的是,广受欢迎的Transformer类方法通常不太适用于小物体检测。这主要是因为小物体检测需要高分辨率的特征,而使用高分辨率特征会导致self-attention机制的计算量急剧增加。尽管有一些方法可以部分缓解这个问题,但目前尚无法从根本上解决这个挑战。
  • 因此,进行小目标检测的更为明智的方法是专注于那些只包含小物体的任务,例如交通标志检测、卫星图像检测等。另一种途径是创建新的基准数据集,例如TinyPerson、AI-TOD等,然后根据数据集的特点,设计方法以达到最先进的性能(正如RFLA和DotD所做的)。这些方法将更有针对性,更容易取得成功,因为它们将专门针对小物体检测的需求和挑战进行了优化。
  • 在众多小目标检测方法中,最实用的方法通常包括以下几个方面:数据增广(例如Stitcher、copy-paste)以增加训练样本的多样性,使用放大输入图片的策略(如GAN放大再检测、将图像裁剪成patch再放大,如SAHI方法)来处理小物体,利用高分辨率的特征(如QueryDet[5])以捕捉更多小物体细节,或者专门为极小目标(<=16*16像素)设计的检测方法,并改进标签分配策略,以增加小目标的正样本数量(例如RFLA和DotD)。这些方法的共同之处在于它们的简洁性,遵循着“大道至简”的原则。它们的核心思想都很朴素,无非是通过增加小目标的训练样本数量(通过数据增广)、将小物体视为大物体(通过放大输入图片或使用高分辨率特征)以及改善小目标的正样本数量(通过适当的标签分配方法),从而有效地应对小目标检测的挑战。


一些小目标的论文:

1.Augmentation for small object detection, CVPR 2019.[1] Relation Networks for Object Detection, CVPR 2018.

2.Spatial-aware Graph Relation Network for Large-scale Object Detection, CVPR 2019.

3.Reasoning-RCNN: Unifying Adaptive Global Reasoning into Large-scale Object Detection, CVPR 2019.

4.HTD: Heterogeneous Task Decoupling for Two-Stage Object Detection, TIP 2021.

5.QueryDet: Cascaded Sparse Query for Accelerating High-Resolution Small Object Detection, CVPR 2022.

6.Scale Match for Tiny Person Detection, WACV 2020.

7.Tiny object detection in aerial images, ICPR 2021.

8.RFLA: Gaussian Receptive Field based Label Assignment for Tiny Object Detection, ECCV 2022.

9.Dot Distance for Tiny Object Detection in Aerial Images, CVPRW 2021.

10.Stitcher: Feedback-driven Data Provider for Object Detection, CVPR 2020.

11.Augmentation for small object detection, CVPR 2019.

12.Slicing Aided Hyper Inference and Fine-tuning for Small Object Detection, ICIP 2022.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1112746.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ChatGPT(1):ChatGPT初识

1 ChatGPT原理 ChatGPT 是基于 GPT-3.5 架构的一个大型语言模型&#xff0c;它的工作原理涵盖了深度学习和自然语言处理技术。以下是 ChatGPT 的工作原理的一些关键要点&#xff1a; 神经网络架构&#xff1a;ChatGPT 的核心是一个深度神经网络&#xff0c;采用了变种的 Tran…

1 tcp协议20问

1什么是TCP网络分层 1.1分层描述 网络访问层&#xff1a; 2 TCP的三次握⼿中为什么是三次&#xff1f;为什么不是两次、四次&#xff1f; 两次握手的话&#xff0c;服务端会单方面认为建立已经成功&#xff0c;但是对于客户端而言&#xff0c;可能只是开个玩笑的&#xff0c…

形式化验证笔记

参考视频&#xff1a; 形式化验证的原理与新应用【DatenLord达坦科技】形式化验证入门(我强推&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;) 形式化验证&#xff1a;在状态机表征的空间里面进行搜索&#xff0c;验证某个模型是否按规范执行且测试覆盖率达到1…

058:mapboxGL监听键盘事件,通过panBy控制前后左右移动

第058个 点击查看专栏目录 本示例是介绍演示如何在vue+mapbox中监听键盘事件,控制前后左右移动。 本例通过panBy方法来移动一定距离的地图,通过.addEventListener的方法来监听键盘的按键动作。注意这里面style中一定要设置好pitch,不能为0,不然就撞墙,不能移动了。 直接复…

OpenCV 笔记(2):图像的属性以及像素相关的操作

Part11. 图像的属性 11.1 Mat 的主要属性 在前文中&#xff0c;我们大致了解了 Mat 的基本结构以及它的创建与赋值。接下来我们通过一个例子&#xff0c;来看看 Mat 所包含的常用属性。 先创建一个 3*4 的四通道的矩阵&#xff0c;并打印出其相关的属性&#xff0c;稍后会详细…

数据库索引种类

文章目录 索引的优缺点优点缺点 聚簇索引特点优点缺点 非聚簇索引特点优点缺点使用场景&#xff1a; 在MyISAM与InnoDB中的使用 索引的优缺点 索引概述 MySQL官方将索引定义为帮助MySQL高效获取数据的数据结构。索引的本质是一种排好序的快速查找数据结构&#xff0c;用于满足…

YOLOv5/v7/v8改进实验(五)之使用timm更换YOLOv5模型主干网络Backbone篇

&#x1f680;&#x1f680; 前言 &#x1f680;&#x1f680; timm 库实现了最新的几乎所有的具有影响力的视觉模型&#xff0c;它不仅提供了模型的权重&#xff0c;还提供了一个很棒的分布式训练和评估的代码框架&#xff0c;方便后人开发。更难能可贵的是它还在不断地更新迭…

(H5轮播)vue一个轮播里显示多个内容/一屏展示两个半内容

效果图 : html: <div class"content"><van-swipeclass"my-swipe com-long-swipe-indicator":autoplay"2500"indicator-color"#00C4FF"><van-swipe-itemclass"flex-row-wrap"v-for"(items, index) in M…

Kubernetes 进阶

Kubernetes 进阶  Service 控制器  Ingress 对象(对外暴露应用)  管理应用程序配置  K8s 数据卷与持久数据卷  再谈有状态应用部署:StatefulSet控制器  K8s 安全访问控制  K8s 部署利器Helm初探 Service 控制器 • Service存在的意义 • Pod与…

更改Kali Linux系统语言以及安装zenmap

目录 更改Kali Linux系统语言 安装 Zenmap 更改Kali Linux系统语言以及安装zenmap 在使用kali的过程中&#xff0c;会遇到许多问题&#xff0c;其中一个就是看不懂英语&#xff0c;下面是如何更换语言的步骤。 更改Kali Linux系统语言 首先&#xff0c;打开kali&#xff0…

学信息系统项目管理师第4版系列32_信息技术发展

1. 大型信息系统 1.1. 大型信息系统是指以信息技术和通信技术为支撑&#xff0c;规模庞大&#xff0c;分布广阔&#xff0c;采用多级 网络结构&#xff0c;跨越多个安全域&#xff1b;处理海量的&#xff0c;复杂且形式多样的数据&#xff0c;提供多种类型应用 的大系统 1.1.…

python安装、输入输出、注释、中文编码、编码规范等基础语法

一、概述 1、简介 Python的创始人为吉多范罗苏姆&#xff08;Guido van Rossum&#xff09;。1989年的圣诞节期间&#xff0c;Guido开始写Python语言的编译器。Python这个名字&#xff0c;来自Guido所挚爱的电视剧Monty Python’s Flying Circus。他希望这个新的叫做Python的…

30 Python的matplotlib模块

概述 在上一节&#xff0c;我们介绍了Python的pandas模块&#xff0c;包括&#xff1a;Series、DataFrame、数据读取和写入等内容。在这一节&#xff0c;我们将介绍Python的matplotlib模块。matplotlib模块是一个Python的2D绘图库&#xff0c;可以实现各种类型的图形绘制&#…

【试题021】C语言算术运算符例题

1.题目&#xff1a;表达式4.8-1/25%3的值是 &#xff1f; 2.代码解析&#xff1a; //表达式4.8-1/25%3的值是?printf("%d\n", (4 - 1 / 2 5 % 3));//分析&#xff1a;多个运算符看优先级高低次序//根据口诀可知&#xff1a; /和%都排第三&#xff0c;和-排第四//所…

AutoSAR入门:应用背景及简介

1、应用背景 在我们现在的汽车行业里面&#xff0c;汽车电子的发展过程中&#xff0c;我们发现有一些新的趋势汽车电子系统的复杂性不断增长。 我们现在可以看到车辆有越来越多的功能&#xff0c;那么这些功能呢&#xff0c;也在往这个控制器上进行集中&#xff0c;比如说我们现…

修炼k8s+flink+hdfs+dlink(六:学习k8s)

一&#xff1a;增&#xff08;创建&#xff09;。 直接进行创建。 kubectl run nginx --imagenginx使用yaml清单方式进行创建。 二&#xff1a;删除。 kubectl delete pods/nginx 三&#xff1a;修改。 kubectl exec -it my-nginx – /bin/bash 四&#xff1a;查看。 …

【Leetcode每日一题 1726】「组合|哈希表」同积元组

2023.10.19 本题重点&#xff1a; 1.题目的理解&#xff0c;如何转化成一种组合问题 2.哈希表的使用 题目介绍&#xff1a; 给你一个由 不同 正整数组成的数组 nums &#xff0c;请你返回满足 a * b c * d 的元组 (a, b, c, d) 的数量。其中 a、b、c 和 d 都是 nums 中的元…

11. 机器学习 - 评价指标2

文章目录 混淆矩阵F-scoreAUC-ROC 更多内容&#xff1a; 茶桁的AI秘籍 Hi, 你好。我是茶桁。 上一节课&#xff0c;咱们讲到了评测指标&#xff0c;并且在文章的最后提到了一个矩阵&#xff0c;我们就从这里开始。 混淆矩阵 在我们实际的工作中&#xff0c;会有一个矩阵&am…

【计算机网络笔记】OSI参考模型基本概念

系列文章目录 什么是计算机网络&#xff1f; 什么是网络协议&#xff1f; 计算机网络的结构 数据交换之电路交换 数据交换之报文交换和分组交换 分组交换 vs 电路交换 计算机网络性能&#xff08;1&#xff09;——速率、带宽、延迟 计算机网络性能&#xff08;2&#xff09;…

分布式存储 vs. 全闪集中式存储:金融数据仓库场景下的性能对比

作者&#xff1a;深耕行业的 SmartX 金融团队 张德敏 近年来随着金融行业的高速发展&#xff0c;经营决策者及监管机构对信息时效性的要求越来越高&#xff0c;科技部门面临诸多挑战。例如&#xff0c;不少金融机构使用数仓业务系统&#xff0c;为公司高层提供日常经营报表&am…