视觉小目标检测论文速读

news2024/12/27 13:55:50

视觉小目标检测论文速读

本文主要针对三篇文章典型文章。

一. SuperYOLO

Super Resolution Assisted Object Detection in Multimodal Remote Sensing Imagery
在这里插入图片描述

1. 主要工作:

  1. 首先去掉Focus模块取保持HR特征, 避免分辨率下降,有效克服小目标空间损失的减少。
  2. 利用像素级多模态融合(RGB+IR)来提取信息,以增强RSI中小对象的更合适和有效的特征。
  3. 设计了一个简单灵活的SR(Super Resolution)分支,用于学习HR特征表示,只用在训练阶段。它可以区分来自广阔背景的小目标低分辨率(LR)输入。SR分支在推理阶段被丢弃

2. 算法细节:

  1. Backbone:以YOLOv5s 作为baseline
    在这里插入图片描述
  2. SR分支结构:Encode-Decoder model, 结合文理信息与语义信息。
    在这里插入图片描述

二. SLICING AIDED HYPER INFERENCE AND FINE-TUNING FOR SMALL OBJECT DETECTION

参考:https://blog.csdn.net/weixin_54546190/article/details/124307316

1. 主要工作:
提出了一个通用解决方案,基于切片辅助的推理和高分图像中小目标障碍物微调
在这里插入图片描述

2. 算法细节:
在这里插入图片描述

  1. 切片辅助的微调: 实际是数据增强
    一张原始图片,切M×N patches, resize 宽度为800-1333,+ pretrained model->fine-tuned model
  2. 切片辅助的推理
    一张原始图片,切成有重叠的M×N patches(如下图), resize 放大, 每一张分别forward;
    (可选FI)原始图片的 inference;
    合并起来,再postprocess
    在这里插入图片描述

三. Anchor Retouching via Model Interaction for Robust Object Detection in Aerial Images

1. 前言
anchor-free: 小目标检测效果好,大目标有问题
anchor-based: 大目标检测效果好,小目标有问题
在这里插入图片描述
2. 主要工作:
RoI Trans + DEA
DEA Head: 构造Sample discriminator, 样本筛选。作用是生成更多的小目标的正向样本,提高训练时样本质量,如下图对样本分布做了统计。
在这里插入图片描述

3. 算法细节:
DEA HEAD = DEA(anchor-free,Fcos) + Faster-RCNN(anchor-based)
在这里插入图片描述
Sampler discriminator 伪代码
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/63850.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

(一) SpringCloud+Security+Oauth2微服务授权初步认识

一 引言 再前面的security专题中 我们学习了单体架构基于SpringSecurity实现的授权方案,这种在业务量较小及业务的复杂度较低时比较实用,随着业务的复杂度越来越高,微服务架构也越来越被更多的公司使用,本文就微服务中的主流授权方案及oauth2中基本概念做简要概述。…

厨神之蛋糕制作

失败了7次,成功了6次。成功的6次里有好有坏,总结一下蛋糕制作的过程与要点。 原料 低筋面粉(筋度越高越偏向包子馒头的口感,松软度越低)、白糖、鸡蛋、水(也可以用牛奶或其他含水的物质)、食用…

多目slam论文阅读系列一:MULTICOL-SLAM论文阅读

论文地址:https://arxiv.org/pdf/1610.07336.pdf 代码:GitHub - urbste/MultiCol-SLAM: This repository contains a multi-fisheye camera SLAM. The underlying SLAM system is based on ORB-SLAM.参考文档:【算法】跑MultiCol-SLAM遇到的效…

Java小区物业管理系统源码带本地搭建教程

技术架构 技术框架:springboot mybatis thymeleaf Mysql5.7 运行环境:jdk8 IntelliJ IDEA maven 宝塔面板 本地搭建教程 1.下载源码,本地电脑新建一个数据库,导入wuye.sql文件至数据库中。 2.使用IDEA打开wuyeadmin目录&…

web随想笔记

1 OJ大概架构 1.0 OJ页面–>WEB服务器(SpringBoot)–>判题机(Linux) OJ页面将提交的代码封装成json格式发给web服务器端,服务器端接收json获取信息,进行进一步封装,转发给判题机,拆解json数据获得程…

擦除编码(EC)数据中心中的最优机架协调更新

擦除编码EC在数据中心中的最优机架协调更新介绍与背景工作文章外主流的工作文章摘要RackCU, the optimal Rack-Coordinated Update solution数据增量基础更新奇偶校验基础更新RackCU其他的更新方法一些数值实验可以仅需改进的地方参考文献介绍与背景工作 擦除编码(…

Simulink建模:CRC校验模型

本文研究CRC校验的Simulink模型及其代码生成。 文章目录1 CRC校验2 C代码形式3 Matlab/Simulink建模及代码生成3.1 Matlab Function建模3.2 For Iteration子系统建模4 总结与思考1 CRC校验 在汽车软件开发中,CRC校验常用于CAN通信中。通常将某个CAN报文中的数据通过…

【AVL树】

目录基础知识AVL树的定义结点的平衡因子结构体部分操作思路AVL树的插入平衡化旋转左单旋转右单旋转先左后右双旋转先右后左双旋转插入函数AVl树的删除左平衡代码右平衡代码删除函数基础知识 AVL树的定义 一棵AVL树或者是空树,或者是具有谢下列性质的二叉搜索树&am…

Docker 实战——部署 Nginx 镜像容器、Tomcat 镜像容器、MySQL 镜像容器

3.安装 Docker 可使用 yum list docker-ce --showduplicates | sort -r 命令来查看 Docker 的所有版本。 [rootDocker ~]# yum -y install docker-ce-17.12.1.ce #安装docker 4.启动 Docker 并设置开机自启 [rootDocker ~]# systemctl start docker [rootDocker ~]# syste…

uniClound云开发创建流程

uniClound是 DCloud 联合阿里云、腾讯云,为开发者提供的基于 serverless 模式和 js 编程的云开发平台。云服务创建项目,使用熟悉的js,轻松搞定前后台整体业务,使前端开发离全栈开发又进一步,尤其是一键生成代码的功能&…

海外的 SEO 网站如何进行优化

作为一个已经出海12年的专业平台,米贸搜为你整理了一份海外SEO优化方法,希望对你有所帮助。 无论是平台还是外贸网站,无论是外贸还是内销,一个绕不开的话题就是流量。随着各平台和外贸网站竞争的加剧,流量的获取成本也…

【ML】基于机器学习的心脏病预测研究(附代码和数据集,逻辑回归模型)

心脏病是人类健康的头号杀手, 全球大约1/3的人口死亡是由心脏病引起的。而我国,每年大概有几十万人口死于心脏病。如果我们可以通过提取人体相关的指标(既往病史、家族病史、血压情况、血糖情况等等),通过数据挖掘方式来分析不同特征对于心脏病的影响,或者建立电子病历,…

flink1.13.2 text文本数据迁移为orc+snappy数据解决方案

1.表结构不变(列名,分区不变),表存储和压缩算法改变 1.1. 外部表(未分区) 1.1.1. 拷贝源表结构,创建外部表 create table if not exists [目标表名] like [源表名] 示例: create table if not exists dwm_soh_estimate_nopartition_out_snappy like dwm_soh_estimate_n…

10x倍加速PDE的AI求解:元自动解码器求解参数化偏微分方程

研究背景 科学和工程中的许多应用需要求解具有不同方程系数、不同边界条件甚至不同求解域形状的偏微分方程(Partial Differential Equation,PDE),即需要求解一个方程族而不是单个方程。这类应用经常在反问题求解、控制和优化、风险评估和不确定性量化领域…

C++GUI之wxWidgets(4)-编写应用涉及的类和方法(1)

目录wxApp ClasswxApp::OnInit()wxFrame ClasswxFrame处理的事件wxApp Class 当wxUSE_GUI1时,wxApp类代表应用程序本身。 除了wxAppConsole提供的特性外,它还可以跟踪顶部窗口(SetTopWindow()),并添加了对视频模式的支持(SetDisp…

2023最新SSM计算机毕业设计选题大全(附源码+LW)之java小区宠物信息管理系统0v9l2

最近发现近年来越来越多的人开始追求毕设题目的设创、和新颖性。以往的xx管理系统、xx校园系统都过时了。大多数人都不愿意做这类的系统了,确实,从有毕设开始就有人做了。但是很多人又不知道哪些毕设题目才算是新颖、创意。太老土的不想做,创…

高低JDK版本中JNDI注入(上)

目录 前言: (一)RMI 0x01 低版本 1.1 服务端 1.2 客户端 1.3 ExportObject.java 0x02 高版本 (二)LDAP 0x01低版本 1.1 服务端 1.2 客户端 1.3 ExportObject.java 前言: 这篇文章主要是分析在高低版本JDK中JNDI注入RMI和LDA…

痞子衡嵌入式:浅析IAR下调试信息输出机制之硬件UART外设

大家好,我是痞子衡,是正经搞技术的痞子。今天痞子衡给大家分享的是IAR下调试信息输出机制之硬件UART外设。 在嵌入式世界里,输出打印信息是一种非常常用的辅助调试手段,借助打印信息,我们可以比较容易地定位和分析程序…

泰迪·滇西科技师范学院智能工作室分享:第一章NumPy库——先基础区别数组和列表

前言 来看NumPy库的应该都是接触到庞大数据处理的朋友吧。NumPy是一个简洁好用的数据库,尤其是在科学计算上,专为进行严格数字处理而产生的。其中的ndarray可以说是NumPy库的心脏,它提供了一个强大的N维数组对象,这一章我们先来简…

2 寄存器

寄存器 CPU是由运算器、控制器、寄存器等器件构成,他们依靠内部总线连接。 运算器进行信息处理:寄存器进行信息存储;控制器控制各种器件进行工作;内部总线连接各种器件,在它们之间进行数据的传送。 寄存器是程序员可…