【DA】《Augmentation for small object detection》

news2024/11/16 18:57:42

在这里插入图片描述

arXiv-2019


文章目录

  • 1 Background and Motivation
  • 2 Related Work
  • 3 Advantages / Contributions
  • 4 Method
    • 4.1 Oversampling
    • 4.2 Augmentation
    • 4.3 Copy-Pasting Strategies
  • 5 Experiments
    • 5.1 Datasets and Metrics
    • 5.2 Oversampling
    • 5.3 Augmentation
    • 5.4 Copy-Pasting strategies
    • 5.4 Pasting Algorithms
  • 6 Conclusion(own) / Future work


1 Background and Motivation

基于深度学习的目标检测效果在MS COCO数据集上越来越好,但是小目标检出率还是无法媲美中目标或者大目标

在这里插入图片描述

在这里插入图片描述

原因

  • only a few images are containing small objects(含有小目标的图片占比比较小)
  • small objects do not appear enough even within each image containing them(每张图片的小目标数量也比较少——lack of diversity in the locations of small objects)

小目标比较少, both across images and across pixels

作者采用 oversampling 和 copy-pasting(not overlap with any existing object)方法来提升 MS COCO 数据集上小目标的检出率

在这里插入图片描述

2 Related Work

  • Object Detection
  • Instance Segmentation
  • Small objects
    • increasing the input image resolution
    • fusing high-resolution features

3 Advantages / Contributions

用 oversampling 和 copy-paste 方法来提升目标检测任务中小目标的检出率

4 Method

Small object detection by Mask R-CNN on MS COCO

在这里插入图片描述

在这里插入图片描述

统计的还算细致,average matching anchors 比较少,average max IoU 也比较小

large object spanning multiple sliding-window locations often has a high IoU with many anchor boxes

小目标面积比较小,负责预测的 grid anchor 也会少很多(只能说高质量的负样本会变少,因为每个GT只有一个 anchor 负责预测——以前的正负样本匹配策略,小目标比较小,周边 grid 的 anchor 可能覆盖不到目标,同为负样本,但质量应该没有大目标的高)

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

4.1 Oversampling

over-sample images containing small objects

4.2 Augmentation

(1)copy mask

(2)random transformations——object size ±20% and rotate it ±15°

(3)paste

4.3 Copy-Pasting Strategies

在这里插入图片描述

5 Experiments

5.1 Datasets and Metrics

MS COCO 2017

  • 118,287 images for training, 5,000 images for validation and 40,670 test images.

  • 860,001 and 36,781 objects from 80 categories are annotated with ground-truth bounding boxes and instance masks

在这里插入图片描述

5.2 Oversampling

在这里插入图片描述

可以看出,小目标提升了,大目标的效果会响应的降低

5.3 Augmentation

在这里插入图片描述

aug 应该是 copy-aug-paste 替换了原图

aug + oversample 是 aug 的基础上过采样,应该也不涉及到原图

original + aug 应该是 aug + 原图相当于 2x 小目标图片,训练数据集变多了,对于 baseline 有一点点不公平

同样也可以观察到,小目标提升了,大目标的效果会响应的降低

5.4 Copy-Pasting strategies

(1)Copy-pasting of a single object
在这里插入图片描述

单个小目标被 copy-paste 很多次

(2)Copy-pasting of multiple objects

在这里插入图片描述

许多小目标,每个小目标仅可能被 copy-paste 一次

choose numerous small objects and copy-paste each of these exactly once in an arbitrary position

(3)Copy-pasting of all small objects

在这里插入图片描述

copy-paste all small objects in each image multiple times in random places

感觉和 multi 的区别是 all,效果没有 multi 好

5.4 Pasting Algorithms

在这里插入图片描述

paste 的时候,不 overlap,边缘也不做 gaussion blur 效果最好

6 Conclusion(own) / Future work

  • MS COCO 数据集检测和分割的 leaderboard

    • https://cocodataset.org/#detection-leaderboard
  • 提升点有限,吹的是相对提升很唬人,而且小目标提升后,大目标效果下降比较明显,整体 AP 的提升基本没有

  • 方法没有任何创新点,文章描述不够简洁

  • 数据集的分析可以参考参考

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2054023.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python入门级[ 基础语法 函数... ] 笔记 例题较多

本文是刚学习Python的笔记,当时使用的编辑器是交互式编程,所以很多代码可能在你们的编译器上面不能运行,我用快引用引起来了,还需要大家自己动手试一试。 内容涉及的比较简单,主要还是Python的语法部分:三…

Ubuntu20.04.4.LTS系统如何下载安装VirtualBox虚拟机?

🏆本文收录于《CSDN问答解惑-专业版》专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收…

Solidworks二次开发:变螺距螺旋线

在帮助文档中,找到变螺距螺旋线的VBA代码,如下: --------------------------------------------------------------Preconditions: Verify that the specified part document template exists.Postconditions:1. Creates a variable-pitch h…

Nginx 学习之 配置支持 IPV6 地址

目录 搭建并测试1. 下载 NG 安装包2. 安装编译工具及库文件3. 上传并解压安装包4. 编译5. 安装6. 修改配置7. 启动 NG8. 查看 IP 地址9. 测试 IP 地址9.1. 测试 IPV4 地址9.2. 测试 IPV6 地址 IPV6 测试失败原因1. curl: [globbing] error: bad range specification after pos …

SQL— DDL语句学习【后端 9】

SQL— DDL语句学习 在数据管理的广阔领域中,SQL(Structured Query Language)作为操作关系型数据库的编程语言,扮演着举足轻重的角色。它不仅定义了操作所有关系型数据库的统一标准,还为我们提供了强大的工具来管理、查…

20240819用SDDiskTool_v1.72写IMG固件到256GB的TF卡后再用它给飞凌OK3588-C核心板刷机

20240819用SDDiskTool_v1.72写IMG固件到256GB的TF卡后再用它给飞凌OK3588-C核心板刷机 2024/8/19 10:35 1、精简的配置HDMI0为主显示屏的步骤: 在串口终端中启动到uboot阶段,按空格进入 显示配置模式。 按 2 进入:2:Display type 按 a 两次…

2、Future与CompletableFuture实战

Future与CompletableFuture实战 Callable与Future与FutureTask介绍Callable详解Future介绍FutureTask使用使用案例:促销活动中商品信息查询 Future的局限性 CompletableFuture使用详解应用场景创建异步操作runAsync&supplyAsync 获取结果join&get 结果处理w…

《亿级流量系统架构设计与实战》第十一章 Timeline Feed服务

Timeline Feed服务 一、概述1、分类2、功能 二、设计原理1、拉模式与用户发件箱2、推模式与用户收件箱3、推拉模式结合 三、关键技术1、内容与用户收件箱的交互(推模式)2、推送拆分子任务3、收件箱模型设计 内容总结自《亿级流量系统架构设计与实战》 一…

[linux#39][线程] 详解线程的概念

线程:是进程内的一个执行分支。线程的执行粒度比进程要细 什么是线程? • 在一个程序里的一个执行路线就叫做线程(thread)。更准确的定义是:线程 是“一个进程内部的控制序列” • 一切进程至少都有一个执行线程 • …

使用Virtio Driver实现一个计算阶乘的小程序——QEMU平台

目录 一、概述 二、代码部分 1、Virtio 前端 (1) User Space (2) Kernel Space 2、Virtio 后端 三、运行 QEMU Version:qemu-7.2.0 Linux Version:linux-5.4.239 一、概述 本篇文章的主要内容是使用Virtio前后端数据传输的机制实现一个计算阶乘的…

基于vue框架的爱喵星人服务平台设计与实现80sgi(程序+源码+数据库+调试部署+开发环境)系统界面在最后面。

系统程序文件列表 项目功能:用户,猫食分类,猫粮信息,养护知识,流浪猫信息,申请领养,志愿者招募,申请加入,猫咪品种,团队活动 开题报告内容 基于Vue框架的爱喵星人服务平台设计与实现 开题报告 一、研究背景与意义 1.1 研究背景 随着社会的快速发展和人们生活水…

使用 onBeforeRouteUpdate 组合式函数提升应用的用户体验

title: 使用 onBeforeRouteUpdate 组合式函数提升应用的用户体验 date: 2024/8/15 updated: 2024/8/15 author: cmdragon excerpt: 摘要:本文介绍如何在Nuxt 3开发中使用onBeforeRouteUpdate组合式函数来提升应用用户体验。通过在组件中注册路由更新守卫&#xf…

Markdown导出为 Excel文件 Vue3

直接复制到单文件内即可使用 需要用到的插件 xlsx 0.17.5marked 14.0.0file-saver 2.0.5vue 3.4.29 直接SFC单文件内使用 <script setup> import {reactive} from vue; import xlsx from xlsx; import {marked} from marked; import {saveAs} from file-saver;const…

鸿蒙(API 12 Beta3版)【元数据(C/C++)】媒体相机开发指导

元数据&#xff08;Metadata&#xff09;是对相机返回的图像信息数据的描述和上下文&#xff0c;针对图像信息&#xff0c;提供的更详细的数据&#xff0c;如照片或视频中&#xff0c;识别人像的取景框坐标等信息。 Metadata主要是通过一个TAG&#xff08;Key&#xff09;&…

Linux基础知识学习(三)

3. Vim 编辑器 1> 定义 im 通过一些插件可以实现和IDE一样的功能&#xff01; vi 是老式的字处理器。 Vim是从 vi 发展出来的一个文本编辑器。代码补完、编译及错误跳转等方便编程的功能特别丰富&#xff0c;在程序员中被广泛使用。 键盘图为&#xff1a; ps &#xff1…

JMeter——设置全局变量和非全局变量

在用JMeter写接口case&#xff0c;遇到一种情况&#xff0c;接口1查看列表接口&#xff0c;接口2查看详情接口&#xff0c;接口2需要传入接口1列表的第一条数据的id。 如果这个id后续改变较多&#xff0c;可以使用非全局变量的设置方法&#xff1b; 如果这个id在整个case都比较…

vs2019使用setup打包exe学习记录

仅记录一下自己的学习过程&#xff0c;如果有问题&#xff0c;请多指正&#xff01; 开头注意&#xff1a;在打包之前一定要确保自己的工程是正常运行的&#xff0c;以及相关环境变量的配置是正确的&#xff0c;我后面就因为QT的环境变量问题报错。 我使用vs2019的QT项目写了…

本庄村果园预售系统的设计与实现bootpf

TOC springboot441本庄村果园预售系统的设计与实现bootpf 第1章 绪论 1.1 课题背景 二十一世纪互联网的出现&#xff0c;改变了几千年以来人们的生活&#xff0c;不仅仅是生活物资的丰富&#xff0c;还有精神层次的丰富。在互联网诞生之前&#xff0c;地域位置往往是人们思…

代码随想录算法训练营 | 动态规划 part06

322. 零钱兑换 给你一个整数数组 coins &#xff0c;表示不同面额的硬币&#xff1b;以及一个整数 amount &#xff0c;表示总金额。 计算并返回可以凑成总金额所需的 最少的硬币个数 。如果没有任何一种硬币组合能组成总金额&#xff0c;返回 -1 。 你可以认为每种硬币的数量是…

【人工智能】Python融合机器学习、深度学习和微服务的创新之路

1. &#x1f680; 引言1.1 &#x1f680; 人工智能的现状与发展趋势1.2 &#x1f4dc; 机器学习、深度学习和神经网络的基本概念1.3 &#x1f3c6; 微服务架构在人工智能中的作用 2. &#x1f50d; 机器学习的演变与创新2.1 &#x1f31f; 机器学习的历史回顾2.2 &#x1f9e0;…