小样本目标检测综述__刘浩宇(导航与控制2021)论文阅读

news2025/1/11 22:38:01

小样本目标检测综述__刘浩宇(导航与控制2021)阅读

0、引言

早期采用了大量标注样本回归候选框的位置,但后来目标集和训练集数据分布不同导致检测效果下降

对于没有大量样本支持的小样本检测应用就需要使用先验知识来弥补样本的不足。

可以分为三类:

  • 数据域

    • 通过先验知识来做数据增强,以弥补样本不足的问题,解决模型不收敛问题。
  • 模型域

    • 通过先验知识来限制模型复杂度,降低假设空间的大小,使得模型收敛加快。
  • 算法域

    • 通过先验知识来提供一个更快捷的搜索策略。

1、小样本目标检测的数学模型

1.1目标检测应用的数学模型

1.2目标检测应用的误差实理际论

数学理论解释、定义这个任务部分!看原论文。

2 数据域的解决方案

2.1转化原有数据集 D t r a i n D_{train} Dtrain

  • 图像增强:翻转、裁剪、缩放、旋转、亮度变换、色调和表合度变换
  • 图像转换:通过类似应用的先验知识, 将原有数据集扩增为新的数据集, 引入新的特征信息, 但类似应用的先验知识往往是不容易得到的。

2.2迁移其他数据集

3 模型域的解决方案

目标检测所采用的模型决定了模型空间P的大小, 复杂度过高的模型不易于模型收敛到最优解, 复杂度低的模型最优解又距离真实模型太远。

3.1多任务训练网络

多任务学习网络同时训练了同一检测网络中的不同任务,在目标检测的应用于检测的网络参数可以共享给分类和定位任务。多任务学习将目标检测的定位和分类参数通过一定的方式共享,降低了需要训练优化的参数量,可以同时提升分类和检测任务的效果。

但是在小样本检测下,不引入其他监督信息时,共享特征仍无法大幅改善泛化能力不足的问题。

3.2增量学习网络

增量学习是指一个学习系统能不断地从新样本中学习新的知识,并能保存大部分以学习到的知识。

具有以下特点:

  • 可以从样本以外的环境中获得新知识
  • 在更新只是过程中会保留大部分以学习到的知识
  • 训练的过程不保留样本
  • 学习系统没有关于整个训练样本的先验知识

增量学习需要注意的是,如何处理新知识和旧知识之间的关系,如何避免灾难性遗忘。

3.3迁移学习

域适应被广泛的应用到目标检测应用中。当给定的已标注的训练样本不足时,可以将其他类似域的先验知识转移到当前应用中,以缓解目标域同样本不足导致效果差的问题。

域适应的方法通常用来提升目标域上的定位效果

3.4 深度度量学习

深度度量学习通过衡量映射在某一空间上的样本之间的距离来学习样本的相似度与区分度

通常被集合在目标检测器的尾端做为分类起使用。其方法对于分类效果有所提升,但是对于定位任务效果提升不明显。

4 算法域的解决方案

4.2元学习

元学习的本质是要寻找一个对于所有任务都较优的模型参数,在更新参数时,元学习结合了所有任务在测试集上的损失作为先验知识来指导梯度更新。

image-20230705153522877

5 文献

  • 增量学习

    • [31] 检测器ONCE,将CentreNet分解为通用类别和特定类别的组件,以支持增量小样本学习。任何新类别在任何时候都能通过小量标注样本注册,并能够始终维度基础类别和已注册的新类别。[Incremental few-shot object detection-2020]
    • [33]端到端增量式目标检测系统,采用知识蒸馏法对基于径向基元的目标检测系统进行优化,引入了多网络自适应精馏。微调已完成新任务时,保留了旧类别的知识。[incremetal learning for object detectors based on Faster RCNN-2020]
  • 迁移学习

    • [38]由俩层自适应模块组成的目标检测结果FAFRCNN,配对过程将样本分成两组, 第一组由目标域的样本和源域的样本组成,第二组由源域的样本组成, 有效地扩充了有限的目标域数据[Few-shot adaptive Faster R-CNN-2019]
    • [27]通过领域竞争损失来对抗领域转移,还提出了一个多层域鉴别器, 该鉴别器采用了最新的域对抗性学习方法进行域对齐。[Label efficient learning of transferable representations domains and tasks-2017]
    • [39]] 提出了一种新的用于语义分割的小样本监督域适应框架, 其主要思想是利用对抗性 学 习 来 对 齐 从 网 络 中 提 取 的 特 征。 同 时,为了解决源数据样本稀缺的问题, 该方案还提出了一种使用源数据和目标数据创建对的配对方法。[Few-shot domain adaptation for semantic segmentation-2019]
    • [41]设计了 一 个 灵 活 的 LSTD深度架构来缓解小样本检测中的困难, 并提出了一种基于源域和目标域的转移指数(TK) 和背景抑制 ( BD ) 的 正 则 化 方 法[a low-shot transfer detector for object detection-2018]
  • 深度度量学习

    • [42]提出了一种同时学习主干网络参数、 嵌入空间和各节点的多模态分布的深度度量学习算法, 度量网络结构作为分类头合并到一个标准的目标检测模型中, 证明了其方法在小样本目标检测问题上的有效性[representative-based metric learning for classification and one shot object detection-2018]
    • [43]在小样本的前提下提出了一种新的实例级嵌入适应机制, 旨在快速适应嵌入的深度特征, 以提高其识别新类别的泛化能力,该方案设计了一个关注自适应模块, 尽可能地提取查询实例及其对应的类中心[Instance-Level embedding adaptation for few-shot learning-2019]
    • [27]使用基于度量学习的方法来概括领域转移中嵌入到新任务的过程,在标记目标之间利用基于度量学习的交叉上损失来稳定和改善学习。[Label efficient learning of transferable representations domains and tasks-2017]
  • 元学习

    • [48] Meta R-CNN采用了基于 RoI 特性的元学习, 并通过 MaskRCNN 改进了小样本的目标分割能力[Meta RCNN: towards fast adaptation for few-shot object detection with Meta learing-2019]
    • [37]充分利用了基类的标记, 并使用元特征学习器和权重调整模块, 实现了快速适应新的类。[Few-shot object detection via feature rewighting-2019]
    • [46]认为元学习是目标跟踪的一种特例[Tracking by instance detection: a Meta-learning approach-2020]
    • [31]加入了元学习类别生成器[Incremental few-shot object detection-2020]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/720820.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Redis实战——商户查询(二)

缓存穿透 缓存穿透 :客户端请求的数据在缓存中和数据库中都不存在,这样缓存永远不会生效,这样的请求都会访问到数据库,这样的大量请求同时过来访问这种不存在的数据,这些请求就都会访问到数据库,对数据库造…

js:使用diff.js实现文本内容差异比较

实现效果 目录 简介安装示例1、json比较diffJson2、按行比较diffLines3、比较数组diffArrays 总结参考资料 简介 A javascript text differencing implementation. 译文:javascript文本差异实现。 相关文档 github https://github.com/kpdecker/jsdiffnpmjs htt…

YoloV8改进---注意力机制:高斯上下文变换器GCT,性能优于ECA、SE等注意力模块 | CVPR2021

目录 1.GCT介绍 实验结果 2.GCT引入到yolov8 2.1 修改modules.py中: 2.2 加入tasks.py中: 2.3 yolov8_GCT.yaml 3.YOLOv8魔术师专栏介绍 1.GCT介绍 论文:https://openaccess.thecvf.com/content/CVPR2021/papers/Ruan_Gaussian_Context_…

MySQL数据库架构

MySQL数据库架构 MySQL架构自顶向下大致可以分为连接层 , SQL层 , 存储引擎层 , 物理文件层。架构如下 连接层 -- 查看最大连接数 show variables like %max_connections%;客户端连接器,MySQL向外提供交互接口连接各种不同的客户端。 客户端/应用程序:客…

7.3.6 【Linux】磁盘/文件系统参数修订

mknod 用到的磁盘 /dev/vda 的相关设备代码如下: 上表当中 252 为主要设备代码 (Major) 而 0~5 则为次要设备代码 (Minor)。 我们的Linux 核心认识的设备数据就是通过这两个数值来决定的!举例来说&#xf…

如何批量将PDF转换为图片?

在生活工作中,我们会处理很多电子合同。这些电子合同一般是PDF格式,不但存储空间大,且预览起来不太便捷,需要我们转换为图片格式更方便预览。如果人工一一处理比较繁琐复杂,有没有什么方案可以快速将pdf转换为图片呢&a…

如果想用unity做一个项目作为面试作品,至少该达到什么样的标准?

本文仅针对题目“如果想用unity做一个项目作为面试作品,至少该达到什么样的标准?”回答内容。 明确职业目标 首先要明确自身的职业目标,不同的行业、公司、游戏类型、岗位对作品的要求是不同的。 去什么样的行业?unity可做的有很…

python的IOError使用

try:npzfile np.load(calibrate.npz)mtx npzfile[mtx]dist npzfile[dist]except IOError:calibrate()python语言IOError错误一般多发生在对文件操作报错时,表示要打开的文件不存在

PostpreSQL内核学习-Chapter4 Foreign Data Wrapper(FDW)

FDW连接 preparations 两个在不同主机(满足TCP/IP连接是分属于不同IP地址下)(如果是安装PG源码)进入源码目录下面的/contrib/postgres_fdw/,然后用make & make install编译和安装 [rootlocalhost /]# cd 源码存…

为什么truncate函数(四舍五入)是x+0.4999997而不是+0.5?

目录 float的不精确表示 0.5的舍入方法 该方法的漏洞 0.4999997f舍入的结果错误 以0.4999997f改进舍入方法 可以用0.49999996、0.49999998或者0.49999999替换0.49999997吗? 在做舍入函数研究时,发现函数中实现四舍五入的trunc函数大概采用的逻辑是floor(…

LVS负载均衡-----DR模式

目录 1.DR模式原理 2.DR 模式的特点: 3.LVS-DR中的ARP问题 问题原因: 解决方法: 问题二:返回报文时源地址使用VIP,导致网关设备的ARP缓存表紊乱 解决方法: 4.DR模式 LVS负载均衡群集部署 1.配置负…

python进程线程问题

参考链接: 代码可去原博文复制: python缩短大量数据处理时间-进程池pool()和map() 一 定义与解释 1、对于python代码,多线程其实是个假的,因为每次计算的时候,实质上只有一个线程计算。使用多线程时,是几…

【天池题解】题解:CAAI-BDSC2023社交图谱链接预测(任务一:社交图谱小样本场景链接预测)

【天池题解】题解:CAAI-BDSC2023社交图谱链接预测(任务一:社交图谱小样本场景链接预测) 文章目录 【天池题解】题解:CAAI-BDSC2023社交图谱链接预测(任务一:社交图谱小样本场景链接预测&#xf…

中介者模式的学习与使用

1、中介者模式的学习 中介者模式是一种行为型设计模式,它通过引入一个中介者对象来解耦一组对象之间的交互。中介者模式促进了对象之间的松耦合,使得它们可以独立地进行通信,而不需要直接相互引用。   在中介者模式中,有以下几个…

获取文件大小并转换单位

天行健,君子以自强不息;地势坤,君子以厚德载物。 每个人都有惰性,但不断学习是好好生活的根本,共勉! 文章均为学习整理笔记,分享记录为主,如有错误请指正,共同学习进步。…

【工具使用】Notepad++如何使用正则表达式同时搜索多个字符串

一,简介 在调试代码定位问题的时候,由于log打印比较多,故需要使用NotePad文本编辑器进行搜索,并且需要同时搜索多个字符串,本文介绍如何同时搜索多个字符串,供参考。 二,操作步骤 2.1 搜索设…

90、基于STM32单片机数字频率计频率检测配NE555脉冲发生器设计(程序+原理图+PCB源文件+参考论文+硬件设计资料+元器件清单等)

单片机主芯片选择方案 方案一:AT89C51是美国ATMEL公司生产的低电压,高性能CMOS型8位单片机,器件采用ATMEL公司的高密度、非易失性存储技术生产,兼容标准MCS-51指令系统,片内置通用8位中央处理器(CPU)和Flash存储单元&a…

如何基于 ESP-IDF SDK 为应用工程添加自定义的 menuconfig 编译条件设置?

在工程的 main 目录下添加 Kconfig.projbuild 文件对需要添加自定义设置的参数进行定义在应用代码中使用自定义设置的参数编写 Kconfig.projbuild 文件 在工程的 main 目录下添加 Kconfig.projbuild 文件 接下来会基于 esp-idf/examples/peripherals/uart/uart_async_rxtxtask…

Python黑魔法揭秘:超强公共操作符和推导式的编程技巧

文章目录 前言公共操作1.运算符1) 合并操作2)* 复制操作in / not in 判断数据在 / 不在容器中 公共方法len()del / del()max()min()range()enumerate() 容器类型转换1)list() 将某个序列转化为列表tuple() 将某个序列转换为元组set() 将某个序…

OpenCloudOS社区开源,助力软件开发

早前红帽宣布限制源代码访问性的政策,并解释说RHEL相关源码仅通过CentOS Stream公开,付费客户和合作伙伴可通过Red Hat Customer Portal访问到源代码,由此也导致非客户获取源码越来越麻烦, 据了解,CentOS是红帽发行的…