发论文idea来了!小样本学习+目标检测,12个创新点汇总

news2024/12/27 13:14:08

在一些特定应用领域,获取大规模且高质量标注的数据十分困难,比如医学图像分析。为了解决这个问题,研究者们提出了小样本目标检测

小样本目标检测是一种结合了小样本学习和目标检测两者优势的技术,能够在有限的训练数据下,训练出具有更高实用性和泛化能力的模型。目前它在工业界与学术界都与各热门研究方向强相关,因此创新切入点很多,是个很好发论文的方向

传统且主流的小样本目标检测方法有基于元学习、基于迁移学习、基于数据增强等。不过为了追求更高的性能和检测精度,现在我们更专注于探索新的改进方法,比如引入新的网络架构。

这次我就根据以上思路整理了12篇小样本目标检测最新paper,各位可以用作参考,包含几种主流方法以及最新的改进方法,开源代码已附。

论文原文+开源代码需要的同学看文末

新改进方法

TIDE: Test-Time Few-Shot Object Detection

方法:论文提出了一种新颖的测试时间少样本目标检测(TIDE)方法,TIDE核心是在配置过程中不需要对模型进行微调,而是引入了一个不对称的架构,用于学习支持实例引导的动态类别分类器。此外,还提供了交叉注意力模块和多尺度调整器来增强模型性能。

创新点:

  • 提出了一种新的FSOD任务,即无需微调的测试时间少样本检测(TIDE),在现实场景中具有更高的适用性。

  • 提供了一种基于非对称编码器的有效FSOD方法,首次尝试解决无需模型微调的TIDE问题。

  • 实验结果表明,TIDE方法能够有效提升模型的FSOD能力,并且在所有任务中都优于微调方法的结果。

基于元学习

Fine-Grained Prototypes Distillation for Few-Shot Object Detection

方法:论文提出了一种新的小样本目标检测框架,通过细粒度的特征聚合(Fine-Grained Feature Aggregation, FFA)模块来改善特征的融合和表示,以实现更有效的知识转移和新类别的快速学习。

创新点:

  • 提出一种新的方法,将支持特征(来自少量样本的类别)蒸馏成更具体和有代表性的细粒度原型。

  • 引入一种新的采样策略,控制不同类别特征与查询特征的聚合比例,以保持正负样本的平衡,提高模型的泛化能力。

  • 在微调阶段,提出了一种知识迁移方法,将基础类别的特征查询复制并适配到新类别上,解决了数据稀缺情况下的训练挑战。

基于迁移学习

Semantic Enhanced Few-shot Object Detection

方法:论文提出了一个基于迁移学习的小样本目标检测框架,利用语义嵌入来改善对于新类别的偏差表示,特别是在极低样本情况下的表示偏差问题。在Pascal VOC和MS COCO数据集上的实验证明了该方法的优越性,尤其是在低样本场景下。

创新点;

  • 提出了一种基于fine-tuning的框架,利用语义嵌入来提高对新类别的泛化能力。该框架在新的fine-tuning阶段使用语义相似度分类器(SSC)代替线性分类器,并通过计算类别名称嵌入和提议区域特征之间的余弦相似度来产生分类结果。

  • 设计了三个新的模块,即SSC,MFF和SAM损失,以提供无偏的表示并增加类别间的分离。SSC和MFF在经典的Faster R-CNN损失和SAM损失的端到端优化过程中进行优化。

基于数据增强

SNIDA: Unlocking Few-Shot Object Detection with Non-linear Semantic Decoupling Augmentation

方法:论文提出了一种基于数据增强方法的小样本目标检测技术。具体来说,作者提出了一种语义引导的非线性实例级数据增强方法SNIDA,该方法通过解耦前景和背景来分别增加它们的多样性,并通过语义引导的非线性变换空间来增强训练数据的多样性。

创新点:

  • 本文提出了一种新的针对FSOD的数据增强方法,通过语义引导的非线性方式解耦了新类对象的前景和背景,并增加了它们的多样性。

  • 为了增加新类样本的数量,本文采用CutMix方法将基类图像与新类对象结合,将整个对象补丁从新类图像中裁剪出来,并应用简单的随机数据增强,如缩放/翻转/颜色退化。然后将增强的对象补丁粘贴到基类图像上,通过重复这个过程,生成包含来自新类和基类的样本的合成集。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“小样本检测”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1983050.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

elementPuls_Treeg更改颜色

elementPuls_Treeg更改颜色 .el-tree {background: transparent;color: #fff;}:deep(.el-tree-node__content:hover) {background: rgba(2, 167, 240, 0.5);}//选中的背景色:deep(.el-tree--highlight-current.el-tree-node.is-current> .el-tree-node__content) {backgrou…

上班族必备!这款免费录屏工具让你工作效率翻倍

www.bandicam.com/downloads/现在还依稀记得疫情爆发的那一年在学校上网课的场景,在家里上着网课担心错过老师讲的重点,就特地找了录屏的工具来使用,帮我录制重点片段,今天就针对录屏的工具整理了四款免费的录屏软件,有…

Linux系统驱动(五)

文章目录 一、实现机制二、字符设备驱动分布实现流程三、添加自己的系统调用函数1. 找到系统调用文件2. 找到 一、实现机制 应用层 vfs层 驱动层 字符设备按照字节流顺序访问,但是实际它提供了无序访问的功能 vi -t sys_open 内核中通过inode号可以唯一的找到一…

C语言典型例题27

《C程序设计教程(第四版)——谭浩强》 习题2.4 用下面的scanf函数输入数据 使a3,b7,x8.5,y71.8,c1A,c2a。问在键盘上怎么输入 代码 //《C程序设计教程(第四版)——谭浩强》 //习题2.4 用下面的scanf函数输入数据,使…

CentOS安装sentry

Sentry介绍 Sentry 是一套开源的实时的异常收集、追踪、监控系统。这套解决方案由对应各种语言的 SDK 和一套庞大的数据后台服务组成,通过 Sentry SDK 的配置,还可以上报错误关联的版本信息、发布环境。同时 Sentry SDK 会自动捕捉异常发生前的相关操作&…

电线电缆测厚双测径仪联控测厚系统

关键字:线缆测厚系统,绝缘层测厚设备,电线皮套测厚,电缆绝缘层测厚, 产品简介: 双测径仪联控测厚系统的工作原理基于光电测量技术。一台测径仪测量电缆的成品直径,另一台测径仪测量线芯的直径。通过这些测量数据,系统计算出绝缘层或护套层的厚…

IT课程学习搭子

各种IT课程齐全可学,价格你说了算,相比于培训班有以下优势: 1、避免被割韭菜,避免踩坑,避免交智商税,最低的成本学最有价值的课,同时又能达到比培训班更好的效果 2、收徒,带你学习 本…

第十五节、三段攻击动画的实现

一、创建攻击动画 新建图层 新建状态 放入攻击动画 二、攻击实现 三段式攻击 1、按下触发三段式 2、按键触发第一下攻击 设立两个参数 一个计数器 计数器并未使用 三、代码实现 1、注册攻击事件 2、设置动画参数关联

中国制造2025,会抛弃精益生产吗?

时至今日,“精益生产”模式依旧大行其道,它始终支持着中国制造业以最低的成本做出优质产品。我们认为,纵然是中国制造2025成为现实,精益生产模式也仍然是整个制造业的精髓之一。 首先,精益生产模式最重要的一根脊梁就是…

【密码学】密码协议的分类:①密钥建立协议

密码协议的分类有很多种方式,这里我采取的是基于协议实现的目的来分类。可以将密码协议分成三类:认证协议、密钥建立协议、认证密钥建立协议。这些协议在密码学和网络安全中扮演着至关重要的角色,下面我来对密钥建立协议详细介绍 密钥建立协议…

Rsync未授权访问漏洞 *

Rsync是Linux/Unix下的一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件和目录,默认运行在873端口。由于配置不当,导致任何人可未授权访问rsync,上传本地文件,下载服务器文件。Rsync 默认允许匿名访问&…

mysql数据库数据类型和约束

mysql数据库:数据类型和约束 常见的数据类型和约束 数据类型 数值类型:INT、BIGINT、FLOAT、DOUBLE,DECIMAL等。字符串类型:CHAR、VARCHAR、TEXT等。日期和时间类型:DATE、DATETIME、TIMESTAMP等。二进制类型:BLOB、LO…

《机器学习by周志华》学习笔记-决策树-02

1、剪枝处理(Pruning) 1.1、背景概念 上文「决策树01」的学习中,我们了解了著名的3种决策树算法ID3、C4.5、CART。这3种决策树算法最根本的核心就是根据特征选择离散属性作为节点来搭建树结构,运用搭好的结构进行推理。 剪枝(pruning)则就是将搭好的决策树去掉一些「非叶节…

[RTOS 学习记录] 预备知识:C语言结构体

这篇文章是我阅读《嵌入式实时操作系统μCOS-II原理及应用》后的读书笔记,记录目的是为了个人后续回顾复习使用。 文章目录 结构体结构体基础声明和定义结构体类型声明和定义结构体变量初始化结构体变量初始化各个成员使用列表符号初始化 使用结构体变量综上 结构体…

C语言程序设计-[5] 输入输出语句

C语言提供了一些输入输出的库函数,使用库函数,必须将相应的头文件“stdio.h”包含进来。 输入输出库函数可分为三类:字符输入输出函数、字符串输入输出函数和格式化输入输出函数。前两类功能单一,使用起来相对简单,以…

消息队列:Kafka吞吐量为什么比RocketMQ大

根据资料显示RocketMQ每秒能处理10W量级数据,而Kafka能处理17W量级数据。 这两者差别主要再使用的零拷贝技术不一样。 再什么情况下零拷贝技术诞生了 为了防止消息队列中的消息因为各种意外情况丢失,要对消息进行持久化处理,将其存储在磁盘…

Dubbo未授权访问漏洞

Dubbo是阿里巴巴公司开源的一个高性能优秀的 服务框架,使得应用可通过高性能的 RPC 实现服务的输 出和输入功能,可以和 Spring框架无缝集成。dubbo 因配置不当导致未授权访问漏洞。 》》》漏洞复现《《《 步骤一:使用以下语句在Fofa上进行资…

STM32智能小车(循迹、跟随、避障、测速、蓝牙、wifi、4g、语音识别)总结

前言 有需要帮忙代做51和32小车或者其他单片机项目,课程设计,报告,PCB原理图的小伙伴,可以在文章最下方加我V交流咨询,本篇文章的小车所有功能实现的代码还有硬件清单放在资源包里,有需要的自行下载即可&a…

Elasticsearch(高性能分布式搜索引擎)-上篇

Elasticsearch(高性能分布式搜索引擎) 文章目录 Elasticsearch(高性能分布式搜索引擎)1 初识elasticsearch1.1 认识和安装1.2 倒排索引1.3 IK分词器1.4 基础概念1.4.1 elasticsearch与数据库对比 2 索引库的操作2.1 Mapping映射属…

FutureTask详解

FutureTask详解 1、FutureTask简介 FutureTask主要用于异步任务的执行和结果获取。其最重要的特性就是可以被提交到线程池中执行&#xff0c;同时也可以用来获取执行结果或检查任务的状态。 2、FutureTask内部结构 继承结构 public class FutureTask<V> implements …