one-shot 序列图像红外小目标分割

news2024/11/25 22:51:04

one-shot 序列图像红外小目标分割

IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING

代码还未开源 GitHub - D-IceIce/one-shot-IRSTS

few-shot:利用少量标注样本进行学习

one-shot: 属于few-shot的特殊情况,只用一个样本进行学习

zero-shot:不通过学习,对未见过的类别进行学习

摘要:

红外小目标序列具有很强的帧间相似性,并且包含丰富的上下文信息,这促使我们用最少的数据实现序列红外小目标分割。受SAM (Segment Anything Model)所领导的大模型在各种下游任务中取得成功的启发,我们提出了一种one-shot、无需训练的方法,将SAM的zero-shot泛化能力完美地适应于序列红外小目标分割。以一帧注释为参考,我们的方法可以准确地分割序列中其他帧中的小目标。具体而言,我们首先通过参考图像与测试图像之间的局部特征匹配获得置信度图。然后,以置信图中的最高点作为提示,设计了以点提示为中心的聚焦(PPCF)模块,解决边界模糊的小目标的过度分割问题。随后,为了防止漏检和误检,我们引入了三级集成(TLE)模块,该模块将前两步中不同级别获得的掩码集成以产生最终掩码。实验表明,我们的方法只需要one-shot就可以达到与基于传统many-shot监督的最先进方法相当的性能,甚至在少few-shot设置中表现更好。此外,消融研究证实了我们的方法在one-shot样本变化、场景变化和多个目标存在下的稳健性。

Introduction

大模型应用到IRSTS中存在一些挑战。以SAM为例:

1)对于特定目标的分割,SAM需要对每张图像进行手动提示,这对于涉及众多红外小目标分割任务的实际应用是不可能的。

2)在预训练阶段,SAM专注于一般目标,使其更适合于大型目标的分割。这对于红外小目标的特征提取和精确分割效果较差。

本文的主要贡献:

  • 这是第一种无需训练的one-shot红外小目标分割方法。仅提供一个注释帧作为参考,从而能够准确分割序列中的其他帧。
  • 充分利用现有大型基础模型对红外小目标探测的强大泛化能力,提出PPCF和TLE模块,有效适应大型基础模型对小目标的细微特征。
  • 仅使用one-shot,我们就实现了与大规模数据训练的最先进的红外小目标分割模型相当的性能

就实现了与大规模数据训练的最先进的红外小目标分割模型相当的性能

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2045465.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

利用Proxy302构建高效代理IP平台:从功能到架构解析

在现代互联网环境中,代理IP已成为企业和个人在隐私保护、网络爬虫、广告验证等场景中的关键工具。在众多代理IP平台中,如何选择一个高效且易用的平台?怎么搭建企业自己的代理IP平台,本文将从多个维度对进行深度分析与简易架构拆解…

你的 “可爱” 同事 justify-content 还在写 left、right 吗??

据 w3c 文档记录: 所以: justify-content 的取值只有这几种: flex-start | flex-end | center | space-between | space-around 千万不要向我 “可爱” 的同事一样这么写: 和他说了还在那里狡辩说来说去不是她 结果一…

2024.8.16(ansible)

一、回顾 1、mysql和python 1. mysql5.7 1.1 不需要执行mysql_ssl_rsa_setup 1.2 Change_master_to. 不需要get public key 2. 可以使用pymysql非交互的管理mysql 2.1 connpymysql.connect(host,user,password,database,port) 2.2 cursorconn.cursor() 2.3 cursor.execute(&qu…

激光雷达点云投影到图像平面

将激光雷达点云投影到图像平面涉及几何变换和相机模型的应用。以下是该过程的基本原理: 1. 坐标系转换 激光雷达生成的点云通常位于激光雷达的坐标系中,而图像则在相机坐标系中。为了将点云投影到图像上,首先需要将点云从激光雷达坐标系转换…

绝对的美剧之最:通宵追剧的最佳选择

在众多美剧中,《火线》堪称冷门中的神作。2002年由HBO出品,共五季,豆瓣评分9.4到9.7分,IMDb也高达9.3分。对于剧迷来说,《火线》无疑是美剧中的天花板。 不同于一般美剧,《火线》没有炫目的动作场面&#x…

使用MYSQL函数问题

使用mysql函数遇到的坑 最近项目需要做很多的报表统计,用到一些mysql的函数。今天就讲其中两个函数的问题 DATE_SUB函数 查询近七天数据 SELECT * FROM my_table WHERE DATE(create_date) >DATE_SUB(CURDATE(), INTERVAL 7 DAY) 这是在网上找的答案&#xf…

Royal累计勒索金额超36亿元,加强服务器防勒索防护迫在眉睫

近日,美国联邦调查局(FBI)和网络安全与基础设施安全局(CISA)联合发布的警报引起了全球网络安全界的广泛关注。曾以"皇家(Royal)"之名臭名昭著的勒索软件组织,现更名为&quo…

AI大模型开发——5.transformer模型(0基础也可懂)(2)

3. 编码处理器(Bert) transformer模型的编码器构成了模型处理输入数据的基础部分。编码器的设计使其能够处理复杂的序列数据, 捕获序列内部的细粒度依赖关系。它通过一系列的层来实现, 每一层都包含自注意力机制、残差连接( Resid…

【三维重建】InstantSplat:稀疏视角的无SfM高斯泼溅 (3D Gaussian Splatting)

提示:关注B站【方矩实验室】,查看视频讲解 文章目录 1.摘要2.Introduction3.主要方法3.1 MVS( DUSt 3R )3.2 GS的初始化3.3 联合优化 4.实验5.总结 1.摘要 InstantSplat将多视图立体(MVS)预测与基于点的表示…

【计算机方向】五本中科院二区SCI神刊!最快3个月accept,国人发文友好,晋升靠它们!

本期将为您带来五本计算机SCI 妥妥毕业神刊! VISUAL COMPUTER International Journal of Computer Vision INFORMATION AND SOFTWARE TECHNOLOGY Nonlinear Analysis-Hybrid Systems Complex & Intelligent Systems 期刊名称:VISUAL …

总结常见报错信息

一、报错内容 Circular view path [index]: would dispatch back to the current handler URL [/login/index] again. Check your ViewResolver setup! (Hint: This may be the result of an unspecified view, due to default view name generation.) 解决方法:把C…

复习之 JVM【类加载机制,内存模型,GC 】

裁员在家,没有面试机会,整理整理面试知识点吧! JVM 全名 Java Virtual Machine(Java虚拟机) Java中的所有类,必须被装载到JVM中才能运行,这个装载工作是由jvm中的类装载器完成的,.…

如何一眼识破电子元器件缺陷?这台设备教你!

电子元器件外观缺陷检测设备是一种用于检测电子元器件外观缺陷的专业设备。随着电子元器件的广泛应用,对其质量和可靠性的要求也越来越高。而电子元器件外观缺陷是影响其性能和寿命的重要因素之一。因此,开发一种高效、准确的电子元器件外观缺陷检测设备…

Qt (6)【按钮类控件 | QPushButton | QCheckBox | QRadioButton | QToolButton】

阅读导航 引言一、按钮类控件概述(继承关系)二、QPushButton三、QRadioButton四、QCheckBox五、QToolButton 引言 在之前的文章中,我们聊到了Qt中QWidget的基础属性,它是构建所有GUI元素的基础。今天,我们要更进一步&…

低代码时代:重塑软件开发版图的机遇与挑战

低代码时代:重塑软件开发版图的机遇与挑战 在数字化转型的浪潮中,低代码(Low-Code)开发平台如同一股清新的风,迅速席卷了整个IT行业,以其“让非专业人士也能快速构建应用程序”的承诺,引发了广…

如何彻底清除硬盘数据不被恢复?保护隐私无忧

在数字时代,硬盘作为存储重要数据的主要设备,其安全性备受关注。当我们需要出售、赠送或报废电脑时,彻底清除硬盘上的数据以防止敏感信息泄露显得尤为重要。本文将详细介绍几种彻底清除硬盘数据且不可恢复的方法,帮助用户保护个人…

自制深度学习推理框架之计算图设计

文章目录 一、计算图1.1 计算图定义1.2 计算图的生成1.2.1 **静态计算图(Static Computational Graph)**1.2.2 **动态计算图(Dynamic Computational Graph)** 1.3 计算图功能1.3.1 训练阶段1.3.2 推理部署阶段 1.4 计算图的调度(执…

Datawhale X 魔搭 AI夏令营第四期-魔搭生图task3学习笔记

进入魔搭社区,找到我的Notebook选择对应运行环境 因为我是一天前登录的,所以需要重新使用相关账号重新登陆。大家可以根据自己的具体情况来登录,仅供参考 进入后,新建终端 在命令行输入如下命令下载安装ComfyUI的执行文件和task1中…

观察者模式(ObserverPattern)

文章目录 1.观察者模式定义2.UML类图3.实现代码 1.观察者模式定义 定义一种订阅机制, 可在对象事件发生时通知多个 “观察” 该对象的其他对象 如果你订阅了一份杂志或报纸, 那就不需要再去报摊查询新出版的刊物了。 出版社 (即应用中的 “…