英文论文(sci)解读复现【NO.15】学习聚合多尺度背景的实例分割在遥感图像

news2025/1/10 22:09:15
此前出了目标检测算法改进专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读发表高水平学术期刊中的 SCI论文,并对相应的SCI期刊进行介绍,帮助大家解答疑惑,助力科研论文投稿。解读的系列文章,本人会进行 创新点代码复现,有需要的朋友可关注私信我获取。

一、摘要

遥感图像的实例分割任务是实现实例级对象的逐像素标记,对各种民用应用具有重要意义。尽管已有的实例分割方法取得了成功,但当它们直接应用于俯视图遥感图像时,大多数为自然图像设计的实例分割方法都遇到了性能急剧下降的问题。通过仔细的分析,我们发现挑战主要来自于由于严重的尺度变化、低对比和聚类分布而缺乏鉴别对象特征。为了解决这些问题,提出了一种新的上下文聚合网络(CATNet)来改进特征提取过程。该模型利用稠密特征金字塔网络(DenseFPN)、空间上下文金字塔(SCP)和层次感兴趣区域提取器(HRoIE)三个轻量级即插即用模块,分别在特征域、空间域和实例域聚合全局视觉上下文。DenseFPN是一种多尺度特征传播模块,通过采用层间残差连接、层间密集连接和特征重权策略,建立更加灵活的信息流。SCP利用注意力机制,通过将全局空间环境聚合到局部区域,进一步增强了特征。对于每个实例HRoIE为不同的下游任务自适应地生成RoI特征。我们在具有挑战性的 iSAID、DIOR、NWPU VHR- 10 和 HRSID 数据集上对提议的方案进行了广泛的评估。评价结果表明,在计算费用相似的情况下,拟议的方法的效果优于目前的技术水平。源代码和经过训练的模型可以在 https://github.com/yeliudev/CATNet 上找到。

二、网络模型及核心创新点

 1.稠密特征金字塔网络(DenseFPN)

2.空间上下文金字塔(SCP)

3.层次感兴趣区域提取器(HRoIE)

三、数据集

iSAID : iSAID 是一个用于航空图像实例分割的大型数据集。iSAID中的所有图像都继承自DOTA , DOTA是面向目标检测的常用方法。它包含了 2806张图片中 655451 个实例的15个类,所有的对象都是从头开始独立标注的。图像的空间分辨率在 800到13000之间。我们在训练和测试的时候将它们分成了 512 × 512个 patch。各类缩写有 SH - ship、ST - storage tank、BD -棒球场、TC -网球场、BC -篮球场、GT -地田场、BR - bridge、LV -大型车辆、 SV - 小型车辆、 HE - 直升机、 SP - 游泳池、 RO -roundabout、SB -足球场、PL - plane、HA - harbor。
DIOR : DIOR是一个只有水平边界框标记的复杂航拍图像数据集。它包含23463张图片190,288个实例,覆盖了20个对象类。DIOR中的对象大小具有严重的类间和类内变量。这个数据集的复杂性也反映在不同的成像质量、天气和季节上。缩写类有:AL-飞机、AR -机场、BF -棒球场、BC -篮球场、BR -桥梁、CH -烟囱、DA -水坝、ES -高速公路服务区、ET 高速公路收费站、GC -高尔夫球场、GT -跑道,运动场、HA -港湾、OV -立交桥、SH -船舶、ST -体育场、SA -储水罐、TC -网球场、TS -火车站、VE车辆、WM -风力机。

NWPU VHR-10 : NWPU VHR-10 是另一个广泛应用于航空图像目标检测的数据集。它有800张高分辨率图像,其中 650张是正片,150张是负片,没有任何感兴趣的物体。该数据集包含10个对象
类别的注释。所有对象都使用可公开访问的水平边界框进行注释。类的缩写是AI -飞机,SH -船,ST -储罐,BD -棒球场,TC -网球球场,BC篮球场,GT跑道,HA港口,BR桥梁,VE车辆。
HRSID : HRSID 是最近推出的用于 SAR 图像中舰船检测和分割的数据集。该数据集包含总计 5,604 张高分辨率SAR图像,包含 16,951 个舰船实例。此数据集中的所有实例都使用像素级掩
码进行注释。图像空间分辨率分别为0.5m、1m、3m。

  四、实验效果(部分展示)

(1)消融实验

表V (d)为消融研究结果。所提出的三个模块在遥感图像的目标检测和实例分割方面都能取得较好的效果。当彼此协作时,性能改进仍然是稳定的,这表明这些模块之间不相互干扰。将这些模
块组合在一起可以获得最佳的实验结果,实现了多领域多尺度上下文的同时聚合。请注意,1×模型缺乏训练。通过适当的数据增强或更长的训练计划,我们的模型可以获得更好的性能。

(2)对比实验

为了研究提出的模块各自的意义和有效性,我们将其与一些有代表性的方法和不同的模块组合进行了对比实验。所有的实验都是使用标准的训练和测试配方在 iSAID数据集上进行的。FLOPs的计算使用512 × 512输入。


图9 (b)和(c)比较了不同多尺度特征传播模块的目标检测和实例分割性能。数值结果如表V (a)示。与现有的代表性方法相比,DenseFPN在目标检测和实例分割任务上都有明显的优势,且计算成本更低。我们还观察到,在 DenseFPN中简单地叠加更多的基本块可以进一步提高性能,表明其模型缩放的能力和灵活性。

 表V (b)显示了多个空间上下文模块之间的对比。与基线相比,NLNet可以有效地带来更高的性能,但计算开销较大。GCNet解决了计算复杂度问题,但也导致了另一个信息混淆问题。在重新加权上下文的帮助下,我们提出的CABlock使用不同的信道减少率稳定地优于GCNet。进一步的实验表明,将CABlocks从主干移动到多尺度融合模块后,可以在相似的计算代价下更好地提高性能。
表V (c)显示了多个RoI 提取器的比较结果。基线模型只裁剪RoI特性从单一的特征图,导致严重的信息丢失和实现普通的结果。简单地计算从多个图层中裁剪的 RoI 特征的总和或串联可以略微提高
性能。考虑到目标检测和实例分割任务需要不同的特征,结合HRoIE进行自适应特征融合,可以更好地为这些任务生成合适的RoI特征。

  五、实验结论

本文深入研究了遥感图像的全局视觉上下文,提出了一种新型的CATNet 框架,该框架能够利用三个轻量级的即插即用模块,即密集特征金字塔网络、空间上下文金字塔和层次兴趣区域提取器。在特征域、空间域和实例域聚合全局视觉上下文。实验表明,这三个模块之间的协作可以有效地增强识别目标特征,从 而 提 高 目 标 检 测 和 实 例 分 割 的 精 度 。 在iSAID、DIOR、NWPU VHR-10 和HRSID数据集上的实验结果表明,在计算成本相似的情况下,所提出的方法显著优于当前的技术水平。我们期望对全球视觉环境的新理解和提出的模块的设计将有助于这一领域的未来研究。

注:论文原文出自Learning to Aggregate Multi-Scale Context for Instance Segmentation in Remote Sensing Images本文仅用于学术分享,如有侵权,请联系后台作删文处理。

解读的系列文章,本人已进行创新点代码复现,有需要的朋友欢迎关注私信我获取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/599179.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于customerId来实现

定义两个upstream,他们和service及route的关系如下: 这里我们使用 0、将下面的这个spring boot项目在192.168.19.50上进行部署 KongDemoApplication.java package com.example.kongdemo;import org.springframework.beans.factory.annotation.Value; import org…

8个升级到ChatGPT Plus的理由,不升级你就out了

​关注文章下方公众号,可免费获取AIGC最新学习资料 导读:ChatGPT Plus 是 OpenAI 聊天机器人的高级付费版本。以每月 20 美元的价格,该服务为您提供访问 GPT-4,您可以享有令人难以置信的稳定性和更快的响应时间。 本文字数&#…

i18n(国际化)代码简单实现

目录 i18n(国际化)是什么?如何实现 i18n(国际化)是什么? 各个国家都有各个国家的语言,如果网站需要让全世界的人使用,那就需要进行国际化功能开发 国际化我知道的一共有两种&#…

弄懂局部变量

成员变量和局部变量的区别 多个线程调用同一个对象的同一个方法时: 如果方法里无成员变量,那么不受任何影响 如果方法里有成员变量,只有读操作,不受影响 存在写操作,考虑多线程影响值 多线程调用…

【网络原理】网络层 IP 协议

✨个人主页:bit me👇 ✨当前专栏:Java EE初阶👇 目 录 🍀一. IP协议报头格式🌻二. IP 地址🌿三. 路由选择 网络层协议的工作: 地址管理路由选择(规划路径) …

如何解决多个node版本问题?

1. 安装nvm 1.1 下载nvm:https://github.com/coreybutler/nvm-windows/releases 注意:路径中不得有空格 接着的直接下一步直至安装完成 安装完成后,打开安装目录 打开settings.txt文件,文件内容如下 在文档内容后面加上下面两行代…

朴素贝叶斯算法的介绍

一、朴素贝叶斯算法的介绍 1.什么是朴素贝叶斯算法? 朴素贝叶斯算法(Naive Bayes Algorithm)是一种基于贝叶斯定理和特征独立性假设的概率分类算法。它被广泛应用于文本分类、垃圾邮件过滤、情感分析等任务。 朴素贝叶斯算法的基本思想是基…

OpenMMLab AI实战营第二期(1)计算机视觉与OpenMMLab概述

通过今天课程的学习,算是比较大的扩展了我的视野,近期主要学一些强化学习的知识,没有想到计算机视觉领域已经发展的这么迅猛,很多以前只是在脑海里想象的计算机视觉应用场景,原来OpenMMLab已经实现了。我比较对目标检测…

人脸识别(Java+ Face++实现)

人脸识别(Java Face实现) 一. 概述 Face的核心技术是基于深度学习的人脸识别技术,其算法在准确率和速度方面都处于领先地位。该公司的产品和服务包括人脸识别SDK、人脸识别API、人脸比对服务、人脸检测服务、活体检测服务等。这些产品和服务广…

在树莓派3B+上安装Pytorch1.7

在树莓派3B上安装Pytorch1.7(应该是最简单的方法了)_package libopenblas-dev has no installation cand_Chauncey_Wang的博客-CSDN博客由于项目要求,我需要在树莓派上安装pytorch这就有几个问题,首先吧,咱们和外面之间有一道长城&#xff0c…

计算机网络 七大性能指标【速率】【带宽】【吞吐量】【时延】【时延带宽积】【往返时间】【利用率】

计算机网络 速率(bit/s 数据的传送速率)带宽(频域-频带宽度,时域-最高速率)吞吐量(单位时间的 数据量)时延(一端传送到另一端所需的时间)1. 发送时延(发送所用…

来自6种编程语言的祝福:欢乐六一儿童节

六一儿童节的由来是为了纪念在法西斯侵略战争中死难的儿童,反对帝国主义的虐杀和毒害儿童,保障儿童权利。1949年11月,国际民主妇女联合会在莫斯科召开大会,决定每年的6月1日为全世界少年儿童的节日,即国际儿童节。 六一…

RPC(1):软件项目架构变化简述

1单体架构 1.1架构图 单体架构就是一个项目里面包含这个项目中全部代码。一个应用搞定全部功能。 DNS 服务器可以是单映射,也可以配置多个映射。 1.2软件代码结构 在单体架构项目中,团队都是通过包(package)进行区分每个模块。 总体包结构&#xff…

Android进阶 :实现自定义View

Android进阶:实现自定义View 导语 有时候我们会想要实现一些复杂或者是独特的组件效果,这时候系统提供的组件可能不能满足我们的需求,这个时候我们一般就会有两个解决办法,一是上网查找开源的控件库,一些流行的开源库…

【JUnit技术专题】「入门到精通系列」手把手+零基础带你玩转单元测试,让你的代码更加“强壮”(夯实功底篇)

手把手零基础带你玩转单元测试,让你的代码更加“强壮” 前言介绍JUnit是什么?JUnit和xUnit之间的关系 JUnit的基本概念JUnit的特点什么是一个单元测试用例 JUnit的用法JUnit的最佳实践案例分析创建一个类创建 Test Case 类创建 Test Runner 类 JUnit总体…

Web实验二 CSS基本样式实验

实验原理 通过创建CSS样式文件,理解CSS样式基本属性作用及意义。 实验目的 理解CSS基本概念及功能 理解CSS样式的设计原则 理解并掌握CSS样式的基本声明方法 理解并掌握多种CSS选择器的使用方法 理解并掌握字文本、表格、超链接等元素常用属性的使用方法 理解并掌握…

机器人学:DH参数总结(传统DH方法和改进DH方法)

1. 传统DH参数方法 1.1 确定坐标系的方法 定义:杆 i i i的近端是关节 i i i,远端是关节 i 1 i1 i1. 【下面的规则参考上面的图看得更清楚】 对于 n n n自由度机器人,可用以下步骤建立与各杆件 i ( i 0 , 1 , … , n ) i(i0,1,…,n) i(i0,…

【iOS底层探索- Block原理分析-循环引用】

文章目录 前言准备工作1. Block的分类2. Block的内存分析捕获外部变量引用计数的变化堆栈释放的差异总结 3. Block的循环引用3.1 什么是循环引用?案例引入 循环引用解决方法1. 强弱共舞2. 手动中断循环引用3. 参数形式解决循环引用(block传参&#xff09…

汇编指令执行过程及CS与IP和DS寄存器关系与变化

内存指令及寄存器初始值: CS:2000H IP:0 DS:1000H AX:0 BX:0 上面在内存中的汇编指令是如何执行的? 验证: 在debug下用a指令先向内存写入下面指令,然后用u指令查看 mov ax,2000 mov ds,ax mov ax,[0008] mov ax,[0002] 在debug下用a指令先向内存写入下面指令,然后用u指…

Computer之Compilation:Cmake的简介、安装、案例应用之详细攻略

Computer之Compilation:Cmake的简介、安装、案例应用之详细攻略 目录 Cmake的简介 Cmake的安装 1、官方下载 2、执行安装程序,并按照提示进行安装 3、验证测试 Cmake的案例应用 Cmake的简介 CMake(Cross-platform Make)是一…