基于整体学习的大幅面超高分遥感影像桥梁目标检测(含数据集下载地址)

news2024/9/27 21:21:49

文章摘要

在遥感图像(RSIs)中进行桥梁检测在各种应用中起着至关重要的作用但与其他对象检测相比,桥梁检测面临独特的挑战。在RSIs中,桥梁在空间尺度和纵横比方面表现出相当大的变化。因此,为了确保桥梁的可见性和完整性,必须在大尺寸高分辨率(VHR)RSIs中进行整体桥梁检测。然而,缺乏大尺寸VHR RSIs的数据集限制了深度学习算法在桥梁检测中的性能。由于在处理大尺寸图像时GPU内存的限制,基于深度学习的物体检测方法通常采用裁剪策略,这不可避免地导致标签碎片化和预测不连续。为了缓解数据集的稀缺性,文章提出了一个名为GLH-Bridge的大规模数据集,该数据集包括从全球不同地理位置采样的6,000张VHR RSIs。这些图像的大小范围从2,048 × 2,048到16,384 × 16,384像素不等,共包含59,737座桥梁。这些桥梁跨越不同的背景,并且每个桥梁都被手动标注,使用了定向边界框(OBB)和水平边界框(HBB)。此外,作者提出了一种高效的整体桥梁检测网络(HBD-Net),用于大尺寸RSIs中的桥梁检测。HBD-Net采用了基于独立检测器的特征融合(SDFF)架构,并通过形状敏感样本重加权(SSRW)策略进行了优化。SDFF架构执行层间特征融合(IFF),以在大尺寸图像的动态图像金字塔(DIP)中融合多尺度上下文,SSRW策略则用于确保不同纵横比桥梁的回归权重的平衡。基于提出的GLH-Bridge数据集,作者建立了包括OBB和HBB任务的桥梁检测基准,并验证了所提出的HBD-Net的有效性。此外,在两个公开可用数据集上的跨数据集泛化实验展示了GLH-Bridge数据集的强泛化能力。

论文地址:

https://ieeexplore.ieee.org/document/10509806

数据集体量较大,超过20G,且需要科学上网进行下载,我们已经为大家下载完毕。

数据集下载地址:

https://www.dilitanxianjia.com/15644/

前世今生

桥梁作为关键的基础设施组件,横跨各种地形,起着基本的交通设施作用。它们在民用交通、军事行动和灾害救援中具有重要意义 [1]。同时,桥梁建设迅速且频繁改造。例如,2012年,美国约有617,000座桥梁,其恶化将在未来50年增加,需要超过1250亿美元用于修复积压的维修工作。因此,桥梁检测的高效性和有效性对于及时更新导航图并进一步监测桥梁的结构健康和状况至关重要 [2],[3]。遥感图像(RSIs)以其广泛的地理覆盖和高频率的重访,适合作为桥梁检测的基础数据。同时,考虑到深度网络的强大特征表示能力,基于深度学习的RSIs桥梁检测具有很大潜力,已成为研究的重点 [4]。

图片

如图1所示,与其他常见物体相比,在RSIs中检测多尺度桥梁相当具有挑战性,主要有两个特征:(i)多样的对象尺度。在高分辨率(VHR)RSIs中,桥梁实例的长度从几像素到数千像素不等。(ii)极端的纵横比。不同桥梁的伸长程度存在显著差异。为了确保小型或狭窄桥梁的可检测性,使用非常高分辨率(VHR)的图像至关重要。同时,为了追求VHR图像中大且长桥梁的结构完整性,有必要在大尺寸图像中进行整体桥梁检测,这对数据集和方法都提出了严格要求。尽管在多类物体检测 [12],[13],[14],[15],[16] 和桥梁检测 [4],[11],[17] 方面取得了显著进展,但在大尺寸VHR RSIs中进行整体桥梁检测的大规模数据集和适当方法仍然存在不足。

图片

如表1所示,尽管已经创建了许多流行的RSIs物体检测数据集 [6],[7],[8],[18],这些数据集中的桥梁数量有限。此外,专门为桥梁检测创建的数据集 [4],[11] 通常受样本量和图像尺寸的限制。现有的一些数据集仅提供水平边界框(HBB)注释,而不是精确的定向边界框(OBB)注释。因此,使用上述数据集训练一个鲁棒且具有广泛适应性的桥梁检测模型似乎不现实。为了解决数据限制问题,作者构建了GLH-Bridge,一个用于大尺寸VHR RSIs桥梁检测的大规模数据集。GLH-Bridge包含全球采样的6,000张VHR RSIs和超过59,000座手动标注的桥梁。与现有的桥梁检测数据集相比,GLH-Bridge通过在大尺寸VHR RSIs中标注多尺度桥梁,涵盖了植被、干河床和道路等多种背景类型,从而更好地捕捉真实场景中桥梁的特征。简而言之,与现有的桥梁检测数据集相比,GLH-Bridge展示了全面的优势和显著的优点。

为了推进这一基础且实际的问题的研究,作者提出了一个新的具有挑战性且有意义的任务:在大尺寸VHR RSIs中进行整体桥梁检测。为了解决这个任务,潜在的解决方案可以分为四个主要方面:(i)鉴于GPU内存的限制,主流的基于深度学习的物体检测方法 [15],[16],[19],[20],[21] 通常采用裁剪策略 [7],[22]。然而,这些策略有固有的局限性,容易切断大型桥梁,如图1所示。除了裁剪策略外,一些物体检测方法通过固定窗口下采样策略处理原始大尺寸图像 [23],[24],[25],导致显著的图像信息丢失;(ii)流式方法 [26] 对大尺寸图像的小块进行前向和后向传递,但无法支持带有归一化的深度神经网络(DNN);(iii)LMS方法 [27] 使用内存卸载将内存跨系统内存(CPU DRAM)和GPU内存共享。然而,它们引入了显著的时间开销,并受最大内存扩展率的限制;(iv)多GPU张量并行化技术 [28],[29] 有望扩展深度网络以支持大尺寸图像的整体处理。然而,它们往往资源密集,且在常规条件下难以操作。总之,现有方法在普通计算资源(如单个24 GB内存的GPU)下无法有效进行大尺寸VHR RSIs的整体桥梁检测。

考虑到上述潜在解决方案的限制,作者提出了一个专为大尺寸VHR RSIs桥梁检测设计的整体桥梁检测网络(HBD-Net)。作者的方法具有两个关键优点:(i)基于独立检测器的特征融合(SDFF)架构在应用于动态图像金字塔(DIP)时,展示了一种高效处理大尺寸图像的方式,资源消耗最小。(ii)形状敏感样本重加权(SSRW)策略平衡了不同纵横比桥梁的回归权重。在GLH-Bridge上的实验结果展示了提出的HBD-Net的出色性能。

总之,据作者所知,本文首次探索了大尺寸VHR RSIs中的整体桥梁检测。本文的主要贡献如下:

  • 提出了GLH-Bridge,第一个用于大尺寸VHR RSIs桥梁检测的大规模数据集。该数据集包含59,737座桥梁,覆盖各种背景,提供了现实场景中桥梁的全面表示。

  • 提出了一个用于大尺寸图像的低成本整体桥梁检测网络(即HBD-Net),它可以高效处理大尺寸图像,并通过设计精良的SDFF架构和SSRW策略整体检测多尺度桥梁。

  • 利用提出的GLH-Bridge数据集,作者创建了一个桥梁检测基准,涵盖了OBB和HBB任务。HBD-Net在性能上优于现有的最先进算法。此外,作者进行了跨数据集泛化实验,展示了GLH-Bridge的强泛化能力。作者希望这个基准可以为大尺寸图像中的物体检测的基础评估做出贡献。

匠心独运

作者开发新数据集用于桥梁检测的目标有两个:(i) 填补大尺寸高分辨率遥感影像(VHR RSIs)桥梁检测的大规模数据集的空白。(ii) 推动一个新颖且具有挑战性的任务:大尺寸VHR RSIs中的整体桥梁检测。

图片

图2. 来自提议的 GLH-Bridge 数据集的采样图像的地理分布图。

图片

图3. 根据标准标注的示例,其中黄色圆圈表示未标注的情况。(a) 形状过于弯曲或不规则的跨水道路不进行标注。(b) 两个终端连接不进行标注。

图片

图4. GLH-Bridge 数据集特征的说明。(a) 不同数据集中桥梁特征的比较。(b) GLH-Bridge 中桥梁面积的分布。(c) GLH-Bridge 中桥梁长度的分布。(d) GLH-Bridge 中桥梁密度的分布。

图片

图5. GLH-Bridge 数据集中不同背景下的桥梁示例。(a) 穿越植被的桥梁。(b) 穿越干涸河床的桥梁。(c) 穿越道路的桥梁。(d) 穿越水体的桥梁。

图片

图6. 所提议的HBD-Net流程。它包含所提出的SDFF架构和SSRW策略。SDFF架构由独立检测器和IFF模块组成。从输入的大尺寸VHR图像开始,作者构建一个DIP并将其发送到SDFF的独立检测器以获取特征。然后,通过IFF模块融合所有SDFF检测器的特征,以共享上下文和详细纹理信息。SSRW策略在对象检测器的样本选择阶段应用,以平衡回归权重。最后,将输出的融合特征输入到对象检测器的头部,以获取每一层的结果,这些结果用于与相应的真实标签计算损失。

图片

图7. 所提议的IFF模块示意图。图中展示了两个相邻层之间特征融合的方法。

图片

图8. 所提出的SSRW策略示意图。红色和蓝色点分别表示对象检测器选择的正样本和负样本。对于基于锚点的检测器,这些点对应于生成锚点或提议的特征图位置。对于无锚点的检测器,这些点指示特征图上的网格。为保持清晰和简洁,与样本点相关联的锚点或提议(适用于基于锚点的方法)在此示意图中未显示。

卓越性能

图片

未来展望

本文提出了一个名为GLH-Bridge的大规模数据集,用于在大尺寸高分辨率遥感图像中进行整体桥梁检测。所提出的数据集包含6,000个高分辨率遥感图像,图像尺寸从2,048 × 2,048到16,384 × 16,384像素不等,包含59,737座跨越不同背景的桥梁,并带有OBB和HBB注释。大尺寸图像、大样本量以及对象尺度和背景类型的多样性使GLH-Bridge成为一个宝贵的数据集,其具备推动一个新的具有挑战性但意义深远的任务的前提:在大尺寸高分辨率遥感图像中进行整体桥梁检测。此外,作者提出了HBD-Net,这是一种专为大尺寸图像中的整体桥梁检测量身定制的经济高效的解决方案。基于所提出的GLH-Bridge数据集,作者建立了一个基准,并对所提出的HBD-Net的有效性进行了经验验证。在未来的工作中,作者将继续丰富GLH-Bridge数据集的样本量和子类别注释。此外,作者的目标包括将所提出的HBD-Net推广到满足大尺寸图像中的多类对象检测。作者努力探索可以同时提高大尺度和小尺度桥梁准确性的方法,从而扩大HBD-Net在各种场景中的适用性和有效性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1919966.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[Godot3.3.3] - 过渡动画

过渡动画 ScreenTransitionAnimation 项目结构 添加场景,根节点为 CanvasLayer2D 并重命名为 ScreenTransition: 添加子节点 ColorRect 和 AnimationPlayer,在 ColorRect 中将颜色(Color)设置为黑色: 找到 Material,新建 Shader…

Scanner工具类

扫描控制台输入 1.nextLine nextLine() 方法会扫描输入流中的字符,直到遇到行末尾的换行符 \n,然后将该行的内容作为字符串返回,同时,nextLine() 会将 Scanner 对象的位置移动到下一行的开头,以便下一次读取数据时从下…

【机器学习】12.十大算法之一支持向量机(SVM - Support Vector Machine)算法原理讲解

【机器学习】12.十大算法之一支持向量机(SVM - Support Vector Machine)算法原理讲解 一摘要二个人简介三基本概念四支持向量与超平面4.1 超平面(Hyperplane)4.2 支持向量(Support Vectors)4.3 核技巧&…

数据结构实操代码题~考研

作者主页: 知孤云出岫 目录 数据结构实操代码题题目一:实现栈(Stack)题目二:实现队列(Queue)题目三:实现二叉搜索树(BST)题目四:实现链表(Linked…

Gitlab CI/CD介绍

基本概念 GitLab CI/CD(持续集成/持续部署)流水线是GitLab平台提供的一项强大功能,旨在通过自动化构建、测试和部署过程,提高开发团队的效率和软件发布的质量。 CI(Continuous Integration):持续…

【驱动篇】龙芯LS2K0300之spi设备驱动

实验介绍 GC9A01是一款小巧(1.28寸)、彩色(分辨率为 240 * 240 RGB)圆形TFT屏幕,它采用4线 SPI的控制方式,电源供电电压为3.3V,有7个控制引脚;本次实验将使用它来验证龙芯SOC的SPI通…

从汇编层看64位程序运行——程序中的栈(Stack)结构及其产生的历史原因

大纲 传统栈程序栈X86体系栈反向的原因参考资料 如果要讲程序在系统层的运行,一个绕不开的名词就是“栈”。所以深入理解“栈”是这个系列重要的基础。本文也将深入浅出,只讲明白程序运行中使用的栈是什么。 传统栈 有计算机基础的同学都知道栈的特点&…

开源浏览器引擎对比与适用场景:WebKit、Chrome、Gecko

WebKit与Chrome的Blink引擎对比 起源与关系: WebKit最初由苹果公司开发,用于Safari浏览器。后来,WebKit逐渐成为一个独立的开源项目,被多个浏览器厂商采用。Blink是Google基于WebKit项目分支出来的一个浏览器引擎,用于…

实现Android夜间模式主题:从入门到精通

实现Android夜间模式主题:从入门到精通 随着用户对夜间模式的需求越来越高,Android开发者需要掌握如何在应用中实现夜间模式。本文将详细介绍在Android中实现夜间模式的步骤,包括配置、实现、以及一些最佳实践,帮助开发者创建更具吸引力和用户友好的应用。 夜间模式的优势…

文献翻译与阅读《Integration Approaches for Heterogeneous Big Data: A Survey》

CYBERNETICS AND INFORMATION TECHNOLOGIES’24 论文原文下载地址:原文下载 目录 1 引言 2 大数据概述 3 大数据的异构性 4 讨论整合方法 4.1 大数据仓库(BDW) 4.2 大数据联盟(BDF) 5 DW 和 DF 方法的比较、分…

逻辑回归中的损失函数

目录 一、损失函数介绍:二、简化上述损失函数: 一、损失函数介绍: 与回归问题成本函数不同的是,逻辑回归模型(解决分类问题)的成本函数在获得损失J的时候不再用真实值y与预测值y^的差值计算损失&#xff0…

adminPage-vue3依赖FormPage说明文档,表单页快速开发,使用思路及范例(Ⅱ)formConfig基础配置项

adminPage-vue3依赖FormPage说明文档,表单页快速开发,使用思路及范例(Ⅱ)formConfig配置项 属性: formConfig(表单项设置)keylabelnoLabeldefaultValuebindchildSlottypeString类型数据(除 time…

探索GitHub上的两个革命性开源项目

在数字世界中,总有一些项目能够以其创新性和实用性脱颖而出,吸引全球开发者的目光。今天,我们将深入探索GitHub上的两个令人惊叹的开源项目:Comic Translate和GPTPDF,它们不仅改变了我们处理信息的方式,还极…

为什么说https访问是网站的标配

在互联网时代,数据安全和隐私保护成为了不可忽视的重要议题。随着网络攻击、数据泄露等事件频发,用户对在线活动的安全性要求越来越高。HTTPS协议作为HTTP协议的加密版本,已经成为现代网站的标配,其重要性和必要性不言而喻。下面从…

【数据结构】初探数据结构面纱:栈和队列全面剖析

【数据结构】初探数据结构面纱:栈和队列全面剖析 🔥个人主页:大白的编程日记 🔥专栏:数据结构 文章目录 【数据结构】初探数据结构面纱:栈和队列全面剖析前言一.栈1.1栈的概念及结构1.2栈的结构选择1.3栈的…

Xilinx FPGA:vivado fpga与EEPROM的IIC通信,串口显示数据,含使用debug教程

一、实验要求 实现FPGA与EEPROM的通信,要求FPGA对EEPROM实现先“写”后“读”,读出的值给uart发送端并显示到电脑上,按下按键1让fpga对EEPROM写入数据;按下按键2让fpga读出对EEPROM写入过的数据。 二、信号流向图 三、程序设计 …

Spring-Spring、IoC、DI、注解开发

1、Spring是什么 Spring是一个轻量级的控制反转(IoC)和面向切面(AOP)的容器(框架)。 Spring整体架构 Spring优点: Spring属于低侵入设计。IOC将对象之间的依赖关系交给Spring,降低组件之间的耦合,实现各个层之间的解耦,让我们更专注于业务…

Day1每日编程题日记:数字统计、两个数组的交集、点击消除

前言:该篇用于记录自看。曾回看昨天的做题代码,竟然会觉得陌生,这竟然是我写的,细细读了一下,原来我当时是这么想的。因此我觉得记代码没有实际用处,重点是领悟了思想,这样子代码就在心中&#…

怎样将aac转换mp3格式?推荐四个aac转MP3的方法

怎样将aac转换mp3格式?当需要将aac格式音频转换为MP3格式时,有几种方法可以轻松实现这一目标。MP3是一种广泛支持的音频格式,几乎所有设备和平台都能播放MP3文件,包括各种音乐播放器、手机、平板电脑和汽车音响系统。而且它也提供…

MQTT协议网关解决方案及实施简述-天拓四方

MQTT协议网关是一个中间件,负责接收来自不同MQTT客户端的消息,并将这些消息转发到MQTT服务器;同时,也能接收来自MQTT服务器的消息,并将其转发给相应的MQTT客户端。MQTT协议网关的主要功能包括协议转换、消息过滤、安全…