丰富上下文的超高分辨率分割:一种新的基准

news2025/1/31 8:07:37

文章目录

  • Ultra-High Resolution Segmentation with Ultra-Rich Context: A Novel Benchmark
    • 摘要
    • 数据集
      • Dataset Summary
      • Data Collection and Pre-processing
    • 数据标注
      • 数据统计
    • WSDNet
    • 实验结果

Ultra-High Resolution Segmentation with Ultra-Rich Context: A Novel Benchmark

摘要

数据
随着人们对超高分辨率(UHR)分割方法的兴趣不断增加和快速发展,迫切需要一个覆盖广泛场景并具有全细粒度密集注释的大规模基准来促进该领域的发展。为此,引入了URUR数据集,即具有超丰富上下文的超高分辨率数据集。顾名思义,URUR包含大量分辨率足够高的图像(3008张5120×5120大小的图像)、广泛的复杂场景(来自63个城市)、足够丰富的上下文(100万个实例,8个类别)和细粒度注释(约800亿个手动注释像素),这远远优于包括DeepGlobe、Inria Aerial、UDD,
模型

  1. 还提出了WSDNet,这是一种更高效、更有效的UHR分割框架,尤其是在超丰富上下文的情况下,
  2. 多级离散小波变换(DWT)自然地被集成以释放计算负担,同时保留更多的空间细节,以及小波平滑损失(WSL)以利用平滑约束重建原始结构化上下文和纹理。
    代码地址
    在这里插入图片描述

数据集

在数量、上下文丰富度和注释质量方面,所提出的URUR数据集远远优于所有现有的UHR数据集,包括DeepGlobe、Inria Aerial、UDD等。在本节中,我们将说明数据集构建的过程,并通过各种信息统计对其进行分析,并给出保护隐私的详细措施。

Dataset Summary

所提出的URUR数据集包含3008张来自63个城市的5012×5012大小的UHR图像。训练、验证和测试集分别包括2157张、280张和571张UHR图像,近似比例为7:1:2。所有图像都用细粒度的像素级类别进行了详尽的手动注释,包括“建筑”、“农田”、“温室”、“林地”、“荒地”、“水”、“道路”和“其他”8类。

Data Collection and Pre-processing

该数据集由几个高质量的卫星图像数据源收集,供公众使用。这产生了来自63个城市的数据,然后我们根据以下标准在每个城市手动选择大约20个场景:
低歧义:所选场景中的对象在外观上不应该有太多明显的语义歧义。
高度多样性:具有不同类别、实例、时间和天气的场景在我们的任务中应该更合适、更有意义。
隐私保护:场景中的任何信息都不应泄露任何有关隐私的信息,如个人、店铺名称等。
因此,数据集在相机视点、照明和场景类型方面有很大的变化。此外,为了增强数据集的多样性和丰富性,为每个场景设置并收集了多个粒度视角。结果,我们总共收集了752张大小为10240×10240的图像,然后将其划分为3008张大小为5120×5120的图像。

数据标注

与自然图像相比,注释UHR图像总是一项更艰巨的工作,因为要标记的对象随着图像分辨率的增加而呈二次增长。这就是为什么现有的UHR数据集通常利用粗粒度注释或只注释一个主要类别。相反,我们打算对所提出的URUR数据集中的整个类别采用更细粒度的注释。图1显示了直观的比较,有关数据集统计的更多细节将在第3.4节中介绍。可以看出,包括DeepGlobe、Inria Aerial和URUR在内的UHR数据集显然比Pascal VOC和COCO等自然数据集包含更多的对象和实例,而这些对象的规模也较小。此外,一个或多个类对经常在空间上混合在一起,这给在注释过程中仔细区分它们带来了很大的麻烦。相比之下,URUR还包含比其他UHR数据集更多的对象和更丰富的上下文。总之,注释细粒度超高分辨率图像的主要挑战和耗时部分不仅反映在过度超高的图像分辨率导致的待注释对象数量上,还反映在尺度急剧变化的对象之间的超丰富的图像上下文导致的许多链问题上。
为了高效准确地进行标注,首先将每个5120×5120的原始UHR图像均匀地裁剪成1000×1000的多个补丁。我们让注释器分别对这些图像块进行注释,然后对它们的结果进行相应的合并,以获得相对于原始UHR图像的最终注释。通过这种方式,我们确保每个注释器只关注较小的图像补丁,这有助于注释过程并提高注释结果的准确性。
在裁剪过程中,相邻的面片具有120×1000像素的重叠区域,以保证注释结果的一致性,避免边界消失。为了进一步节省人力并加快整个过程,使用早期手动注释的图像来训练ISDNet模型,并用于在剩余图像上生成分割掩模。作为参考,注释器在我们开发的注释工具的帮助下调整掩码。

数据统计

在这里插入图片描述

表1显示了所提出的URUR数据集与现有的几个主要UHR数据集之间的详细统计比较,包括DeepGlobe[4]、Inria Aerial[5]、ISIC[5]、ERM-PAIM[37]、UDD[6]和UA Vid[7]。首先,对于最基本的图像统计,URUR由3008张大小为5120×5120的图像组成,在图像数量和分辨率方面都优于所有其他数据集。具体来说,除ISIC和DeepGlobe外,其他所有数据集的图像数量都在200以下。DeepGlobe包含803张图像,但分辨率仅为2448×2448(5.9M),甚至没有达到UHR介质的最小阈值(8.3M)(如第1节所示)。

WSDNet

在这里插入图片描述
WSDNet:
由深分支D(下分支)和浅分支S(上分支)组成
在S中,使用拉普拉斯金字塔将输入图像分解为两个子带,然后将其连接并馈送到浅层网络中,以提取全尺寸的空间细节
在D中,使用两级离散小波变换(DWT)对输入图像进行下采样,然后将其输入到深度网络中,以获取高级类别上下文。
接下来,利用两级反相离散小波变换(IWT)将原始输入的尺度为1/32的输出上采样到1/8。最后,将这两个分支与多尺度特征融合,并使用基本交叉熵损失Lseg、辅助损失Laux以及小波平滑损失(WSL)进行优化,以在超分辨率头的帮助下重建原始输入。点线内的模块在推理过程中被移除。
小波平滑损失函数:
在这里插入图片描述
总损失
在这里插入图片描述

实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/631754.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SSM整合快速入门案例(一)

文章目录 前言一、设计数据库表二、创建工程三、SSM技术整合四、功能模块开发五、接口测试总结 前言 为了巩固所学的知识,作者尝试着开始发布一些学习笔记类的博客,方便日后回顾。当然,如果能帮到一些萌新进行新技术的学习那也是极好的。作者…

不认识docker,怎么好意思说自己是干IT的

1.Docker是什么 一款产品从开发到上线,从操作系统,到运行环境,再到应用配置。作为开发运维之间的协作我们需要关心很多东西,这也是很多互联网公司都不得不面对的问题,特别是各种版本的迭代之后,不同版本环…

用户行为数据分析

文章目录 用户行为数据分析1 项目描述2 项目需求3 数据准备1、创建user_data数据表用于导入user_data.csv中的数据2、加载user_data.csv中的数据到user_data表3、接下来进行数据清洗,包括:删除重复值,时间戳格式化,删除异常值。 4…

OpenGL光照之基础光照

文章目录 环境光照漫反射光照计算漫反射光照镜面光照代码 现实世界的光照是极其复杂的,而且会受到诸多因素的影响,这是我们有限的计算能力所无法模拟的。因此OpenGL的光照使用的是简化的模型,对现实的情况进行近似,这样处理起来会…

MyBatis-Plus(2.0)

ActiveRecord ActiveRecord(简称AR)一直广受动态语言(PHP、Ruby等)的喜爱,而java作为准静态语言,对于ActiveRecord往往只能感叹器优雅 什么是ActiveRecord? ActiveRecord也属于ORM(对象关系映射)层,由Rail…

视频|人人能看懂的苹果visionOS空间设计课程

本周的重磅消息无疑是苹果Vision Pro以及对应的visionOS,考虑到苹果头显硬件上当前以第一方App为主,因此本届WWDC的一个重点就是释放visionOS和相关能力给开发者,让开发者尽快打造出更多、更优质的第三方App阵容。 与此同时,苹果也…

【vue3】10-vue组件化额外知识补充(下)-动态组件-组件缓存-v-model在组件上的应用

组件化-额外知识补充(下) 动态组件的使用(了解)keep-alive(理解)认识keep-alivekeep-alive的使用 异步组件的使用webpack分包处理(了解)Vue中实现异步组件 组件的v-model组件的混入Mixin(了解&a…

阿里云弹性公网EIP收费价格表(按量/包年包月/配置费)

阿里云弹性公网EIP怎么收费?EIP地域不同价格不同,EIP计费模式分为包年包月和按量付费,弹性公网IP可以按带宽收费也可以按使用流量收费,阿里云百科分享阿里云弹性公网IP不同地域、不同计费模式、按带宽和按使用流量详细收费价格表&…

基于springboot+vue技术的在线考试系统源码数据库

源码看这里 https://download.csdn.net/download/2301_76965813/87881785 前台 学生登录: 如果没有账号,首先需要以学生的身份进行注册,即输入姓名、性别、密码以及班级,注册成功之后输入账户名和密码进行登录,进入…

conda虚拟环境配置和系统相关配置

一、conda虚拟环境 首先,尽量别在base中直接安装自己的包。原因有以下两个: 1.base环境是conda运行的基础,没法一键清除,如果损坏base环境要么滚回要么卸载重装,比较麻烦 2.base中很多包并不是项目需要的包&#xff0c…

Spring5

Spring5 文章目录 Spring5一.框架概述二.入门案例三.IOC容器1.IOC概念2.IOC底层原理3.IOC接口 四.IOC操做Bean管理1.Bean管理2.基于xml配置文件方式实现(1).创建对象(2).注入属性第一种注入:set方法第二种注入:有参数的构造p名称空间注入(了解)注入空值和特殊符号外部Bean内部B…

itop-3568开发板驱动学习笔记(27)设备树(六)pinctrl

《【北京迅为】itop-3568开发板驱动开发指南.pdf》 学习笔记 文章目录 pinctrl 子系统简介pinctrl 设备树语法pinctrl 客户端pinctrl 服务端瑞星微平台全志平台三星平台iMX 平台 pinctrl 子系统简介 Linux pinctrl 子系统用来管理 GPIO 引脚,它主要完成了以下三种功…

MySQL数据库,从入门到精通:第三篇——MySQL 数据库规范和基础查询语句

MySQL数据库,从入门到精通:第三篇——MySQL 数据库规范和基础查询语句 第三篇_MySQL 数据库规范和基础查询语句1. SQL概述1.1 SQL背景知识1.2 SQL语言排行榜1.3 SQL 分类 2. SQL语言的规则与规范2.2 SQL大小写规范 (建议遵守)2.3 …

设计模式-03.02-创建型-工厂建造者原型

工厂模式【常用】 工厂模式很重要,后面的很多架构设计,都是工厂模式联合着其它设计模式使用。 一般情况下,工厂模式分为三种更加细分的类型:简单工厂、工厂方法和抽象工厂。不过,在 GoF 的《设计模式》一书中&#xff…

docker资源控制cgroup

一、CPU控制 cgroups,是一个非常强大的linux内核工具,他不仅可以限制被namespace隔离起来的资源, 还可以为资源设置权重、计算使用量、操控进程启停等等。所以cgroups (Control groups) 实现了对资源的配额和度量。 cgroups有四大功能: 资源限制:可以…

SpringAOP详解

目录 前言: 相关概念 切点表达式规则 代码演示 SpringAOP实现原理 织入(代理的生成时机) JDK和CGLIB区别 小结: 前言: AOP(Aspect Oriented Programming)是思想(面向切面编程…

文心一言 VS 讯飞星火 VS chatgpt (37)-- 算法导论5.4 1题

一、一个屋子里必须要有多少人,才能让某人和你生日相同的概率至少为1/2? 必须要有多少人,才能让至少两个人生日为 7月 4 日的概率大于 1/2? 文心一言: 一个屋子里必须要有多少人,才能让某人和你生日相同的概率至少为1/2&#…

Linux下ElasticSearch7.9.2安装配置(包含服务器配置、启动停止脚本、开放端口和elasticsearch-head插件的使用)

Linux下ElasticSearch7.9.2安装配置 前言1.下载安装1.1 使用wget的方式下载1.2 官网下载 2.上传到服务器并解压3.修改es配置文件3.1 es目录简介3.2 修改配置文件 4. 创建用户并赋权5. 服务器修改配置5.1 修改文件句柄数和线程数5.2 关闭swapping5.3 修改虚拟内存 6. 启动es6.1 …

“配置DHCP Snooping实验:保护网络中的DHCP服务和防止欺骗攻击“

"配置DHCP Snooping实验:保护网络中的DHCP服务和防止欺骗攻击" 【实验目的】 部署DHCP服务器。熟悉DHCP Snooping的配置方法。验证拓扑。 【实验拓扑】 实验拓扑如图所示。 设备参数如下表所示。 设备 接口 IP地址 子网掩码 默认网关 R1 F0/0 …

腾讯云轻量应用服务器和云服务器区别详细说明

腾讯云轻量应用服务器是什么?腾讯云轻量服务器和云服务器有什么区别?为什么轻量应用服务器费用更低?是因为轻量服务器CPU内存性能比云服务器CVM性能差吗?轻量应用服务器适合中小企业或个人开发者搭建企业官网、博客论坛、微信小程…