STAR数据集:首个用于大型卫星图像中场景图生成大规模数据集

news2024/11/26 16:45:08

2024-06-12,在遥感图像领域,由武汉大学等机构联合创建的STAR数据集,标志着场景图生成技术在大规模、高分辨率卫星图像中的新突破。

一、研究背景:

场景图生成(Scene Graph Generation, SGG)技术在自然图像中已取得显著进展,但在高分辨率的卫星图像(Satellite Imagery, SAI)领域仍面临巨大挑战。卫星图像的多尺度对象、复杂的场景关系以及丰富的背景信息,要求算法不仅要有强大的感知能力,还需具备深层次的认知解析能力。

目前遇到困难和挑战:

1、大尺寸、高分辨率的SAI场景中,对象尺寸和长宽比的巨大变化增加了检测难度。

2、现有数据集缺乏大规模、多尺度的SAI场景图生成数据。

3、缺乏有效的算法框架来处理SAI中的长距离上下文推理。

4、现有的场景图生成模型大多针对小尺寸自然图像设计,难以直接应用于SAI。

数据集地址:STAR|卫星图像分析数据集|场景图生成数据集

二、让我们一起来看一下STAR数据集:

STAR数据集是首个大规模、高分辨率SAI场景图生成数据集,覆盖超过21万个对象和40万个关系三元组。

数据集构建:

  • 收集了来自全球的高分辨率SAI图像,图像大小从512×768到27,860×31,096像素不等。

  • 由人类专家指导,所有对象被分类并使用定向边界框(Oriented Bounding Boxes, OBB)进行精确注释。

  • 关系注释考虑了上下文推理,包括8大类58个子类的关系。

数据集特点:

  • 覆盖了包括机场、港口、核电站和大坝在内的11种与人类活动密切相关的复杂地理空间场景。

  • 提供了丰富的对象类别和关系类型,有助于开发更精准的SAI解析模型。

  • 注释详尽,包括对象的精确定位和丰富的上下文关系。

数据集可用于训练和评估面向SAI的SGG模型,支持对象检测(Object Detection, OD)和场景图生成(Scene Graph Generation, SGG)任务。提供了基于STAR数据集的挑战性任务和基准测试。

基准测试

对多种现有的SGG方法进行了测试,包括Faster R-CNN、RetinaNet和Cascade R-CNN等。

引入了上下文感知级联认知(CAC)框架,显著提高了在STAR数据集上的性能。

三、展望STAR数据集的应用

比如,我是一个环境监测专家。

我需要经常需要四处搜集证据,分析线索,来确定工业园区的污染源。这可不容易,我得用那些分辨率不高的卫星图像,瞪大眼睛找啊找,看哪里的烟囱在冒烟,哪里的河流颜色不对劲。有时候,我还要亲自下现场,取水样,这不仅耗时耗力,而且效率还不高。

现在,我可以通过STAR数据集训练的智能系统,来分析那些高分辨率的卫星图像了。

比如说,我观察到一个工业园区,那里有很多化工厂。我把一张工业园区的卫星图像输入到智能系统中,系统很快就识别出了所有的烟囱和排放口。然后,系统通过分析这些烟囱和周围环境的关系,比如风向、周围植被的健康状况,甚至是附近河流的流向,推断出了可能的污染排放路径。

“哇,你看这里!”我指着屏幕上的图像对同事说,“这个烟囱排放的烟雾,随风飘向了东北方向,那边正好有一片居民区。” 智能系统还识别出了烟雾中的污染物类型,给出了污染指数的预测。

再比如,我发现系统标注出了几个异常的排放事件,这些事件在以前的低分辨率图像中是看不到的。但现在我可以及时向环保部门报告,采取预防措施。

而且,这个智能系统还能学习。随着我不断输入新的数据,它变得越来越聪明,识别得越来越准确。现在也不用等上一个星期才拿到实验室的分析报告。我只需要点点鼠标,系统就能给我提供实时的、准确的污染监测结果。让我的工作变的高效起来。可以准时下班了。

来吧,让我一起走进数据集:STAR|卫星图像分析数据集|场景图生成数据集

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2192989.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何使用ssm实现基于bootstrap的课程辅助教学网站的设计与实现+vue

TOC ssm782基于bootstrap的课程辅助教学网站的设计与实现vue 第1章 绪论 1.1研究背景与意义 在科学技术水平还比较低下的时期,学校通常采用人工登记的方式对相关的课程信息进行记录,而后对这些信息记录进行管理和控制。这种采用纸质存储信息的管理模…

Linux基础项目开发1:量产工具——显示系统

文章目录 数据结构抽象使用场景disp_mannger.h Framebuffer编程Framebuffer.c 显示管理最终disp_manager.hdisp_manager.c 测试单元测试代码 数据结构抽象 我们添加的显示管理器中有Framebuffer和web输出,对于两个不同的设别我们需要抽象出同一个结构体类型&#x…

市面上8款AI论文大纲一键生成文献的软件推荐

在当前的学术研究和写作领域,AI论文大纲自动生成软件已经成为提高写作效率和质量的重要工具。这些工具不仅能够帮助研究人员快速生成论文草稿,还能进行内容优化、查重和排版等操作。本文将分享市面上8款AI论文大纲一键生成文献的软件,并特别推…

YOLOv11改进 | 卷积模块 | 分布移位卷积DSConv替换Conv

秋招面试专栏推荐 :深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转 💡💡💡本专栏所有程序均经过测试,可成功执行💡💡💡 本文介绍DSConv, DSConv 将…

算法1:双指针思想的运用(2)--C++

1.盛水最多的容器 题目链接:11. 盛最多水的容器 - 力扣(LeetCode) 题目解析: 在解析题目时,我们可以把最直接的方法先列举出来,然后再根据相应的算法原理,来进行优化 思路一:暴力…

Docker 启动 Neo4j:详细配置指南和浏览器访问

Docker 启动 Neo4j:详细配置指南和浏览器访问 文章目录 Docker 启动 Neo4j:详细配置指南和浏览器访问一 Neo4j compose 得 yml 配置二 配置描述三 浏览器访问 这篇文章详细介绍了如何使用 Docker Compose 启动 Neo4j 数据库,包括 docker-com…

菜鸟笔记003 获取目标对象的颜色值

在illustrator中,我们时常要获取一些对象的颜色值,但是一时不知道如何获取,下面我就来讲讲如何获取目标对象的颜色值。 下面以选择对象的最上层对象为例,我们通过查阅javascript编程手册,可以很容易获取下面代码: var sel=app.activeDocument.selection[0]; //获取最上…

【S32K3 RTD MCAL 篇1】 K344 KEY 控制 EMIOS PWM

【S32K3 RTD MCAL 篇1】 K344 KEY 控制 EMIOS PWM 一,文档简介二, 功能实现2.1 软硬件平台2.2 软件控制流程2.3 资源分配概览2.4 EB 配置2.4.1 Dio module2.4.2 Icu module2.4.4 Mcu module2.4.5 Platform module2.4.6 Port module2.4.7 Pwm module 2.5 …

SCTF2024(复现)

SCTF2024(复现) web SycServer2.0 开题: 需要登录,进行目录扫描,得到/config,/hello,/robots.txt 等,访问/hello 显示需要 token,查看源码发现存在 sqlwaf 可以通过抓…

基于ucontext库实现协程类

文章目录 前言协程基础知识协程上下文对称协程与⾮对称协程有栈协程与⽆栈协程 ucontext库接口熟悉一个简单的函数切换自动调用 协程类的实现接口全局变量线程局部变量malloc封装协程切换构造函数协程执行的方法 测试协程切换手动切换复用 前言 协程(Coroutine&…

Maven安装使用

说明:Maven是Apache旗下的一个开源项目,是一款用于管理和构建java项目的工具。一般来说,它帮助我们管理依赖、构建项目。本文介绍在Windows系统下安装Maven。 下载&安装&验证 下载 首先,在Maven官网(https:…

【第十五周】PyTorch深度学习实践2

目录 摘要Abstract1.多分类问题1.1.Softmax1.2.维度问题1.3.NLLLoss v.s. CrossEntropy1.4.代码实践1.4.1.导入相应的包1.4.2.准备数据集1.4.3.模型设计1.4.4.构造损失和优化器1.4.5.模型训练 2.卷积神经网络基础篇2.1.代码实践2.1.1.导入相应的包:2.1.2.准备数据集…

我谈巴特沃斯滤波器

目录 写在前面的内容我谈巴特沃斯滤波器巴特沃斯滤波器的幅频响应频率变换巴特沃斯各种滤波器例子 写在前面的内容 先看看冈萨雷斯对巴特沃斯滤波器的介绍。 低通 高通 带阻 带通 第一个问题,截止频率处的增益。 0.5的增益是不是陡度小了?巴特沃…

ai智能论文生成系统有用吗?分享5款ai文献综述自动生成器

近年来,人工智能(AI)技术在学术写作领域的应用越来越广泛,尤其是在文献综述的自动生成方面。AI智能论文生成系统通过深度学习和自然语言处理技术,能够帮助研究人员快速生成高质量的文献综述,从而提高写作效…

深度扩展AntSK,让.NET Aspire助力您的AI项目

引言 在现今飞速发展的技术世界中,引用最新的工具和框架来提升项目的性能和可管理性至关重要。作为一名开发者,我最近在自己的AI知识库项目AntSK中集成了.NET Aspire,这为我的项目注入了新的活力。如果你还不清楚什么是.NET Aspire&#xff0…

[单master节点k8s部署]32.ceph分布式存储(三)

基于ceph rbd生成pv 在集群中认证ceph 用下面代码生成ceph的secret .创建 ceph 的 secret,在 k8s 的控制节点操作: 回到 ceph 管理节点创建 pool 池: [rootmaster1-admin ~]# ceph osd pool create k8stest 56 pool k8stest created [rootm…

BERT论文解读及情感分类实战(论文复现)

BERT论文解读及情感分类实战(论文复现) 本文所涉及所有资源均在传知代码平台可获取 文章目录 BERT论文解读及情感分类实战(论文复现)简介BERT文章主要贡献BERT模型架构技术细节任务1 Masked LM(MLM)任务2 N…

【web安全】——常见框架漏洞

1.ThinkPHP框架漏洞 thinkphp是一个国内轻量级的开发框架,采用phpapache,在更新迭代中,thinkphp也经常爆出各种漏洞,thinkphp一般有thinkphp2、thinkphp3、thinkphp5、thinkphp6版本,前两个版本已经停止更新&#xff…

【详细教程】如何使用YOLOv11进行图像与视频的目标检测

《博主简介》 小伙伴们好,我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源,可关注公-仲-hao:【阿旭算法与机器学习】,共同学习交流~ 👍感谢小伙伴们点赞、关注! 《------往期经典推…

m4a怎么转换成mp3?音频转换MP3只需要这6个小工具!

m4a怎么转换成mp3?M4A和MP3是两种常见的音频格式,M4A通常使用AAC(高级音频编码)进行压缩,提供更高的音质和更小的文件体积,特别适合在Apple设备上使用。而MP3则以其高压缩比和广泛的兼容性著称,…