目标检测舰船数据集整合

news2024/12/26 11:23:21

在这里插入图片描述
在这里插入图片描述

一、光学数据集

1、 DIOR 数据集(已下载yolo版本)(论文中提到过

在这里插入图片描述

“DIOR”是一个用于光学遥感图像目标检测的大规模基准数据集。数据集包含23463个图像和192472个实例,涵盖20个对象类。这20个对象类是飞机、机场、棒球场、篮球场、桥梁、烟囱、水坝、高速公路服务区、高速公路收费站、港口、高尔夫球场、地面田径场、天桥、船舶、体育场、储罐、网球场、火车站、车辆和风磨。
数据论文地址:Object Detection in Optical Remote Sensing Images: A Survey and A New Benchmark

2、 LEVIR 数据集

在这里插入图片描述
LEVIR数据集由大量 800 × 600 像素和0.2m〜1.0m /像素的高分辨率Google Earth图像和超过22k的图像组成。LEVIR数据集涵盖了人类居住环境的大多数类型地面特征,例如城市,乡村,山区和海洋。数据集中未考虑冰川,沙漠和戈壁等极端陆地环境。数据集中有3种目标类型:飞机,轮船(包括近海轮船和向海轮船)和油罐。所有图像总共标记了11k个独立边界框,包括4,724架飞机,3,025艘船和3,279个油罐。每个图像的平均目标数量为0.5。
数据下载地址:http://levir.buaa.edu.cn/Code.htm
数据论文地址:Random Access Memories: A New Paradigm for Target Detection in High Resolution Aerial Remote Sensing Images

3、DOTA 数据集(已下载yolo版本)(论文中提到过

具体信息:https://blog.csdn.net/weixin_43427721/article/details/122057389
在这里插入图片描述
DOTA是用于航空图像中目标检测的大规模数据集。它可以用于开发和评估航空影像中的物体检测。对于DOTA数据集,它包含来自不同传感器和平台的2806个航拍图像。每个图像的大小在大约800×800到4000×4000像素的范围内,并且包含各种比例,方向和形状的对象。这些DOTA图像由航空影像解释专家分类为15个常见对象类别。完全注释的DOTA图像包含188、282个实例,每个实例都由任意(8自由度)四边形标记。
论文地址:DOTA: A Large-scale Dataset for Object Detection in Aerial Images

4、 NWPU VHR-10 数据集(已下载voc格式)(论文中提到过

4.1 基本信息

NWPU VHR-10 (Cheng et al.,2016) 这个高分辨率(VHR)遥感图像数据集是由西北工业大学(NWPU)构建的,包含10类正例样本650张以及不包含给定对象类的任何目标的150张反例图像(背景),正例图像中至少包含1个实例,总共有3651个目标实例。具体类别信息如下:
NWPU VHR-10数据集是仅用于研究的公开提供的10类地理空间物体检测数据集,这十类物体是飞机,轮船,储罐,棒球,网球场,篮球场,地面跑道,港口,桥梁和车辆。此数据集总共包含800幅超高分辨率(VHR)遥感图像,是从Google Earth和Vaihingen数据集裁剪而来的,然后由专家手动注释。
NWPU VHR-10 Dataset 是一个用于空间物体检测的 10 级地理遥感数据集,其拥有 650 张包含目标的图像和 150 张背景图像,共计 800 张,目标种类包括飞机、舰船、油罐、棒球场、网球场、篮球场、田径场、港口、桥梁和汽车共计 10 个类别。该数据集由西北工业大学于 2014 年发布。
在这里插入图片描述

在这里插入图片描述

4.2数据说明

4.2.1目标图像定义

本数据集中目标为航拍图像下的目标种类,包括飞机、舰船、油罐、棒球场、网球场、篮球场、田径场、港口、桥梁和汽车共计10个类别。

4.2.2数据来源

715幅高分辨率图像使用Google Earth软件在全球部分区域中截取,85幅超高分辨率图像CIR由德国摄影测量、遥感和地理信息学会(DGPF)提供。Google Earth截取图像的分辨率介于0.5m到2m,CIR图像分辨率为0.08m。

4.2.3数据格式

数据集分为positive image set、negative image set、ground truth三个文件
positive image set目录下为正例图像,negative image set目录下为反例图像
正例、反例图像皆从001开始命名,所有图像为jpg格式。

4.2.4样本标注信息

NWPU VHR-10采用HBB的标注方法。ground truth文件夹包含650个单独的txt文件,每个文件对应于positive
image set文件夹中的一个图像,这些文本文件的每一行都定义了一个ground truth边界框,格式如下:

(x1,y1),(x2,y2),a

其中(x1,y1)为bounding box的左上角坐标,(x2,y2)为bounding box的右下坐标,a为对象类别(1-飞机、2-轮船、3-储油罐、4-棒球场、5-网球场、6-篮球场、7田径场、8-港口、9-桥梁、10-汽车)。
在这里插入图片描述
参考文献:Learning Rotation-Invariant Convolutional Neural Networks for Object Detection in VHR Optical Remote Sensing Images

5、 VEDAI 数据集(论文中提到过

在这里插入图片描述

VEDAI是航空影像中车辆检测的数据集,作为一种在不受限制的环境中对目标检测算法进行基准测试的工具。数据库中除了包含很小的车辆以外,还表现出不同的可变性,例如多个方向,光照/阴影变化,镜面反射或遮挡。此外,每个图像都有几个光谱带和分辨率。作者还给出了精确的实验方案,以确保可以正确复现和比较不同人获得的实验结果。对于这些算法的不同设置,作者还给出了一些基准以测试该数据集上的性能,以提供基准比较。
下载地址:https://downloads.greyc.fr/vedai/
参考文献:Vehicle Detection in Aerial Imagery : A small target detection benchmark

6、DIUx xView 2018

在这里插入图片描述
在这里插入图片描述

xView是最大的公开可用的开销图像集之一。它包含来自世界各地复杂场景的图像,并用超过一百万个边界框进行注释,这些边界框代表60种对象类别的不同范围。与其他架空图像数据集相比,xView图像具有高分辨率,多光谱特性,并带有更多种类的对象标记。DIUx xView挑战赛的重点是加快四个计算机视觉领域的进展:降低检测的最小分辨率;提高学习效率;启用更多对象类的发现;改进对细粒度类的检测。DIUx xView挑战紧随挑战的脚步,例如上下文中的通用对象(COCO),并试图建立SpaceNet和世界功能图(FMoW),以将计算机视觉应用于来自太空可用图像,以便我们以新的方式理解视觉世界并解决一系列重要的问题。
下载地址:http://xviewdataset.org/
参考文献:xView: Objects in Context in Overhead Imagery

7、 HRSC2016 数据集 (论文中出现过

在这里插入图片描述

7.1 基本信息

数据集所有图像均来自六个著名的港口。图像分辨率在2-m和0.4-m之间。图像尺寸范围从300到1500,大多数图像大于1000 x 600。 训练,验证和测试集分别包含436个图像(包括1207个样本),181个图像(包括541个样本)和444个图像(包括1228个样本)。
HRSC2016 (Liu etal.,2016)是西北工业大学采集的用于轮船的检测的数据,包含4个大类19个小类共2976个船只实例信息。论文中特别指出他们的数据集是高分辨率数据集,分辨率介于0.4m和2m之间。数据集所有图像均来自六个著名的港口,包括海上航行的船只和靠近海岸的船只,船只图像的尺寸范围从300到1500,大多数图像大于1000x600。

7.2 数据说明

7.2.1目标图像定义

本数据集中目标为航拍图像下的船只,包括海上船只与近岸船只。作者在对船只模型进行分类时采用了高度为3的树形结构,L1层次为Class、L2层次为category、L3层次为Type,类似生物学的分类观 点,具体表示如下:

在这里插入图片描述
7.2.2数据来源

使用Google Earth软件在全球部分区域中截取的图像,既包括Google Earth默认显示的图片, 又包括相同地点的历史图片。

7.3 数据格式及规模

数据集分为Train、Test、ImageSets三个文件。Train、Test目录分为只包含船只图像的AllImages和只包含注释信息的Annotations,图像以港口序号顺序命名、以bmp格式存储,图像的注释信息以xml文件存储。此外,Test文件下的Segmentations文件还包含了船只分割图像,即语义分割的标签,以png格式存储。训练、验证和测试集分别包含436个图像(包括1207个样本)、181个图像(包括541个样本)和444个图像(包括1228个样本)。ImageSets目录下包含train.txt、val.txt、trainval.txt以及test.txt,保存了训练集、验证集、交叉验证集、测试集的图片编号。各类样本在训练集、验证集、测试集中的分布如下所示:
在这里插入图片描述

下载地址:http://www.escience.cn/people/liuzikun/DataSet.html
参考文献:A_High_Resolution_Optical_Satellite_Image_Dataset_for_Ship_Recognition_and_Some_New_Baselines

8、HRRSD数据集(论文中提到过

在这里插入图片描述
HRRSD 数据集是2019年中国科学院大学发布的数据集,HRRSD包含从Google Earth和Baidu地图获取的21761幅图像,空间分辨率从0.15-m到1.2-m。HRRSD中有55740个目标的实例,每个类别4k左右。HRRSD包含13类目标。13个类别分别是:飞机、棒球场、篮球场、桥梁、十字路口、田径场、港口、停车场、船、存储罐、丁字路口、网球场、汽车。
数据库的亮点是,各个类别之间样本量较均衡,每个类别都有大约4000个样本。
下载链接:https://github.com/CrazyStoneonRoad/TGRS-HRRSD-Dataset

9、SIMD 数据集(论文中提到过

SIMD数据集,其大部分图像测量为1024 × 768像素。SIMD (haroon et al.,2020) 是由巴基斯坦国立科学技术大学提出的主要用于车辆检测的目标检测数据集,包含5000幅遥感图像(图片尺寸:1024768)和45096个实例。SIMD数据集中的图像分辨率都是1024768的JPG格式。SIMD数据集是一个多类别、开源、高分辨率的遥感对象检测数据集,共包含15个类别,如图4所示。另外,SIMD数据集上的中小目标分布较多(w < 0.4,h < 0.4)。
在这里插入图片描述

10、ACS数据集 (论文中提到过

ACS数据集由飞机、汽车和船舶三大类组成。它是由航空图像目标检测数据集(DOTA)、中国科学院大学-航空图像目标检测(UCAS-AOD)、NWPUVHR-10[20]、遥感图像目标检测(RSOD)和学习、视觉与遥感实验室(LEVIR)[16]等5个数据集组合而成。ACS数据集中有4159张遥感图像,共有27438个标记对象,包括13082架飞机,4843辆汽车和9513艘船。

二、 SAR

1、 SSDD 数据集(已下载并且训练)(论文中提到过

在这里插入图片描述
在数据集SSDD中,一共有1160个图像和2456个舰船,平均每个图像有2.12个舰船,数据集后续会继续扩充。相比于具有20类目标的PASCAL VOC数据集,SSDD虽然图片少,但是类别只有舰船这一种,因此它足以训练检测模型。

2、SSDD+ 数据集

在这里插入图片描述

SSDD+的数据集相对于SSDD数据将垂直边框变成了旋转边框,旋转边框可在完成检测任务的同时实现了对目标的方向估计。

3、OpenSARShip 数据集

在这里插入图片描述

OpenSAR是由上海交通大学高级传感技术中心(AST)开发的开放式SAR图像管理和处理平台,用于SAR图像的读取,处理,可视化和算法测试。SAR图像管理和算法测试是OpenSAR的主要任务。
OpenSAR支持导入各种SAR数据源,例如TerraSAR-X,RADARSAT 1/2,COSMO-SkyMed等。用户可以通过该平台搜索和查看SAR图像数据。OpenSAR支持注册各种算法,例如图像去噪,场景分类,目标检测,目标识别,变化检测等。用户可以通过该平台搜索,配置和执行这些算法,并且完整的测试报告也将提供给用户。
下载地址:http://opensar.sjtu.edu.cn/
参考文献:
Huang L, Liu B, Li B, et al. OpenSARShip: A Dataset Dedicated toSentinel-1 Ship Interpretation[J]. IEEE Journal of Selected Topics in AppliedEarth Observations and Remote Sensing, 2017.

4、AIR-SARShip-1.0 数据集

在这里插入图片描述

高分辨率SAR舰船检测数据集-1.0(AIR-SARShip-1.0)首批发布31幅图像,图像分辨率包括1m和3m,成像模式包括聚束式和条带式,极化方式为单极化,场景类型包含港口、岛礁、不同等级海况的海面,目标覆盖运输船、油船、渔船等十余类近千艘舰船。 图像尺寸约为3000×3000像素,图像格式为Tiff、单通道、8/16位图像深度,标注文件提供相应图像的长宽尺寸、标注目标的类别以及标注矩形框的位置。
下载地址:AIR-SARShip-1.0:高分辨率SAR舰船检测数据集
参考文献:http://radars.ie.ac.cn/article/doi/10.12000/JR19097?viewType=HTML

5、 SAR-Ship-Dataset 数据集

在这里插入图片描述

该数据集以我国国产高分三号SAR数据和Sentinel-1 SAR数据为主数据源,共采用了102景高分三号和108景Sentinel-1 SAR图像构建高分辨率SAR船舶目标深度学习样本库。目前,该深度学习样本库包含43819船舶切片。高分三号的成像模式是Strip-Map (UFS)、Fine Strip-Map 1 (FSI)、Full Polarization 1 (QPSI)、Full Polarization 2(QPSII)和Fine Strip-Map 2 (FSII)。这5种成像模型的分辨率分别是3m、5m、8m、25m和10m。Sentinel-1的成像模式是条带模式(S3和S6)和宽幅成像模式。
下载链接:https://github.com/CAESAR-Radi/SAR-Ship-Dataset
参考文献:A SAR Dataset of Ship Detection for Deep Learningunder Complex Backgrounds

6、 HRSID 数据集(论文中提到过

在这里插入图片描述

该数据集是电子科技大学的苏浩在2020年1月发布数据集,HRSID是高分辨率sar图像中用于船舶检测、语义分割和实例分割任务的数据集。该数据集共包含5604张高分辨率SAR图像和16951个ship实例。ISSID数据集借鉴了Microsoft Common Objects in Context (COCO)数据集的构建过程,包括不同分辨率的SAR图像、极化、海况、海域和沿海港口。该数据集是研究人员评估其方法的基准。对于HRSID, SAR图像的分辨率分别为:0.5m, 1 m, 3 m。
下载链接:https://github.com/chaozhong2010/HRSID

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/693412.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CSS 边框盒子

文章目录 边框盒子 边框盒子 提示&#xff1a;这里可以添加本文要记录的大概内容&#xff1a; 默认的盒子类型是内容盒子&#xff1a;content-box 在内容盒子中&#xff0c;width和height是内容尺寸 盒子整体的尺寸内容的尺寸两个边框两个内边距 css3引入了新的盒子类型&…

Linux——对动静态库的优缺点和底层剖析对比

目录 静态库底层剖析&#xff1a; 所以静态库的优缺点总结&#xff1a; 动态库底层剖析&#xff1a; 所以使用动态库的优缺点剖析&#xff1a; 静态库底层剖析&#xff1a; 如上图&#xff1a;file1.exe被加载到了内存&#xff0c;成为了进程&#xff0c;因为代码中都有pri…

【Docker】docker安装配置Jenkins

docker 安装 Jenkins #拉镜像 docker pull jenkins/jenkins#创建卷(volume) docker volume create jenkins_home#制作容器并启动 docker run -d \ -p 8080:8080 \ -p 50000:50000 \ -v jenkins_home:/var/jenkins_home \ -v /usr/lib/jvm/java-8-openjdk-amd64:/usr/local/java…

IMX6ULL系统移植篇-镜像烧写方法

一. 烧录镜像简介 本文我们就来学习&#xff1a;windows 系统下烧录镜像的方法。 如何使用 NXP 官方提供的 MfgTool 工具通过 USB OTG 口来 烧写系统。 二. windows下烧录镜像 1. 烧录镜像前准备工作 &#xff08;1&#xff09;从开发板上拔下 SD卡。 &#xff08;2…

SpringBoot中如何优雅的统一全局返回格式与处理系统异常?

在领域驱动设计&#xff08;DDD&#xff09;中&#xff0c;接口层主要负责处理与外部系统的交互&#xff0c;包括接收用户或外部系统的请求&#xff0c;调用应用层服务处理请求&#xff0c;以及将处理结果返回给请求方。 我发现一些代码中&#xff0c;接口的返回值类型众多&am…

chatgpt赋能python:Python语言单词大全:从入门到精通

Python语言单词大全&#xff1a;从入门到精通 Python是一种高级编程语言&#xff0c;适用于各种应用领域&#xff0c;如数据科学、机器学习、网站开发和自动化脚本编写等。Python语言有其内置的语法和功能&#xff0c;我们将在本文中逐一介绍和解释。 1. Python中最基本的单词…

K8S集群安全之安全机制

1. 安全机制说明&#xff1a; Kubernetes作为一个分布式集群的管理工具&#xff0c;保证集群的安全性是其一个重要的任务。API Server是集群内部各个组件通信的中介&#xff0c;也是外部控制的入口。所以Kubernetes的安全机制基本就是围绕保护APIServer来设计的。Kubernetes使…

小程序实现双列布局

目录 1 双列布局2 采用流式布局3 采用网格布局总结 小程序中双列布局是一个常见的效果&#xff0c;比如在电商小程序的商品推荐&#xff0c;效果如下&#xff1a; 1 双列布局 双列布局的话特点是随着数据的增多&#xff0c;我们会出现偶数或者奇数的问题&#xff0c;如果是偶…

【Data Studio 2.1.0连接openGauss2.1.0】

Data Studio 2.1.0连接openGauss2.1.0 一、实验环境说明二、配置客户端接入方式三、Data Studio2.1.0连接openGauss数据库 一、实验环境说明 openGauss2.1.0版本Data Studio 2.1.0 版本 二、配置客户端接入方式 【以下操作是omm用户进行】 修改配置文件pg_hba.conf&#xf…

12--Gradle进阶 - Gradle任务的类型

12--Gradle进阶 - Gradle任务的类型 任务类型 前面我们定义的task 都是DefaultTask 类型的,如果要完成某些具体的操作完全需要我们自己去编写gradle 脚本&#xff0c;势必有些麻烦&#xff0c;那有没有一些现成的任务类型可以使用呢&#xff1f;有的&#xff0c;Gradle 官网给出…

C. Tenzing and Balls - dp

分析&#xff1a; 补题。当时不明白的点是如何快速查询相同元素的下标&#xff0c;可以用last[a[i]]表示与a[i]相同的最近的一个数的下标&#xff0c;可以遍历数组的同时实现下标的查询和变化&#xff0c;不断通过遍历来更新last[a[i]]的值&#xff0c;即last[a[i]]i。 然后是状…

衡石bi的几种跳转方式

衡石bi的几种跳转方式 通过点击表格的单元格跳转(带参) 点击首页的表格里任意一行的单元格跳转到明细页的企业相关数据 这两个数据集都是有一个info_uuid的主键&#xff0c;我们知道每个控件都可以设置交互的方式进行跳转应用内的仪表盘。 点击首页里要设置跳转的控件右上角的…

maven基础教程

一、安装moven 1、下载maven包 首先到maven官网下载安装包&#xff0c;解压到本地目录&#xff0c;然后配置环境变量。 maven下载地址&#xff1a;https://maven.apache.org/download.cgi 2、配置环境变量 然后打开环境变量&#xff0c;添加 MAVEN_HOME 系统变量&#xff…

JVM-jvisualvm性能监控可视化工具使用与eden-s0-s1分配分析

目录 第一步&#xff1a;安装jvisualvm 第二步&#xff1a;安装VisualvmGc插件 方式一&#xff1a;jvisualvm工具直接下载安装 方式二&#xff1a;去官网下载导入安装 总结 第三步&#xff1a;idea安装VisualvM Launcher插件 第四步&#xff1a;演示young中eden、s0、s1垃…

轻量级数据交换格式:jsoncpp

"这不属于我&#xff0c;因为沉默背后&#xff0c;也有冲动" 一、认识json (1) 为什么有那么多的数据交换格式&#xff1f; 比如说&#xff0c;现在我有下面的数据: #include <iostream> #include <string>int main() {std::string name "张三&q…

比较两个突出的node.js框架:koa和express

目录 一、Koa 和 Express 的介绍 二、Koa 和 Express 的区别 1.异步编程方式不同 2.错误处理方式不同 三、Koa 和 Express 的优缺点 1.Express 的优点 2.Express 的缺点 3.Koa 的优点 4.Koa 的缺点 总结 接上文讲述了 koa框架&#xff0c;这边文章比较一下这两个突出…

CentOS系统忘记密码了改怎么修改重置103.88.34.X

首先&#xff0c;打开centos7&#xff0c; 在正常系统入口按↑和↓"e"&#xff0c;会进入edit模式 然后找到以“Linux16”开头的行&#xff0c;在该行的最后面输入“init/bin/sh” 按下ctrlx组合键来启动系统 接下来再输入“mount -o remount,rw /”(注意mount与…

ceph对象存储使用总结

ceph对象存储使用总结 大纲 基础概念安装对象存储网关RADOS网关配置对象存储网关RADOS网关修改RADOS网关端口修改支持https访问RADOS网关使用s3cmd操作对象存储Ceph dashboard管理RADOS网关使用java程序操作对象存储 基础准备 操作系统 ubuntu~18.04ceph版本 Octopus v15.2…

适用于 3DS Max 和 Cinema 4D 的 Chaos Corona 10重磅推出!

Chaos 发布了 Corona 10&#xff0c;适用于3DS Max和Cinema 4D 的渲染器的最新版本 &#xff01;Corona 10 对软件的多项现有功能进行了更新&#xff0c;包括贴花、体积渲染、景深和程序云。 目前渲云云渲染已支持Corona 10&#xff0c;支持批量渲染&#xff0c;批量出结果&am…

chatgpt赋能python:介绍Python语言

介绍Python语言 Python是一门易学易用的编程语言&#xff0c;它被广泛应用于各种领域&#xff0c;包括数据科学、机器学习、人工智能、Web开发等。自1991年首次推出以来&#xff0c;Python不断演进和发展&#xff0c;如今已经成为行业内一种不可或缺的编程语言。它在可读性和语…