目标检测舰船数据集整合

在这里插入图片描述

一、光学数据集

1、 DIOR 数据集(已下载yolo版本)（论文中提到过）

在这里插入图片描述

“DIOR”是一个用于光学遥感图像目标检测的大规模基准数据集。数据集包含23463个图像和192472个实例，涵盖20个对象类。这20个对象类是飞机、机场、棒球场、篮球场、桥梁、烟囱、水坝、高速公路服务区、高速公路收费站、港口、高尔夫球场、地面田径场、天桥、船舶、体育场、储罐、网球场、火车站、车辆和风磨。
数据论文地址：Object Detection in Optical Remote Sensing Images: A Survey and A New Benchmark

2、 LEVIR 数据集

在这里插入图片描述
LEVIR数据集由大量 800 × 600 像素和0.2m〜1.0m /像素的高分辨率Google Earth图像和超过22k的图像组成。LEVIR数据集涵盖了人类居住环境的大多数类型地面特征，例如城市，乡村，山区和海洋。数据集中未考虑冰川，沙漠和戈壁等极端陆地环境。数据集中有3种目标类型：飞机，轮船（包括近海轮船和向海轮船）和油罐。所有图像总共标记了11k个独立边界框，包括4,724架飞机，3,025艘船和3,279个油罐。每个图像的平均目标数量为0.5。
数据下载地址：http://levir.buaa.edu.cn/Code.htm
数据论文地址：Random Access Memories: A New Paradigm for Target Detection in High Resolution Aerial Remote Sensing Images

3、DOTA 数据集（已下载yolo版本）（论文中提到过）

具体信息：https://blog.csdn.net/weixin_43427721/article/details/122057389
在这里插入图片描述
DOTA是用于航空图像中目标检测的大规模数据集。它可以用于开发和评估航空影像中的物体检测。对于DOTA数据集，它包含来自不同传感器和平台的2806个航拍图像。每个图像的大小在大约800×800到4000×4000像素的范围内，并且包含各种比例，方向和形状的对象。这些DOTA图像由航空影像解释专家分类为15个常见对象类别。完全注释的DOTA图像包含188、282个实例，每个实例都由任意（8自由度）四边形标记。
论文地址：DOTA: A Large-scale Dataset for Object Detection in Aerial Images

4、 NWPU VHR-10 数据集(已下载voc格式)（论文中提到过）

4.1 基本信息

NWPU VHR-10 (Cheng et al.，2016) 这个高分辨率(VHR)遥感图像数据集是由西北工业大学(NWPU)构建的，包含10类正例样本650张以及不包含给定对象类的任何目标的150张反例图像（背景），正例图像中至少包含1个实例，总共有3651个目标实例。具体类别信息如下：
NWPU VHR-10数据集是仅用于研究的公开提供的10类地理空间物体检测数据集，这十类物体是飞机，轮船，储罐，棒球，网球场，篮球场，地面跑道，港口，桥梁和车辆。此数据集总共包含800幅超高分辨率（VHR）遥感图像，是从Google Earth和Vaihingen数据集裁剪而来的，然后由专家手动注释。
NWPU VHR-10 Dataset 是一个用于空间物体检测的 10 级地理遥感数据集，其拥有 650 张包含目标的图像和 150 张背景图像，共计 800 张，目标种类包括飞机、舰船、油罐、棒球场、网球场、篮球场、田径场、港口、桥梁和汽车共计 10 个类别。该数据集由西北工业大学于 2014 年发布。

在这里插入图片描述

4.2数据说明

4.2.1目标图像定义

本数据集中目标为航拍图像下的目标种类，包括飞机、舰船、油罐、棒球场、网球场、篮球场、田径场、港口、桥梁和汽车共计10个类别。

4.2.2数据来源

715幅高分辨率图像使用Google Earth软件在全球部分区域中截取，85幅超高分辨率图像CIR由德国摄影测量、遥感和地理信息学会（DGPF）提供。Google Earth截取图像的分辨率介于0.5m到2m，CIR图像分辨率为0.08m。

4.2.3数据格式

数据集分为positive image set、negative image set、ground truth三个文件
positive image set目录下为正例图像，negative image set目录下为反例图像
正例、反例图像皆从001开始命名，所有图像为jpg格式。

4.2.4样本标注信息

NWPU VHR-10采用HBB的标注方法。ground truth文件夹包含650个单独的txt文件，每个文件对应于positive
image set文件夹中的一个图像，这些文本文件的每一行都定义了一个ground truth边界框，格式如下:

(x1,y1),(x2,y2),a

其中(x1,y1)为bounding box的左上角坐标，(x2,y2)为bounding box的右下坐标，a为对象类别(1-飞机、2-轮船、3-储油罐、4-棒球场、5-网球场、6-篮球场、7田径场、8-港口、9-桥梁、10-汽车)。
在这里插入图片描述
参考文献：Learning Rotation-Invariant Convolutional Neural Networks for Object Detection in VHR Optical Remote Sensing Images

5、 VEDAI 数据集（论文中提到过）

在这里插入图片描述

VEDAI是航空影像中车辆检测的数据集，作为一种在不受限制的环境中对目标检测算法进行基准测试的工具。数据库中除了包含很小的车辆以外，还表现出不同的可变性，例如多个方向，光照/阴影变化，镜面反射或遮挡。此外，每个图像都有几个光谱带和分辨率。作者还给出了精确的实验方案，以确保可以正确复现和比较不同人获得的实验结果。对于这些算法的不同设置，作者还给出了一些基准以测试该数据集上的性能，以提供基准比较。
下载地址：https://downloads.greyc.fr/vedai/
参考文献：Vehicle Detection in Aerial Imagery : A small target detection benchmark

6、DIUx xView 2018

在这里插入图片描述

xView是最大的公开可用的开销图像集之一。它包含来自世界各地复杂场景的图像，并用超过一百万个边界框进行注释，这些边界框代表60种对象类别的不同范围。与其他架空图像数据集相比，xView图像具有高分辨率，多光谱特性，并带有更多种类的对象标记。DIUx xView挑战赛的重点是加快四个计算机视觉领域的进展：降低检测的最小分辨率；提高学习效率；启用更多对象类的发现；改进对细粒度类的检测。DIUx xView挑战紧随挑战的脚步，例如上下文中的通用对象（COCO），并试图建立SpaceNet和世界功能图（FMoW），以将计算机视觉应用于来自太空可用图像，以便我们以新的方式理解视觉世界并解决一系列重要的问题。
下载地址：http://xviewdataset.org/
参考文献：xView: Objects in Context in Overhead Imagery

7、 HRSC2016 数据集（论文中出现过）

在这里插入图片描述

7.1 基本信息

数据集所有图像均来自六个著名的港口。图像分辨率在2-m和0.4-m之间。图像尺寸范围从300到1500，大多数图像大于1000 x 600。训练，验证和测试集分别包含436个图像（包括1207个样本），181个图像（包括541个样本）和444个图像（包括1228个样本）。
HRSC2016 (Liu etal.，2016)是西北工业大学采集的用于轮船的检测的数据，包含4个大类19个小类共2976个船只实例信息。论文中特别指出他们的数据集是高分辨率数据集，分辨率介于0.4m和2m之间。数据集所有图像均来自六个著名的港口，包括海上航行的船只和靠近海岸的船只，船只图像的尺寸范围从300到1500，大多数图像大于1000x600。

7.2 数据说明

7.2.1目标图像定义

本数据集中目标为航拍图像下的船只，包括海上船只与近岸船只。作者在对船只模型进行分类时采用了高度为3的树形结构，L1层次为Class、L2层次为category、L3层次为Type，类似生物学的分类观点，具体表示如下：

在这里插入图片描述
7.2.2数据来源

使用Google Earth软件在全球部分区域中截取的图像，既包括Google Earth默认显示的图片，又包括相同地点的历史图片。

7.3 数据格式及规模

数据集分为Train、Test、ImageSets三个文件。Train、Test目录分为只包含船只图像的AllImages和只包含注释信息的Annotations，图像以港口序号顺序命名、以bmp格式存储，图像的注释信息以xml文件存储。此外，Test文件下的Segmentations文件还包含了船只分割图像，即语义分割的标签，以png格式存储。训练、验证和测试集分别包含436个图像（包括1207个样本）、181个图像（包括541个样本）和444个图像（包括1228个样本）。ImageSets目录下包含train.txt、val.txt、trainval.txt以及test.txt，保存了训练集、验证集、交叉验证集、测试集的图片编号。各类样本在训练集、验证集、测试集中的分布如下所示：
在这里插入图片描述

下载地址：http://www.escience.cn/people/liuzikun/DataSet.html
参考文献：A_High_Resolution_Optical_Satellite_Image_Dataset_for_Ship_Recognition_and_Some_New_Baselines

8、HRRSD数据集（论文中提到过）

在这里插入图片描述
HRRSD 数据集是2019年中国科学院大学发布的数据集，HRRSD包含从Google Earth和Baidu地图获取的21761幅图像，空间分辨率从0.15-m到1.2-m。HRRSD中有55740个目标的实例，每个类别4k左右。HRRSD包含13类目标。13个类别分别是：飞机、棒球场、篮球场、桥梁、十字路口、田径场、港口、停车场、船、存储罐、丁字路口、网球场、汽车。
数据库的亮点是，各个类别之间样本量较均衡，每个类别都有大约4000个样本。
下载链接：https://github.com/CrazyStoneonRoad/TGRS-HRRSD-Dataset

9、SIMD 数据集（论文中提到过）

SIMD数据集，其大部分图像测量为1024 × 768像素。SIMD (haroon et al.，2020) 是由巴基斯坦国立科学技术大学提出的主要用于车辆检测的目标检测数据集，包含5000幅遥感图像（图片尺寸：1024768）和45096个实例。SIMD数据集中的图像分辨率都是1024768的JPG格式。SIMD数据集是一个多类别、开源、高分辨率的遥感对象检测数据集，共包含15个类别，如图4所示。另外，SIMD数据集上的中小目标分布较多（w < 0.4，h < 0.4）。
在这里插入图片描述

10、ACS数据集（论文中提到过）

ACS数据集由飞机、汽车和船舶三大类组成。它是由航空图像目标检测数据集(DOTA)、中国科学院大学-航空图像目标检测(UCAS-AOD)、NWPUVHR-10[20]、遥感图像目标检测(RSOD)和学习、视觉与遥感实验室(LEVIR)[16]等5个数据集组合而成。ACS数据集中有4159张遥感图像，共有27438个标记对象，包括13082架飞机，4843辆汽车和9513艘船。

二、 SAR

1、 SSDD 数据集（已下载并且训练）（论文中提到过）

在这里插入图片描述
在数据集SSDD中，一共有1160个图像和2456个舰船，平均每个图像有2.12个舰船，数据集后续会继续扩充。相比于具有20类目标的PASCAL VOC数据集，SSDD虽然图片少，但是类别只有舰船这一种，因此它足以训练检测模型。

2、SSDD+ 数据集

在这里插入图片描述

SSDD+的数据集相对于SSDD数据将垂直边框变成了旋转边框，旋转边框可在完成检测任务的同时实现了对目标的方向估计。

3、OpenSARShip 数据集

在这里插入图片描述

OpenSAR是由上海交通大学高级传感技术中心（AST）开发的开放式SAR图像管理和处理平台，用于SAR图像的读取，处理，可视化和算法测试。SAR图像管理和算法测试是OpenSAR的主要任务。
OpenSAR支持导入各种SAR数据源，例如TerraSAR-X，RADARSAT 1/2，COSMO-SkyMed等。用户可以通过该平台搜索和查看SAR图像数据。OpenSAR支持注册各种算法，例如图像去噪，场景分类，目标检测，目标识别，变化检测等。用户可以通过该平台搜索，配置和执行这些算法，并且完整的测试报告也将提供给用户。
下载地址：http://opensar.sjtu.edu.cn/
参考文献：
Huang L, Liu B, Li B, et al. OpenSARShip: A Dataset Dedicated toSentinel-1 Ship Interpretation[J]. IEEE Journal of Selected Topics in AppliedEarth Observations and Remote Sensing, 2017.

4、AIR-SARShip-1.0 数据集

在这里插入图片描述

高分辨率SAR舰船检测数据集-1.0（AIR-SARShip-1.0）首批发布31幅图像，图像分辨率包括1m和3m，成像模式包括聚束式和条带式，极化方式为单极化，场景类型包含港口、岛礁、不同等级海况的海面，目标覆盖运输船、油船、渔船等十余类近千艘舰船。图像尺寸约为3000×3000像素，图像格式为Tiff、单通道、8/16位图像深度，标注文件提供相应图像的长宽尺寸、标注目标的类别以及标注矩形框的位置。
下载地址：AIR-SARShip-1.0：高分辨率SAR舰船检测数据集
参考文献：http://radars.ie.ac.cn/article/doi/10.12000/JR19097?viewType=HTML

5、 SAR-Ship-Dataset 数据集

在这里插入图片描述

该数据集以我国国产高分三号SAR数据和Sentinel-1 SAR数据为主数据源，共采用了102景高分三号和108景Sentinel-1 SAR图像构建高分辨率SAR船舶目标深度学习样本库。目前，该深度学习样本库包含43819船舶切片。高分三号的成像模式是Strip-Map (UFS)、Fine Strip-Map 1 (FSI)、Full Polarization 1 (QPSI)、Full Polarization 2(QPSII)和Fine Strip-Map 2 (FSII)。这5种成像模型的分辨率分别是3m、5m、8m、25m和10m。Sentinel-1的成像模式是条带模式（S3和S6）和宽幅成像模式。
下载链接：https://github.com/CAESAR-Radi/SAR-Ship-Dataset
参考文献：A SAR Dataset of Ship Detection for Deep Learningunder Complex Backgrounds

6、 HRSID 数据集（论文中提到过）

在这里插入图片描述

该数据集是电子科技大学的苏浩在2020年1月发布数据集，HRSID是高分辨率sar图像中用于船舶检测、语义分割和实例分割任务的数据集。该数据集共包含5604张高分辨率SAR图像和16951个ship实例。ISSID数据集借鉴了Microsoft Common Objects in Context (COCO)数据集的构建过程，包括不同分辨率的SAR图像、极化、海况、海域和沿海港口。该数据集是研究人员评估其方法的基准。对于HRSID, SAR图像的分辨率分别为:0.5m, 1 m, 3 m。
下载链接：https://github.com/chaozhong2010/HRSID