原始数据集详情
简介:该数据集由WHU-OPT-SAR数据集整理而来,覆盖面积51448.56公里,分辨率为5米。据我们所知,WHU-OPT-SAR是第一个也是最大的土地利用分类数据集,它融合了高分辨率光学和SAR图像,并进行了充分的标注。
数据集包含100张5556*3704像素的光学图像和同一地区的SAR图像,覆盖了中国湖北省(北纬30°N-33°,东经108°E-117°)约50000公里的区域。该地区属亚热带季风气候,最低海拔50米,最高海拔3000米。WHU-OPT-SAR覆盖了山脉、林地、丘陵、平原等不同地形和针叶林、阔叶林、灌木和水生植被等不同植被的广泛遥感图像,该数据集中带有像素级注释的图像可以为基于深度学习的土地利用分类提供数据源。
Key | Value |
---|---|
卫星类型 | 高分三号(GF-3) |
覆盖区域 | 山脉、林地、丘陵、平原等不同地形 |
场景 | 未知 |
分辨率5 | 米 |
数量 | 100张 |
单张尺寸 | 5556*3704左右 |
原始影像位深 | 8位 |
标签图片位深 | 8位 |
原始影像通道数 | 单通道 |
标签图片通道数 | 单通道 |
标签类别对照表
像素值 | 类别名(英文) | 类别名(中文) | RGB |
---|---|---|---|
0 | background | 背景 | 0,0,0 |
1 | water | 水体 | 255,0,0 |
彩色表添加
大家是否有这样的困惑?真值标签图片的像素值太小,比如1、2、3······,由于像素值太小,导致看上去标签图片全为黑色,无法看出真值标签与影像图片的像素位置是否对应?如果真值标签的像素值间隔太大,又无法直接作为训练样本。
其实有办法可以解决这个问题,那就是在像素值为1、2、3等的图片上添加一个彩色表,添加的彩色表不会改变标签图片的像素值,但是可以由彩色的视觉效果展示,如下图所示:
数据预处理
下面对原始影像及标签进行模型训练前的数据预处理,根据这套数据集的原始信息,根据自己训练模型的图片尺寸大小使用代码批量裁剪原始影像和标签为所需要的尺寸,比如512*512,另外如果需要检查裁剪后的数据是否一一对应,最好给标签数据添加彩色表,这样就可以轻易看出影像和真值标签是否一致了。
最后可以直接用于训练的数据集结构如下所示:
├── train
│ ├── images
│ │ ├── 2522_0_0.tif
│ │ ├── 2522_0_512.tif
│ │ └── ......
│ └── labels
│ ├── 2522_0_0.tif
│ ├── 2522_0_512.tif
│ └── ......
└── val
├── images
│ ├── 2522_512_512.tif
│ ├── 2523_0_0.tif
│ └── ......
└── labels
├── 2522_512_512.tif
├── 2523_0_0.tif
└── ......
需要本博客相关数据和代码的小伙伴,可免费下载!!!
百度网盘链接
https://pan.baidu.com/s/1sczevrIIdC8T-8XZ1H6Wow?pwd=dxvl
为防止链接失效,建议转存后再下载,网盘文件说明如下:
01、官网原始数据集;
02、中间处理好的数据集
03、裁剪后可训练的数据集;