1.数据概况
地球观测技术的进步使得土地覆盖制图的空间分辨率不断提高,但这也导致了高分辨率影像样本收集和更新变得更加耗时。本研究提出了一种基于样本噪声学习的跨分辨率土地覆盖制图框架,利用现有低分辨率产品生成大量高分辨率影像标签用于深度语义分割模型的训练,实现2020年全国10米分辨率土地覆盖高效制图。包含耕地、林地、草地/灌木、湿地、水体、不透水面、裸地和冰雪8个类别,经过精度评估总体精度达到84%。
2.研究方法
提出了一种基于深度标签噪声学习的跨分辨率地表覆盖制图方法CRLC(Cross-Resolution Land-Cover mapping framework based on noisy label learning),主要包括以下三个步骤:
(1)数据准备:搜集2020年份所有可获取的哨兵2号10米分辨率数据,合成全国年度无云影像;
(2)样本生成:利用历史产品生成样本,并利用条件随机场模型(CRF)将历史样本与最新影像对齐,构建超过10亿像素级别的大规模地表覆盖分类训练集;
(3)模型训练:利用数据集训练高分辨率深度语义分割网络(HDNet),通过样本噪声剔除模块实现模型的文件训练。
3.产品内容
CRLC产品是按1°×1°的瓦片形式提供的,覆盖全球研究区范围共计1140个图幅。
坐标系统:EPSG:4326(WGS84)地理坐标系统。
命名规则:N_<左下角经度>_<左下角纬度>.tif
类别体系:1.耕地,2.林地,3.草地/灌木,5.湿地,6.水体,8.不透水面,9.裸地,10.冰雪。
4.精度验证
搜集了全国6544个样本点进行制图精度评估,平均制图精度为79.61%,平均用户精度为86.31%,平均F1分数为81.89%。最终评估的总体精度为84.35% ± 0.92%。
为了定性地与已有的地表覆盖产品进行对比,我们展示了参考数据的空间图和包括 GlobeLand30 在内的五种不同的全球地表覆盖产品。显示了三个位置,与现有的产品对比,CRLC产品表现出了良好的准确率和均质性。
数据下载地址:2020年全国10m分辨率地表覆盖数据集