近年来,为了满足生态文明和可持续发展的理念,科学的城市绿地规划和管理在中国越来越受到重视。因此,提高UGS分类体系和布局布局的合理性,建设绿色宜居城市,是近年来政府和学者关注的重点。为此,本文选取中国大陆31个主要城市作为研究区域,旨在构建官方分类系统下用于深度学习模型训练的综合UGS数据集,并为每个城市生成高分辨率的绿色空间地图。
研究区域包括四个直辖市(北京、上海、天津和重庆)、五个自治区的首府(呼和浩特、南宁、拉萨、银川和乌鲁木齐)以及中国大陆 22 个省的省会(哈尔滨、长春、沈阳、石家庄、兰州、西宁、西安、郑州、济南、长沙、武汉、南京、成都、贵阳、昆明、杭州、南昌、广州、福州和海口)
该数据是由中山大学石茜等研究者通过深度学习方法,基于GoogleEarth影像和城市边界数据绘制的。数据格式为栅格格式(.tif)。空间分辨率为1m。数据采集与2020年。
以下是本数据生产的基本流程:
-
使用全球城市边界(GUBs)数据对遥感图像进行裁剪,构建一个高分辨率的城市绿地数据集(UGSet),共包含 4544 个大小为 512x512 的样本。
-
构建一个由生成器(UGSNet)和判别器组成的深度学习模型。UGSNet 是一个用于提取绿地空间的全卷积网络,它集成了增强坐标注意力(ECA)模块以捕获更有效的特征表示,并使用点头模块获得精细的绿地空间结果。判别器是一个全连接网络,用于通过对抗训练来适应不同城市的绿地空间映射。
-
实现流程的主要步骤如下: a. 首先,对 UGSNet 进行预训练,使用 UGSet 获得生成器的良好起始训练点。 b. 在 UGSet 上预训练后,判别器负责通过对抗训练将预训练的 UGSNet 适应到不同城市。 c. 最后,使用 2179 个 Google Earth 图像(分辨率约为 1.1 米,经度为 7′30′′,纬度为 5′00′′的数据框)获得中国 31 个主要城市的绿地空间分布数据(UGS-1m)。
类似数据基本生产流程总结如下:
一、数据收集和预处理:
-
从 Google Earth Engine 下载对应城市边界范围内的高分辨率遥感影像(如 1 米分辨率)。
-
从公开的城市边界数据源(如 OpenStreetMap)获取城市边界数据。
-
对下载的遥感影像进行裁剪,保留目标城市范围内的数据。
-
对影像进行数据增强,以提高模型的泛化能力,例如旋转、缩放、翻转等。
二、标签制作:
-
对裁剪后的遥感影像进行人工标注,以产生绿地和非绿地的分类标签。这是训练深度学习模型的关键数据。
-
也可以尝试使用半监督或弱监督方法生成标签,以减少人工标注的工作量。
三、模型选择与训练:
-
选择合适的深度学习模型,例如 U-Net、SegNet、DeepLab 等,这些模型在遥感影像分割任务中表现良好。
-
将预处理过的遥感影像和对应的标签输入模型进行训练,调整超参数以优化模型性能。
-
使用交叉验证方法评估模型的性能,如准确率、召回率、F1 分数等。
四、模型推理:
-
使用训练好的模型对整个城市范围内的遥感影像进行推理,得到绿地分布数据。
-
可能需要将遥感影像分割成较小的子图像,以适应模型的输入尺寸。在推理完成后,需要将子图像拼接回原始影像的尺寸。
五、结果后处理与分析:
-
对模型输出的绿地分布数据进行后处理,例如去除噪声、填充空洞等。
-
对绿地分布数据进行定量分析,如绿地覆盖率、绿地连通性等指标。
-
可以将绿地分布数据与其他地理信息数据进行融合,以便进行更深入的城市规划和环境保护研究。
在整个流程中,需要注意数据质量、模型性能和计算资源的平衡。不断优化模型和调整参数,以达到更好的绿地分布数据提取效果。
数据下载地址:
①四个直辖市(北京、上海、天津和重庆);
②五个自治区的首府(呼和浩特、南宁、拉萨、银川和乌鲁木齐);
③大陆 22 个省的省会(哈尔滨、长春、沈阳、石家庄、兰州、西宁、西安、郑州、济南、长沙、武汉、南京、成都、贵阳、昆明、杭州、南昌、广州、福州、太原、合肥和海口);