一、数据基本概况
降水数据在气象学、水文学、农业、生态学等领域有着广泛的用途。以下是一些降水数据的主要用途:
-
气象预报和监测: 降水数据是气象预报的重要组成部分,对预测天气、气候和自然灾害(如暴雨、洪水)至关重要。监测实时和历史降水数据有助于制定紧急响应计划和提前预警。
-
水文研究: 降水是水文循环的起点,影响河流、湖泊和地下水的水位和水量。水文学家使用降水数据来模拟和预测径流、洪水和水资源的可利用性。
-
农业管理: 降水对农业产量有直接影响。农民和农业专业人员使用降水数据来制定灌溉计划、决定种植季节和采取其他农业管理措施。
-
生态学研究: 降水是生态系统中能量和养分输入的主要来源。生态学家使用降水数据来研究生态系统的结构和功能,以及不同植物和动物群落对降水变化的响应。
-
气候变化研究: 长期的降水数据可以用于分析气候变化趋势。科学家使用这些数据来研究气候系统的变化,评估气候模型的准确性,并预测未来的气候趋势。
-
环境保护: 了解降水模式对环境保护至关重要。例如,监测降水有助于识别酸雨、土壤侵蚀和其他环境问题。
这里介绍四个降水产品,其下载地址为:All Gridded Precipitation Datasets: NOAA Physical Sciences Laboratory
这里分析了其中的四个数据产品,分别是GPCC、GPCP、CMAP和PREC/L的数据特征以及基本的信息。
(1)GPCC降水数据
GPCC提供了三组数据集。首先是监测产品,覆盖自1982年至今,基于来自7,000个站点的经过质量控制的数据。第二个是完整数据产品(V2020),覆盖自1891年至2019年,基于来自全球67,200个站点的经过质量控制的数据,这些站点具有10年或更长记录期。该产品包含了以0.25° x 0.25°、0.5° x 0.5°、1.0° x 1.0°和2.5° x 2.5°纬度经度为空间分辨率的月度总降水量,站点的降水异常值被插值,然后叠加在相应分辨率上的GPCC气候学V2020上。第三个是最新的初步估算(1x1),但分析的站点有限。我们从2012年开始处理这个数据集。
(2)GPCP降水数据
GPCP月度产品通过整合来自陆地和海洋的各种卫星数据集以及陆地上的雨量分析,提供了全球降水的一致分析。从1979年至今,雨量站、卫星和探空观测的数据已经合并,估算了一个2.5度的全球网格上的月降水量。卫星降水估算数据的精心组合为迄今为止提供的全球海洋降水分析提供了最全面的数据,并为陆地上的降水分析添加了必要的空间细节。除了这些数据集的组合之外,GPCP产品还提供了降水分析中不确定性的估算值。
(3)CMAP降水数据
CMAP月度数据集包括两个文件,其中包含月平均的降水率数值。这些数值来自于5种卫星估算数据(GPI、OPI、SSM/I散射、SSM/I发射和MSU)以及雨量数据。增强文件还包括混合的NCEP/NCAR再分析降水数值。标准文件只包括卫星估算数据和雨量数据。 此外,还提供了五旬数据。
这个数据集包括月平均的降水率数值(毫米/天)。数据范围大致在0到70毫米/天之间。五旬数据集每年包括73个五旬,第12个五旬覆盖了2月25日至3月1日,不考虑是否是闰年。五旬数据集从存储在netCDF文件中的日期开始。
(4)PREC和PREC/L降水数据
PREC和PREC/L月度数据集包括三个文件,其中包含月平均的降水总量。降水数据在3个空间分辨率下提供。全球分析通过对陆地上的雨量观测进行插值(PREC/L),并通过对海洋上的历史观测进行EOF重建(PREC/O)来定义。雨量观测来自于全球历史气候网络(GHCN)第2版和气候异常监测系统(CAMS)数据集中收集的超过17,000个站点。使用Gandin的OI技术同化这些观测。PREC/L中观测到的降水的平均分布和年周期与几个已发表的基于雨量计的数据集相一致,与ENSO相关的异常模式与先前研究中发现的模式相似。所有地图都使用陆地蒙版存储,因为平滑会使值远远超过海洋。1x1和0.5x0.5使用CPC在其ftp站点提供的包含1和0的蒙版进行存储。2.5x2.5使用CPC提供的百分比陆地文件进行存储。该文件为每个网格框中的值提供了0到100的范围。我们存储了所有值,其中值>0。您可以选择使用他们的陆地文件和不同的截止值进一步屏蔽数据。
二、数据读取处理
在读取文件内容时,对于time变量的处理稍微有些不同。之前我的专栏介绍了如何处理nc文件中的time变量,但是收录不够全,下面我将总结本人遇到的各类情况。
matlab两种方法将NC文件中的gregorian日期转换成年月日ymd_matlab转化nc文件中的时间-CSDN博客
针对于上述提到的四种降水数据产品,其存储格式为nc文件,而对于time字段的读取存在以下几种情况:
units = 'hours since 1800-01-01 00:00:0.0'
units = 'days since 1800-1-1 00:00:00'
对于第一种,采用的读取方法为
time = ncread(file,'time');
dt1 = datetime(1800,1,1) + hours(time);
对于第二种,采用以下方法读取
time = ncread(file,'time');
dt2 = datetime((time)*24*3600, 'ConvertFrom', 'epochtime', 'Epoch', '1800-01-01');
关于如何提取特定研究区域的时间序列、以及进行空间的变化速率、年振幅、半年振幅分析,可以参见以下文章:
GPCC全球降水数据集下载并使用MATLAB进行读取分析--以长江流域为例_gts降水数据-CSDN博客
如何提取特定研究区域边界,可以参见以下文章:
读取谷歌地球的kml文件中的经纬度坐标_kml 读取-CSDN博客
三、四种数据产品的对比
以下内容参考Yi et al.(2016)的支撑材料的内容,结果显示在下图中。不同的数据集共享相似的变化模式,但它们之间似乎存在系统差异。例如,GPCP的时间序列始终是最大的,而CMAP的时间序列始终是最小的。与年际变化相比,系统差异要大得多,使得年际变化变得无意义。然而,我们认为年际变化是可靠的,因为所有数据集都具有相似的变化模式。因此,通过以下过程估算了每个时间点的不确定性:1)在每个数据集中去除均值(因为所有数据集的均值都将为零,所以系统差异也被去除);2)对于每个时间点,有来自四个数据集的四个值,四个值之间的变化被设置为不确定性。换句话说,系统差异未包含在不确定性中。(摘自Yi et al.(2016)支撑材料)
参考文献
Yi, S., Sun, W., Feng, W., & Chen, J. (2016). Anthropogenic and climate‐driven water depletion in Asia. Geophysical Research Letters, 43(17), 9061-9069.