气象数据是在各项研究中都经常使用的数据,气象指标包括气温、风速、降水、湿度等指标,说到常用的降水数据,最详细的降水数据是具体到气象监测站点的降水数据!
之前我们分享过1929-2022年全球气象站点的逐年平均气温数据、逐年最高气温和逐年最低气温数据。本次我们为大家继续带来具体到气象监测站点的数据——1929-2022年全球气象站点的逐年平均降水量数据!
原始数据来源于美国国家海洋和大气管理局(NOAA)下设的国家环境信息中心(NCEI),原始数据以英寸为单位,数据格式为csv,缺失数据用99.99表示。为了方便大家使用,我们对原始数据进行了一些处理,包括:①降水单位转为毫米;②处理得到了shp和excel两种数据格式;③对于excel格式,将缺失数据表示为空值,对于shp格式,缺失值依然用99.99表示;④基于当年所有天数的降水量通过求平均值得到降水量的年平均值。该数据的其他重要信息包括数据坐标为GCS_WGS_1984,以2022年为例全球有12000多个气象观测站点,具体的数据处理方式会在下文详细介绍!
以下为数据的详细信息:
01 数据预览
该数据包括shp和excel两种格式,每种格式文件里面包括1929-2022年每年的平均降水量!
我们先来看一下Excel格式的数据,数据字段包括气象观测站点的编号(STATION)、气象观测站点的名称(NAME)、纬度(LATITUDE)和经度(LONGITUDE)以及每年平均降水量数据(例如2022)。我们来预览一下:
接下来我们来看一下Shp格式的数据,Shp格式数据的具体属性和Excel数据相同,我们来预览一下:
02 数据来源
数据来源于美国国家海洋和大气管理局(NOAA)下设的国家环境信息中心(NCEI),网址为:https://www.ncei.noaa.gov/data/global-summary-of-the-day/archive/,包括了1929—2022年的气象数据,
大家可以自己去该网站下载原始数据!
03 数据处理说明
1.合并处理:
从NCEI网站下载到的原始csv数据,每一个csv是某个特定站点1年内所有日期的总降水量数据,按天记录,但并不全是365天,有的300多天,有的只有十几天。我们按照年份将每年涉及到的所有气象观测站点的每日总降水量数据进行合并处理,最终得到以年份命名的1929-2022年全球范围气象站点的逐日总降水量数据。
2.平均处理:
然后基于所有站点的逐日降水总量数值,我们求得每年所有天数的日降水总量数据的平均值,以此分别得到所有站点的逐年平均降水量数据!
3.单位换算:
原始数据单位为英寸(in),根据公式1英寸=25.4毫米,将英寸换算为毫米(mm)。
4.空值处理:
原始csv数据中的缺失值用数字99.99表示!在处理时,Excel格式文件用空值表示数据缺失;由于Shp文件会自动把空值识别为0,为区分空值与0毫米降水量,Shp中仍保留数字99.99表示数据缺失,特此说明!
5.站点数量说明:
每一年的站点数并不相同,基本是越新的年份全球气象站点数越多,2022年有12319个,早些年份的气象站点较少。有一点需要注意,对于缺失经纬度信息的站点,Excel中进行保留,其经纬度信息为空值。Shp中则将缺失经纬度信息的站点进行了删除。所以存在Excel和Shp中站点数量不一致的情况,例如2022年Shp中的站点个数为12281,Excel中的站点数量为12319。
6.降水量说明:
①对于PRCP降水量指标,存在着数值为0和空值的情况!其中:数值为0的,解释为气象站没有报告当天的任何降水数据,也没有在每小时的观测中报告任何降水情况。需要说明的是也可能存在发生了降水,但没有报告的情况。②对于空值,原始降水数据一个csv文件是一个站点的所有天的数据,但是并不365天都有,原始数据里面没有空值。处理后为什么会有空值呢?因为是所有站的所有天放在一个csv里面,比如站点A没有6月1号,但站点B有,那么6月1号的站点A就是空值。
文末下方是我们的公众号名片,我们将定期介绍各类城市数据以及数据的可视化和分析技术,有关1929-2022年全球站点的逐年平均降水量数据的更多详情,欢迎大家多多关注我们进行了解!