Python是功能强大、免费、开源,实现面向对象的编程语言,Python能够运行在Linux、Windows、Macintosh、AIX操作系统上及不同平台(x86和arm),Python简洁的语法和对动态输入的支持,再加上解释性语言的本质,使得它在大多数平台上的许多领域都是一个理想的脚本语言,特别适用于快速的应用程序开发。Python具有丰富和强大的库,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。除了Python标准库,几乎所有行业领域都有相应的Python软件库,随着NumPy、SciPy、Matplotlib和Pandas等众多Python应用程序库的开发,Python在科学和工程领域地位日益重要,在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面的优异性能使得Python在地球科学中地理、气象、气候变化、水文、生态、传感器等领域的学术研究和工程项目中得到广泛应用并高效解决各种数据分析问题,可以预见未来Python将成为科学和工程领域的主流程序设计语言。
1、提供虚拟机(Virtual Box)文件(预装好Anaconda环境,可直接使用)
2、提供原始数据和中间临时文件
专题一、Python重点工具讲解【打好基础】
ØNumpy:科学计算
ØScipy:科学计算
ØSklearn:机器学习
ØMatplotlib:可视化
ØCartopy:地理数据可视化
ØGeoPandas:地理数据分析
专题二、常见地球科学数据讲解【掌握数据的特点】
1、站点数据:
ØGSOD
ØGHCN
FLUXNET:全球通量观测网络数据
2、格点观测数据
ØCRU
ØCN05.1
ØOISST、HadSST
3、再分析:
ØERA5
ØGLDAS
4、遥感数据:
ØGLEAM
ØLandsat
ØMODIS
ØTRMM
ØSMAP:土壤湿度主动被动遥感数据
专题三、使用Xarray处理netCDF和Geotiff数据
ØXarray
读取&写入 netCDF文件
Groupby & resample 对时间、空间信息进行操作
Rasterio & rioxarray
专题四、使用Pysat进行大空间分析
1. 空间自相关分析
Ø分析干旱事件发生的空间聚集性
2. 空间回归模型
Ø建模气温与地形因素的空间关系
ØGWR模型评估地形对降水分布的局部影响
3. 空间点模式分析
Ø探测极端天气事件的热点区域
4. 时空数据分析
评估城市热岛效应的时空演化
专题五、使用Dask进行大数据并行计算
Ø无结构数据的并行处理
Ø延迟计算
案例一:
并行处理长时间序列的TRMM降水数据,识别极端降水事件的时空分布特征
案例二:
利用Dask并行计算,快速监测全球范围内干旱的发生、发展和持续时间
专题六、使用Pandas分析时间序列数据-1
案例一:时间序列填补
案例二:极端风速重现期分析
案例三:台风个数统计
专题七、使用Pandas分析时间序列数据-2
1、环流指数与温度、降水变化的关联性
Ø各环流指数对全球及区域温度变化的影响
Ø环流指数与极端高温/低温事件的联系
Ø环流指数与干旱/洪水事件的关联
Ø环流指数对季风系统的影响
2、空间插值
Ø使用Kriging进行站点数据插值
Ø使用IDW插值生成高分辨率气温场
3、缺测数据插补
Ø针对地面站点数据中的缺失值进行插补
Ø利用机器学习算法插补遥感数据中的缺测像元
结合空间插值和时间插值等多种方法提高数据质量
专题八、使用Python处理遥感
数据1
以Landsat数据为例
1、大数据的可视化
ØGB级数据可视化
2、植被指数计算
3、裁剪区域
Ø使用mask掩膜文件裁剪
使用shapefile文件裁剪
专题九、使用Python处理遥感数据2—以MODIS数据为例
1、预备工作:
ØPython读取HDF4-EOS数据
Ø使用GDAL库预处理
Ø转投影为wgs84+lonlat
Ø拼接多景影像
2、案例一:土地利用分析(MOD12C1)
Ø2000-2020年青藏高原土地利用分析
Ø分析不同土地利用分类上气温和降水的变化
3、案例二:生态系统生产力分析(MOD17A2)
Ø青藏高原草场上土地利用GPP变化
Ø分析草场GPP与降水之间关系(ERA5再分析数据)
4、案例三:分析积雪覆盖时间(MOD10A2)
Ø2000-2020年间青藏高原积雪时间统计
Ø分析祁连山不同高程带积雪时间统计(DEM:GTOP30S)
5、案例四:积雪与生产力之间的关系(MOD10A2和MOD17A2)
分析新疆北疆积雪覆盖时间与春季GPP的变化
专题十、使用Python处理站点数据以GSOD和气象共享网数据为例
1、数据的读取
Ø读取美国NOAA的GSOD日值数据
Ø读取气象共享网日值数据
2、数据清洗:
Ø数据整理
Ø异常值检测
ü阈值法
ü模型法
ü孤立森林
3、多时间尺度的统计:
Ø年尺度统计
Ø季尺度统计
4、站点插值:(随机森林树)
利用高程、经纬度插值气温数据
专题十一、使用Python处理遥感水文数据以TRMM遥感降水数据和GLEAM数据等为例
案例一:空间降尺度
Ø使用NDVI、DEM和机器学习算法对TRMM降水数据降尺度
案例二:分析蒸散数据的年际变化
Ø读取GLEAM数据,并分析蒸散发的年际变化
Ø比较MODIS ET产品与GLEAM的差异
案例三:使用随机森林算法估算地表蒸散发
ØGLEAM和ERA5数据建立机器学习估算模型
Ø在区域尺度上进行长时间序列模拟
3、案例三:比较多套土壤湿度产品
Ø比较GLDAS、GLEAM和CCI SM
案例四:分析降水~蒸散发-土壤湿度关系
分析降水~蒸散发-土壤湿度的年际变化
专题十二、使用Python处理遥感和模式数据以PKU GIMMS NDVI遥感降水数据和GLDAS数据为例
案例一:结合GIMMS NDVI和陆面模式数据分析干旱影响
Ø获取陆面模式模拟的土壤湿度数据
Ø建立植被生产力与干旱的响应关系
Ø评估不同地区的干旱敏感性
案例二:青藏高原地区干旱对高寒草地生态系统的影响
Ø基于NDVI识别青藏高原历史干旱年份
结合GLDAS模拟的土壤温湿度等数据,分析干旱对植被的影响机制
专题十三、使用Python处理气候变化数据1观测数据
案例一:百年气温趋势:CRU数据
案例二:百年海温趋势:HadSST
案例三:再分析数据处理
ERA5数据气温评估
专题十四、使用Python进行气候诊断分析在GHCN站点数据基础上
Ø使用Mann-Kendall趋势检验
Ø使用Mann-Kendall突变分析
Ø和Sen's slope估计气候变化趋势
使用小波分析等分析周期
专题十五、使用Python处理气候变化数据2以CMIP6数据为例降尺度
ØDelta方法
Ø百分位校正方法
案例一:计算极端气候指数
案例二:未来气候变化背景下中国地区GPP变化(CMIP6+MOD17+机器学习)
案例三:未来气候变化背景下中国地区土地利用变化
专题十六、使用Python对WRF模式数据后处理
案例一:空间坐标重采样
案例二:风速垂直高度插值
Ø获取风机70和100m高度的风速和风向
专题十七、使用Python运行生态模型
以CN05.1数据和Biome-BGC生态模型为例
1、模型讲解
2、气象数据的准备
3、控制文件生成
4、模式的运行
ØMuliprocesing 并行运行
5、模式后处理
Ø结果统计
结果可视化(NPP)
Python语言在地球科学交叉领域中的实践技术融合应用 (qq.com)