基于机器学习、遥感和Penman-Monteith方程的农田蒸散发混合模型研究_刘燕_2022
- 摘要
- 关键词
- 1 绪论
- 2 数据与方法
- 2.1 数据
- 2.2 机器学习算法
- 2.3 Penman-Monteith方程
- 2.4 Medlyn公式
- 2.5 模型性能评估
- 3 基于机器学习算法的混合模型估算农田蒸散量的评价与比较
- 4 利用人工神经网络算法和遥感植被指数改善PM方程估算农田蒸散量的精度
- 5 结论
摘要
本文的研究内容旨在发展能够准确获取全球或区域尺度蒸散量的混合模型,主要工作包括:
(1)构建了六种不同的混合蒸散模型。这六种混合模型基于六种传统的机器学习算法,分别是KNN、RF、SVM、XGBoost、ANN、LSTM。然后使用17个全球分布的农田通量站点的涡度协方差通量塔的通量数据构建模型。
(2)分析了十种不同的输入因子组合对混合模型估算农田蒸散量性能的影响。将气象数据分别和一种、两种、三种以及四种遥感数据输入到机器学习方法中,构建气孔导度模型,进而运用Penman-Monteith(PM)方程计算蒸散。
(3)评估了六种基于机器学习的混合模型在使用相同的输入变量下估算蒸散的精度,以得到一种较优的基于机器学习的估算蒸散方法。
(4)构建Medlyn-Penman-Monteith模型。将得到的较优的混合机器学习模型和Medlyn-PM模型比较,以得到适用于不同的环境条件的模型,提升模型模拟区域尺度农田蒸散的精度,能够为区域尺度准确估算农田蒸散提供方法支持。
(5)研究了ANN-PM模型在干旱环境下的准确性。利用ANN-PM模型的模拟值与观测值之间的相关系数(r)来评估模型的性能。通过比较ANN-PM模型模拟蒸散值与观测值之间的时间序列图,研究模型是否能捕捉干旱站点蒸散的时间序列变化。
关键词
蒸散;机器学习;遥感;Penman-Monteith方程
1 绪论
本文的主要研究内容如下:
(1)基于六种不同的ML算法,使用全球17个通量站点的气象数据和中分辨率成像光谱仪(Moderate-resolution Imaging Spectroradiometer, MODIS)数据构建了估算蒸散的六种混合模型,并优化模型的参数。
(2)分析十种不同的输入变量组合对混合模型的影响。将十种输入因子分别输入到混合模型中,比较每种模型的相关系数和均方根误差来衡量不同的变量组合。进一步比较基于机器学习算法的六种混合模型使用相同的输入变量估算蒸散的性能,得到了一种性能较优的混合模型。
(3)将上述得到的基于ML算法的混合模型与构建的Medlyn-PM模型比较,评估其估算蒸散的性能。最后研究性能较好的混合模型在干旱环境下的准确性。
2 数据与方法
2.1 数据
2.1.1 通量站点数据
本文使用来自FLUXNET2015数据集的5个气象因子数据和观测ET数据,日尺度上时间连续的气象数据包括气温(Temperature, Ta)、降水(Precipitation, P)、大气二氧化碳浓度(Carbon dioxide concentration, Ca)、太阳辐射(Solar radiation, SW)和饱和水汽压差(Vapor Pressure Deficit, VPD)。
2.1.2 遥感数据
MODIS数据包括归一化差异植被指数(NDVI)、增强植被指数( EVI)、植被近红外反射率(NIRv) 和 短 波 红 外 波 段 (SWIR)。
2.2 机器学习算法
六种机器学习算法(KNN、RF、SVM、XGBoost、ANN、LSTM)
2.3 Penman-Monteith方程
本研究构建的六种基于ML算法的混合模型和Medlyn-PM模型都是基于PM方程的物理框架,主要差异在于Gs的计算。PM方程的计算公式如下:
2.4 Medlyn公式
基于PM方程的ET区域尺度建模的关键是要准确地量化表面电导,这是ET建模中不确定性的最大来源。因此,Medlyn等将最优气孔行为理论与光合作用模型相结合,为表征Gs提供了一个新的生物物理框架。该Gs模型的计算方法如下:
本文将Medlyn模型与ML方法相结合,研究哪种纯粹基于ML的Gs方法或者Medlyn模型和ML的集成可以表现得更好。
2.5 模型性能评估
r、RMSE、MAE
3 基于机器学习算法的混合模型估算农田蒸散量的评价与比较
4 利用人工神经网络算法和遥感植被指数改善PM方程估算农田蒸散量的精度
4.1 基于Medlyn公式的混合模型
4.2 干旱气候下ET估计模型的评估
4.3 Medlyn公式的参数优化
4.4 实验结果分析
4.4.1 ANN-PM模型与Medlyn-PM模型的比较
4.4.2 评估ANN-PM模型在干旱气候下估算蒸散的性能
5 结论
主要结论如下:
(1)不同模型的最优参数:基于KNN模型的K值为5,基于RF模型和XGBoost模型的max_depth分别为8和7,基于ANN模型和LSTM模型的隐含层数都为2、每层神经元数分别是48和40,基于Medlyn模型的待定系数g0=0.06、g1=3.94。
(2)与使用一种RS因子的混合模型相比,使用两种RS因子的混合模型呈现了较好的结果(RMSE=18.60-26.29 W m-2,r=0.87-0.96);使用三种或四种RS因子的混合模型表现出的性能和使用两种RS因子的混合模型的性能相似。
(3)基于不同的ML算法的混合模型中,ANN-PM模型表现出较强地估算蒸散的能力(RMSE=18.67-20.69 W m-2,r=0.90-0.94)。
(4)ANN-PM模型和Medlyn-PM模型相比,ANN-PM模型在估算农田蒸散方面具有较好的性能(RMSE=19.23-19.71 W m-2,r=0.93),拟合效果好,精度较高且适用范围广。
(5)ANN-PM模型能较好地捕捉干旱站点(DE-Rus,US-Tw2,US-Tw3和US- Twt)ET的时间序列变化。ANN-PM模型在干旱站点估算蒸散的性能是合理的,其在干旱站点预测的ET与观测值的平均r是0.87,所有站点的平均r是0.86。