我国地域辽阔,自然条件复杂,灾害性天气种类繁多,地区差异性大。雷雨大风、冰雹、短时强降水等强对流天气是造成经济损失、危害生命安全最严重的一类灾害性天气。由于强对流降水具有高强度、小空间尺度等特点,一直是气象预报领域的一大挑战。本文从时序数据普遍存在的因果关系入手,研究了基于因果推理的强对流降水临近预报问题。
针对问题一:为解决有效应用双偏振变量改进强对流预报问题,从“时序因果性”与“空间关联性”两个维度出发,提出了基于结构因果模型的 ZH 临近预报方法。首先,统计不同区域的总降水量,采用最大互信息与皮尔逊相关系数对不同区域之间的关联进行量化,并引入“区域半径”的概念确定区域的空间关联范围。然后,为了确定关联区域变量
Z 、 | ZDR | 、 | KDP | 之间的因果关系,提出了基于多元传递熵的因果贝叶斯网络构建方法。最 | |||||
后,为了定量表示 | Z 、 | ZDR | 、 | KDP | 之间的因果关系,建立可提取用于强对流临近预报双偏 |
振雷达资料中微物理特征信息的数学模型,根据多元传递熵的计算过程,推导了其结构因
逐渐减弱。2. 所提方法在 3km/5km 等高面情况下优于核回归、多层感知机(MLP)、长短记忆神经网络(LSTM)等基线方法,但在1km等高面时其预测效果略低于MLP。3. 不同区域的降水规律对预测结果有较大影响,当有突发性降水时,ZH预报偏差大。
针对问题二:为解决当前数据驱动算法中存在的“回归到平均”问题,将其分解为两类子问题。一是无法预测极端降水事件的发生,二是无法准确预测极端降水事件发生之后的降水数据。针对子问题一,使用极值理论拟合极端降水事件分布,并采用 peaks-over- threshold (POT)方法得到极端降水事件的发生概率与极值。针对子问题二,在问题一结构因果模型的基础上,将极端降水事件抽象成干预,并基于卡尔曼滤波原理,对极端气象事件所带来的影响进行动态建模,得到了基于干预影响动态建模的 ZH 预报模型,从而缓解预报的模糊效应。主要结论如下:1. 当突发性降水不规律时,POT方法能够有效地预测
该方法只能够对“回归到平均”的问题进行缓解,并不能完全消除。
针对问题三:为解决利用 | Z 和 | ZDR | 进行定量降水估计的问题,考虑降水的“时序因果性” |
与“空间关联性”,提出了基于时空因果图神经网络的定量降水估计模型。在第二章因果贝
叶斯网络的基础上,计算 | Z 和 | ZDR | 之间的因果强度。然后,使用图卷积模块提取空间相关 |
性,使用时序卷积模块提取时序因果性,从而实现对降水量的定量估计。主要结论如下:
1. 时空图神经网络在求解降水量这种带有复杂时空关系的问题上具有一定优越性,与Deep Switching Auto-Regression Factorization(DSARF)、LSTM等基线方法相比,MAE提升了25.79%和44.82%。2. 将时序因果信息与空间关联信息引入到时空图神经网络中能够提高模型估计精度,与没有添加因果信息的时空图神经网络相比,其MAE和MSE分别提升了1.83%和0.15%。
针对问题四:为解决双偏振雷达在强对流降水临近预报中的贡献度评估,优化数据融合策略的问题,提出了基于反事实推理的数据融合策略优化方法。在第四章时空因果图神经网络的基础上,将模型的输入替换为反事实样本,计算模型输出的变化,从而对双偏振雷达资料在强对流降水临近预报中的贡献进行评估。为了更好地应对突发性和局地性强的强对流天气,提出了基于元学习的数据融合策略优化方法。该方法以第四章模型为基本框架,
通过输入不同组合的双偏振雷达观测数据( | ZH | , | Z | H , | Z | DR | | )来训练模型得到基学习器。 |
然后,以不同基学习器的降雨预报值作为输入,训练一个元学习器来输出不同模型预报值的集成结果。当输出误差达到最小时,理论上此时元学习模型代表最优融合策略。主要结
论如下: | Z 和 | ZDR | 在强对流降水临近预报中都起到了重要作用,但是相对来说,ZH 在强 |
对流降水临近预报中起到的作用更为显著。2. 基于元学习的数据融合策略方法能够提高预 |
测效果,但该效果只体现在MSE显著下降,而MAE却略有上升。主要原因为:元学习在学习过程中会把预测的数据作为训练集,这回导致降水量为0值区域的误差不断累加从而导致MAE的上升。同时,这种累计误差可能会使强降水区域的预测值不断趋近于真实值,导致MSE显著下降。因此,这种方法能更好地应对突发性和局地性强的强对流天气。
关键词:强对流降水预报;因果推理;时序因果性;空间关联性;时空图神经网络;
元学习
第1章 绪论
1.1 研究背景与意义
强对流降水作为一种具有高强度、短时程、小空间尺度的降水现象,一直是气象预报领域的一大挑战。这种降水形式通常与雷暴、短时强降水、冰雹和龙卷风等灾害性天气现象相关联,对人们的日常生活和经济活动产生巨大的影响。因此,对强对流降水的准确预报对于减少其带来的损失和灾害至关重要。
在过去的几十年中,强对流降水预报的方法和技术经历了巨大的变革。传统的预报方法主要依赖于气象专家的经验和直觉,利用他们丰富的经验得出预测结果。这种主观预报方法虽然在某些情况下效果显著,但也存在局限性,尤其是在天气系统较复杂和不确定性较大的情况下。随着理论方法的进步,客观预报方法逐渐崭露头角。这些方法主要依赖于数值天气预报模型,基于大气的物理和动力学方程通过计算机模拟大气的运动和变化,从而预测未来的天气情况。然而,由于强对流降水的小尺度和短时程特性,传统的数值模型往往难以捕捉其细节和变化,导致预报出现不准确的问题[1]。
近年来,随着深度学习和人工智能技术的发展,通过有效结合气象大数据,这些技术开始被应用于强对流天气预报领域。基于深度学习的预报方法,通过训练大量的历史天气数据,学习天气的模式和规律,从而提高预报的准确性。例如,基于深度学习的短时定量降水预测研究,通过训练雷达和卫星数据,可以更准确地预测降水的位置、强度和移动方向。此外,新的技术和方法,如基于双偏振雷达的降水短临预报技术、基于TrajGRU的短临预报实现等,也为强对流降水的临近预报带来了新的机会和挑战。这些技术结合了传统的数值模型和现代的深度学习方法,能够有效提高强对流天气预报的准确性和时效性。
强对流降水的临近预报是一个复杂而又具有挑战性的问题,本文在双偏振雷达获取的水平反射率因子、差分反射率和比差分相移等数据的基础上,针对提高预报精度、缓解模糊效应,优化数据融合策略的问题开展研究,旨在更好地应用双偏振雷达改进强对流降水短临预报效果,从而及时做到防灾减灾,为人们的生命和财产提供更好的保护。
1.2 国内外研究现状
1.2.1 强对流降水临近预报方法
强对流降水的临近预报方法是气象学中的重要研究方向,其目的是为了更准确、更及时地预测强对流降水事件。传统的强对流降水临近预报依靠数值天气预报模型开展,这些模型通过数理方程来模拟大气的运动和演变。目前,常用的数值模型包括WRF、MM5等,这些模型能够模拟大气中的水汽、温度、风速等参数,从而预测强对流降水的发生。近年来,人工智能技术在强对流降水临近预报中的应用逐渐增多。通过对大量的气象数据进行学习,机器学习模型能够发现数据中的模式和规律,从而实现对强对流降水的预测。深度学习,尤其是卷积神经网络(CNN)和循环神经网络(RNN),在图像和序列数据分析中表现出色,因此在雷达和卫星数据分析中具有广泛的应用前景。CNN通过卷积层提取空间特征,适合处理具有空间结构的气象图像数据[2];而RNN则能够处理时序数据,捕捉时间序列中的动态变化,适用于时序气象数据的分析[3]。当前的研究重点聚焦于利用历史数据进一步提高预报的准确性,为了达到这一目的需要研究如何对原始数据进行转换和处理以提取出对模型学习有用的特征,以及使用数据融合方法整合来自不同源的气象数据以提供更为全面和准确的输入特征。
1.2.2 回归到平均缓解方法
回归到平均(Regression to the Mean)是一个统计学概念,指的是在一系列随机变量中,一个极端的观测值往往会被一个更接近平均值的观测值所跟随。选择合适的统计方法和模型可以缓解回归到平均的影响,常见的方法有多层模型(Multilevel Models)、贝叶斯方法、协变量调整、随机效应模型、交叉验证、引导法(Bootstrapping)等[4]。多层模型可以处理具有层次结构或分组结构的数据,能够考虑到组内和组间的差异,从而减少误差和回归到平均的影响,但是计算复杂度高,对模型的假设和参数的解释较为复杂;贝叶斯方法通过引入先验知识和后验分布,提供了一种以概率的形式处理不确定性的方式,方法较为直观且易于解释,但是对于大型模型计算上可能非常复杂,并且选择合适的先验分布时可能会引入主观性;协变量调整可以帮助控制潜在的混杂变量,增强因果关系的解释能力,从而减少回归到误差的影响,其缺点在于对选取协变量的要求较高,如果协变量选择不当可能会引入偏见;随机效应模型考虑了观测值之间的随机变异,通过引入随机效应,研究者可以更好地捕捉数据中的随机性,从而减少回归到平均的影响,但是其计算复杂度高,并且需要足够的数据来估计随机效应;交叉验证是一种评估模型预测性能的方法,通过将数据分为训练集和测试集并多次重复这一过程,可以评估模型的稳健性和预测能力,但是计算成本高且分割数据可能导致某些子集的信息丢失;引导法是一种基于重采样的统计方法,可以用来估计参数的分布和置信区间,通过多次重采样,引导法可以提供对参数估计的不确定性的更好的了解,从而减少回归到平均的影响。
1.2.3 特征重要性评估
特征重要性评估是机器学习中的一个关键步骤,目的在于避免无用、冗余的特征,使用易于理解的简单特征。它有助于我们理解模型的工作原理,优化模型性能,以及解释模型的预测。特征重要性评估方法可以大致分为三类:过滤方法、包装方法和嵌入方法。过滤方法主要基于统计学的方法,在模型训练之前评估特征的重要性,这类方法的主要优点是计算速度快,不依赖于任何机器学习算法,因此它们通常被视为预处理步骤,其缺点是它们可能会忽略特征之间的相互作用;包装方法通过训练模型来评估特征的重要性,这类方法考虑了特定模型的性能,因此通常能够找到对给定模型最有用的特征子集,例如递归特征消除(RFE)、前向和后向特征选择,但是包装方法的计算成本较高,尤其是当特征数量很大时;嵌入方法在模型训练过程中直接评估特征的重要性,可以考虑特定模型的性能和特征之间的相互作用,而且通常比包装方法更为高效,例如LASSO回归[5]、决策树和随机森林[6]以及神经网络等。
1.2.4 因果推理
因果推理的目标是发现变量背后的因果关系。图灵奖获得者Judea Peral 将因果关系分为三层即:“因果发现”、“干预”和“反事实推理”[7]。20世纪80年代,许多学者研究了图与概率论之间的关系[10],并且在时间序列数据中实现因果发现、干预估计和反事实推理方面取得很大的进展,这给本文提供了良好的启发。
因果发现主要指挖掘数据之间的因果关系,剔除冗余的相关关系,得到更具有可解释性、更鲁棒的关联关系;干预影响评估主要是指评价治疗手段、政策、环境变化等治疗措施对系统所产生的影响;反事实推理用来回答“如果怎样将会怎样”的问题,如果当初事情发生的方式与现实不一样,那么结构将会如何,是一种精确的归因分析方法。
本文主要解决四个问题,如何有效应用双偏振变量改进强对流预报?如何缓解预报的模糊效应?如何进行定量降水估计?以及如何评估双偏振雷达资料在强对流降水临近预报中的贡献?在前两个问题中,使用因果发现方法可以获取目标变量的直接原因,建立直
接原因与目标变量之间的确定性函数关系,获得更精确、更鲁棒的结果;在如何缓解预报的模糊效应中,预报的模糊效应是指当极端事件发生后,数据驱动方法的预测却更接近于平均值,这对于强对流预报来说是不合理的。因此可以把极端事件抽象成干预,来计算干预的影响,并对干预的影响进行动态建模,最后将干预的影响融入预测模型中,以缓解预报的模糊效应;对于评估双偏振雷达资料在强对流降水临近预报中的贡献这一问题,可以通过使用反事实推理来回答,如果使用的是传统雷达,那么估计的降水量将会如何?通过这种对比来评估双偏振雷达资料在强对流降水临近预报中的贡献。
1.3 本文的主要内容与结构安排
1.3.1 论文主要研究内容
论文针对强对流降水临近预报问题,从时序数据普遍存在的因果关系入手,研究了基于因果推理的强对流降水临近预报问题。首先,为解决有效应用双偏振变量改进强对流预报问题,从“时序因果性”与“空间关联性”两个维度入手,提出了基于结构因果模型的ZH临近预报方法。然后,针对当前数据驱动算法存在的“回归到平均”问题,使用极值理论拟合极端事件的分布,得出极端时间的发生概率与极值。然后将极端天气抽象为“干预”,在结构因果模型的基础上,提出了基于干预影响动态建模的预报模糊效应缓解方法。再次,针对定量降水估计问题,考虑区域降水的“时序因果性”与“空间关联性”,提出了基于时空因果图神经网络的定量降水估计模型。最后,为解决双偏振雷达在强对流降水临近预报中的贡献度问题,优化数据融合策略,提出了基于反事实推理的数据融合策略优化方法。
1.3.2 论文组织结构
论文主要分 7 章对强对流降水临近预报问题展开研究,其组织结构图 1 所示,下面就论文各章的研究内容安排如下:
第 1 章:“绪论”。本章主要介绍了论文的研究背景与意义;分析了与论文研究内容相关工作的国内玩研究现状,主要包括强对流降水临近预报方法、回归到平均缓解方法、特征重要性评估方法以及因果推理研究现状;最后介绍了论文的主要内容及结构安排。
第2章:“基于结构因果模型的 | Z 临近预报”。本章主要解决有效应用双偏振变量改进强对 H |
流预报问题。首先进行区域关联性分析,找到区域之间的空间关联性,其次提出了基于多
元传递熵的因果贝叶斯网络构建方法,构造变量之间的因果关联;最后为了定量表示 | Z 、 H | |||||
ZDR | 、 | KDP | 之间的因果关联,根据多元传递熵的计算过程,推导出了结构因果模型,对 | Z | H | |
进行定量预报。 | ||||||
第 3 章:“基于极值理论与干预影响动态建模的预报模糊效应缓解”。本章主要解决数据驱动算法中存在的“回归到平均”问题。在第2章结构因果模型的基础上,根据极值理论拟合极端事件的分布,得出极端事件发生的规律。然后,将极端气象事件抽象成干预,并对极端气象事件所带来的影响进行动态建模,将这种影响冗余结构因果模型中,得到了其随时间动态变化的状态空间模型,从而缓解预报模糊效应。
第4章:“基于时空因果图神经网络的定量降水估计”。本章主要解决利用 | Z 和 H | Z | DR |
进行定量降水估计的问题。根据第2章推导的因果贝叶斯网络,考虑区域降水的“时序因果 |
性”与“空间关联性”,提出了基于时空因果图神经网络的定量降水估计模型。使用时序卷积
模块提取 | Z 和 H | 之间的时序因果性,使用图卷积模块提取不同区域之间的空间关联性, |
从而提高估计模型精度。 |
第 5 章:“基于反事实推理的数据融合策略优化”。本章主要解决评估双偏振雷达资料在强对流降水临近预报中的贡献及如何数据融合策略优化的问题。根据第4章得到的定量降水估计模型,采用反事实推理方法,将输入更换为传统雷达信息数据,对二者情况进
行差异化表征,从而对双偏振雷达数据特征的重要性进行评估。为了更好地应对突发性和局地性强的强对流天气,提出了基于元学习的数据融合策略优化方法。该方法以第四章模
型为基本框架,通过输入不同组合的双偏振雷达观测数据( | ZH | , | Z | H , | Z | DR | | )来训练模 |
型预报降水量。然后,以不同模型的预报值作为输入,训练一个元学习器来输出不同模型预报值的集成结果。当输出误差达到最小时,理论上此时元学习模型代表最优融合策略。 第6章:“模型改进与推广”。对本文提出的模型的优点与缺点进行总结。
图1 论文组织结构图
1.4 本章小结
本章介绍了强对流降水临近预报的研究背景与研究意义;并针对提出的四个问题,对强对流降水临近预报、回归到平均缓解方法、特征重要性评估这三个内容的研究现状进行了总结,指明了可以进一步研究的方法,并对贯穿全文的因果推理方法进行了介绍,并说明了技术路线需要使用因果推理的理由;最后介绍了本文的主要内容与结构安排。
问题一要求有效应用双偏振变量改进强对流预报,建立可用于强对流临近预报双偏振雷达资料中微物理特征信息的数学模型。临近预报的输入为前面一小时时(10帧)的雷达
观测量( | Z 、 | ZDR | 、 | KDP | ),输出为后续一小时(10 帧)的 | Z 临近预报。本节从时序数 |
据普遍存在的因果关系入手,结合关联区域历史降水数据信息,提出了一种基于结构因果
模型的 | Z 临近预报方法,主要流程如图2。 H |
图2 问题1求解思路
(1)区域关联性分析:每个地区的降水量不仅只受自身地区的影响,相邻地区的历史降水规律也能够提供一定借鉴意义(具有某些关联的地区)。因此,本节首先对 256×256个平面区域每次降水的总量进行了统计,并定义“区域半径”来确定与之间的空间相关性。
分别采用最大互信息系数(Maximal Information Coefficient,MIC)和皮尔逊相关系数并结合“区域半径”对不同区域的降水量关联联系进行计算,总结出不同区域的降水关联规律,找到与区域具有显著影响的关联区域。
(2)临近预报模型:1. 因果贝叶斯网络构建,在得到每个区域的“关联区域”后,使用
多元传递熵构造自身区域与降水关联区域的3个等高面(1km,3km,7km)的 | Z 、 | ZDR | 、 | |||||||
KDP | 参数的因果动态贝叶斯网络,因果动态贝叶斯网络可以描述数据内涵的因果机制,可 | |||||||||
以用于提取强对流临近预报双偏振雷达资料中微物理特征信息的数学模型。2. 结构因果方 | ||||||||||
程推导,基于因果贝叶斯网络,从时间序列的因果关系入手,推导了 | Z 、 | 、 | KDP | 参数 | ||||||
的结构因果模型(SCM)。该模型以确定性方程的形式表达了 | Z 、 | 、 | KDP | 的物理关联, | ||||||
可以实现对 | Z 的精确临近预报,还具备传统机器学习方法不具备的可解释性。 H | |||||||||
(3)模型求解:以不同区域为背景,结合参数估计对临近预报模型进行求解,并与MLP、核回归、长短记忆神经网络(Long Short Term Memory networks)等预测算法进行对比,得出相应结论。
2.2 区域关联性分析
2.2.1 不同区域降水量统计
为了总结出区域相关性,提取区域之间的相关特征,统计出了256×256(共计65536)个区域的所有降水次数的降水量总和,如图3所示。
图3 不同区域降水量
从图 3 可以看出,这一 256km×256km 区域的降水主要集中在中心靠右区域,不同地方之间的降水差别较大,区域之间可能存在某种空间相关性,为了衡量不同区域之间的空间相关性,下面首先定义“区域半径”,然后结合最大互信息与皮尔逊相关系数对不同区域之间的关联进行量化。
2.2.2 区域半径选择
区域半径的定义如图4所示,假设被关联的区域为第K个区域,当它的区域半径为R = 2时,其“邻居区域”如蓝色区域所示。相应的计算公式为:
Ty | _ | top bottom | = | K | 1R | 256* 1[ : | R | ] | , | Ty | _ | left right | = | [ Ty | _ | top Ty | _ | bottom ] | | ones | (2 | R | 1, ).* 1[ : | R | ] | (1) |
图4 区域半径定义
需要说明的是,当K位于两侧时,其计算公式需要考虑一定约束。例如,当K = 258,且R = 2时,其邻居区域如图4(右),相关计算代码见附录,在此不做赘述。
为了选择合适的区域半径,本节设计了基于贪婪搜索的区域半径选择方法,力求在得到最佳能够体现空间依赖性的区域半径,以减少计算时间。基本思路为:
(1)给定区域半径R,计算区域的“邻居区域”;
(2)计算区域与邻居区域的降水量关系;
(3)遍历R,找到最佳半径(通过不同区域降水量关系求得)。
最大互信息系数和皮尔逊相关系数在计算变量关系当面起到了重要的作用。为了避免单一变量导致的计算结果偏差,本节选择最大互信息系数和皮尔逊相关系数来计算区域与邻居区域的降水量关系。
最大互信息系数:衡量两个变量之间的关联程度、线性和非线性关系,相比较互信息具有更高的准确度,且具有一定的普适性、公平性和对称性。其计算公式如下:
Mic x y , ) | = max a b B | I x y ( ; ) | (2) |
log min( , ) a b 2 | |||
其中 ,a b是在 ,x y方向上划分格子的个数。B是变量, ( ; ) I x y 表示 ,x y的互信息。 |
皮尔逊相关系数:表示两个变量之间协方差和标准差的商,用来表示两者间线性相关性,其值介于-1到1之间,公式如下:
X Y | = | cov X Y , ) | = | E X | − | X | )( Y | − | Y | )] | (3) |
X Y | X Y |
其中为标准差,cov为协方差,E为数学期望,为均值。
随机选择八个区域(坐标分别为[35,175], [38, 210], [85, 179], [128, 125], [130, 126], [180, 150], [191, 155], [225, 170])及邻域半径R为输入(考虑计算时间与空间纬度,R选择1至20),在不同邻域半径下计算不同区域与其邻居区域的最大互信息系数和皮尔逊相关系数,力求获得不同区域的最佳区域半径。得到结果如图5,具体数据见附录。
图5 不同区域半径下区域与其邻居区域的最大互信息系数和皮尔逊相关系数
图 5 不同区域半径下区域与其邻居区域的最大互信息系数和皮尔逊相关系数,根据图5 可知,当区域半径为 1 时,每种区域与其邻居区域相关性非常强,这证明相邻区域之间具有很强的相关性。同时,随着区域半径的增加,其相关性逐渐减弱。因此,我们可以得
出如下结论:区域与区域之间是存在空间相关性的,当区域半径为1时,区域之间的关联性很强。并且随着区域半径增加,这种关系单调递减。
为了得到不同区域的关联区域,我们认为当最大互信息系数与皮尔逊相关系数均大于0.8时,两个区域之间是存在显著关联的。基于这种约束,便可得到不同区域的关联区域。
因此,在对某个区域的 | Z 进行预报时,不仅要考虑自身区域的双偏振雷达信息,还需要 H |
考虑关联区域的双偏正雷达信息。
2.3 临近预报模型
在2.2节中分析出的区域关联性的基础上,提出了一种基于结构因果模型的 | Z 临近预 H |
报方法。首先基于多元传递熵构造了能够体现双偏振雷达资料中微物理特征的因果贝叶斯
网络;随后基于多元传递熵的计算过程,推导出了结构因果方程来对 | Z 进行定量预报。 H |
2.3.1 因果贝叶斯网络构建
(1)因果贝叶斯网络
贝叶斯网络由概率有向无环图(DAG)表示,其中顶点是随机变量,弧表示对应于弧的两端节点的两个变量之间的概率依赖关系[12]。在图中,一个顶点v有一个条件概率表
P( |v Parent(v)) | ,描述了变量与其父节点之间的关系。贝叶斯网络的一个重要特征是局部 |
有向马尔可夫条件,这意味着,以其父节点为条件,v独立于网络中既不是v的后代也不是父节点的变量,这样的特征使得联合概率分布表示为式(4):
在贝叶斯网络中,弧的方向不需要有意义,其中一些甚至可能不遵循时间顺序。这是
因为两个网络A | →B | 和A | B | 在概率模型中是等价的,产生相同的边际分布并对相同的查 | |
询(例如 | P A B )产生相同的概率推断。 |
因果贝叶斯网络(Causal Bayesian Network, CBN)与贝叶斯网络有相同的形式,不同之处在于,在因果网络中,变量A的父节点是A的直接原因。换句话说,当且仅当A是指
定总体中B的直接原因(描述为给定数据集)时,弧A | →B | 存在因果贝叶斯网络中。因果 |
贝叶斯网络采用贝叶斯网络来描述因果信息和传统的条件依赖,它们通过概率演算来计算因果效应,因此贝叶斯网络是因果网的基础[13]。因果动态贝叶斯网络在因果贝叶斯网络的
基础上考虑了因果参数之间的时间滞后,如图6。
图6 因果动态贝叶斯网络
因果动态贝叶斯网络不仅直观的展示了目标变量与其因变量的定性关系,而且反映了
其时间相关性,所以可以使用因果贝叶斯网络对双偏振雷达资料中微物理特征之间的因果
关联进行建模。
(2)基于多元传递熵的因果贝叶斯网络构建
Z | oher | 基于多元传递熵的因果贝叶斯网络构建方法的输入为 Z = { Z , Z , K } 、 self H DR DP = { Z H , Z DR , K },其中Zself 代表本区域的双偏振雷达信息,Zother 代表相关区域的双偏振 | |||||||||||||||||
雷达信息, | 3 | Z = Z , Z , Z } 代表 1km、3km、7km 三个等高面的 H 1 H 3 H 7 , Z DR 7 }代表1km、3km、7km三个等高面的ZDR 参数,K DP = { K DP 1 , | ZH | 3 | 参数, | ||||||||||||||
Z | DR | = | { Z | DR | 1 | , | Z | DR | K | DP | , | K | DP | 7 | } | 代 | |||
表1km、3km、7km三个等高面的K 参数,输出为因果动态贝叶斯网络DP GCBN 。 传递熵定义如下:假设X :{ , x n = 2,1 ,..., N },Y :{ y n = 2,1 ,..., N }为两个随机变量,X 是 n n | |||||||||||||||||||
具有k阶的马尔科夫过程,Y是具有l阶的马尔科夫过程,可以得到下式: