1 引言
托布勒的地理第一定律指出,“一切都与其他事物有关,但近处的事物比远处的事物更相关。
在半变异函数的情况下,更接近的事物更可预测,变异性更小,而遥远的事物则难以预测,相关性也较低。
例如,当前位置的地形更可能与前方 1 米处的地形相似,而不是与 100 米外的地形相似。
半变异函数绘制了样本值(污染、海拔、噪声等)如何随距离变化。
接下来以土壤水分样本作为案例进行说明。
案例包含 10 英亩田地中的 73 个土壤水分样本。在西北角,样品更湿润,含水量更高。但在东部象限,它们要干燥得多,如下图所示。
针对上图存在以下疑问:
- 不同地点的值的可预测性如何?
- 距离较近的已知值是否比距离较远的值更相似?
可以用统计依赖性或自相关来描述这个想法。此外,空间自相关(距离较近的事物比距离较远的事物更相似)为预测提供了有价值的信息。
2 半变异函数原理
要了解空间依赖性,可以使用半变异函数进行估计。半变异函数取 2 个采样位置,并将两点之间的距离称为 h。
在 x 轴上,它以滞后为单位绘制距离 (h),滞后只是分组距离。取每组 2 个样本位置,测量响应变量(土壤中的含水量)之间的方差,并将其绘制在 y 轴上。
根据观察者的不同,半变异函数看起来像是一大堆点。例如,土壤水分图如下所示:
但是可以通过选择单个点来做一些侦探工作。当在半变异函数上取这个点时:
可以在地图上看到它们代表哪 2 个点。这是有道理的,因为它们彼此相距很远。因此,它在半变异函数中的极右位置。下面强调的正是这一点:
它们与该特定滞后距离的平均值也存在很大差异。如果半方差较高,则它在 y 轴上的位置较高。可以看到,半方差在滞后距离越近时越小,滞后距离越大,半方差就越大。
我们正在研究 2 个样本之间的所有距离及其变异性。半变异函数考虑所有点及其与方差的距离。
这就是为什么半变异函数上有这么多点的原因。这是上面数据集的一个子集,可以看到我们可以在半变异函数中绘制的所有不同点集。
3 半变异函数计算
半方差函数是距离 h 的函数,也是方向 α 的函数。当一个变量分布于空间时,该变量叫区域化变量(regionalized variable),半方差函数就是区域化变量 Z ( x i ) Z(x_i) Z(xi) 和 Z ( x i + h ) Z(x_i+h) Z(xi+h) 增量平方的数学期望,即区域化变量增量的方差(variograms)。其计算公式:
r ( h ) = 1 2 N ( h ) ∑ i = 1 N ( h ) [ Z ( x i ) − Z ( x i + h ) ] 2 r(h)=\frac{1}{2N(h)}\sum_{i=1}^{N(h)}[Z(x_i)-Z(x_i+h)]^2 r(h)=2N(h)1i=1∑N(h)[Z(xi)−Z(xi+h)]2
式中, r ( h ) r(h) r(h) 是相隔距离为 h h h 的半方差图的估计值, N ( h ) N(h) N(h) 是相隔距离为 h 的所有点的配对数, Z ( x i ) Z(x_i) Z(xi) 是样点 x i x_i xi 的平均密度, Z ( x i + h ) Z(x_i+h) Z(xi+h) 是样点 x i + h x_i+h xi+h 的平均密度。
半方差图是 r ( h ) r(h) r(h) 作为距离 h h h 的函数的图形,其值为某一特定方向的值,其中有4个最重要的参数:
- 变程(RANGE):是当变异函数的值达到平衡时的间隔距离,反映了区域化变量影响范围的大小。
- 块金值(NUGGET):指变异函数曲线延伸到间隔距离为零时的截距,反映区域化变量内部随机性的可能程度
- 基台值 C 0 + C C_0+C C0+C(SILL):是指达到平衡时的变异函数值,反映变量变化幅度的大小
- 空间变异比 C 0 / ( C 0 + C ) C_0/(C_0+C) C0/(C0+C):反映变量空间变异的程度,其值较高,说明随机部分引起的空间异质性程度较高;较低则说明由空间自相关部分引起的空间变异较大;如果该比值接近1,则说明该变量在整个尺度上具有恒定的变异。从结构性因素看,其表示系统变量的空间相关程度,比值小于25%,说明变量具有强烈的空间相关;比值在25%-75%,变量是中等程度的空间相关;大于75%,变量空间相关性很弱。
以 r ( h ) r(h) r(h) 为纵轴, h h h 为横轴,绘制出 r ( h ) r(h) r(h) 随 h h h 增加的变化曲线为半方差图。
从图中可以看出:
- 在距离较近的采样点,点之间的值差异往往很小。换言之,半方差很小。
- 随着远离采样点的距离增加,采样点之间不再存在关系。它们的方差开始趋于平缓,样本值彼此之间没有关联。
- 当同一位置有两个采样点时,可以预期具有相同的值,因此块金值应为零。有时他们不会,这增加了随机性。但在图形开始调平之前,这些值在空间上是自相关的。
- 当距离增加时,半方差会增加。相隔很远的点对较少,因此样本点之间的相关性较低。
- 正如半变异函数所示,它开始达到其平坦的渐近水平。尝试拟合函数以对此行为进行建模。
4 半方差图拟合模型
计算取样范围内所有可能距离间隔的变异函数,绘制函数曲线图,进而建立变异函数理论模型。
地统计学中常用来拟合实际变异曲线的理论模型有球状模型、指数模型、高斯模型、线状模型等。
- 一般情况下,球状模型说明所研究的种群呈聚集分布,表示当样本点间隔距离达到变程之前,样点的空间依赖性随样点间距离增大而降低
- 指数模型与球状模型相似,但其基台值是渐进线
- 随机分布的 r ( h ) r(h) r(h) 不随距离变化而规律性变化
- 非水平线状模型表示种群为中等程度的聚集分布,其空间依赖范围超过研究尺度
- 完全随机或均匀的数据,曲线表现为纯块金变异图, r ( h ) r(h) r(h) 呈水平直线或稍有斜率,表明在抽样尺度下无空间相关性
选择何种模型去拟合样本半方差图是一个复杂的过程,一般是根据样本方差图的形状或研究目的来确定。
自然界中许多生物和非生物因子的空间分布与方向有密切关系,因此,也产生了相应的各项异性模型。
有些区域化变量往往包含各种尺度或各种层次的变化,反映在半方差函数上其结构往往不是一种模型结构,而是多种模型结构相叠加在一起的套合结构。
python实现:
https://scikit-gstat.readthedocs.io/en/latest/userguide/variogram.html#the-variogram
参考:
https://gisgeography.com/semi-variogram-nugget-range-sill/