引言
当我们尝试使用克里金方法插值数据时,最常见的问题之一就是数据中存在极值或者说是异常值。极值是指与其他数据相比非常大或非常小的数据值。通常是由于监测设备故障或数据输入失误造成的,比如不小心删除了数据中的小数点。在进行插值之前,应手动纠正或删除这些错误数据。然而,并非所有异常值都是有问题的。有些极值是真实的有效值,以下内容我们将讨论如何处理这种异常值。
适用软件:ArcMap 、ArcGIS Pro、GeoScene Pro
本文相关截图来自ArcMap软件。
数据介绍
本文引用的数据是1995年奥地利地表苔藓的重金属浓度含量。其测量单位为每千克苔藓的重金属毫克数,这里我们将重点讨论重金属钼元素。如下图所示,北部地区钼元素浓度较低,南部地图钼浓度较高。而且在南部地区有两个位置的钼浓度显著高于其他地方(7.66 and 1.81 mg/kg)。
1995奥地利钼元素含量分布图
虽然这两个地区的钼元素浓度高到看起来像是异常值,但在这些地点同时也发现其他重金属元素的浓度一样很高,因此钼元素高浓度不太可能是机器或人为错误造成的。要创建钼元素浓度的准确预测图,不能简单地删除或忽略这两个位置的测量值。
极值问题
我们在进行插值时,经常会遇到当某些数据值比所有其他值大几倍时,很难建立一个有效的克里金模型。原因在于克里金模型的核心是半变异函数,当存在极值时,很难找到一个半变异函数来拟合所有数据。例如,对于钼元素数据,地统计向导建议使用下图所示的半变异函