如何度量预测用户付费的误差

news2026/2/8 10:42:21

在广告，电商，游戏等行业中，预测用户付费是核心的业务场景，能直接帮助提升收入，利润等核心业务指标，堪称预测中的明星。在预测用户付费的系列文章中，结合作者理论和工程实践经验，深入探讨如何更好更准地去预测用户付费。准确预测的第一步是准确度量预测用户付费的误差。

MAE和RMSE

传统的回归预测通常使用MAE，RMSE等指标去评价预测误差。

MAE全称Mean Absolute Error，指平均绝对值误差，是对预测值和真实值的绝对差值计算平均值，其计算公式是：

计算绝对值的好处在于能避免正负误差抵消的情况。例如，有三个误差值，不取绝对值的话，计算平均误差为0，与实际情况不符。而取绝对值后，计算平均误差为0.667。

RMSE全称Root Mean Square Error，指均方根误差，是计算所有预测值和真实值的样本标准差，即对预测值和真实值的差值取平方再计算平均值再开根号，其计算公式是：

由于在误差计算中引入了平方计算，和MAE比较，RMSE会放大较大的误差。例如，有两组误差值，

计算可得，

第一组MAE=10.0，RMSE=10.0，比例1:1

第二组MAE=340.0，RMSE=577.408，比例1:1.698

可见较大的误差值对RMSE影响更显著，换句话说，使用RMSE指标度量误差，会更多地去惩罚较大的误差，从而避免出现特别明显的预测误差。因为RMSE是光滑可微函数，所以很多回归模型都使用RMSE作为默认损失函数。

MAPE和WAPE

尽管MAE和RMSE是机器学习回归模型的默认度量指标，但不太适合付费预测的业务场景。例如，对于同样的真实值，

有以下两组不同的预测值，

计算得到以下两组不同的误差值，

第一组MAE=10.0，RMSE=10.0

第二组MAE=10.0，RMSE=17.32

只看MAE，两组误差一样大。只看RMSE第二组误差更大。但对于付费预测业务来说，第一组，

虽然更准确地预测了付费值100的用户。
但将两个付费值10元的用户都预测为0，会损失两个付费用户。

第二组，

虽然预测付费值100的误差更大，但预测为70也能给予相当的信号。
同时完全准确预测了两个付费值10的用户，在付费用户数上3:1领先于第一组。

在对业务的帮助上，第二组明显更好，理应认为第二组误差更小。

显然，MAE和RMSE不适合用来度量用户付费预测的误差。对于这样的情况，对误差引入百分比计算，将误差值计算转化为相对误差计算。把误差定义为预测误差占真实值的百分比，则真实付费值10，预测误差值1，和真实付费值100，预测误差值10，尽管数值上有10倍的差异，但在百分比上都是误差10%。上文的例子，按百分比误差计算得到以下两组新的误差值，

通常使用MAPE计算百分比误差。MAPE全称Mean Absolute Percentage Error，指平均绝对百分比误差，是预测值和真实值的绝对差值，除以真实值，得到绝对百分比误差，再求其平均值。其计算公式是：

按MAPE计算，

第一组MAPE=70%

第二组MAPE=10%

可见第二组比第一组误差更小。所以MAPE更适合付费金额预测这样的场景，即倾向于每一个真实值都能预测得比较准确，即使大额付费用户的误差值大一些，也不影响对整体预测准确程度的评估。但MAPE指标也存在一个问题，如果真实值为0，则出现除数为0的情况，无法计算，不能度量预测值>0并且真实值=0这种情况的误差。

对于MAPE做一个改进，用绝对误差总和去除以真实值总和，可以避免除数为0的问题。这样的指标叫WAPE，全称Weighted Absolute Percentage Error，指加权绝对百分比误差，是预测值和真实值的绝对差值之和，再除以真实值之和。其计算公式是：

按WAPE计算，

第一组WAPE=(10+10+10)/(10+10+100)=25%

第二组WAPE=(0+0+30)/(10+10+100)=25%

细心的读者已经发现，这两组的误差一模一样。因为WAPE统计的是总体误差，而无法区分具体误差的分布。

考虑到WAPE不能完全体现具体误差分布，在实际工程实践中，一般会综合评价MAPE和WAPE两个指标，先用WAPE看总体误差，再用MAPE看具体误差。如果业务对不同付费区间的误差敏感程度不一样，还要看相应付费区间的MAPE和WAPE，最简单的区间划分是十分位，即看十分位划分的MAPE和WAPE。

如果需要WAPE能对不同情况的误差进行区别，则需要对不同情况的误差进行加权处理，从而得到加权后的指标，叫WMAPE，全称Weighted Mean Absolute Percentage Error，指加权平均绝对百分比误差，是预测值和真实值的绝对差值乘以加权系数之和，再除以真实值乘以加权系数之和。其计算公式是：

假设我们希望增加付费更小用户的权重，设真实值=10，加权系数=1.0，真实值=100，加权系数=0.8，则得到WMAPE的值为，

第一组WMAPE=(10*1.0+10*1.0+10*0.8)/(10*1.0+10*1.0+100*0.8)=28%

第二组WMAPE=(0*1.0+0*1.0+30*0.8)/(10*1.0+10*1.0+100*0.8)=24%

计算结果是第二组误差更小，能说明第二组对权重更高的用户付费预测更准确。

使用MAPE和WAPE代替MAE和RMSE度量预测用户付费误差，并指导模型进行优化之后，会得到如下效果：

显著降低总体预测误差。
真实值较小用户的预测误差降低最为明显。
显著减少过预测（预测值大于真实值）的情况。

同时也会存在如下问题：

真实值较大用户的预测误差可能不降反增。
整体预测总值偏低，大部分预测值都是欠预测（预测值小于真实值）。
欠预测会导致给模型下游系统的信号值偏低，影响业务效果

单位信号量误差

为什么使用MAPE和WAPE会导致欠预测？因为MAPE和WAPE的计算中，真实值是分母，相当于乘以，越大，乘数越小，越小，乘数越大。相对于平均值回归曲线，MAPE在平均值回归曲线下方的点，更小，乘数更大，有更大的权重，会把MAPE整体往平均值回归曲线的下方去拉，会有更多的点在平均值回归曲线下方，使得更多预测值低于平均值，从而导致欠预测。

为了解决欠预测的问题，引入信号量的概念，信号量等于预测平均值除以真实平均值。预测完全准确的情况下，信号量等于1。

$semaphore = \frac{\bar \hat{y_i}}{\bar y_i}$