【目标检测】Focal Loss

news2026/2/13 16:58:09

Focal Loss用来解决正负样本不平衡问题，并提升训练过程对困难样本的关注。

在一阶段目标检测算法中，以YOLO v3为例，计算置信度损失（图中第3、4项）时有目标的点少，无目标的点多，两者可能相差百倍千倍甚至更多，这就导致无目标的置信度损失会以压倒性的数量优势在数值上淹没有目标的置信度损失。

首先，我们回顾一下第三、四项里 $[\cdot]$ 所对应的BCELoss，其公式如下：

其中， $p\in[0,1]$ 是经sigmoid输出的预测概率， $y\in\{0,1\}$ 是真实标签。简单起见，我们使用 $p_t$ 简化上述损失， $p_t$ 公式如下：

于是，我们得到

在此基础上，Focal Loss引入 $\alpha_t$ 来加权BCELoss以解决正负样本不平衡的问题，公式如下：

其中， $\alpha_t$ 定义如下：

其中， $\alpha\in[0,1]$ 是自行设定的权重参数。直观来说，当正样本较少时，我们可以设定一个较大的 $\alpha$ ，例如 $0.9$ ，这样正样本的损失相比负样本的损失就会更大从而解决正负样本失衡的问题。

⚠️ 事实上，Focal Loss原文中的最佳 $\alpha$ 是 $0.25$ ，这说明原文并不是用它来处理正负样本失衡的，更像是一个超参数。

进一步地，Focal Loss还能使得模型在训练过程中更加关注困难样本。对于正样本来说，我们希望预测概率 $p\rightarrow 1$ ，那么 $p$ 越小说明该样本预测起来就越困难，反之就越简单。对于负样本， $p$ 越小说明该样本预测起来就越简单，反之就越困难。直观上，我们只需努力矫正困难样本，毕竟简单样本已经预测的不错了，于是Focal Loss引入 $(1-p_t)^{\gamma}$ 来加权BCELoss以实习对困难样本的关注，公式如下：