- Focal Loss是在交叉熵损失函数的基础上增加了一个平衡因子 α \alpha α和一个聚焦因子 γ \gamma γ,分别用来调节不同类别样本的权重以及难分样本和易分样本之间的权重
- 一个样本的交叉熵损失函数如下:
- p t p_t pt表示将该样本分类为t的概率
- 一个样本的Focal Loss如下:
1)为了解决样本不均衡问题,增加了平衡因子 α t \alpha_t αt以调节不同类别的权重
2)为了聚焦于困难样本的训练和挖掘,增加了聚焦因子 γ \gamma γ,可以看到如果该样本的 p t p_t pt很高,那么由于增加了 ( 1 − p t ) γ (1-p_t)^\gamma (1−pt)γ,可以使得该样本对应的权重变小,即易分类样本的权重变小;反之,难分类样本的权重相对而言会变大。从而可以聚焦于困难样本的挖掘。
- 当 p t p_t pt很小时(样本难分), ( 1 − p t ) γ (1-p_t)^\gamma (1−pt)γ趋近1,难分样本的权重不受影响;当很 p t p_t pt很大时(样本易分), ( 1 − p t ) γ (1-p_t)^\gamma (1−pt)γ趋近0,损失函数中样本的权重下降很多
- 聚焦因子 γ \gamma γ可以调节易分类样本权重的降低程度,越大权重降低程度越大
- 例如:
- Focal Loss常用于目标检测领域,由于存在大量anchor bboxes
参考链接:https://blog.csdn.net/qq_41204464/article/details/122671175