【损失函数】Cross Entropy Loss 交叉熵损失

news2026/2/15 8:34:36

1、介绍

主页介绍的几种损失函数都是适用于回归问题损失函数，对于分类问题，最常用的损失函数是交叉熵损失函数 Cross Entropy Loss。它用于测量两个概率分布之间的差异，通常用于评估分类模型的性能。

2、公式

对于二分类问题，交叉熵损失的一般形式为：

$Binary Cross Entropy Loss=-\frac{1}{N} \sum_{i=1}^N\left[y_i \log \left(\hat{y}_i\right)+\left(1-y_i\right) \log \left(1-\hat{y}_i\right)\right]$

其中， ${N}$ 是样本数量， ${y}_i$ 是实际标签， $\hat{y}_i$ 是模型的预测概率。

对于多分类问题，交叉熵损失的一般形式为：

$Categorical Cross Entropy Loss=-\frac{1}{N} \sum_{i=1}^N \sum_{j=1}^C y_{i j} \log \left(\hat{y}_{i j}\right)$

其中， ${N}$ 是样本数量， ${C}$ 是类别数量， $\hat{y}_{i j}$ 是实际标签的独热编码（one-hot encoding）， ${y}_{i j}$ 是模型对类别 ${j}$ 的预测概率。

3、图像

上图是交叉熵损失（Cross Entropy Loss）的图像。图中展示了两个类别（真实类别和错误类别）的概率与损失之间的关系，可以看到约接近目标值损失越小，随着误差变差，损失呈指数增长。

4、实例

假设我们有以下情况：我们正在训练一个模型来进行三种实例的分类，此时有100个待测样本。

我们使用 CrossEntropyLoss 作为损失函数：

import torch
import torch.nn as nn

# 示例数据
torch.manual_seed(42)
num_classes = 3
num_samples = 100
y_true = torch.randint(0, num_classes, (num_samples,))
y_pred_logits = torch.randn(num_samples, num_classes)

# 定义交叉熵损失函数
criterion = nn.CrossEntropyLoss()

# 计算损失
loss = criterion(y_pred_logits, y_true)

print(f'Cross Entropy Loss: {loss.item()}')

在这个例子中，y_pred_logits 是模型的输出，它包含了对每个类别的未归一化的预测值。y_true 是实际标签。通过传递这两者给 CrossEntropyLoss，可以计算交叉熵损失。在实际训练中，您可能需要结合优化器来更新模型的权重以减小损失。