【大厂AI课学习笔记NO.59】（12）过拟合与欠拟合

news2026/2/14 19:29:07

拟合就是调整参数和模型，让结果无限接近真实值的过程。

我们先来了解个概念：

偏差-方差窘境（bias-variance dilemma）是机器学习中的一个重要概念，它涉及到模型选择时面临的权衡问题。

偏差（Bias）度量了学习算法的期望预测与真实结果的偏离程度，即刻画了学习算法本身的拟合能力。当模型过于简单，无法捕捉到数据的所有复杂性时，就会出现高偏差的情况，此时模型可能会欠拟合（underfit）数据。

方差（Variance）则度量了在同样大小的训练集的变动下，学习性能的变化，即刻画了数据扰动所造成的影响。当模型过于复杂，对训练数据中的噪声和特定细节过于敏感时，就会出现高方差的情况，此时模型可能会过拟合（overfit）数据。

在模型选择时，我们通常会面临偏差和方差之间的权衡。简单的模型可能具有较高的偏差和较低的方差，而复杂的模型可能具有较低的偏差和较高的方差。因此，在选择模型时，我们需要找到一个平衡点，使得模型既能够捕捉到数据的内在规律，又不会对数据中的噪声和特定细节过于敏感。

偏差-方差窘境的存在意味着我们无法同时最小化偏差和方差。在实际应用中，我们通常需要借助交叉验证、正则化等技术来平衡偏差和方差，从而选择出最优的模型。

需要注意的是，除了偏差和方差之外，还有一个重要的因素也会影响模型的性能，那就是噪声（Noise）。噪声表达了在当前任务上任何算法所能达到的期望泛化误差的下界，即刻画了学习问题本身的难度。因此，在实际应用中，我们还需要考虑噪声对模型性能的影响。

泛化性能是由学习算法的能力，数据的充分性，以及学习任务共同难度决定了。

之前讲过，在此不再赘述。

我们再学习一个概念：偏差-方差分解（bias-variance decomposition）

偏差-方差分解（Bias-Variance Decomposition）是机器学习中一种重要的分析技术，用于解释学习算法泛化性能的一种工具。给定学习目标和训练集规模，它可以把一种学习算法的期望误差分解为三个非负项的和，即样本真实噪音（Noise）、偏差（Bias）和方差（Variance）。

样本真实噪音：是任何学习算法在该学习目标上的期望误差的下界，即刻画了学习问题本身的难度。这是由数据本身的特性所决定的，无法通过优化模型来减少。
偏差：度量了某种学习算法的平均估计结果所能逼近学习目标的程度，即刻画了模型的拟合能力和准确性。偏差越小，说明模型的拟合能力越强，预测结果越接近真实值。
方差：度量了在面对同样规模的不同训练集时，学习算法的估计结果发生变动的程度，即刻画了模型对数据扰动的敏感性。方差越小，说明模型对数据扰动的鲁棒性越强，不会因为训练集的微小变化而导致预测结果的剧烈波动。

需要注意的是，偏差和方差通常是相互矛盾的，即偏差的减小可能导致方差的增加，反之亦然。因此，在选择模型时，需要综合考虑偏差和方差之间的平衡，以及噪声对模型性能的影响，从而选择出最优的模型。

总的来说，偏差-方差分解提供了一种从偏差和方差的角度来解释学习算法泛化性能的方法，有助于我们更好地理解模型的性能表现，并指导我们进行模型选择和优化。

好，我们来了解过拟合与欠拟合。