【AI学习笔记】初学机器学习西瓜书的知识点概要记录

news2026/2/7 21:37:35

初学机器学习西瓜书的知识点概要记录

1.1 机器学习
1.2 典型的机器学习过程
1.2 机器学习理论
1.3 基本术语
1.4 归纳偏好
1.5 NFL定理
2.1 泛化能力
2.2 过拟合和欠拟合
2.3 三大问题
2.4 评估方法
2.5 调参与验证集
2.6 性能度量
2.7 比较检验

以下内容出自周志华老师亲讲西瓜书

1.1 机器学习

（1）经典定义：利用经验改善系统自身的性能。（经验->数据）
随着该领域的发展，目前主要研究智能数据分析的理论和方法，并已成为智能数据分析技术的源泉之一

1.2 典型的机器学习过程

在这里插入图片描述

适用于全局 - 模型适用于局部 - 模式（pattern）

1.2 机器学习理论

PAC（Probably Approximately Correct 概率近似正确模型）
$y|\leq \epsilon )\geq 1- \delta$

建立一个模型，对于数据 $x$ 样本得到一个模型 $f$ ，那么模型 $f$ 会对 $x$ 进行一个判断，即 $f (x)$ ，我们希望这个模型判断特别准，即逼近真实结果 $y$ 。那么可以表达为 $y|\leq \epsilon$ ，即它们俩的差别小于一个很小的数。希望能得到这样一个模型 $f$ ，但并不是每次都能得到，所以希望能以很高的概率去得到它，很高的概率意味着 $y|\leq \epsilon )\geq 1- \delta$ ，如果 $\delta$ 非常小，那么获取到这个模型的概率就非常高。
为什么不追求该模型一定是准的，即 $∣ f (x) - y ∣ = 0$ ，且一定能获取到该模型？
机器学习通常解决的问题具有高度的不确定性、高度的复杂性，甚至不知道怎么去做它。当我们的知识已经不能精确的给我结果的时候，我从数据里去分析，希望能从数据中得到答案。
$P ? = NP$
P问题：在多项式时间内，能找到该问题的解。
NP问题：在多项式时间内，给一个解，能判断它是不是解。
如果 $∣ f (x) - y ∣ = 0$ ， $P = 1$ ，那么意味着每次都能给到最佳答案，那么即证明了 $P = NP$

1.3 基本术语

在这里插入图片描述
非监督学习：拿到的数据中，没有希望结果，聚类、密度估计
监督学习：预测内容、分类回归

1.4 归纳偏好

机器学习算法学习过程中对某种类型假设的偏好
在这里插入图片描述
一般原则：奥卡姆剃刀（若非必要，勿增实体）
学习算法的归纳偏好是否与问题本身匹配，大多数时候直接决定了算法能否取得好的性能！

1.5 NFL定理

NFL定理：一个算法 $a$ 若在某些问题比领一个算法 $b$ 好，必存在另一些问题 $b$ 比 $a$ 好。

NFL定理的重要前提：所有“问题”出现的机会相同、或所有问题同等重要
实际情形并非如此，我们通常只关注自己正在试图解决的问题
脱离具体问题，空泛地谈论“什么学习算法更好”毫无意义！
最优方案往往来自：按需设计、度身定制

2.1 泛化能力

泛化能力强，能很好地适用于 unseen instance

2.2 过拟合和欠拟合

泛化误差：在“未来”样本上的误差
经验误差：在训练集上的误差，亦称“训练误差”
在这里插入图片描述
过拟合（over fitting），所有的算法都是在缓解过拟合，在学习具体算法时需要关注该算法靠什么去缓解过拟合，以及缓解过拟合的策略在什么情况下会失效，明白以上两点便把握了该算法应该在什么时候用。

2.3 三大问题

三个关键问题：
（1）如何获得测试结果评估方法
（2）如何评估性能优劣性能度量
（3）如何判断实质差别比较检验

2.4 评估方法

关键：怎么获得“测试集”？
测试集应该与训练集"互斥"

常见方法：
（1）留出法（hold-out）
在这里插入图片描述

例如训练一个100条数据的数据集，训练出的模型称为 $M_{100}$ ，它的性能判断 $Err_{100}$ ，但是 $Err_{100}$ 是无法得到的，因此我们划分出80条数据集进行训练，得到模型 $M_{80}$ ，则用剩下的20条数据进行测试得到 $Err_{80}$ ，使用 $Err_{80}$ 去近似 $Err_{100}$ 。但是如果测试集使用的数据过多，那么 $M_{80}$ 已经不是 $M_{100}$ 模型了，随着训练集的减少，该近似效果就会变差，同时又希望测试集更多，才会使 $Err_{80}$ 的测试结果更准确。因此大部分情况下都是使用经验值20%去做测试。在通过抽取的训练集训练出模型后，通过性能判断 $Err_{80}$ 选择最终的模型，此时并不是把 $M_{80}$ 作为最终的模型，而是使用所有数据集训练得到 $M_{100}$ .