机器学习复习
1 - 在机器学习的背景下,什么是诊断(diagnostic)?
A. 这指的是衡量一个学习算法在测试集(算法没有被训练过的数据)上表现如何的过程
B. 迅速尝试尽可能多的不同方法来改进算法,从而看看什么方法有效
C. 机器学习在医疗领域的应用,目的是诊断病人的病情
D.一个测试,你运行这个测试是为了深入了解什么是/不是学习算法的工作
答案:D
2 - 一个算法在训练集上做得越好,它对新数据的归纳就越好,这一点始终是正确的。
A. 错
B. 对
答案:错
3 - 对于一个分类任务,假设你使用三个不同的神经网络架构训练三个不同的模型。你用哪些数据来评估这三个模型,以选择最佳模型?
A. 交叉验证集
B. 训练集
C. 测试集
D. 所有数据
答案:A
4 - 如果模型在交叉验证集上的误差比训练误差高许多,这表明模型具有:
A. 低方差
B. 低偏差
C. 高方差
D. 高偏差
**答案:C **
5 - 哪一个是确定你的模型是否有高偏差(对训练数据的拟合不足)的最佳方法?
A. 看交叉验证误差与性能基线水平相比是否很高
B. 看训练误差是否很高(超过15%左右)
C. 将训练误差与交叉验证误差进行比较
D. 将训练误差与性能的基线水平相比较
**答案:D **
6 - 你发现你的算法有很高的偏差。以下哪项看起来是改善算法性能的好选择?(多选)
A. 收集额外的特征或增加多项式特征
B. 降低正则化参数 λ (lambda)
C. 收集更多的训练实例
D. 从训练集中删除例子
**答案:AB **
7 - 你发现你的算法的训练误差为2%,交叉验证误差为20%(远高于训练误差)。
根据你对该算法是否存在高偏差或高方差的认识,哪些看起来是改善该算法性能的好选择?(多选)
A. 减少正则化参数 λ
B. 增加正则化参数 λ
C. 减少训练集的大小
D. 收集更多的训练数据
**答案:BD **
8 - 以下哪一种是误差分析的方法?
A. 手动检查模型错误分类的训练样本,以确定共同特征和趋势
B. 收集额外的训练数据,以帮助算法做得更好
C. 计算测试误差 \(J_{test}\)
D. 计算训练误差 \(J_{train}\)
答案:A
9 - 我们有时会取一个现有的训练实例,并对其进行修改(例如,旋转图像),以创建一个具有相同标签的新实例。这个过程叫什么?
A. 偏差/方差分析
B. 机器学习诊断
C. 数据增强
D. 误差分析
答案:C
10 - 进行迁移学习的两种可能方式是什么?(多选)
A. 下载一个预先训练好的模型,并将其用于预测,而不对其进行修改或重新训练
B. 给定一个数据集,预先训练,然后在同一数据集上进一步微调一个神经网络
C. 你可以选择训练模型的所有参数,包括输出层,以及早期层
D. 你可以选择只训练输出层的参数,而让模型的其他参数固定
答案:CD