机器学习期末

news2025/4/21 21:57:43

选择题

  1. 以下哪项不是机器学习的类型?
    A. 监督学习
    B.无监督学习
    C.半监督学习
    D.全监督学习

D

  1. 哪一个是机器学习的合理定义?
    A、机器学习是计算机编程的科学
    B、机器学习从标记的数据中学习
    C、机器学习是允许机器人智能行动的领域
    D、机器学习能使计算机能够在没有明确编程的情况下学习

D

  1. 以下哪项是计算机视觉中用于自动图片标注的核心技术?
    A. 决策树
    B. 卷积神经网络(CNN)
    C. 支持向量机(SVM)
    D. 随机森林

B。
CNN能自动提取图像特征,是计算机视觉中的核心技术;
支持向量机在许多分类任务中很有效;

  1. 下列不属于机器学习的主要流派的是

A.符号主义
B.联想主义(联结主义)
C.进化主义
D.行为类推主义

B。联结主义(或称连接主义)是指神经网络等方法,它强调通过神经元的连接模拟学习过程。这个术语通常用于神经网络或深度学习,并不是机器学习的一个独立流派,而是属于其中的一部分。

  1. 以下哪种损失函数通常用于回归任务?
    A) 交叉熵损失
    B) 合页损失(Hinge Loss)
    C) 均方误差(MSE)
    D) KL散度

C。A) 交叉熵损失:交叉熵损失函数通常用于分类任务,尤其是用于衡量分类任务中预测的概率分布与真实标签之间的差异,因此不适用于回归任务。
B) 合页损失(Hinge loss):合页损失函数通常用于支持向量机(SVM)中的分类任务,而不是回归任务。它通过计算预测结果与正确标签之间的“合页”距离来进行优化。
C) 均方误差损失(MSE):均方误差(MSE)是回归任务中最常用的损失函数,它通过计算预测值与真实值之间的平方差来度量模型的表现。在回归问题中,目标是最小化这个损失函数。
D) KL散度损失:Kullback-Leibler散度(KL散度)用于衡量两个概率分布之间的差异,虽然它在一些生成模型(如变分自编码器)中会使用,但它通常不用于回归任务。

  1. 关于机器学习中偏差(Bias)与方差(Variance)的权衡,以下哪种说法​​错误​​?
    A. 增加模型复杂度通常会降低偏差,但可能增加方差
    B. 集成方法(如Bagging)通过降低方差来提升泛化性能
    C. 正则化(如L2正则化)通过增加偏差来减少方差
    D. 高偏差问题表明模型对训练数据的拟合不足,应减少正则化强度

D
A. 增加模型复杂度通常会降低偏差,但可能增加方差:这个选项是正确的。通常,随着模型复杂度的增加(例如增加参数或采用更复杂的模型),模型可以更好地拟合训练数据,从而降低偏差。然而,模型复杂度增加也可能导致过拟合,使模型在训练数据上表现很好,但在测试数据上表现较差,导致方差增大。
B. 集成方法(如Bagging)通过降低方差来提升泛化性能:这个选项是正确的。集成方法(如Bagging)通过组合多个弱模型来降低方差,尤其是在数据噪声较大的情况下。Bagging通过训练多个独立的模型,并将它们的预测结果结合起来,从而减少模型的方差,提升泛化能力。
C. 正则化(如L2正则化)通过增加偏差来减少方差:这个选项是正确的。正则化(例如L2正则化)通过对模型的复杂度进行约束,限制模型的自由度,防止过拟合。虽然正则化可能会增加偏差,但它通常能显著减少方差,从而改善模型的泛化能力。
D. 高偏差问题表明模型对训练数据的拟合不足,应减少正则化强度:这个选项是错误的。高偏差通常意味着模型过于简单,无法有效捕捉数据中的复杂模式(即欠拟合)。在这种情况下,应该 增加模型复杂度 或 减少正则化强度,以便模型能够更好地拟合训练数据。然而,如果模型已经很复杂,过度减少正则化可能会导致方差增加,并引发过拟合问题。因此,问题的描述中,“应减少正则化强度”在特定情况下可能不适用,尤其当模型复杂度已经足够时,反而需要适度增加正则化。
在这里插入图片描述

  1. 混淆矩阵的精度表示公式为:
    A. TP/(TP+FN)
    B. TP/(TP+FP)
    C. TN/(TN+FN)
    D. TN/(TN+TP)

B.
精度表示的是模型预测为正的实例中,实际上为正的比例,计算公式为 TP/(TP+FP)
A. TP / (TP + FN):这个公式表示的是召回率(Recall),也叫敏感度,即模型正确识别的正类实例占所有真实正类实例的比例。
C. TN / (TN + FN):这个公式表示的是特异度(Specificity),也叫真负率,即模型正确识别的负类实例占所有真实负类实例的比例。

  1. 以下哪种数据类型允许进行算术运算,但不具有绝对零点?
    A) 名义变量
    B) 序数变量
    C) 间隔变量
    D) 比率变量

C

  1. 以下哪项是机器学习模型的过拟合现象?
    A.模型在训练数据上表现良好,但在测试数据表现不佳
    B.模型在训练数据上表现不佳,但在测试数据表现良好
    C.模型在训练数据和测试数据表现良好
    D.模型在训练数据和测试数据表现不佳

A

  1. 在机器学习中,以下哪种算法属于监督学习?
    A.K-Means 聚类
    B.主成分分析(PCA)
    C.支持向量机(SVM)
    D.自编码器

C
监督学习需要利用带有标签的数据进行训练,ACD都是无监督学习
常见的监督学习种类:

  • 支持向量机(SVM):SVM 是一种用于二分类和多分类任务的强大算法。它通过找到一个最优的超平面来将不同类别的数据分隔开。SVM在高维空间中表现良好,并且可以应用于线性和非线性分类问题。
  • 决策树(Decision Trees):决策树是一种基于树结构的分类和回归算法。它通过在特征上进行递归的二分决策来进行分类或预测。决策树易于理解和解释,并且对于数据的处理具有良好的适应性。
  • 逻辑回归(Logistic Regression):逻辑回归是一种广泛应用于二分类问题的线性模型。尽管名字中带有"回归",但它主要用于分类任务。逻辑回归输出预测的概率,并使用逻辑函数将连续输出映射到[0, 1]的范围内。
  • K近邻算法(K-Nearest Neighbors,KNN):KNN 是一种基于实例的学习方法。它根据距离度量来对新样本进行分类或回归预测。KNN使用最接近的K个训练样本的标签来决定新样本的类别。
  1. 以下关于机器学习算法应用场景的描述中,错误的是:
    A. 朴素贝叶斯算法常用于文本分类任务中的垃圾邮件过滤
    B. 循环神经网络(RNN)特别适合处理时间序列数据,如股票价格预测
    C. 聚类算法(如 K-Means)需要标注好的训练样本才能划分数据类别
    D. 强化学习在自动驾驶领域中通过试错机制优化决策策略

C
聚类算法(如K-Means)属于​​无监督学习​​,其核心特点是不依赖标注数据,而是通过数据内在结构(如距离、密度)自动划分类别。
标注数据是监督学习的要求。

  1. 哪个不是测量中心倾向的方法
    A均值。B中位数。C众数。D方差

D
中心倾向指标用于描述数据集的“中心位置”或典型值,方差​​属于​​离散程度指标​​,衡量数据分布的波动性或分散程度(如数据偏离均值的程度),而非中心位置。

  1. 在机器学习中,当出现过拟合(Overfitting)现象时,以下哪种方法不能用来解决这个问题?
    A. 增加训练数据
    B. 增加模型复杂度
    C. 使用数据增强(如翻转、旋转、添加噪声)
    D. 使用更强的正则化方法(如 dropout、drop - connect、L₂)

B
增加模型复杂度通常会降低偏差,但可能增加方差

  1. 支持向量机算法属于 ()
    A. 决策树学习
    B. 统计学习
    C. 集成学习
    D.记忆学习

B

  1. 以下属于解决模型欠拟合的方法是?
    A、增加训练数据量
    B、对模型进行裁剪
    C、增加训练过程的迭代次数
    D、正则化

C.

对于 B,增加训练数据量​​,常用于解决过拟合(通过数据多样性增强泛化能力),而非改善欠拟合。若模型复杂度不足,增加数据可能无济于事。

  1. 在边缘检测中,以下哪种算子对噪声最敏感,且未进行高斯平滑处理?

A. Sobel 算子
B. Prewitt 算子
C. Canny 算子
D. Laplacian 算子

D

  1. 在卷积神经网络(CNN)中,关于池化层(Pooling Layer)的作用,以下哪项描述是错误的?

A. 池化层通过降采样减少特征图的空间尺寸,从而降低计算复杂度。
B. 最大池化(Max Pooling)能够保留局部区域的显著特征,增强模型的平移不变性。
C. 平均池化(Average Pooling)通过计算局部区域的平均值,有助于抑制噪声影响。
D. 池化层通过反向传播自动学习最优的池化核参数,类似于卷积层的权重更新。

D
池化层(如最大池化、平均池化)是​​无参数操作​​,其核内计算(如取最大值/平均值)是预定义的,不涉及权重学习。

  1. 在深度神经网络的训练过程中,若遇到梯度消失问题,下面哪种方案最能有效缓解这一问题?
    A. 继续使用 Sigmoid 激活函数
    B. 提高学习率以加速梯度传递
    C. 将激活函数替换为 ReLU 或其变体(如 Leaky ReLU)
    D. 增加网络层数,以强化模型的特征提取能力

C

  1. 假设有一个钓鱼式攻击或恶意软件分类模型,其中钓鱼式攻击网站和恶意软件网站属于标记为 1(true)的类别,无害网站属于标记为 0(false)的类别。此模型误将合法网站归类为恶意软件。这叫什么?
    A、假负例
    B、真正例
    C、真负例
    D、假正例

D
注意这里将钓鱼网站定义为正例。

  1. 以下哪一项不是单神经元模型的组成部分?
    A. 输入特征x
    B. 激活函数g
    C. 损失函数L
    D. 输入特征x的平方

B

  1. 在机器学习中,特征归一化的目的是什么

A. 增加模型的复杂度
B. 加快模型的训练
C. 使不同特征的数值范围一致
D. 减少特征之间的相关性

C

  1. 以下哪种方法可以缓解过拟合(Overfitting)?
    A. 减少训练数据量 B. 增加模型复杂度 C. 添加L2正则化 D. 删除部分特征

C
虽然正则化可能带来偏差,但能极大降低方差,缓解过拟合
此外,增加数据也能缓解过拟合

  1. 在逻辑回归中,假设函数 hθ​(x)=g(θTx) 使用的激活函数 g(z) 是:
    A. Sigmoid 函数
    B. ReLU 函数
    C. 双曲正切函数
    D. 恒等函数

A

  1. 以下关于降维说法不正确的是?
    A.降维是将训练样本从高维空间转换到低维空间
    B.降维有助于数据可视化
    C.通过降维可以更有效地挖掘有意义的数据结构
    D.降维不会对数据产生损伤

D

  1. 决策树学习的关键是?
    A.初始结点选择
    B.剪枝
    C.选择最优划分属性
    D.分枝

C

  1. 线性回归和逻辑回归属于无监督学习算法

错误
回归是监督学习的一种任务

  1. Sigmoid函数是一种通用的激活函数,现在大多数情况下都在使用

错误

  • Sigmoid 的导数在输入值较大或较小时趋近于零,导致反向传播时梯度几乎消失,深层网络难以训练。
  • Sigmoid 的输出范围是 (0,1),导致后续层的输入始终为正,可能引发参数更新时的锯齿形路径,降低收敛效率。
  • Sigmoid 涉及指数运算,计算成本高于 ​​ReLU​​ 的简单阈值操作(max(0,x))。
    ​​
    当前主流激活函数​​为 ​​ReLU 及其变体​​
  1. 贝叶斯优化(Bayesian Optimization)在超参数调优过程中不依赖任何先验假设,仅通过随机采样选择下一组评估的超参数。

错误

  1. 当出现过拟合时,验证集损失(Validation loss)会一直下降。

错误
验证损失持续下降通常表明模型仍在有效学习,而过拟合的标志是验证损失在达到最低点后明显回升

  1. 在深度神经网络中,Dropout 技术仅在训练阶段启用以减少过拟合,而在测试阶段禁用 Dropout,从而确保所有神经元都参与前向传播。

正确

  1. 在机器学习中,K近邻(KNN)算法在训练阶段不需要进行模型训练,直接存储所有训练数据即可。

正确

  1. 无监督学习不需要任何标签数据,完全依靠算法自动发现数据中的模式或结构。

错误

  1. 在机器学习任务中,如果目标是预测一个网站明天是否被DDoS攻击(是/否),那么这属于一个回归问题。

错误,这是一个分类问题(具体为二分类任务)

  1. 主成分分析(PCA)是一种数据增维方法

错误
PCA 通过正交变换将原始高维数据投影到低维空间(主成分),​​保留最大方差的方向​​,从而减少特征数量、去除冗余信息,属于典型的​​降维技术​​。

  1. 聚类只能在已有数据集上进行分簇,不具备对新数据的预测能力

正确

  1. 在神经网络中,在反向传播的向后传递过程中,从输入层开始计算误差信号(δ),然后向前传播到输出层。

错误。在神经网络中,反向传播的误差信号(δ)是从输出层开始计算,然后向后传递(即向输入层方向传播),而非从输入层开始向前传播。​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2339689.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python多任务编程:进程全面详解与实战指南

1. 进程基础概念 1.1 什么是进程? 进程(Process)是指正在执行的程序,是程序执行过程中的一次指令、数据集等的集合。简单来说,进程就是程序的一次执行过程,它是一个动态的概念。 想象你打开电脑上的音乐播放器听歌,…

【QT】 QT中的列表框-横向列表框-树状列表框-表格列表框

QT中的列表框-横向列表框-树状列表框-表格列表框 1.横向列表框(1)主要方法(2)信号(3) 示例代码1:(4) 现象:(5) 示例代码2:加载目录项在横向列表框显示(6) 现象: 2.树状列表框 QTreeWidget(1)使用思路(2)信号(3)常用的接口函数(4) 示例代码&am…

决策树:ID3,C4.5,CART树总结

树模型总结 决策树部分重点关注分叉的指标,多叉还是单叉,处理离散还是连续值,剪枝方法,以及回归还是分类 一、决策树 ID3(Iterative Dichotomiser 3) 、C4.5、CART决策树 ID3:确定分类规则判别指标、寻找能够最快速降低信息熵的方…

easyexcel使用模板填充excel坑点总结

1.单层map设置值是{属性},那使用两层map进行设置值,是不是可以使用{属性.属性},以为取出map里字段只用{属性}就可以设置值,那再加个.就可以从里边map取出对应属性,没有两层map写法 填充得到的文件打开报错 was empty (…

C# LINQ基础知识

简介 LINQ(Language Integrated Query),语言集成查询,是一系列直接将查询功能集成到 C# 语言的技术统称。使用LINQ表达式可以对数据集合进行过滤、排序、分组、聚合、串联等操作。 例子: public class Person {public int Id;public string…

GCoNet+:更强大的团队协作 Co-Salient 目标检测器 2023 GCoNet+(翻译)

摘要 摘要:本文提出了一种新颖的端到端群体协作学习网络,名为GCoNet,它能够高效(每秒250帧)且有效地识别自然场景中的共同显著目标。所提出的GCoNet通过基于以下两个关键准则挖掘一致性表示,实现了共同显著…

QT常见输入类控件及其属性

Line Edit QLineEdit用来表示单行输入框,可以输入一段文本,但是不能换行 核心属性: 核心信号 信号 说明 void cursorPositionChanged(int old,int new) 当鼠标移动时发出此型号,old为先前位置,new为新位置 void …

Few-shot medical image segmentation with high-fidelity prototypes 论文总结

题目:Few-shot medical image segmentation with high-fidelity prototypes(高精确原型) 论文:Few-shot medical image segmentation with high-fidelity prototypes - ScienceDirect 源码:https://github.com/tntek/D…

如何使用Node-RED采集西门子PLC数据通过MQTT协议实现数据交互并WEB组态显示

需求概述 本章节主要实现一个流程:使用纵横智控的EG网关通过Node-red(可视化编程)采集PLC数据,并通过MQTT协议和VISION(WEB组态)实现数据交互。 以采集西门子PLC为例,要采集的PLC的IP、端口和点…

【cocos creator 3.x】速通3d模型导入, 模型创建,阴影,材质使用,模型贴图绑定

1、右键创建平面,立方体 2、点击场景根节点,shadows勾选enabled3、点击灯光,shadow enabled勾选 4、点击模型,勾选接收阴影,投射阴影(按照需要勾选) 5、材质创建 6、选中节点,找…

驱动开发硬核特训 · Day 15:电源管理核心知识与实战解析

在嵌入式系统中,电源管理(Power Management)并不是“可选项”,而是实际部署中影响系统稳定性、功耗、安全性的重要一环。今天我们将以 Linux 电源管理框架 为基础,从理论结构、内核架构,再到典型驱动实战&a…

【零基础】基于DeepSeek-R1与Qwen2.5Max的行业洞察自动化平台

自动生成行业报告,通过调用两个不同的大模型(DeepSeek 和 Qwen),完成从行业趋势分析到结构化报告生成的全过程。 完整代码:https://mp.weixin.qq.com/s/6pHi_aIDBcJKw1U61n1uUg 🧠 1. 整体目的与功能 该脚本实现了一个名为 ReportGenerator 的类,用于: 调用 DeepSe…

C 语言联合与枚举:自定义类型的核心解析

目录 1.联合体 1.1联合体的声明与创建 1.2联合体在内存中的存储 1.3相同成员的结构体与内存比较 1.4联合体内存空间大小的计算 1.5联合体的应用 2.枚举类型 2.1枚举变量的声明 2.2枚举变量的优点 2.3枚举的使用 上篇博客中,我们通过学习了解了C语言中一种自…

基于Canal+Spring Boot+Kafka的MySQL数据变更实时监听实战指南

前期知识背景 binlog 什么是binlog 它记录了所有的DDL和DML(除 了数据查询语句)语句,以事件形式记录,还包含语句所执行的消耗的时间,MySQL 的二进制日志是事务安全型的。一般来说开启二进制日志大概会有1%的性能损耗。 binlog分类 MySQL Bi…

MySQL运维三部曲初级篇:从零开始打造稳定高效的数据库环境

文章目录 一、服务器选型——给数据库一个舒适的家二、系统调优——打造高性能跑道三、MySQL配置——让数据库火力全开四、监控体系——数据库的体检中心五、备份恢复——数据安全的最后防线六、主从复制——数据同步的艺术七、安全加固——守护数据长城 引言:从小白…

【MySQL】MySQL的基础语法及其语句的介绍

1、基础语法 mysql -h【主机名】 -u【用户名】 -p //登录MySQL exit或quit; //退出MySQL show database; //查看MySQL下的所有数据库 use 【数据库名】; //进入数据库 show tables; //查看数据库下的所有表名 *MySQL的启动和关闭 &am…

【计算机视觉】三维视觉项目 - Colmap二维图像重建三维场景

COLMAP 3D重建 项目概述项目功能项目运行方式1. 环境准备2. 编译 COLMAP3. 数据准备4. 运行 COLMAP 常见问题及解决方法1. **编译问题**2. **运行问题**3. **数据问题** 项目实战建议项目参考文献 项目概述 COLMAP 是一个开源的三维重建软件,专注于 Structure-from…

ALSA架构学习2(驱动MAX98357A)

1 前言和环境 之前其实写过两篇,一篇是讲ALSA,一篇是I2S。 ALSA架构学习1(框架)_alsa框架学习-CSDN博客 总线学习5--I2S_max98357接喇叭教程-CSDN博客 在ALSA那篇的结尾,也提了几个小练习。比如: ### 4…

数据结构*集合框架顺序表-ArrayList

集合框架 常见的集合框架 什么是顺序表 顺序表是一种线性表数据结构,它借助一组连续的存储单元来依次存储线性表中的数据元素。一般情况下采用数组存储。 在数组上完成数据的增删查改。 自定义简易版的顺序表 代码展示: public interface IArray…

VMware Workstation 保姆级 Linux(CentOS) 创建教程(附 iso)

文章目录 一、下载二、创建 一、下载 CentOS-7.9-x86_64-DVD-2009.iso 二、创建 VMware Workstation 保姆级安装教程(附安装包) VMware Workstation 保姆级安装教程(附安装包) VMware Workstation 保姆级安装教程(附安装包)