机器学习复习题

news2024/11/18 14:00:11

1 单选题

  1. ID3算法、C4.5算法、CART算法都是( )研究方向的算法。
    A . 决策树 B. 随机森林
    C. 人工神经网络 D. 贝叶斯学习

参考答案:A

  1. ( )作为机器学习重要算法之一,是一种利用多个树分类器进行分类和预测的方法。
    A . 决策树 B. 随机森林
    C. 人工神经网络 D. 贝叶斯学习

参考答案:B

  1. ()是一种具有非线性适应性信息处理能力的算法,可克服传统人工智能方法对模式识别、语音识别、非结构化信息处理方面的缺陷。
    A . 决策树 B. 随机森林
    C. 人工神经网络 D. 贝叶斯学习

参考答案:C

  1. ()是机器学习较早的研究方向,其源于英国数学家托马斯.贝叶斯在1763年发表的一篇论文中提到的贝叶斯定理。
    A . 决策树 B. 随机森林
    C. 人工神经网络 D. 贝叶斯学习

参考答案:D

  1. 基于学习策略进行分类,机器学习可分为( )。
    A. 模拟人脑的机器学习和采用数学方法的机器学习
    B. 归纳学习、演绎学习、类比学习、分析学习
    C. 监督学习、无监督学习、强化学习
    D. 结构化学习、非结构化学习

参考答案:A

  1. 机器学习按学习方法大致可分为( )。
    A. 模拟人脑的机器学习和采用数学方法的机器学习
    B. 归纳学习、演绎学习、类比学习、分析学习
    C. 监督学习、无监督学习、强化学习
    D. 结构化学习、非结构化学习

参考答案:B

  1. 机器学习按学习方式大致可分为( )。
    A. 模拟人脑的机器学习和采用数学方法的机器学习
    B. 归纳学习、演绎学习、类比学习、分析学习
    C. 监督学习、无监督学习、强化学习
    D. 结构化学习、非结构化学习

参考答案:C

  1. 机器学习按数据形式大致可分为( )。
    A. 模拟人脑的机器学习和采用数学方法的机器学习
    B. 归纳学习、演绎学习、类比学习、分析学习
    C. 监督学习、无监督学习、强化学习
    D. 结构化学习、非结构化学习

参考答案:D

  1. 机器学习的实质是( )。
    A. 根据现有数据,寻找输入数据和输出数据的映射关系/函数
    B. 建立数据模型
    C. 衡量输入数据和输出数据的映射关系/函数的好坏
    D. 挑出输入数据和输出数据的最佳映射关系/函数

参考答案: A

  1. 越复杂的模型,在training data set表现出越好的误差性能,但在testing data set中并不总是表现出好的误差性能,这种现象被称为( )?
    A. 过拟合
    B. 泛化性能
    C. 欠拟合
    D. 泛化能力

参考答案: A

  1. K近邻算法是( )。
    A.有监督学习
    B.无监督学习
    C.半监督学习
    D.自主学习

参考答案: A

  1. 在数据预处理阶段,我们常常对数值特征进行归一化或标准化(standardization, normalization)处理。这种处理方式理论上不会对下列哪个模型产生很大影响?()
    A. k k k-Means
    B. k k k-NN
    C. 决策树

参考答案:C

分析: k k k-Means和 k k k-NN都需要使用距离。而决策树对于数值特征,只在乎其大小排序,而非绝对大小。不管是标准化或者归一化,都不会影响数值之间的相对大小。关于决策树如何对数值特征进行划分。

  1. 下面哪个情形不适合作为 k k k-Means迭代终止的条件?
    A. 前后两次迭代中,每个聚类中的成员不变
    B. 前后两次迭代中,每个聚类中样本的个数不变
    C. 前后两次迭代中,每个聚类的中心点不变

参考答案:B

分析:A和C是等价的,因为中心点是聚类中成员各坐标的均值

  1. 关于欠拟合(under-fitting),下面哪个说法是正确的?
    A. 训练误差较大,测试误差较小
    B. 训练误差较小,测试误差较大
    C. 训练误差较大,测试误差较大

参考答案:C

当欠拟合发生时,模型还没有充分学习训练集中基本有效信息,导致训练误差太大。测试误差也会较大,因为测试集中的基本信息(分布)是与训练集相一致的。

  1. 关于集成学习(ensemble learning),下面说法正确的是:
    A. 单个模型都是使用同一算法
    B. 在集成学习中,使用“平均权重”会好于使用“投票”
    C. 单个模型之间有低相关性

参考答案:C

  1. 以下说法哪些是正确的?
    A. 在使用 k k k-NN算法时,k通常取奇数
    B. k k k-NN是有监督学习算法
    C.在使用 k k k-NN算法时, k k k取值越大,模型越容易过拟合
    D. k k k-NN和 k k k-Means都是无监督学习算法

参考答案:B

  1. (单选题)不属于神经网络常用学习算法的是( )。
    A. 监督学习
    B. 增强学习
    C. 观察与发现学习
    D. 无监督学习

参考答案: C

  1. (单选题)
    ( ) 是一门用计算机模拟或实现人类视觉功能的新兴学科,其主要研究目标是使计算机具有通过二维图像认知三维环境信息的能力。
    A. 机器视觉
    B. 语音识别
    C. 机器翻译
    D. 机器学习

参考答案: A

  1. (单选题)在图灵测试中,如果有超过( )的测试者不能分清屏幕后的对话者是人还是机器,就可以说这台计算机通过了测试并具备人工智能。
    A. 30%
    B. 40%
    C. 50%
    D. 60%

参考答案: A

  1. (单选题)知识图谱可视为包含多种关系的图。在图中,每个节点是一个实体(如人名、地名、事件和活动等),任意两个节点之间的边表示这两个节点之间存在的关系。下面对知识图谱的描述,哪一句话的描述不正确( )
    A. 知识图谱中一条边可以用一个三元组来表示
    B. 知识图谱中一条边连接了两个节点,可以用来表示这两个节点存在某一关系
    C. 知识图谱中两个节点之间仅能存在一条边
    D. 知识图谱中的节点可以是实体或概念

参考答案:C

  1. 以下哪个步骤不是机器学习所需的预处理工作( )
    A. 数值属性的标准化
    B. 变量相关性分析
    C. 异常值分析
    D. 与用户讨论分析需求

参考答案: D

  1. 数据预处理对机器学习是很重要的,下面说法正确的是( )
    A. 数据预处理的效果直接决定了机器学习的结果质量
    B. 数据噪声对神经网络的训练没什么影响
    C. 对于有问题的数据都直接删除即可
    D. 预处理不需要花费大量的时间

参考答案: A

  1. 谷歌新闻每天收集非常多的新闻,并运用( )方法再将这些新闻分组,组成若干类有关联的新闻。于是,搜索时同一组新闻事件往往隶属同一主题的,所以显示到一起。
    A. 回归
    B. 分类
    C. 聚类
    D. 关联规则

参考答案: C

  1. 回归问题和分类问题的区别是什么?
    A. 回归问题与分类问题在输入属性值上要求不同
    B. 回归问题有标签,分类问题没有
    C. 回归问题输出值是连续的,分类问题输出值是离散的
    D. 回归问题输出值是离散的,分类问题输出值是连续的

参考答案: C

  1. 有关数据质量不正确的说法是( )
    A. 错误的数据将可能产生有害于决策的结果
    B. 因为数据量很大,所以数据质量差一些也对机器学习没多大影响
    C. 数据预处理的重要目的是提高机器学习结果的质量
    D. 从业务系统提取的脏数据需要预处理才能进行建模工作

参考答案: B

  1. 假设你正在做天气预报,并使用算法预测明天气温(摄氏度/华氏度),你会把这当作一个分类问题还是一个回归问题?
    A. 分类
    B. 回归

参考答案: B

  1. 假设你在做股市预测。你想预测某家公司是否会在未来7天内宣布破产(通过对之前面临破产风险的类似公司的数据进行训练)。你会把这当作一个分类问题还是一个回归问题?
    A. 分类
    B. 回归

参考答案: A

  1. 下列哪一个图片的假设与训练集过拟合?
    A.
    在这里插入图片描述
    B.
    在这里插入图片描述
    C.
    Image Name
    D.
    在这里插入图片描述
    参考答案: A

  2. 下列哪一个图片的假设与训练集欠拟合?
    A.
    在这里插入图片描述
    B.
    在这里插入图片描述
    C.
    在这里插入图片描述
    D.
    在这里插入图片描述
    参考答案: A

  3. 给定一定数量的红细胞、白细胞图像以及它们对应的标签,设计出一个红、白细胞分类器,这属于什么问题?
    A. 有监督学习
    B. 半监督学习
    C. 无监督学习
    D. 其他答案都正确

参考答案: A

  1. 已知变量x与y正相关,且由观测数据算得x的样本平均值为3,y的样本平均值为3.5,则由该观测数据算得的线性回归方程可能是( )。
    A. y=0.4x+2.3
    B. y=2x-2.4
    C. y=-2x+9.5
    D. y=-0.3x+4.4

参考答案: A

  1. ( )属于机器学习中的回归问题。
    A. 根据房屋特性预测房价
    B. 预测短信是否为垃圾短信
    C. 识别车牌
    D. 机场安检人脸识别

参考答案: A

  1. 以下哪个选项是尚未实现的人工智能技术?( )
    A. 无人驾驶
    B. 人工智能下围棋
    C. 智能导航
    D. 人脑芯片

参考答案: D

  1. 以下哪个选项是已经实现的人工智能技术?( )
    A. 有情感的机器人
    B. 通过图灵测试的语音应答机器人
    C. 自我进化的机器人
    D. 智能导航

参考答案: D

  1. 当前的人工智能处于( )阶段。
    A. 弱人工智能
    B. 强人工智能
    C. 超人工智能
    D. 非人工智能

参考答案: A

  1. 若得到如下一颗决策树,则属性值为(色泽 = 乌黑,根蒂 = 稍蜷,敲声 = 浊响,纹理 = 清晰,脐部 = 稍凹,触感 = 硬滑)的西瓜应判别为()
    A. 好瓜
    B. 坏瓜
    C. 好瓜坏瓜都行
    D. 无法判断
    在这里插入图片描述

参考答案: A

  1. 若神经网络结构中输入层有a个神经元,紧跟其后的隐藏层有b个神经元,则从输入层到该隐藏层的权重个数是( )
    A. a + b
    B. a - b
    C. a * b
    D. a/b

参考答案: C

  1. 在聚类中,样本数据()
    A. 有标签信息
    B. 没有标签信息
    C. 标签信息可有可无
    D. 不同的聚类情况不一样

参考答案: B

  1. 聚类试图将样本划分为若干个不相交的子集,每个子集称为( )
    A. 类
    B. 树
    C. 簇
    D. 点

参考答案: C

  1. 根据下图,查准率的定义是( )
    A. P = T P T P + F N P = \frac{TP}{TP + FN} P=TP+FNTP
    B. P = T P T N + F N P = \frac{TP}{TN + FN} P=TN+FNTP
    C. P = T P T P + F P P = \frac{TP}{TP + FP} P=TP+FPTP
    D. P = T P T P + T N P = \frac{TP}{TP + TN} P=TP+TNTP
    在这里插入图片描述
    参考答案: C

分析: T P TP TP指 “预测为正(Positive), 预测正确(True)” (可以这样记忆:第一位表示该预测是否正确,第二位表示该预测结果为正还是负) , 于是,我们可以这样理解查准率 P = T P T P + F P P = \frac{TP}{TP + FP} P=TP+FPTP : 所有预测为正例的样本中,预测准确的比例;召回率 R = T P T P + T N R = \frac{TP}{TP + TN} R=TP+TNTP所有预测准确的样本中,正例所占的比例

2 多选题

  1. 下面属于训练集(Training data set)和测试集(Testing data set)区别表述的是
    A. Testing data set用于测试寻找到的函数的效果
    B. Training data set用于寻找函数
    C. Training data set用于挑选模型
    D. Training data set用于构建模型

参考答案: ABCD

  1. 机器学习的方法由( )等几个要素构成。
    A. 损失函数
    B. 优化算法
    C. 模型
    D. 模型评估指标

参考答案: ABCD

  1. 下列哪些学习问题不属于监督学习?( )
    A. 聚类
    B. 回归
    C. 分类
    D. 降维

参考答案: AD

  1. 下面的一些问题最好使用有监督的学习算法来解决,而其他问题则应该使用无监督的学习算法来解决。以下哪一项你会使用监督学习?(选择所有适用的选项)在每种情况下,假设有适当的数据集可供算法学习。
    A. 根据一个人的基因(DNA)数据,预测他/她的未来10年患糖尿病的几率
    B. 根据心脏病患者的大量医疗记录数据集,尝试了解是否有多种类型的心脏病患者群,我们可以为其量身定制不同的治疗方案
    C. 让计算机检查一段音频,并对该音频中是否有人声(即人声歌唱)或是否只有乐器(而没有人声)进行分类
    D. 给出1000名医疗患者对实验药物的反应(如治疗效果、副作用等)的数据,发现患者对药物的反应属于哪种类别或“类型”

参考答案: AD

  1. 当数据集中样本类别不均衡时,常采用哪些方法来解决?()
    A. 降采样
    B. 升采样
    C. 人造数据
    D. 更换分类算法
    E. 以上都不是。

参考答案: ACD

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/852397.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【交换排序】冒泡排序 与 快速排序

交换排序基本思想: 所谓交换,就是根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置,交换排序的特点是:将键值较大的记录向序列的尾部移动,键值较小的记录向序列的前部移动。 目录 1.冒泡排序 2.快…

Day 76:通用BP神经网络 (3. 综合测试)

1 代码: package dl;import java.util.Arrays;/*** Full ANN with a number of layers.** author Fan Min minfanphd163.com.*/ public class FullAnn extends GeneralAnn {/*** The layers.*/AnnLayer[] layers;/*********************** The first constructor.*…

Python爬虫——selenium的安装和基本使用

1.什么是selenium? selenium是一个用于web应用程序测试的工具selenium测试直接运行在浏览器中,就像真正的用户在操作一样支持通过各种driver(FrifoxDriver,ItenrentExploreDriver,OperaDriver,ChromeDrive…

【linux开发基础知识】

基础--图形界面 基础--终端 基础-用户/组 基础-目录 基础-文件 Shell-基础 Shell-参数 Shell-if Shell-while/for Shell-until/case Shell-函数 Shell-正则表达式 Shell-常用命令 开发-svn 开发-编辑(vim) 开发-编译 开发-调试 开发-部署 建议 ● http://linux.vbir…

海外应用商店关键词优化之如何提高应用可见度

应用商店关键词优化是确保用户可以在Google Play和Apple应用商店中找到我们应用的重要一步。我们需要选择正确的关键词,将它们放在正确的位置,并合并一系列不同的关键词,同时确保拥有良好的转化率。 1、了解当前的元数据是关键字选择的第一步…

selenium环境搭建

文章目录 1、下载谷歌浏览器2、下载谷歌驱动 1、下载谷歌浏览器 浏览器下载完成后,在任务管理器中禁止浏览器的自动更新。因为驱动版本必须和浏览器一致,如果浏览器更新了,驱动就用不起了。 2、下载谷歌驱动 谷歌驱动需要和谷歌浏览器版本…

Eigen在QT中的配置

Eigen简介 Eigen支持包括固定大小、任意大小的所有矩阵操作,甚至是稀疏矩阵;支持所有标准的数值类型,并且可以扩展为自定义的数值类型;支持多种矩阵分解及其几何特征的求解;它不支持的模块生态系统提供了许多专门的功能…

浏览器自动访问打开网址的软件小工具模拟测试

用微软框架写了个浏览器自动访问和打开网址的工具,进行测试模拟: 1、获取链接方式,可通过API接口返回JSON链接格式,也可以集成到文档手动录入链接由软件进行循环运行。 2、配置一些参数:数量、次数、时间间隔等 看下演…

常用dbGet命令

我正在「拾陆楼」和朋友们讨论有趣的话题,你⼀起来吧?拾陆楼知识星球入口 Examples of dbGet Command 1. Find the top name of the design dbGet top.name 2. Get all the attributes of a selected object dbGet selected.?? If you press tab key…

华为OD机试真题 Java 实现【判断字符串子序列】【2023 B卷 100分】,倒序遍历

目录 专栏导读一、题目描述二、输入描述三、输出描述四、解题思路五、Java算法源码六、效果展示1、输入2、输出3、说明 华为OD机试 2023B卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试(JAVA)真题(A卷B卷&#…

智汇云舟入选IDC《中国智慧城市数字孪生技术评估,2023》报告

8月7日,国际数据公司(IDC)发布了《中国智慧城市数字孪生技术评估,2023》报告。智汇云舟凭借在数字孪生领域的创新技术与产品,入选《2023中国数字孪生城市技术提供商图谱》。 报告通过公开征集的形式进行申报&am…

PCkit3如何刷固件

PCkit3如何刷固件 一般在MAPLAB安装时,在安装路径下面都会自带所有烧写器的固件包,找到对应的固件包利用MPLAB进行刷新就行了,具体步骤如下: 首先打开MPLAB软件,然后Programmer->Settings…然后点击configuration …

线程控制+线程tid+线程局部存储+线程私有栈

线程控制函数 今天学习的都是linux线程库中的函数。<pthread.h> pthread_creat()创建线程 int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg); 参数 thread:返回线程IDattr:设置线程的属性&…

eclipse怎么导入web项目?看这篇为你解决!

引言【注意】 在导入别人写好或者自己写的web项目要确定以下几点&#xff0c;防止导入的时候出现错误。 确认eclipse的版本&#xff1b;如果web项目是21版的eclipse写的&#xff0c;而你要导入的的eclipse是17版的会出现错误&#xff0c;导入了也没用&#xff0c;运行不出结果。…

Huggingface使用

文章目录 前置安装Huggingface介绍NLP模块分类transformer流程模块使用详细讲解tokennizermodeldatasetsTrainer Huggingface使用网页直接体验API调用本地调用(pipline)本地调用&#xff08;非pipline&#xff09; 前置安装 anaconda安装 使用conda创建一个新环境并安装pytorc…

Qt应用开发(基础篇)——LCD数值类 QLCDNumber

一、前言 QLCDNumber类继承于QFrame&#xff0c;QFrame继承于QWidget&#xff0c;是Qt的一个基础小部件。 QLCDNumber用来显示一个带有类似lcd数字的数字&#xff0c;适用于信号灯、跑步机、体温计、时钟、电表、水表、血压计等仪器类产品的数值显示。 QLCDNumber可以显示十进制…

关于将预留单中增强字段带入物料凭证和会计凭证中

1、业务需求 预留中自定义文本字段“大项修”。根据预留创建物料凭证时&#xff0c;将该字段带入到物料凭证中&#xff0c;类似标准字段“项目文本”。并在物料凭证自动产生会计凭证后&#xff0c;将该字段带入到会计凭证行项目中。 其中需要解决以上三张凭证对该字段的界面显…

c/c++函数可变参数的实现

c语言&#xff0c;利用<stdarg.h> 里面的 typedef char* va_list; void va_start ( va_list ap, prev_param ); /* ANSI version */ type va_arg ( va_list ap, type ); void va_end ( va_list ap );#include <stdio.h> #include <stdarg.h> double Sum(int…

火爆全球的AI艺术二维码到底是怎么做的?

如今&#xff0c;二维码扫描已经成为一种与呼吸一样自然的本能动作。支付、购物、点餐、订票、浏览网页&#xff0c;几乎所有事情都可以通过扫描二维码来完成。你是否可以想象到下面是二维码&#xff1f;AI生成的艺术二维码使二维码瞬间变得高逼格。这些艺术二维码极具吸引力&a…

如何制定项目计划?甘特图告诉你

最近被领导指派负责一个新的项目&#xff0c;我想把项目做成功&#xff0c;给老板留下深刻的印象&#xff0c;同时也给自己的职业生涯添上浓墨重彩的一笔。 但是&#xff0c;项目管理流程很复杂&#xff0c;项目本身也不好做。在收集了与该项目有关的所有信息&#xff0c;并将…