机器学习复习7

news2025/2/21 22:26:24

机器学习复习7

1 - 根据下图中绘制的决策树,如果一个动物的耳朵是软的,脸型是圆的,并且有胡须,那么这个模型会预测它是猫还是不是猫?

Image Name

A. 不是猫
B. 是猫

**答案:B **

2 - 以一棵决策树学习来对垃圾邮件和非垃圾邮件进行分类。有20个训练实例,包括10个垃圾邮件和10个非垃圾邮件。
如果算法可以从四个特征中选择,产生四个相应的分割,它将选择哪一个(即纯度最高的)?

A. 左边分割:10封邮件中有5封是垃圾邮件。右边分割:10封邮件中有5封是垃圾邮件
B. 左边分割:2封邮件中有2封是垃圾邮件。右边分割:18封邮件中有8封是垃圾邮件
C. 左边分割:8封邮件中有7封是垃圾邮件。右边分割。12封邮件中有3封是垃圾邮件
D. 左边分割:10封邮件中有10封是垃圾邮件。右边分割:10封邮件中有0封是垃圾邮件

**答案:D **

3 - 熵的定义为 \(H(p_1) = - p_1 log_2(p_1) - p_0 log_2(p_0)\),其中 \(P_1\) 是正样本的占比,\(P_0\) 是负样本的占比
在一棵决策树的某一节点上,10个例子中有6个是猫,10个例子中有4个不是猫。哪个表达式可以计算熵 \(H(p_1)H(p_1)\) 这组10只动物的熵?

Image Name

A. \((0.6) \log _{2}(0.6)+(1-0.4) \log _{2}(1-0.4)\)

B. -\((0.6) \log _{2}(0.6)-(1-0.4) \log _{2}(1-0.4)\)

C. \((0.6) \log _{2}(0.6)+(0.4) \log _{2}(0.4)\)

D. -\((0.6) \log _{2}(0.6)-(0.4) \log _{2}(0.4)\)

**答案:D **

4 - 信息增益

信息增益的定义:\(H\left(p_{1}^{\text {root }}\right)-\left(w^{\text {left }} H\left(p_{1}^{\text {left }}\right)+w^{\text {right }} H\left(p_{1}^{\text {right }}\right)\right)\)

在分裂之前,由5只猫和5只非猫组成的群体的熵是H(5/10) H(5/10)。在对某一特征进行分割后,由7只动物(其中4只是猫)组成的小组的熵为H(4/7)H(4/7)。另一组有3只动物(1只是猫),其熵为H(1/3)H(1/3)。信息增益的表达式是什么?

A. \(H(0.5)-\left(\frac{4}{7} * H(4 / 7)+\frac{4}{7} * H(1 / 3)\right)\)

B. \(H(0.5)-\left(\frac{7}{10} H(4 / 7)+\frac{3}{10} H(1 / 3)\right)\)

C. \(H(0.5)-(H(4 / 7)+H(1 / 3))\)

D. \(H(0.5)-(7 * H(4 / 7)+3 * H(1 / 3))\)

**答案:B **

5 - 独热编码

Image Name

为了表示耳朵形状的3种可能值,你可以为耳朵形状定义3个特征:尖耳朵、软耳朵、椭圆形耳朵。对于一个耳朵不尖、不软但呈椭圆形的动物,你如何用特征向量表示这一信息?

A. [0, 0, 1]
B. [1,0,0]
C. [0, 1, 0]
D. [1, 1, 0]

**答案:A **

6 - 对于一个连续值的特征(如动物的体重),数据集中有10只动物。为该特征找到最佳分割的推荐方法是什么?

Image Name

A. 选择10个例子之间的9个中点作为可能的分割点,并找到能带来最高信息增益的分割点
B. 尝试每一个间隔有规律的数值(例如,8、8.5、9、9.5、10等),并找到能带来最高信息增益的分割
C. 使用梯度下降法,找到能带来最高信息增益的分割阈值
D. 使用单次编码将特征转化为0和1的离散特征向量,然后应用我们讨论过的离散特征的算法

**答案:A **

7 - 其中哪些是决定停止分裂的常用标准?(多选)

A. 当树已经达到最大深度时
B. 当额外分裂的信息收益过大时
C. 当一个节点50%是一个类,50%是另一个类时(熵的最高值)
D. 当一个节点中的例子数量低于一个阈值时

**答案:AD **

8 - 对于随机森林,你如何建立每个单独的树,以使它们不都是彼此相同的?

Image Name

A. 对训练数据进行无替换抽样
B. 在同一训练集上多次训练该算法。这自然会产生不同的树
C. 对训练数据进行替换采样
D. 如果你要训练B个树,就在训练集的1/B上训练每个树,所以每个树都是在一个不同的例子集上训练

**答案:C **

9 - 在一项分类任务中,你要在决策树和神经网络之间做出选择,输入x是一张100x100分辨率的图像。你会选择哪个?

A. 决策树,因为输入是非结构化的,决策树通常在非结构化数据中工作得更好
B. 一个神经网络,因为输入的是非结构化的数据,而神经网络通常对非结构化的数据工作得更好
C. 神经网络,因为输入的是结构化数据,而神经网络通常在结构化数据中工作得更好
D. 决策树,因为输入的是结构化数据,而决策树通常在结构化数据中工作得更好

**答案:C **

10 - 替代抽样指的是什么?

A. 它指的是使用一个新的数据样本,我们用它来永久地覆盖(也就是替换)原始数据
B. 它指的是对训练集做一个相同的拷贝的过程
C. 绘制一个例子的序列,当挑选下一个例子时,首先从我们要挑选的集合中删除所有以前绘制的例子
D. 绘制一个例子序列,当挑选下一个例子时,首先将所有先前绘制的例子从我们正在挑选的集合中替换掉

**答案:D **

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/706238.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

spring boot启动原理分析

springboot启动类中有两个关键的地方 1.SpringBootApplication注解 2.SpringApplication.run方法 SpringBootApplication注解分析 SpringBootApplication注解由三大注解构成, SpringBootConfiguration、EnableAutoConfiguration、ComponentScan。 SpringBootCon…

Java-八股文-基础本部分<一>

Java基础部分 基础篇<一> Java基础部分 基础篇<二> Java基础部分 基础篇<三> Java基础部分 异常篇 Java基础部分 集合篇 Java基础部分 线程篇 ❤️ &#x1f9e1; &#x1f49b; &#x1f49a; &#x1f499; &#x1f49c;&#x1f5a4; &#x1f90d;…

什么是网络货运平台?

一、什么是网络货运平台&#xff1f; 网络货运平台是依托互联网平台整合配置运输资源&#xff0c;以承运人身份与托运人签订运输服务合同、承担承运人责任&#xff0c;委托实际承运人完成运输服务的物流平台。它通过互联网形式实现运输过程真实、公平、公正、合法&#xff0c…

【LeetCode】239. 滑动窗口最大值

239. 滑动窗口最大值 思路 当我们遍历数组时&#xff0c;我们需要维护一个双端队列&#xff0c;用于存储滑动窗口中的元素的索引。 队列中的元素按照降序排列&#xff0c;即「队头元素是当前滑动窗口中的最大值」。 具体的步骤如下&#xff1a; 创建一个双端队列 window&#…

Spring Boot中的Elasticsearch自动配置:原理与使用

Spring Boot中的Elasticsearch自动配置&#xff1a;原理与使用 简介 在Spring Boot中&#xff0c;Elasticsearch是非常流行的搜索引擎。为了方便开发人员使用Elasticsearch&#xff0c;Spring Boot提供了Elasticsearch自动配置功能。本文将介绍Elasticsearch自动配置的原理与…

burpsuite踩坑(一)

今天在使用burpsuite的时候&#xff0c;能抓到https或者http的包。 但是repeater模块无法使用&#xff0c;而且放行包之后&#xff0c;会出现提示。 搞了半天&#xff0c;以为是证书的问题&#xff0c;或者是burp汉化版的原因&#xff0c;还把汉化版的burp给删除了。 发现都…

【Docker】基于jib插件,实现Docker部署springboot项目

文章目录 创建springboot项目jib插件介绍使用打tar包 Docker部署springboot项目 在工作中&#xff0c;作为一名后端开发人员&#xff0c;项目部署运维的事我们可能都要同时干&#xff0c;今天想跟大家聊聊关于springboot项目使用docker部署相关操作。后期还会跟大家分享docker-…

笔记-方向导数和梯度

笔记-方向导数和梯度 目录方向导数梯度方向导数和梯度的关系 目录 方向导数 方向导数和偏导数的区别就是&#xff1a;方向不同。仅此而已。 我们常说的偏导数无非就是对x轴求偏导&#xff0c;对y求偏导。而方向导数则是对x轴与y轴之间的某一新方向求导数。 还是用一下上次的…

大模型基础之注意力机制和Transformer

【注意力机制】 核心思想&#xff1a;在decoder的每一步&#xff0c;把encoder端所有的向量提供给decoder&#xff0c;这样decoder根据当前自身状态&#xff0c;来自动选择需要使用的向量和信息. 【注意力带来的可解释性】 decoder在每次生成时可以关注到encoder端所有位置的…

Llama大模型运行的消费级硬件要求【CPU|GPU|RAM|SSD】

大型语言模型 (LLM) 是强大的工具&#xff0c;可以为各种任务和领域生成自然语言文本。 最先进的LLM之一是 LLaMA&#xff08;大型语言模型 Meta AI&#xff09;&#xff0c;这是由 Facebook 的研究部门 Meta AI 开发的一个包含 650 亿个参数的模型 要在家运行 LLaMA 模型&…

详解LeafLet中如何展示GeoServer发布的图层组

目录 前言 一、关于图层组 1、使用图层图组的好处 2、创建图层组 二、在Leaflet中展示图层组 1、新建Html模板框架 2、绑定地图map和底图设置 3、绑定图层组 总结 前言 在之前的博文中&#xff0c;曾经重点介绍如何使用LeafLet叠加Geoserver wms图层到已有底图的方法 ,…

机器学习复习6

机器学习复习 1 - 在机器学习的背景下&#xff0c;什么是诊断(diagnostic)&#xff1f; A. 这指的是衡量一个学习算法在测试集(算法没有被训练过的数据)上表现如何的过程 B. 迅速尝试尽可能多的不同方法来改进算法&#xff0c;从而看看什么方法有效 C. 机器学习在医疗领域的应用…

上手vue2的学习笔记1之了解前端三剑客

纯小白学习前端开发&#xff0c;找学习资料也花费了一些时间&#xff0c;后续配置环境&#xff0c;也走了很多弯路&#xff0c;这里梳理一下这几天的学习资料&#xff0c;做一个简单的总结。 1.初步了解vue Vue是一套用于构建用户界面的渐进式框架。与其它大型框架不同的是&a…

CountDownLatch基本使用及原理

CountDownLatch基本使用及原理 一、CountDownLatch简介二、CountDownLatch类的继承关系1. AbstractQueuedSynchronizer: 用于构建锁和同步器的框架。2. Sync: CountDownLatch的内部类&#xff0c;提供了锁的具体实现。 三、Semaphore的基本使用1. 使用场景&#xff1a;2. 代码实…

Unity3D:编辑属性

推荐&#xff1a;将 NSDT场景编辑器 加入你的3D工具链 3D工具集&#xff1a; NSDT简石数字孪生 编辑属性 属性是用于游戏对象组件和资源的设置和选项。 可在 Inspector 窗口中编辑属性。 光源组件显示了各种值和引用属性 属性分为以下主要类别&#xff1a; 引用&#xff1a;…

Scrapy框架之Docker 安装 MongoDB

目录 Docker安装 MongoDB Docker 安装 MongoDB 第一次 MongoDB基础命令 算机存储数据的概念 查看数据库 切换数据库/创建数据库 删除当前数据库 创建集合 查看集合 删除集合 数据的增加 样例 数据的更新 举例 Docker安装 MongoDB Docker Docker 是一个开源的应…

ARM fiq和irq的区别 共享内存 混合联编 6.25

day4 汇编代码初始化系统中&#xff1a; 为什么要保存cpsr&#xff1a;要把其他的状态还原 如&#xff08;N Z&#xff09; user&#xff1a;mov r0,#3cmp r0,#4... //irqmovlt r1,#5irq:mov r0,#10cmp r0,#10moveq r2,#6fiq和irq的区别&#xff1a; fiq和irq的区别&#…

CVPR 2023 | SAN: Side Adapter Network for Open-Vocabulary Semantic Segmentation

CVPR 2023 | SAN: Side Adapter Network for Open-Vocabulary Semantic Segmentation 论文&#xff1a;https://arxiv.org/abs/2302.12242代码&#xff1a;https://github.com/MendelXu/SAN 架构设计 冻结的 CLIP&#xff0c;其位置编码为了适应不同于预训练的输入分辨率&…

贪心算法:解决最优问题的简洁而高效方法

目录 引言&#xff1a; 一. 概念与原理 二. 应用场景 3. 实现方法 4. 优缺点分析 引言&#xff1a; 在计算机科学领域&#xff0c;我们经常面临着需要在一系列选择中找到最优解决方案的问题。贪心算法正是针对这类最优化问题而设计的一种简洁而高效的方法。不同于其他复杂…

Educational Codeforces Round 151 (Rated for Div. 2)(A-B)

打完涨了20分…… 算法选修课就学会了dfs……如果有期末复习的这种劲头&#xff0c;其他算法估计早就学会了&#xff08; A Forbidden Integer 这个还WA了三发…… signed main(){IOS;int n,k,x;bool f1;cf{cin>>n>>k>>x;if(k1)cout<<"NO"…