【机器学习】简答

news2025/1/23 13:48:30
1.什么是机器学习?
  • 机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能
  • “训练”与“预测”是机器学习的两个过程,“模型”则是过程的中间输出结果,“训练”产生“模型”,“模型”指导 “预测”。计算机从给定的数据中学习规律,即从观测数据(样本)中寻找规律(模型),并利用学习到的规律(模型)对未知或无法观测的数据进行预测。
2.根据数据集组成不同,通常可以把机器学习算法分为哪四类?
  1. 监督学习:每组训练数据有一个明确的标签或结果。如分类、回归问题,本书介绍的算法中,神经网络、线性模型、支持向量机都是监督学习。
  2. 无监督学习:数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。如聚类问题。
  3. 半监督学习:介于监督学习与无监督学习之间一种机器学习方式,主要考虑如何利用少量的标签样本和大量的没有标签的样本进行训练和分类的问题
  4. 强化学习:学习对象根据观察到的周围环境的反馈来做出判断,环境只给出评价(奖励)而非正确答案。如机器人控制。
 3.什么是版本空间?

        对假设空间(样本所有可能性的集合)采用自顶向下或自底向上的方法搜索并不断删除与训练集正例不一致的假设,直至剩余的都是与训练集一致的假设。这些与训练集一致的假设的集合称之为版本空间。

4.归纳偏好的原则
  • 奥卡姆剃刀:在可能的多个模型中选择最简单最直接的模型
  • 没有免费的午餐定理NFL:没有绝对好的算法,每种算法都有其适用的场景和局限性。要具体问题具体分析。 
5.机器学习、深度学习、人工智能的关系

 人工智能是目标,机器学习是手段,深度学习是算法。

6.过拟合和欠拟合

(1)过拟合:模型过于复杂,很可能已经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质,这样会导致泛化性能下降。训练集上表现好,测试集上表现差。

(2)欠拟合:模型过于简单,没有很好地捕捉到训练样本中数据特征,不能很好地拟合数据。训练集测试集表现都差。


造成过拟合的原因:

  • 模型过于复杂
  • 训练数据集样本单一或样本不足
  • 数据噪声太大或干扰信息太多
  • 训练迭代次数太多,对数据反复训练会让模型学到偶然的特征。

如何缓解过拟合?

  • 采用合适的模型,控制模型复杂度
  • 使用不同分布的数据训练。如数据增强,预训练。
  • 使用图像裁剪方法对图像进行预处理
  • 降低特征的数量
  • L1、L2正则化,降低模型复杂度
7.三种评估方法及优劣 
  • 留出法:直接将数据集D划分为两个互斥的集合,其中一个是训练集S,另一个为测试集T。一般采用分层采样保留类别比例
    • 优点:快速简洁,避免数据偏差
    • 缺点:对训练集、测试集的划分比例敏感
  • 交叉验证法:将数据集分层采样划分为k个大小相似的互斥矛集,每次用k-1个子集的并集作为训练集,余下的子集作为测试集,最终返回k个测试结果的均值,称为k折交叉验证法。评估结果的稳定性和保真性很大程度取决于k的取值。
    • 优点充分利用数据,能帮助进行参数调优
    • 缺点:数据集比较大时,训练模型的开销较大。
    • 特例:当k=样本数m时,为留一法,结果往往比较准确,但数据集大时,训练开销难以忍受。
  • 自助法:对数据集D有放回采样m次得到训练集D,没有被采样到的样本作为测试集。
    • 优点:适用于数据集小,难以有效划分开训练集、测试集的样本
    • 缺点:但由于产生的数据集改变了初始的分布,会引入估计误差
  • 数据不平衡情况:留出法和交叉验证法都可以采取分层采样,而自助法可能会进一步加剧类别分布的不平衡,所以类别不平衡情况不建议用自助法。
8.什么是调参?

        许多学习算法都有参数,参数配置不同,学得模型的性能会有显著差异。进行模型评估和选择时,除了要对适用学习算法进行选择,还需要对算法的参数进行设定,这就是调参。要调的不仅有算法超参数,还有模型参数。

9.回归的分类
  • 线性回归:用于处理连续数值的问题,预测出来的结果是一个数字,如房价
  • 逻辑回归(对数几率回归):在线性回归拟合的直线或超平面上添加联系函数(这里是一个对数几率函数),预测结果是离散的分类,如判断一个瓜是否是好瓜
10.多分类学习策略及适用范围

利用二分类器解决多分类问题。

方法:

  • ovo:对n个类别两两组合训练出n(n-1)/2个分类器,对每个样本得到这n(n-1)/2个分类器的预测结果,通过投票选出预测次数多的类别。
  • ovr:对n个类别单独与其他类别组合训练出n个分类器,对每个样本得到这n个分类器的预测结果,如有正则直接选为正的那个类别,若有多个正,则选择置信度高的那个类别类别作为答案。
  • mom:m次随机将n个类别划分为两半分别作为正负样本进行训练,采用纠错输出码技术,将每个类别每次划分的结果填入编码矩阵,每个类别就得到了一个m维的编码。对每个样本得到这m个分类器的预测结果,同样组成一个编码,计算这个编码与每个类别编码之间的距离,选择距离最小的那个类别作为最终结果。

适用范围:

  • ovo:训练的分类器多,存储开销和测试时间大,但每次训练只有两个类的样例训练时间短。
  • ovr:训练的分类器少,存储开销和测试时间小,但每次训练都要用到全部样例训练时间长。
  • mom:可以根据具体任务和数据集特性设计更复杂的分类策略,以平衡不同类别之间的关系。

 

11.偏差方差和噪声
  • 偏差是预测值和真实值之间的差别,刻画算法拟合能力。偏差大可能是欠拟合问题,可以增加训练迭代次数、获取更多特征。
  • 方差是在不同训练集上得到的预测结果的差异,刻画数据扰动影响。方差大可能是过拟合问题,可以增加训练数据、添加正则化项解决。
  • 噪声是当前任务任何算法所能达到的泛化误差的下界,刻画问题本身的难度。 
12.决策树剪枝的目的

是对付“过拟合”的主要手段 

13.激活函数和线性分类器的关系
  • 线性分类器是使用一个“超平面”将正负样本隔离开的模型,如对数几率回归、感知机、支持向量机(未引入核函数的话)
  • 激活函数引入非线性因素,提高神经网络对模型的表达能力,解决线性模型所不能解决的问题,如线性不可分的问题,使得神经网络能够学习和表示更复杂的函数和模式,大大提高了神经网络的表达能力和泛化能力。 (支持向量机引入核函数也可以解决线性不可分问题)
    • 感知机虽然使用了激活函数,但由于其单层结构,其决策边界仍然是线性的,因此无法解决非线性可分问题。
    • 要解决非线性问题,需要至少两层神经网络。多层神经网络通过组合多个线性函数和非线性激活函数,能够逼近任意非线性函数,从而解决线性不可分的问题。
14.支持向量机和神经网络关系
  • 对于非线性问题,SVM通过引入核函数将输入空间映射到高维空间,使得原本线性不可分的数据在高维空间中变得线性可分。
  • 神经网络则是通过增加隐藏层和使用非线性激活函数(如sigmoid、ReLU等)来引入非线性因素,使得网络能够学习和表示更复杂的函数和模式,从而解决非线性问题。
15.贝叶斯学派、贝叶斯决策论和贝叶斯分类器之间的联系

概率模型训练=参数估计,对于参数估计有两个学派:

1.频率主义学派:参数是固定值

2.贝叶斯学派:

  • 贝叶斯学派:认为参数本身也有分布,引入了先验概率和后验概率的概念,通过贝叶斯公式将先验概率和似然函数(条件概率)结合,得到后验概率,从而对未知参数进行推断。 
  • 贝叶斯决策论:利用先验概率和贝叶斯公式计算后验概率,然后根据后验概率大小进行决策分类。
  • 贝叶斯分类器:是基于贝叶斯决策论构建的分类器,用于对新的数据样本进行分类。通过计算数据样本属于不同类别的后验概率,选择具有最大后验概率的类别作为该样本的所属类别。
 16.线性回归和逻辑回归区分

(1)线性回归

  • 解决的是回归问题,用于预测连续性的变量
  • 拟合一个y=wx+b的函数
  • 通常使用最小二乘法来估计模型的参数w和b。最小二乘法通过最小化预测值与实际值之间的均方误差来求解。

(2)逻辑回归也叫对数几率回归

  • 解决的是分类问题,用于预测的某个事件发生的概率,通常输出值在0到1之间。在线性模型基础上添加一个联系函数g(.),将线性模型的输出映射到0到1之间,从而得到概率值。
  • 拟合一个y=sigmoid(wx+b)的函数
  • 使用极大似然估计来估计模型的参数,通过最大化样本数据的对数似然来求解参数。
17.线性判别分析LDA怎么求投影矩阵
  1. 计算类内散度矩阵Sw和类间散度矩阵Sb
  2. 想要最大化Sb同时最小化Sw,转化为最大化广义瑞利商问题J=W^TSbW/ W^TSwW
  3. 对广义瑞利商问题求导为0转换为广义特征值问题求解WSb=λWSw
  4. 对W求闭式解得d'个最大非零广义特征值所对应的特征向量组成的矩阵
  5. W为所要求的投影矩阵,d'小于属性数d,可以通过这个投影减小样本维数实现了监督降维

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1821118.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

uni-app利用renderjs实现安卓App上jssip+freeswitch+webrtc音视频通话功能

效果图 前置知识 利用renderjs在app端加载for web库 JsSIPFreeSwitchVue实现WebRtc音视频通话 原始模块 <template><viewclass"test-sip":userExtension"userExtension":change:userExtension"JsSIP.handleUserExtenSionChange":tar…

基于D-H参数、旋量代数、李群、李代数和微分流形的机器人建模方法

在机器人建模中&#xff0c;D-H参数、旋量代数、李群、李代数和微分流形方法为机器人运动学和动力学的精确描述提供了理论基础。旋量代数、李群李代数和微分流形”均属于“PoE &#xff08;Product of Exponentials&#xff09;表示方法”的范畴。 D-H 表示方法和 PoE 表示方法…

11.QLoRA微调ChatGLM3-6B

实战 QLoRA 微调 ChatGLM3-6B 大模型 实战 PEFT 库 QLoRA ChatGLM3-6B 微调数据集 AdvertiseGen AdvertiseGen 数据集获取 使用ChatGLM3-6b Tokenizer处理数据 关于ig nore_label_id 的设置&#xff1a; 在许多自然语言处理和机器学习框架中&#xff0c; ig nore_label_id 被…

JVM知识梳理

一 JVM 是一种规范 1.1 Java程序的执行过程 一个 Java 程序&#xff0c;首先经过 javac 编译成 .class 文件&#xff0c;然后 JVM 将其加载到方法区&#xff0c;执行引擎将会执行这些字节码。执行时&#xff0c;会翻译成操作系统相关的函数。JVM 作为 .class 文件的翻译存在…

[Algorithm][贪心][柠檬水找零][将数组和减半的最少操作次数][最大数][摆动序列]详细讲解

目录 1.柠檬水找零1.题目链接2.算法原理详解3.代码实现 2.将数组和减半的最少操作次数1.题目链接2.算法原理详解3.代码实现 3.最大数1.题目链接2.算法原理详解3.代码实现 4.摆动序列1.题目链接2.算法原理详解3.代码实现 1.柠檬水找零 1.题目链接 柠檬水找零 2.算法原理详解 …

Cisco Packet Tracer实验(一)

协议的概念 VLSM&#xff1a;可变长子网掩码&#xff08;Variable Length Subnet Mask&#xff09;没有传统意义上的A、B、C类网络&#xff0c;根据需求变化子网掩码的长度 CIDR无类别域间路由&#xff08;ClasslessInter-Domain Routing、CIDR&#xff09;把子网聚合在一起&…

多款可观测产品全面升级丨阿里云云原生 5 月产品月报

云原生月度动态 云原生是企业数字创新的最短路径。 《阿里云云原生每月动态》&#xff0c;从趋势热点、产品新功能、服务客户、开源与开发者动态等方面&#xff0c;为企业提供数字化的路径与指南。 趋势热点 &#x1f947; 阿里云云原生产品负责人李国强&#xff1a;推进可…

Eureka到Nacos迁移实战:解决配置冲突与启动异常

问题&#xff1a;Eureka到Nacos迁移实战&#xff1a;解决配置冲突与启动异常 在进行微服务架构升级&#xff0c;特别是注册中心从Eureka转向Nacos的过程中&#xff0c;我遇到了一个典型的技术挑战。目标是为了减少因配置变更导致的服务重启频率&#xff0c;我决定拥抱Nacos以其…

【PB案例学习笔记】-21小大写金额转换

写在前面 这是PB案例学习笔记系列文章的第21篇&#xff0c;该系列文章适合具有一定PB基础的读者。 通过一个个由浅入深的编程实战案例学习&#xff0c;提高编程技巧&#xff0c;以保证小伙伴们能应付公司的各种开发需求。 文章中设计到的源码&#xff0c;小凡都上传到了gite…

安装台式电脑网卡驱动

安装电脑网卡驱动 1. 概述2. 具体方法2.1 先确定主板型号2.2 详细操作步骤如下2.2.1 方法一2.2.2 方法二2.2 主流主板官网地址 结束语 1. 概述 遇到重装系统后、或者遇到网卡驱动出现问题没有网络时&#xff0c;当不知道怎么办时&#xff0c;以下的方法&#xff0c;可以作为一…

MMDetection实用工具详解(下):模型复杂度、基准测试

工具目录 四、模型复杂度应用展示结果解析 五、基准测试鲁棒性测试基准应用展示结果解析Testing gaussian_noise at severity 0Testing gaussian_noise at severity 2Aggregated results 遇到的tools自定义导包模块No Module Error错误解决思路 上期MMDetection内三个实用工具详…

2、给出五种并行计算机体系结构的名称,并分别画出其典型结构。

①并行向量处理机&#xff08;PVP&#xff09; ②对称多机系统&#xff08;SMP&#xff09; ③大规模并行处理机&#xff08;MPP&#xff09; ④分布式共享存储器多机系统&#xff08;DSM&#xff09; ⑤工作站机群&#xff08;COW&#xff09;

户外led显示屏如何选择?

在繁华的都市中&#xff0c;户外LED显示屏以其独特的魅力&#xff0c;成为传递信息、展示形象的重要工具。然而&#xff0c;面对市场上琳琅满目的产品&#xff0c;如何选择一款适合自己的户外LED显示屏呢&#xff1f;下面&#xff0c;我们将从屏幕类型、尺寸等具体参数出发&…

教程:A5000 GPU 上运行阿里最新开源大模型 Qwen2

这是我们新一篇关于大模型的文章&#xff0c;我们此前还讲过如何运行 LLama3 大模型。而这次&#xff0c;我们将使用 Ollama 运行阿里千问Qwen2:7b。要知道 Qwen2 可是目前最热门的开源大语言模型了&#xff0c;甚至在一些性能测试中比 LLama3 表现还突出。谁不想试试看呢&…

Golang | Leetcode Golang题解之第149题直线上最多的点数

题目&#xff1a; 题解&#xff1a; func maxPoints(points [][]int) (ans int) {n : len(points)if n < 2 {return n}for i, p : range points {if ans > n-i || ans > n/2 {break}cnt : map[int]int{}for _, q : range points[i1:] {x, y : p[0]-q[0], p[1]-q[1]if…

《NVIDIA-Jetson AGX Orin》移除或临时忽略 NVIDIA 仓库

阿丹&#xff1a; 开发的过程中出现了一些问题&#xff0c;在下载以及安装docker的时候&#xff0c;明明已经修改到了阿里云的国内镜像&#xff0c;但是还在下载的时候去访问了英伟达的下载仓库。在国内网络环境就会导致下载失败&#xff0c;网络不可达&#xff0c;本文章记录一…

现在Java行情不好可以转.net吗?

转向.NET开发可能是一个选择&#xff0c;但要注意以下几点。我这里有一套编程入门教程&#xff0c;不仅包含了详细的视频 讲解&#xff0c;项目实战。如果你渴望学习编程&#xff0c;不妨点个关注&#xff0c;给个评论222&#xff0c;私信22&#xff0c;我在后台发给你。 技术转…

好书推荐:生成式AI入门与AWS实战

这本书给LLM的爱好者者提供了完整的学习路线&#xff0c;让读者从使用大语言模型开始到剖析常用的技术概念&#xff0c;能够填补了机器学习爱好者从传统的文字处理到大语言模型的空白知识&#xff0c;包括显存计算优化&#xff0c;微调&#xff0c;RAG&#xff0c; 多模态&…

电池包断路单元DBU的预充电电阻应用案例

当电池组接触器闭合到电机和逆变器上时&#xff0c;逆变器电容器中会有电流涌入。这种非常高的电流至少可能会使接触器老化&#xff0c;并可能永久损坏接触器。 因此&#xff0c;当我们关闭电池组上的接触器时&#xff0c;我们分三个步骤执行此操作&#xff1a; 1.关闭主负极…

【机器学习】鸢尾花分类:机器学习领域经典入门项目实战

学习机器学习&#xff0c;就像学习任何新技能一样&#xff0c;最好的方法之一就是通过实战来巩固理论知识。鸢尾花分类项目是一个经典的入门项目&#xff0c;它不仅简单易懂&#xff0c;还能帮助我们掌握机器学习的基本步骤和方法。 鸢尾花数据集&#xff08;Iris Dataset&…