吃透《西瓜书》第一章绪论、第二章模型评估

news2024/11/24 8:43:08

目录

第一章 绪论

1.1 引言

1.2 基本术语

1.3 假设空间

第二章 模型评估

2.1 为什么需要模型评估?

2.2 模型评估的定义

2.2.1 评估方法之留出法:

2.2.2 交叉验证法和自助法

2.3 深入理解模型评估


第一章 绪论

1.1 引言

机器学习是什么?

机器学习的主要流程

 通俗就是,找一个最适合的函数方法~

机器类似一个学生,接触的越多,学习的越多,越厉害~

但是也害怕脏数据(类似环境对人类的影响)

 机器学习可以做什么?

  • 图片识别
  • 互联网推荐系统(购物、短视频等等的个性化推荐)
  • 自动驾驶(模型去决策车辆收集的信息,转而控制车辆)
  • 古文献修复

1.2 基本术语

 

监督学习:数据是带标签的数据

非监督学习:不带标签

分类:例如人的性别

回归:返回的是连续值,比如人的年龄

聚类:物以类聚,人以群分

数据:记录的集合

样本:每一条记录

标签:属性

特征向量:一个数据(因为使用到了各个标签)

1.3 假设空间

什么是假设空间?

机器学习的假设空间是指模型可以表示的所有可能解决一个特定问题的假设集合

假设空间包括了所有可能的参数取值和模型结构的组合。在机器学习中,我们通过从假设空间中选择一个最优的假设来进行模型训练和预测。

假设空间的大小取决于所选择的模型的复杂性。如果模型很简单,假设空间可能较小,表示能力有限;相反,如果模型很复杂,假设空间会更大,能够表示更多种类的函数关系。

选择合适的假设空间对于机器学习任务的成功至关重要。如果假设空间过小,模型可能无法捕捉到数据中的复杂关系,导致欠拟合;而如果假设空间过大,模型可能会过度拟合训练数据,对新的数据表现不佳。

因此,在实际应用中,需要根据问题的特点和数据集的规模选择合适的假设空间,以获得最好的性能和泛化能力。


 

第二章 模型评估

2.1 为什么需要模型评估?

经验误差 和泛化误差的关系

经验误差是指模型在训练集上的误差,也就是模型预测结果与实际标签之间的差异。它反映了模型对于已有数据的拟合能力。

泛化误差是指模型在新样本上的误差,也就是模型在未曾见过的数据上的预测能力。它衡量了模型对于未知数据的适应能力。

验证集用来做什么呢? 用来调整模型的超参数

混淆矩阵

 混淆矩阵是一种用于评估分类模型性能的表格,它展示了模型对于不同类别的预测结果与实际标签之间的关系。

混淆矩阵通常是一个N×N的矩阵,其中N表示类别的数量。对于二分类问题,混淆矩阵包含4个关键指标:真正例(True Positive, TP)、真负例(True Negative, TN)、假正例(False Positive, FP)和假负例(False Negative, FN)。

- 真正例(TP):模型正确地预测为正类的样本数量。
- 真负例(TN):模型正确地预测为负类的样本数量。
- 假正例(FP):模型错误地预测为正类的样本数量。
- 假负例(FN):模型错误地预测为负类的样本数量。

混淆矩阵可以帮助我们计算多个评估指标,如准确率召回率精确率等,从而全面评估模型的分类性能。

 

 

示例:

 

过拟合和欠拟合

过拟合指的是模型在训练数据上表现得很好,但在未见过的测试数据上表现较差的现象。

欠拟合则是指模型在训练数据上表现较差,无法很好地拟合数据,无法捕捉到数据中的特征和规律。

解决过拟合问题的方法包括:

  • 1. 增加训练样本:增加更多的训练数据可以减少过拟合的可能性。
  • 2. 减小模型复杂度:降低模型的复杂度,如减少参数的数量、调整模型结构等。
  • 3. 正则化(Regularization):通过在损失函数中添加正则化项,限制模型参数的大小,避免过拟合。
  • 4. Dropout:在训练过程中,随机地忽略一部分神经元和连接,减少模型的复杂度

解决欠拟合问题的方法包括:

  • 1. 增加模型复杂度:提高模型的复杂度,增加参数的数量、增加网络层数等。
  • 2. 特征工程:对原始数据进行特征转换、组合等操作,提取更有意义的特征。
  • 3. 收集更多数据:增加更多的训练数据可以帮助模型更好地学习数据的模式和规律。
  • 4. 调整模型超参数:如学习率、正则化参数等,通过交叉验证等方法找到最优的超参数组合。

2.2 模型评估的定义

2.2.1 评估方法之留出法:

         数据构成:

训练数据

训练数据是用来训练模型的数据集。通常情况下,训练集是我们拥有的最大的数据集。在监督学习中,训练数据包括输入数据和对应的标签。

验证数据

验证数据是用来验证模型的准确性、泛化性能的数据集。该数据集通常是从训练数据中分离出来的,可以用来评估模型的性能和调整模型的参数。在训练过程中,使用验证数据来判断是否出现过拟合或欠拟合等问题,以及选择更好的模型。

测试数据

测试数据是用来测试模型的泛化能力的数据集。该数据集通常是从训练数据和验证数据中分离出来的,可以用来评估模型的准确性和实用性。测试数据应该与实际场景的数据具有相似的特征,以测试模型的真实性能。
 

        数据分层:

 6 2 2 或者 7 2 1分层~

数据分割是指将数据集按照一定比例分割成训练集、验证集和测试集

通常情况下,数据集的分割比例是  6:2:2  或  7:2:1 ,训练集、验证集和测试集分别占总数据集的60%、20%和20%或70%、20%和10%。

其中,训练集用于训练模型,验证集用于调整模型的参数和评估模型的性能,测试集用于测试模型的泛化性能。

数据分割要保证数据之间的独立性和随机性,以防止在训练和测试过程中出现数据泄漏和过拟合的问题。

2.2.2 交叉验证法和自助法

k折交叉验证:

将原始数据集随机划分为k 个大小相等的子集,每次其中k-1 个子集的并集用作训练集,剩下的一个子集用作验证集。

依次使用每个子集作为验证集,重复k 次训练和验证的过程,最终得到k 个模型性能指标的均值作为最终评估结果。

自助法:

通过重复有放回抽样构建新的训练集,并利用新训练集进行模型训练和测试的方法

多次之后,抽出来的,当成训练集~

自助法的主要步骤如下

  • 从原始数据集中有放回地抽取样本,构建新的训练集。由于有放回地抽样,新的训练集可能包含重复样本和遗漏样本
  • 使用新的训练集进行模型训练
  • 对于每个训练得到的模型,使用原始数据集中未被抽取的样本进行测试。重复上述步骤多次,得到一系列模型性能指标的分布
  • 利用这些模型性能指标的分布,可以进行模型评估、参数估计等

2.3 深入理解模型评估

 偏差和方差

 后面 Irreducible error 不可预测的错误 或者 噪声

  

模型越复杂,模型拟合能力越强,偏差逐渐变小,容易过拟合

模型越复杂,可能性就会越多,方差越大

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/786571.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java网络编程(二)流

网络程序所做的很大一部分工作都是简单的输入和输出:将数据字节从一个系统移动到另一个系统。字节就是字节。在很大程度上讲,读取服务器发送给你的数据与读取文件并没什么不同。向客户端发送文本与写文件也没有什么不同。但是,Java中输入和输出(I/O)的组…

【node.js】04-模块化

目录 一、什么是模块化 二、node.js中的模块化 1. node.js中模块的分类 2. 加载模块 3. node.js 中的模块作用域 4. 向外共享模块作用域中的成员 4.1 module对象 4.2 module.exports 对象 4.3 exports对象 5. node.js 中的模块化规范 一、什么是模块化 模块化是指解…

Grafana - TDEngine搭建数据监测报警系统

TDengine 与开源数据可视化系统 Grafana 快速集成搭建数据监测报警系统 一、介绍二、前置条件三、Grafana 安装及配置3.1 下载3.2 安装3.2.1 windows安装 - 图形界面3.2.2 linux安装 - 安装脚本 四、Grafana的TDEngine配置及使用4.1 登录4.2 安装 Grafana Plugin 并配置数据源4…

安卓版本的发展4-13

Android 4.4 KitKat 1、通过主机卡模拟实现新的 NFC 功能。 2、低功耗传感器,传感器批处理,步测器和计步器。 3、全屏沉浸模式,隐藏所有系统 UI,例如状态栏和导航栏。它适用于鲜艳的视觉内容,例如照片、视频、地图、…

结构型设计模式之装饰器模式【设计模式系列】

系列文章目录 C技能系列 Linux通信架构系列 C高性能优化编程系列 深入理解软件架构设计系列 高级C并发线程编程 设计模式系列 期待你的关注哦!!! 现在的一切都是为将来的梦想编织翅膀,让梦想在现实中展翅高飞。 Now everythi…

上海科技大学智能生活组齐聚合合信息,“沉浸式”体验人工智能产品

近期,上海科技大学组织本科生产业实践-校企联合人才培养活动,30余名学生组成的“智能生活组”实地参访人工智能及大数据科技企业上海合合信息科技股份有限公司(简称“合合信息”)。本次活动旨在通过项目体验、主题交流&#xff0c…

2023-7-24-第二十二式备忘录模式

🍿*★,*:.☆( ̄▽ ̄)/$:*.★* 🍿 💥💥💥欢迎来到🤞汤姆🤞的csdn博文💥💥💥 💟💟喜欢的朋友可以关注一下&#xf…

VS Code 设置大小写转换快捷键

VS Code 设置大小写转换快捷键 前言:VS Code 没有默认的大小写转换快捷键,需要我们自己添加。 一 、打开快捷键设置面板 二、添加快捷键 在搜索框输入 “转换为大写”,如果您的VS Code没有汉化,此处输入“Transform to Uppercase…

vmware平台上虚拟机无法查看到WWID

需要在虚拟机中部署rac测试环境,创建虚拟机后无法查看到wwid [rootdb1 ~]# for i in cat /proc/partitions |awk {print $4} |grep sd; do echo "Device: $i WWID: /usr/lib/udev/scsi_id --page0x83 --whitelisted --device/dev/$i "; done |sort -k4 De…

Bootstrap每天必学之面板

Bootstrap每天必学之面板 1、面板 面板(Panels)是Bootstrap框http://架新增的一个组件,其主要作用就是用来处理一些其他组件无法完成的功能。同样在不同的版本中具有不同的源码: ☑ Less版本:对应的源码文件是 panel…

深度学习论文分享(五)DDFM: Denoising Diffusion Model for Multi-Modality Image Fusion

深度学习论文分享(五)DDFM: Denoising Diffusion Model for Multi-Modality Image Fusion 前言Abstract1. Introduction2. Background2.1. Score-based diffusion models2.2. Multi-modal image fusion2.3. Comparison with existing approaches 3. Meth…

解决ros-melodic-desktop-full(18.04)安装过程中未满足的依赖关系问题(注:也可以解决20.04noetic的)

自己安装火焰截图软件时使用sudo apt-get install flameshot时出现: 正在读取软件包列表... 完成 正在分析软件包的依赖关系树 正在读取状态信息... 完成 您也许需要运行“apt --fix-broken install”来修正上面的错误。 下列软件包有未满足的依赖关系:…

Vue组件通信原理及应用场景解析

🌷🍁 博主 libin9iOak带您 Go to New World.✨🍁 🦄 个人主页——libin9iOak的博客🎐 🐳 《面试题大全》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~&#x1f33…

SolidWorks打开step.格式文件提示“输入的文件名无效、无法发现、被锁住或为不兼容的类型”的解决办法

有时候用SolidWorks打开step.格式文件会提示“输入的文件名无效、无法发现、被锁住或为不兼容的类型”,从而无法正常打开此文件,如图: 目前小编找了两种解决这个问题的办法,供大家参考: 方法一: 打开Solid…

istio安装部署总结

istio安装部署总结 大纲 istio基础概念版本选择安装istio核心主件卸载istiokiali安装 istio基础概念 https://istio.io/latest/zh/docs/ 中文文档 istio是一个服务治理平台,治理服务间的访问,(例如流量控制,安全策略&#xf…

第五讲:MySQL中DDL表的修改与删除

1、alter:改变 2、table:表 3、truncate:截断,删节 学习渠道:黑马程序员

如何创建高级 CSS 下拉菜单

效果展示 实现思路及部分代码 1、定义整体页面结构 从上述的效果展示图可以看出,页面的整体结构应该需要一个总菜单容器来装载父级菜单项,并且对应的父级菜单项应该有对应的菜单子项。子菜单是分类的话,我们还需要额外在扩展对应的容器来装…

mysql(由浅到深)

文章目录 1. 数据库分类与SQL分类2. SQL的数据类型3. DDL CURD3.1 库的操作3.2 表约束3.3 表的操作 4 DML CURD5. DQL (数据查询语言)5.1 单表查询5.2 聚合查询与分组查询5.3 多表查询与外键约束5.4 多表之间的连接查询5.4.1左链接查询5.4.2 右连接查询5…

FPGA图像处理仿真实验——均值滤波(FIFO)

之前的博客中用shift ram做的均值滤波,那篇文章里讲了原理,在这里不进行重复。考虑到shift ram的深度有限,在处理高分辨率图片时可能会收到限制,所以这次采用FIFO来进行均值滤波。FIFO可以看成是一个先进先出的堆栈,有…