一起对话式学习-机器学习03——模型评估与模型选择

一起对话式学习-机器学习03——模型评估与模型选择

news2026/2/14 8:05:04

【一】前言

这一部分其实已在第二节中介绍到，这节起到回顾归纳的作用。

【二】训练误差与测试误差

首先，在分类问题中，有误差率和准确率两个概念，二者和为1。

误差率：分类错误的样本数占总数的比例。

其次，在回归问题中，则有训练误差和测试误差两个概念，顾名思义不再多说，可详见02。而在未知新样本上也就是进行预测时产生的误差称为泛化误差，这是我们要追求使之最小化的，即预测最准确的。

【三】过拟合和模型选择

已在02详细介绍过概念，指出几点：欠拟合较好克服，增加训练轮数，增加模型复杂性就好，而过拟合往往是机器学习面临的关键障碍且无法避免只能尽量缓解。

与02所述一致，以测试误差可以作为泛化误差进行求解，但如果数据较少可以进行数据重利用：留出法、交叉验证法与自助法，之后会详细介绍。

接下来举个拟合多项式函数的例子方便理解：

如图M代表目标函数的项数，下面有公式辅助理解，四张图不变的那条曲线可以看作标准答案模型，当然我们在实际建模时几乎不可能做到完美，那看看第几个最好？不难看出是第三个，第四个明显过拟合，第一二个欠拟合。

针对这个问题，实际求解的过程是怎样的？首先确定模型项数（基本形式）后，列出损失函数使用测试数据利用最小二乘法（因为设定未知参数幂次为1，所以是线性问题用最小二乘法）得出一组未知参数解，最后计算一下其训练误差。就这样对于每个项数/复杂度的模型皆如此得出下图：

肯定要选二者都较低的复杂度，如何选择呢？其实02已经给出标准答案，可以用正则化与交叉验证。

Over！！！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2150430.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

数仓工具：datax

数仓工具：datax

datax可以理解为sqoop的优化版， 速度比sqoop快因为sqoop底层是map任务，而datax底层是基于内存 DataX 是一个异构数据源离线同步工具，致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定…

阅读更多...

4款音频转文字在线转换工具帮你解锁新的记录模式。

4款音频转文字在线转换工具帮你解锁新的记录模式。

越来越多的人都知道使用一些工具来将音频直接转换成文字，这样便省去了手动输入的麻烦。而且使用音频进行记录也能够提高工作的效率，像会议记录，课堂教学记录，采访录音等。如果大家有需要将自己的音频转成文字，可以试试…

阅读更多...

PDF——压缩大小的方法

PDF——压缩大小的方法

方法一：QQ浏览器->格式转换->PDF转纯图PDF

阅读更多...

【C++】STL----stack和queue常见用法

【C++】STL----stack和queue常见用法

🔥个人主页🔥：孤寂大仙V 🌈收录专栏🌈：C从小白到高手 🌹往期回顾🌹：【C】list常见用法 🔖 流水不争，争的是滔滔不息。文章目录一、stack的介绍s…

阅读更多...

KTH7823——16 位高精度低延时霍尔磁编码器可编程 ABZ 和 PWM 输出模式角度传感器

KTH7823——16 位高精度低延时霍尔磁编码器可编程 ABZ 和 PWM 输出模式角度传感器

KTH7823 是一款高精度绝对角度霍尔传感器芯片，最高 16 位分辨率绝对角度输出，可实现在轴向和离轴场合下的无接触式磁场角度测量。不论转速范围在 0-120000rpm 之间， KTH7823 都能快速准确地输出角度信息，适用于需要精准角…

阅读更多...

7个提升网站分页体验的 CSS 和 JavaScript 代码片段

7个提升网站分页体验的 CSS 和 JavaScript 代码片段

文章目录前言正文1.简洁直观的悬停分页效果2.实时显示页码的分页3.适合响应式设计的多功能分页4.专为移动设备优化的分页5.无数字的极简分页设计6.触屏友好的分页7.结合无限滚动与分页的设计总结前言分页是内容丰富的网站中不可缺少的导航工具，能帮助用户更轻松…

阅读更多...

鱼类计数与识别系统源码分享

鱼类计数与识别系统源码分享

鱼类计数与识别检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer V…

阅读更多...

【C语言】⾃定义类型：联合和枚举

【C语言】⾃定义类型：联合和枚举

⾃定义类型：联合和枚举 1. 联合体1.1 联合体类型的声明1.2 联合体的特点1.3 相同成员的结构体和联合体对⽐1.4 联合体⼤⼩的计算1.5 联合的⼀个练习 2. 枚举类型2.1 枚举类型的声明2.2 枚举类型的优点2.3 枚举类型的使⽤ 1. 联合体 1.1 联合体类型的声明像结构体…

阅读更多...

滚珠花键与滚珠丝杆的区别与应用

滚珠花键与滚珠丝杆的区别与应用

在机械工业中，经常使用滚珠花键这种传动元件，人们经常拿它与滚珠丝杆相比较，甚至与之混淆。事实上，它们是不同的，滚珠花键和滚珠丝杆在机械传动领域中各有其独特的作用和特点。那么，两者之间的区别是什么呢…

阅读更多...

list(二) （list模拟实现）

list(二) （list模拟实现）

首先进行大框架先写基本的结点类有data next prev template<class T>class ListNode//或者使用struct 就不用在写public声明公有{public://这里不仅仅是成员函数成员变量也要公有化 ListNode<T>* _next;ListNode<T>* _prev;T _data;}之后是链表list类…

阅读更多...

OpenHarmony（鸿蒙南向开发）——小型系统内核（LiteOS-A）【时间管理】

OpenHarmony（鸿蒙南向开发）——小型系统内核（LiteOS-A）【时间管理】

往期知识点记录： 鸿蒙（HarmonyOS）应用层开发（北向）知识点汇总鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~ 子系统开发内核轻量系统内核（LiteOS-M） 轻量系统内核&#…

阅读更多...

围剿Model Y，小米SUV也来拼刺刀了

围剿Model Y，小米SUV也来拼刺刀了

文 | AUTO芯球作者 | 雷慢马斯克真是被小米雷军盯上了， 前面小米SU7死磕Model 3， 现在小米SUV又来打Model Y了， 别不信啊，就刚刚，小米SUV出现了最大的曝光， 外观谍照，内饰中控台都曝光了…

阅读更多...

RflySim工具链常见问题答疑

RflySim工具链常见问题答疑

1. RflySim结合硬件能不能实现无人机颜色巡线呢？ 可以，内置有一个通过相机识别来攻击小球的实验，可见：【RflySim安装路径】\RflySimAPIs\8.RflySimVision\1.BasicExps\1-VisionCtrlDemos\e3_ShootBall，不过要想实现无人…

阅读更多...

Linux 进程3

Linux 进程3

进程地址空间 CPU读取数据都需要地址，在计算机中所有东西都是一种数据，包括我们的进程。这是一个进程空间示意图，操作系统通过task_struct结构体链表来管理每一个进程，结构体里面有一个指针指向操作系统为进程开辟的一段空间&am…

阅读更多...

博导团队指导、解读实验结果、SCI论文润色

博导团队指导、解读实验结果、SCI论文润色

表观组： DAP-seq:转录因子-DNA互作研究工具 ATAC-seq :染色质开放程度研究工具 H3K4me3 ChIP-seq:组蛋白甲基化修饰工具 BS-seq :DNA甲基化研究工具 H3K27ac ChIP-seq:组蛋白乙酰化修饰研究工具 Cut&Tag:转录因子研究工具 ChIP-seq:转录因子-DNA互作工具互作组…

阅读更多...

HTTP 教程

HTTP 教程

HTTP/HTTPS 简介 HTTP（Hypertext Transfer Protocol，超文本传输协议）和 HTTPS（Hypertext Transfer Protocol Secure，超文本传输安全协议）是用于在网络中传输信息的两种主要协议。它们定义了客户端和服务器…

阅读更多...

PDF样本册如何分享到朋友圈

PDF样本册如何分享到朋友圈

想象一下，你刚刚参加了一场行业盛会，获取了一份包含最新行业动态、优秀案例的PDF样本册。你迫不及待地想要分享给身边的朋友，与他们共同学习、探讨。然而，传统的分享方式要么依赖纸质版，要么通过电子邮件&#xff0c…

阅读更多...

C++模拟实现list：list、list类的初始化和尾插、list的迭代器的基本实现、list的完整实现、测试、整个list类等的介绍

C++模拟实现list：list、list类的初始化和尾插、list的迭代器的基本实现、list的完整实现、测试、整个list类等的介绍

文章目录前言一、list二、list类的初始化和尾插三、list的迭代器的基本实现四、list的完整实现五、测试六、整个list类总结前言 C模拟实现list：list、list类的初始化和尾插、list的迭代器的基本实现、list的完整实现、测试、整个list类等的介绍一、list list本…

阅读更多...

LeetCode讲解篇之220. 存在重复元素 III

LeetCode讲解篇之220. 存在重复元素 III

文章目录题目描述题解思路题解代码题目描述题解思路我们可以考虑存储数组中连续indexDiff个数字，这样我们只需要在这连续的indexDiff个数字中查找相差小于等于valueDiff的两个数字的问题对于该查找问题，我们可以考虑使用以valueDiff大小为一个桶&a…

阅读更多...

自动化测试常用函数

自动化测试常用函数

目录一、元素的定位 1、cssSelector 2、xpath （1）xpath 语法 1、获取HTML页面所有的节点 2、获取HTML页面指定的节点 3、获取一个节点中的直接子节点 4、获取一个节点的父节点 5、实现节点属性的匹配 6、使用指定索引的方式获取对应的节点内容…

阅读更多...

推荐文章

最新文章