11 模型选择 + 过拟合和欠拟合

11 模型选择 + 过拟合和欠拟合

news2026/3/26 18:15:51

训练集：用于训练权重参数

验证集：用来调参，评价模型的好坏，选择合适的超参数

测试集：只用一次，检验泛化性能，实际场景下的数据

非大数据集通常使用K-折交叉验证

K-折交叉验证

一个数据集分成K份，每次拿出1份做验证集，其余K-1份做训练集，共做K次训练，求得K次训练的平均精度。K-折交叉验证降低数据分布不均匀带来的误差，举一个极端的例子，K=10000，将数据集分成10000份，做10000次训练，求得平均误差，这样做充分利用了数据，同时也会付出高昂的成本。如果数据集很大，可以采取K=2或3。

过拟合和欠拟合

模型容量：拟合各种函数的能力

模型容量和数据之间的关系

模型容量低，数据简单，可以取得不错的效果

模型容量低，数据复杂，无法学习到足够的信息，可能导致欠拟合。如用线性方程拟合曲线分布的数据

模型容量高，数据量简单，极端情况，模型可以把所有数据全部存下来，这样容易出现过拟合。如用多次方程拟合曲线分布的数据

模型容量高，数据量复杂，可以学习到更多复杂的知识，往往具有较好的性能，这也是目前的一个方向

横坐标是模型容量，每一个点代表一个模型，纵坐标是误差。从零点往右看，刚开始训练模型容量低，拟合能力比较弱，训练误差比较大，泛化误差也比较大。随着模型容量的增高，训练误差逐渐减少，模型足够大到记住所以训练数据，训练误差可以为0。同时，泛化误差也在降低，可以看到当泛化误差过了一个临界点，泛化误差不降反增，处于过拟合状态，这个阈值点是理论的最优点。我们尽量减少泛化误差和训练误差的gap。

结论：模型容量需要匹配数据规模，否则容易出现欠拟合和过拟合。从理论上讨论，统计机器学习提供工具衡量模型容量复杂度，往往计算复杂。实际中，更多通过实验观察训练误差和验证误差。

b站链接：模型选择_哔哩哔哩_bilibili

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/961524.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

云原生Kubernetes:二进制部署K8S多Master架构（三）

云原生Kubernetes:二进制部署K8S多Master架构（三）

目录一、理论 1.K8S多Master架构 2.配置master02 3.master02 节点部署 4.负载均衡部署二、实验 1.环境 2.配置master02 3.master02 节点部署 4.负载均衡部署三、总结一、理论 1.K8S多Master架构 (1) 架构 2.配置master02 （1）环境关闭防…

阅读更多...

Docker：自定义镜像

Docker：自定义镜像

（总结自b站黑马程序员课程） 环环相扣，跳过部分章节和知识点是不可取的。一、镜像结构镜像是分层结构，每一层称为一个Layer。 ①BaseImage层：包含基本的系统函数库、环境变量、文件系统。 ②Entrypoint&#xff1…

阅读更多...

Vue在表格中拿到该行信息的方式（作用域插槽-#default-scope-解决按钮与行点击的顺序问题）

Vue在表格中拿到该行信息的方式（作用域插槽-#default-scope-解决按钮与行点击的顺序问题）

遇到的问题在做表格的时候，表格是封装好了的，用于展示数据。如果想给单行增加按钮，可以单独写一列存放按钮，最基本的需求是，点击按钮后要拿到数据然后发起请求。且Vue的element-plus，当我们点击按钮之后…

阅读更多...

python二级例题

python二级例题

请编写程序，生成随机密码。具体要求如下：‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬ （1）使用 rand…

阅读更多...

XSS漏洞及分析

XSS漏洞及分析

目录 1.什么是xss漏洞 1）存储型XSS漏洞 2）反射型XSS漏洞 3）DOM型XSS漏洞 2.什么是domcobble破环 3.案例一 1）例题链接 2）代码展示 3）例题分析 4.案例二 1）例题链接 2）代…

阅读更多...

jvm-堆

jvm-堆

1.堆的核心概念一个jvm实例只存在一个堆内存，堆也是java内存管理核心区域 java堆区在jvm启动的时候即被创建，其空间大小就确定了，是jvm管理最大的一块内存空间； 堆可以处于物理上不连续的内存空间，但在逻辑上它应该被…

阅读更多...

Linux gdb调式的原理

Linux gdb调式的原理

文章目录一、原理分析二、dmoe测试2.1 hello.s2.2 demo演示参考资料一、原理分析 #include <sys/ptrace.h> #include <sys/types.h> #include <sys/wait.h> #include <unistd.h> #include <stdio.h> #include <stdlib.h> #include <…

阅读更多...

使用VBA快速比对数据

使用VBA快速比对数据

实例需求：第一行是全系列数据集合，现在需要对比第一行数据，查找第2行数据中缺失的数字，保存在第3行中。具备VBA初步使用经验的同学，都可以使用双重循环实现这个需求，这里给大家提供另一种实现思路&#x…

阅读更多...

写的一款简易的热点词汇记录工具

写的一款简易的热点词汇记录工具

项目需要对用户提交的附件、文章、搜索框内容等做热词分析。如下图： 公司有大数据团队。本着不麻烦别人就不麻烦别人的原则，写了一款简易的记录工具，原理也简单，手工在业务插入锚点，用分词器分好词，排掉字…

阅读更多...

阿晨的运维笔记 | CentOS部署Docker

阿晨的运维笔记 | CentOS部署Docker

使用yum安装 # step 1: 安装必要的一些系统工具 sudo yum install -y yum-utils device-mapper-persistent-data lvm2 # Step 2: 添加软件源信息 sudo yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo # Step 3: 更新并安装 …

阅读更多...

使用VBA快速关闭应用程序进程

使用VBA快速关闭应用程序进程

使用VBA进行开发时，如果需要关闭其他Office应用程序，那么通常可以使用GetObject的方式获取该应用程序的引用，然后再关闭，有时需要重复多次以关闭多进程。如果希望关闭的应用程序并非Office组件，那么GetObject方式有时就…

阅读更多...

裸露土方智能识别算法 python

裸露土方智能识别算法 python

裸露土方智能识别算法通过opencvpython网络模型框架算法，裸露土方智能识别算法能够准确识别现场土堆的裸露情况，并对超过40%部分裸露的土堆进行抓拍预警。此次算法用到的Python是一种由Guido van Rossum开发的通用编程语言，它很快就变得非常流…

阅读更多...

NOR型flash vs NAND型flash

NOR型flash vs NAND型flash

FLASH是一种存储芯片，全名叫Flash EEPROM Memory，通过程序可以修改数据，即平时所说的“闪存”。闪存可以在软件的控制下写入和擦写数据。其存储空间被分割成相对较大的可擦除单元，成为擦除块（erase block&#xff09…

阅读更多...

嵌入式岗位笔试面试专栏 - 岗位介绍

嵌入式岗位笔试面试专栏 - 岗位介绍

文章目录一、嵌入式岗位的分类二、热门领域及公司三、发展前景四、技能要求沉淀、分享、成长，让自己和他人都能有所收获！😄 📢本篇我们将讲解嵌入岗位的工作职责。一、嵌入式岗位的分类嵌入式软件工程师大致可以分为两种类型：应用开发工程师驱动开发工程师应用工程…

阅读更多...

【炼气境】HashMap原理以及如何使用

【炼气境】HashMap原理以及如何使用

系列文章目录文章目录系列文章目录前言1、数据结构2、工作原理3、当两个对象的 hashCode 相同会发生什么？4、你知道 hash 的实现吗？为什么要这样实现？5、为什么要用异或运算符？6、HashMap 的 table 的容量如何确定？l…

阅读更多...

PHP8内置函数中的变量函数-PHP8知识详解

PHP8内置函数中的变量函数-PHP8知识详解

在php8中，与变量相关的内置函数比较多，本文说一些比较重要的、常见的内置函数。今日着重讲解了5个，分别是：检测变量是否为空的函数empty()、判断变量是否定义过的函数isset()、销毁指定的变量的函数unset()、获取变量的类型的函数…

阅读更多...

【力扣周赛】第 359 场周赛（选择区间型DP⭐⭐⭐⭐⭐新题型双指针）

【力扣周赛】第 359 场周赛（选择区间型DP⭐⭐⭐⭐⭐新题型双指针）

文章目录竞赛链接Q1：7004. 判别首字母缩略词（模拟）Q2：6450. k-avoiding 数组的最小总和解法1——贪心哈希表解法2——数学公式 Q3：7006. 销售利润最大化⭐⭐⭐线性DP相似题目列表2008. 出租车的最大盈利（和…

阅读更多...

2023.9.1 简单认识 JVM

2023.9.1 简单认识 JVM

目录 JVM 内存划分本地方法栈虚拟机栈程序计数器堆区元数据区 JVM 类加载机制加载验证准备解析初始化类被加载的几种情况（懒汉模式 ---> 只要被用到才会被加载） 双亲委派模型 JVM 内存划分 JVM 是一个应用程序，在…

阅读更多...

SSM(Spring-Mybatis-SpringMVC)

SSM(Spring-Mybatis-SpringMVC)

文章目录 1. 介绍1.1 概念介绍 2 SSM整合框架3. SSM功能模块开发4 测试4.1 业务层接口测试4.2 表现层接口测试 5.优化 -表现层数据封装6.异常处理 1. 介绍 1.1 概念介绍 SSM项目是指基于SpringSpringMVCMyBatis框架搭建的Java Web项目。 Spring是负责管理和组织项目的IOC容器和…

阅读更多...

二、C#—第一个c#程序（2）

二、C#—第一个c#程序（2）

🌻🌻 目录一、编写第一个C#程序1.1 使用Visual Studio创建c#程序的步骤1.2 编写第一个程序“Hello Word”1.3 c#程序的基本结构1.3.1 c#中的命名空间1.3.2 c#中的类1.3.3 c#中的程序启动器——Main方法1.3.4 c#中的标识符1.3.5 c#中的关键字1.3.6 c#中的…

阅读更多...

推荐文章

最新文章