6_回归算法 —欠拟合、过拟合原因及解决方法

news2025/4/17 13:27:16

文章目录

一、过拟合与欠拟合
1 过拟合
- 1.1 线性回归的过拟合
- 1.2 过拟合和正则项
- - 1.2.1 带有L2正则化的线性回归—Ridge回归
  - 1.2.2 带有L1正则化的线性回归—LASSO回归
  - 1.2.3 Ridge（L2-norm）和LASSO（L1-norm）比较
  - 1.2.4 Elasitc Net
2 欠拟合
3 用法（梯度下降、坐标轴下降法）

一、过拟合与欠拟合

在这里插入图片描述

1 过拟合

**过拟合：**一个假设在训练数据上能够获得比其他假设更好的拟合，但是在训练数据外的数据集上却不能很好地拟合数据，此时认为这个假设出现了过拟合的现象。(模型过于复杂)

多项式扩展的时候，如果指定的阶数比较大，那么有可能导致过拟合。从线性回归模型中来讲，我们认为训练出来的模型参数值越大，就表示越存在过拟合的情况。

原因：原始特征过多，存在一些嘈杂特征，模型过于复杂是因为模型尝试去兼顾各个测试数据点

解决办法：

进行特征选择，消除关联性大的特征(很难做)
交叉验证(让所有数据都有过训练)
正则化(了解)

为了解决过拟合问题：我们可以选择在损坏函数中加入惩罚项（对于系数过大的惩罚），主要分为L1-norm和L2-norm。

1.1 线性回归的过拟合

在这里插入图片描述

1.2 过拟合和正则项

引入了 正则化 概念。

在这里插入图片描述

直观上来看，如果我们想要解决上面回归中的过拟合问题，我们最好就要消除X₃和X₄的影响，也就是想让θ₃，θ₄都等于0，一个简单的方法就是我们对θ₃，θ₄进行惩罚，增加一个很大的系数，这样在优化的过程中就会使这两个参数为零。

在这里插入图片描述

1.2.1 带有L2正则化的线性回归—Ridge回归

使用L2正则的线性回归模型就称为Ridge回归（岭回归）

在这里插入图片描述

岭回归：回归得到的回归系数更符合实际，更可靠。另外，能让估计参数的波动范围变小，变的更稳定。在存在病态数据（异常数据）偏多的研究中有较大的实用价值。

1.2.2 带有L1正则化的线性回归—LASSO回归

使用L1正则的线性回归模型就称为LASSO回归（Least Absolute Shrinkage and Selection Operator）

在这里插入图片描述

1.2.3 Ridge（L2-norm）和LASSO（L1-norm）比较

L2-norm中，由于对于各个维度的参数缩放是在一个圆内缩放的，不可能导致有维度参数变为0的情况，那么也就不会产生稀疏解；实际应用中，数据的维度中是存在噪音和冗余的，稀疏的解可以找到有用的维度并且减少冗余，提高回归预测的准确性和鲁棒性（减少了overfitting）（L1-norm可以达到最终解的稀疏性的要求）
Ridge模型具有较高的准确性、鲁棒性以及稳定性；LASSO模型具有较高的求解速度。
如果既要考虑稳定性也考虑求解的速度，就使用Elasitc Net

1.2.4 Elasitc Net

同时使用L1正则和L2正则的线性回归模型就称为Elasitc Net算法（单性网络算法）
在这里插入图片描述

2 欠拟合

**欠拟合：**一个假设在训练数据上不能获得更好的拟合，但是在训练数据外的数据集上也不能很好地拟合数据，此时认为这个假设出现了欠拟合的现象。(模型过于简单)

原因：学习到数据的特征过少

解决办法：增加数据的特征数量

3 用法（梯度下降、坐标轴下降法）

只要且标函数是凸函数，就使用梯度下降—>普通的线性回归和L2-norm线性回归
坐标轴下降法—>L1-norm

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/791931.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

YOLOv7 论文学习

YOLOv7 论文学习

1. 解决了什么问题？ 实时的目标检测器是计算机视觉系统的重要组成部分。目前应用在 CPU 端的实时目标检测方法大多基于 MobileNet、ShuffleNet、GhostNet，而用在 GPU 的实时目标检测方法大多基于 ResNet、DarkNet、DLA，然后使用 CSPNet 策略…

阅读更多...

bfs算法和dfs算法

bfs：广度优先搜索，一层一层搜索 dfs：深度优先搜索，先搜索一边，如果其中某个节点不符，那么回溯上一个节点，再向另一边搜索，直到搜索完毕为止这是我个人的理解，具体可参…

阅读更多...

AIGC第一波裁员，揭开了AI大模型创业的裂痕

AIGC第一波裁员，揭开了AI大模型创业的裂痕

大模型开始商业化肉搏，AIGC创业走向残酷时刻。短短一年，AIGC产业正以N倍速经历其他产业可能要走几年或十几年的波澜起伏：从现象级产品爆红出圈、产业热情全面点燃、创业融资层出不穷，到一批明星独角兽被曝身陷窘境、裁员求生&am…

阅读更多...

28.基于注解的声明式事务

28.基于注解的声明式事务

基于注解的声明式事务准备工作将之间的使用的数据库表t_user更改为t_user1，使用的依赖和对应的jdbc.properties不变即可准备数据库 BookSql.sql CREATE TABLE t_book (book_id int(11) NOT NULL AUTO_INCREMENT COMMENT 主键,book_name varchar(20) DEFAULT …

阅读更多...

【如何训练一个中英翻译模型】LSTM机器翻译模型部署（三）

【如何训练一个中英翻译模型】LSTM机器翻译模型部署（三）

系列文章【如何训练一个中英翻译模型】LSTM机器翻译seq2seq字符编码（一） 【如何训练一个中英翻译模型】LSTM机器翻译模型训练与保存（二） 【如何训练一个中英翻译模型】LSTM机器翻译模型部署（三） 【如何训…

阅读更多...

Java的0xFFFF在赋值、比较时引起的困惑

Java的0xFFFF在赋值、比较时引起的困惑

Java中的0xFFFF是整型，在赋值、比较的时候容易引起混淆，涉及到符号位、数值大小，赋值给什么类型的变量。我今天在编码的时候就遇到了一些困惑。用代码样例的形式记录下来，加深理解： package com.thb;public class Tes…

阅读更多...

mysql null 值查询不出来问题

mysql null 值查询不出来问题

最新遇到mysql null 值查询的问题，当查询这个字段有的为null 有的不为null 该字段查询条件查询为null值得将不显示。举例新建表 test_user name和phone得值默认值为null 我们添加一些数据查询下name 不是张三得数据 select * from test_user where name !张…

阅读更多...

将Spring Session存储到Redis中实现持久化

将Spring Session存储到Redis中实现持久化

文章目录 Session持久化1. 添加依赖2. 配置redis连接信息3. 存储和读取session从Redis Session持久化 1. 添加依赖在项目中添加session依赖和redis依赖，如下所示： <dependency><groupId>org.springframework.boot</groupId><art…

阅读更多...

答粉丝问）【问题记录解决】如何重新训练已经经过p-tuning微调的模型；自然语言处理平台dialogflow 智能对话式问答应用程序相关问题

答粉丝问）【问题记录解决】如何重新训练已经经过p-tuning微调的模型；自然语言处理平台dialogflow 智能对话式问答应用程序相关问题

如果有人以你不喜欢的方式对待你，那一定是你允许的，否则他只能得逞一次。——张德芬 🎯作者主页：追光者♂🔥 🌸个人简介： 💖[1] 计算机专业硕士研究生💖 🌟[2] 2022年度博客之星人工智能领域TOP4🌟 🏅[3] 阿里云社区特邀专家博主🏅 �…

阅读更多...

字符串（2）--- 前缀函数与 KMP 算法

字符串（2）--- 前缀函数与 KMP 算法

/* https://www.luogu.com.cn/problem/UVA455 最小周期： n - pi[n -1] */ #include <iostream> #include <string> #include <vector> using namespace std; vector<int> prefix_fun(string s) { int len s.length(); /…

阅读更多...

曲线拟合(MATLAB拟合工具箱)位置前馈量计算(压力闭环控制应用)

利用PLC进行压力闭环控制的项目背景介绍请查看下面文章链接，这里不再赘述。信捷PLC压力闭环控制应用(C语言完整PD、PID源代码)_RXXW_Dor的博客-CSDN博客闭环控制的系列文章，可以查看PID专栏的的系列文章，链接如下：张力控制之速度闭环(速度前馈量计算)_RXXW_Dor的博客-CSD…

阅读更多...

7.语句

7.语句

7.1 表达式和语句 ●表达式: 表达式是可以被求值的代码，JavaScript 引擎会将其计算出一个结果。 ●语句: 语句是一段可以执行的代码。比如: prompt() 可以弹出一个输入框，还有if语句、for循环语句等等区别: 1.表达式：因为表达式可被求值&…

阅读更多...

八、Kafka时间轮与常见问题

八、Kafka时间轮与常见问题

Kafka与时间轮 Kafka中存在大量的延时操作。 1、发送消息-超时重试机制 2、ACKS 用于指定分区中必须要有多少副本收到这条消息，生产者才认为写入成功（延时等） Kafka并没有使用JDK自带的Timer或者DelayQueue来实现延迟的功能，而…

阅读更多...

Leetcode-每日一题【剑指 Offer 03. 数组中重复的数字】

Leetcode-每日一题【剑指 Offer 03. 数组中重复的数字】

题目找出数组中重复的数字。在一个长度为 n 的数组 nums 里的所有数字都在 0～n-1 的范围内。数组中某些数字是重复的，但不知道有几个数字重复了，也不知道每个数字重复了几次。请找出数组中任意一个重复的数字。示例 1： 解题思…

阅读更多...

uni-app：模态框的实现（弹窗实现）

uni-app：模态框的实现（弹窗实现）

效果图代码标签 <template><view><button click"showModal true">显示模态框</button><view class"modal" v-if"showModal"><view cla…

阅读更多...

安科瑞能源物联网以能源供应、能源管理、设备管理、能耗分析的能源流向为主线-安科瑞黄安南

安科瑞能源物联网以能源供应、能源管理、设备管理、能耗分析的能源流向为主线-安科瑞黄安南

摘要：随着科学技术的发展，我国的物联网技术有了很大进展。为了提升电力抄表服务的稳定性，保障电力抄表数据的可靠性，本文提出并实现了基于物联网的智能电力抄表服务平台，结合云计算、大数据等技术，提供电力…

阅读更多...

测试老鸟经验，性能测试重点17个疑难解答，一篇打通...

测试老鸟经验，性能测试重点17个疑难解答，一篇打通...

目录：导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结（尾部小惊喜） 前言 1、如何理解性能测…

阅读更多...

三层交换基础实验

三层交换基础实验

要求: 1.IP地址基于192.168.1.0/24划分 2.使用OSPF 3.使用DHCP 4.全网可达 1.配置二层交换 SW 3 <Huawei>system-view [Huawei]sysname SW3 [SW3]interface GigabitEthernet 0/0/2 [SW3-GigabitEthernet0/0/2]port link-type access [SW3-GigabitEthernet0/0/2]por…

阅读更多...

Spring5学习笔记 — IOC

Spring5学习笔记 — IOC

✅作者简介：大家好，我是Cisyam，热爱Java后端开发者，一个想要与大家共同进步的男人😉😉 🍎个人主页：Cisyam-Shark的博客 💞当前专栏： Spring专栏 ✨特色专栏&a…

阅读更多...

XCP详解「3.1·ASAP2新建A2L文件」

XCP详解「3.1·ASAP2新建A2L文件」

返回 XCP详解「总目录」 ASAP2中新建A2L文件通过ASAP2生成需要A2L文件更常用些新建Database ASAP2界面打开如下设置标定信号数量最大值导入elf文件，elf路径建议直接索引编译生成的Debug下的，防止编译后忘记更新加载信号查找需要监控或者修改的变…

阅读更多...

推荐文章

最新文章