【机器学习】正则化到底是什么?

news2024/11/28 6:29:44

先说结论:机器学习中的正则化主要解决模型过拟合问题。

如果模型出现了过拟合,一般会从两个方面去改善,一方面是训练数据,比如说增加训练数据量,另一方面则是从模型角度入手,比如,降低模型复杂度。
但无论是增加数据量还是降低模型复杂度,都是不容易做到的,这时正则化就是一个唾手可得选择,只要在损失函数中加入正则化项,往往就能得到一个不错的效果提升。

什么是过拟合?

如果模型在训练集上效果好,但在测试集上效果差,这时我们就怀疑模型出现了过拟合。
在这里插入图片描述

最左边的是欠拟合,模型过于简单,只能拟合简单的线性关系。

在这里插入图片描述

中间的代表刚好拟合,其拟合的是一个2次多项式:
在这里插入图片描述

最右边的图就是过拟合的例子,模型过于复杂,也就是说模型考虑的太多了,模型可能使用了与分类无关的特征,或者模型试图去拟合关于特征的M次多项式,最终导致过拟合。

在这里插入图片描述

什么是正则化?

以线性回归为例,正常情况下,损失函数是这个样子的:

(1)

加入正则化项后:

(2)

如果q等于1称为L1正则化,q等于2称为L2正则化。

为什么正则化能防止过拟合?

前面我们说过,降低模型复杂度可以防止过拟合,正则化本质上就是在降低模型复杂度,正则化项其实就是对损失函数达到最小值的最优解w进行了限制。

在SVM的推理过程中,我们接触了带约束的最优化问题,并且知道可以通过拉格朗日乘子法以及对偶问题将带等式约束以及不等式约束优化问题转换成不带约束的优化问题。 所以对于公式(2),可以等价为:

(3)

(4)

上面的公式可视化为:

在这里插入图片描述

上图,蓝色的圆是原始损失函数(1)的等高线,其中心点是最优解,棕色的代表正则化项,有了正则化项约束后,最优解只能在棕色的圆或者正方形内寻找,所以最优解只能是等高线与圆的切点或者与正方形顶点的交点。

那为什么与正则化项相交点的参数能防止过拟合呢?

先来看L1正则化,最优解w一定是在坐标轴上,也就是说w的某些维度一定是0,这就起到了参数稀疏化的作用。

(在神经网络中的Dropout机制不也是一种正则化思想嘛!)
既然参数的某些元素为0,那么就可能把模型拟合的M次多项式高次项或者组合项去掉转换为2次多项式了。
在这里插入图片描述

而L2正则化虽然没有使W中的某些元素为0,但却使w的每个元素都很小,也就是限制了某些高次项或者复杂组合项的作用。 所以无论是哪种正则化,都是在约束模型的复杂度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1192552.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

HDR 成像技术学习(四)

HDR(High Dynamic Range,高动态范围)仿佛是成像领域永恒的话题,动态范围越大,图像能清晰呈现的明暗差别也就越大。与传统的SDR(标准动态范围)相比,HDR图像能够以更高质量同时显示画面的亮部和暗部。 随这些年CMOS图像传感器工艺技术进步,以及后端数字信号处理算力的提升…

编译内核源码

本文将记录内核源码编译步骤,供有需要的人参考使用。 一、内核源码下载网址 内核源码网址:https://kernel.org/ 二、准备编译环境 这里需要注意区分x86架构和arm架构,需要不同的架构内核就准备对应的服务器即可,在服务器上安装…

arthas常用命令

arthas常用命令 IDEA插件 arthas idea退出arthasjad 反编译watch 方法执行数据观测tracemonitor https://arthas.aliyun.com/doc/ IDEA插件 arthas idea 退出arthas # quit或者exit命令,只是退出当前的连接, Attach到目标进程上的arthas还会继续运行,端口会保持开…

火力全开!腾讯云这次直接开卖5年

如果你是一名网站管理员,或者是一名创业公司的CEO,那么腾讯云这个词一定不会陌生。作为国内领先的云计算服务提供商,腾讯云一直以来都在为各行各业的用户提供着高效、稳定、安全的云计算服务。 而在今天,我们要给大家带来一个重磅…

2020年五一杯数学建模B题基于系统性风险角度的基金资产配置策略分析解题全过程文档及程序

2020年五一杯数学建模 B题 基于系统性风险角度的基金资产配置策略分析 原题再现 近年来,随着改革开放程度的不断提高,我国经济运行中的各种风险逐渐暴露并集中传导和体现于金融领域。党的“十九大”报告提出“守住不发生系统性金融风险的底线”要求&am…

官媒代运营:让大众倾听品牌的声音

在当今数字时代,媒体的影响力和多样性远远超出了以往的范畴。品牌和企业越来越依赖媒体来传播信息、建立声誉以及与大众互动。而媒体矩阵成为了现代品牌传播的关键策略,使大众能够倾听品牌的声音。媒体矩阵:多元化的传播渠道 媒体矩阵是指利…

使用双动态令牌混合器学习全局和局部动态以进行视觉识别

TransXNet: Learning Both Global and Local Dynamics with a Dual Dynamic Token Mixer for Visual Recognition 1、问题与解决2、引言3、方法3.1 双动态令牌混合器(D- Mixer)3.2 IDConv(Input-dependent Depthwise Convolution)3.3 Overlapping Spatial Reduction Attention …

玩具品牌的国际化之路:市场推广战略解析

玩具产业一直是全球市场中备受瞩目的领域之一。随着全球化的发展和互联网的普及,越来越多的玩具品牌开始进军国际市场。这既是机遇,也是挑战。在竞争激烈的全球市场中,如何成功推广玩具品牌是一个关键的问题。本文Nox聚星将和大家探讨玩具品牌…

Live800:企业客户服务如何数字化转型?

现代社会,随着互联网的快速发展,企业客户服务也在不断的数字化转型。数字化转型不仅可以更好地为客户提供服务,也可以提高企业的效率和降低成本。那么,企业客户服务如何数字化转型呢? 一、在线客服系统 在线客服系统是…

ECharts常用配置

1.使用: (1).下载引入 npm install echarts(版本号) --save import * as echarts from "echarts"; (2).准备一个DOM容器 (3).初始化echarts实例对象 echarts.init(document.getE…

获取小程序页面路径完整流程

应用场景:因为所涉及的功能要跳转到滴滴打车小程序的代驾页面,而我并不知道他的appid和对应的页面路径,所以跟着我的步骤走下,这里拿滴滴打车小程序举例。 现在的话我们是拿到了小程序对应的appid了,接下来就去获取小程…

软件测试:性能测试工具Jmeter与Locust

Apache JMeter™和Locust都是是最受欢迎的性能测试工具。 JMeter 和 Locust 简介 JMeter是久经考验的性能框架之一,其第一个版本大约在20年前发布。 它是用纯Java语言编写的。 最初,JMeter开发用于执行Web和FTP应用程序的负载测试。 但是,现…

算法打卡02——删除有序数组中的重复项

题目:删除有序数组中的重复项 给你一个 非严格递增排列 的数组 nums ,请你 原地 删除重复出现的元素,使每个元素 只出现一次 ,返回删除后数组的新长度。元素的 相对顺序 应该保持 一致 。然后返回 nums 中唯一元素的个数。 考虑…

ECRS工时分析软件:精益成本管理的得力助手

在制造业领域,精益成本管理已经成为提高企业竞争力、实现持续发展的关键因素。而在精益成本管理中,ECRS改善分析法是一种非常实用的工具。ECRS工时分析软件,结合了ECRS改善分析法和VIOOVI精益成本管理法的精髓,为IE部门在优化生产…

游读广州|康园环保行

“走出家门,共享阳光”残障人士游读广州项目是由广州市慈善会、广州市善城社区公益基金会资助、广州市黄埔区惠民社会服务中心实施的第四届“创善?微创投”广州市社区公益微创投项目,黄埔区康园工疗站约120名残障人士为服务对象,通过游玩与教…

解决Web server failed to start. Port XXXX was already in use.

这句错误描述意思是:当前程序的端口号被占用了,需要将占用该端口的程序停止掉才行。 解决方案: 1.winR键调出运行窗口,输入cmd进入命令行: 2.输入命令netstat -ano|findstr "XXXX"查看“XXXX”对应端口的程序占用情况…

平安人寿基于 Apache Doris 统一 OLAP 技术栈实践

导读:平安人寿作为保险行业领军企业,坚持技术创新,以数据业务双轮驱动的理念和更加开放的思路来应对不断增长的数据分析和应用需求;以深挖数据价值、保障业务用数效率为目标持续升级大数据产品体系。自 2022 年起平安人寿开始引入…

CSS3 用户界面、图片、按钮

一、CSS3用户界面&#xff1a; 在CSS3中&#xff0c;增加了一些新的用户界面特性来调整元素尺寸、框尺寸和外边框。CSS3用户界面属性&#xff1a;resize、box-sizing、outline-offset。 1、resize&#xff1a; resize属性指定一个元素是否应该由用户去调整大小。 <style…

YOLOv5 - common.py文件解读

&#x1f368; 本文为[&#x1f517;365天深度学习训练营学习记录博客 &#x1f366; 参考文章&#xff1a;365天深度学习训练营 &#x1f356; 原作者&#xff1a;[K同学啊 | 接辅导、项目定制](https://mtyjkh.blog.csdn.net/) &#x1f680; 文章来源&#xff1a;[K同学的学…

霍尔电流传感器如何进行可靠性测试?主要应用在哪些领域?

霍尔电流传感器广泛应用于航空航天、电源监测、飞行器状态监测、变速驱动设备、焊接设备供电电源、新能源汽车蓄电池管理系统等领域&#xff0c;在电流检测领域中有着重要地位和实用价值&#xff0c;在电驱系统中被称为新能源汽车的动力“心脏”。因此&#xff0c;霍尔电流传感…