C2-1.4（L1,L2）正则化

C2-1.4（L1,L2）正则化

news2025/4/11 1:49:13

C2-1.4（L1,L2）正则化

参考书籍

在这里插入图片描述

1 正则化的概念

正则化(Regularization) 是机器学习中对原始损失函数引入额外信息，以便防止过拟合和提高模型泛化性能的一类方法的统称。也就是目标函数变成了原始损失函数+额外项，常用的额外项一般有两种，中文称作L1正则化和L2正则化，或者L1范数和L2范数（实际是L2范数的平方）。
L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓惩罚是指对损失函数中的某些参数做一些限制。对于线性回归模型，使用L1正则化的模型叫做Lasso回归，使用L2正则化的模型叫做Ridge回归（岭回归）。
为什么只对W进行限制，而不对b进行限制呢？：
- 答：b是一个常数，影响拟合曲线的上下位移

在这里插入图片描述

在这里插入图片描述

回到顶部

2 正则化的作用

L1正则化可以使得参数稀疏化，即得到的参数是一个稀疏矩阵，可以用于特征选择。
- 稀疏性，说白了就是模型的很多参数是0。通常机器学习中特征数量很多，例如文本处理时，如果将一个词组（term）作为一个特征，那么特征数量会达到上万个（bigram）。在预测或分类时，那么多特征显然难以选择，但是如果代入这些特征得到的模型是一个稀疏模型，很多参数是0，表示只有少数特征对这个模型有贡献，绝大部分特征是没有贡献的，即使去掉对模型也没有什么影响，此时我们就可以只关注系数是非零值的特征。这相当于对模型进行了一次特征选择，只留下一些比较重要的特征，提高模型的泛化能力，降低过拟合的可能。
L2正则化可以防止模型过拟合（overfitting）；一定程度上，L1也可以防止过拟合。

3、L1、L2正则化的公式表示

（把λ 变成 λ/2m ）

在这里插入图片描述

4、对L1正则化，L2正则化可视化理解

黑色阴影：表示的是 w1 w2的限制条件的范围（W1,W2必须符合在阴影内）
紫色阴影：表示损失函数，每一圈代表的是LOSS的等高线、
要求：
- ①：W1,W2必须满足 <=Θ ，
- 且 ②：Loss需要在满足①条件之下，LOSS损失函数值最小

结论：最后的结果是交点W*是最后正则化后W的结果

在这里插入图片描述

5、正则化如何降低过拟合

首先来复习一下**“正则化”公式：**

为了防止过拟合，线性回归的代价函数被叠加了一个正则化部分。如下图：

在这里插入图片描述

情况一/极端一：λ特别大时：

如λ取1000时，损失函数的值受正则化影响，为了减小J（w,b）最终的值，就尽量减少 w值，导致 W1 ≈W2≈…≈0

最终 f(x) ≈ b。最终造成了 欠拟合

情况二/极端二：λ特别小时：

如λ取0时，损失函数的值就导致了不受正则化的影响，就变成了以前那样的函数。形成了过拟合情况。

取中间值时候：

4.1、如何选择合适的lanmbda呢？

Step1：使用训练集训练出12个不同程度的正则化模型，每个\lambda一个；
Step2：使用12个模型分别对交叉验证集计算出验证误差；
Step3：得出交叉验证误差最小的那个模型；（比如这里给出的 λ = 5的情况）
Step4：使用Step3中得到的模型计算测试集上的误差，看是否能够推广。

在这里插入图片描述

4.2、lambda和偏差/方差的关系曲线

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1464521.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Oladance、南卡、韶音开放式耳机怎么样？3个月真实对比测评

Oladance、南卡、韶音开放式耳机怎么样？3个月真实对比测评

哪款开放式耳机好用？我亲自体验并评测了市场上流行的三个品牌的开放式耳机：Oladance、南卡、韶音。通过深入测试多维度性能表现，确保你能够远离劣质产品可能带来的问题。我想提醒大家，如果选错耳机可能会影响到音乐的真实还原和…

阅读更多...

【高德地图】Android搭建3D高德地图详细教

【高德地图】Android搭建3D高德地图详细教

📖Android搭建3D高德地图详细教程 📖第1章高德地图介绍✅了解高德地图✅2D地图与3D地图 📖第2章搭建3D地图并显示✅第 1 步：创建 Android 项目✅第 2 步：获取高德Key✅第 3 步：下载地图SDK✅第 4 步&…

阅读更多...

2023 龙蜥操作系统大会演讲实录：《兼容龙蜥的云原生大模型数据计算系统——πDataCS》

2023 龙蜥操作系统大会演讲实录：《兼容龙蜥的云原生大模型数据计算系统——πDataCS》

本文主要分三部分内容：第一部分介绍拓数派公司，第二部分介绍 πDataCS 产品，最后介绍 πDataCS 与龙蜥在生态上的合作。杭州拓数派科技发展有限公司（简称“拓数派”，英文名称“OpenPie”）是国内基础数据计…

阅读更多...

Android platform tool中d8.bat不生效

Android platform tool中d8.bat不生效

d8.bat因找不到java_exe文件，触发EOF d8.bat中之前代码为： set java_exe if exist "%~dp0..\tools\lib\find_java.bat" call "%~dp0..\tools\lib\find_java.bat" if exist "%~dp0..\..\tools\lib\find_java.bat" …

阅读更多...

【教3妹学编程-算法题】匹配模式数组的子数组数目 II

【教3妹学编程-算法题】匹配模式数组的子数组数目 II

3妹：2哥2哥，你有没有看到上海女老师出轨男学生的瓜啊。 2哥 : 看到了，真的是太毁三观了！ 3妹：是啊， 老师本是教书育人的职业，明确规定不能和学生谈恋爱啊，更何况是出轨。 2哥 : 是啊…

阅读更多...

petalinux_zynq7 驱动DAC以及ADC模块之一：建立IP

0. 环境 - ubuntu18 - vivado 2018.3 - mizar z7010 ada106模块 1. vivado 1.1 创建vivado工程运行vivado source /tools/Xilinx/Vivado/2018.3/settings64.sh vivado& 创建vivado工程 Vivado -> Create Project -> Next -> -> Project name: …

阅读更多...

【论文阅读笔记】Revisiting RCAN: Improved Training for Image Super-Resolution

【论文阅读笔记】Revisiting RCAN: Improved Training for Image Super-Resolution

论文地址：https://arxiv.org/abs/2201.11279 代码地址：https://github.com/zudi-lin/rcan-it 论文小结本文的工作，就是重新审视之前的RCAN，然后做实验来规范化SR任务的训练流程。此外，作者得出一个结论：…

阅读更多...

Vue单文件学习项目综合案例Demo，黑马vue教程

Vue单文件学习项目综合案例Demo，黑马vue教程

文章目录前言一、小黑记事本二、购物车三、小黑记账清单前言 bilibili视频地址一、小黑记事本效果图主代码 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"/><meta http-equiv"X-UA-Compatible&…

阅读更多...

linux增加物理磁盘并挂载到文件系统

linux增加物理磁盘并挂载到文件系统

centos7增加物理磁盘并挂载到文件系统 1、查看所有磁盘情况 fdisk -l2、创建挂载路径 mkdir /data3、格式化磁盘 #磁盘filesystem(上图标红处) mkfs.xfs -f /dev/sda建议与其它磁盘文件系统保持一致，我这里是xfs 可通过 cat /dev/sda查看 4、挂载 mount /dev/…

阅读更多...

5个精美的wordpress中文企业主题模板

5个精美的wordpress中文企业主题模板

元宇宙WordPress主题模板简洁大气的元宇宙 Metaverse WordPress主题模板，适合元宇宙行业的企业官网使用。 https://www.jianzhanpress.com/?p3292 职业技术培训WordPress主题模板简洁大气的职业技术培训WordPress主题，适合用于搭建教育培训公司官方…

阅读更多...

3个wordpress中文企业主题模板

3个wordpress中文企业主题模板

农业畜牧养殖wordpress主题简洁大气的农业畜牧养殖wordpress主题，农业农村现代化，离不开新农人、新技术。 https://www.jianzhanpress.com/?p3051 老年公寓wordpress主题浅绿色简洁实用的老年公寓wordpress主题，适合做养老业务的老年公…

阅读更多...

37.仿简道云公式函数实战-数学函数-SIN

37.仿简道云公式函数实战-数学函数-SIN

1. SIN函数 SIN 函数可用于计算角度的正弦值，返回 -1 到 1 之间的数值。 2. 函数用法 SIN(弧度) 使用该函数时，需要将角度转化为弧度参与计算，可通过 RADIANS 函数将角度转化为弧度。 3. 函数示例如计算 SIN(30) 的值，可设…

阅读更多...

【linux进程间通信(二)】共享内存详解以及进程互斥概念

【linux进程间通信(二)】共享内存详解以及进程互斥概念

💓博主CSDN主页:杭电码农-NEO💓 ⏩专栏分类:Linux从入门到精通⏪ 🚚代码仓库:NEO的学习日记🚚 🌹关注我🫵带你学更多操作系统知识 🔝🔝 进程间通信 1. 前言2. 共享内…

阅读更多...

【stm32】hal库学习笔记-UART/USART串口通信（超详细！）

【stm32】hal库学习笔记-UART/USART串口通信（超详细！）

【stm32】hal库学习笔记-UART/USART串口通信 hal库驱动函数 CubeMX图形化配置导入LCD.ioc RTC设置时钟树配置设置LSE为RTC时钟源 USART设置中断设置程序编写编写主函数 /* USER CODE BEGIN 2 */lcd_init();lcd_show_str(10, 10, 16, "Demo12_1:USART1-CH340&q…

阅读更多...

MLflow【部署 01】MLflow官网Quick Start实操安装、模型训练、数据预测（一篇学会部署使用MLflow）

MLflow【部署 01】MLflow官网Quick Start实操安装、模型训练、数据预测（一篇学会部署使用MLflow）

一篇学会部署使用MLflow 1.版本及环境2.官方步骤Step 1 - Get MLflowStep 2 - Start a Tracking ServerStep 3 - Train a model and prepare metadata for loggingStep 4 - Log the model and its metadata to MLflowStep 5 - Load the model as a Python Function (pyfunc) an…

阅读更多...

yolov5导出onnx转engine推理

yolov5导出onnx转engine推理

yolov5导出注意事项配置需要提供配置文件和权重文件，不然导出模型不能正常推理。默认提供检测头。 ModuleNotFoundError: No module named ‘tensorrt’安装TensorRT-python发现报错由于ModuleNotFoundError: No module named ‘tensorrt’安装TensorRT-pyt…

阅读更多...

备战蓝桥杯—— 双指针技巧巧答链表1

备战蓝桥杯—— 双指针技巧巧答链表1

对于单链表相关的问题，双指针技巧是一种非常广泛且有效的解决方法。以下是一些常见问题以及使用双指针技巧解决： 合并两个有序链表： 使用两个指针分别指向两个链表的头部，逐一比较节点的值，将较小的节点链接到结果链表…

阅读更多...

【学习iOS高质量开发】——协议与分类

【学习iOS高质量开发】——协议与分类

文章目录一、通过委托与数据源协议进行对象间通信1.委托模式2.要点二、将类的实现代码分散到便于管理的数个分类之中1.如何实现2.要点三、总是为第三方类的分类名称加前缀1.为什么总是为第三方类的分类名称加前缀2.要点三、勿在分类中声明属性1.勿在分类中声明属性的原因2.…

阅读更多...

OpenAI文生视频大模型Sora概述

OpenAI文生视频大模型Sora概述

Sora，美国人工智能研究公司OpenAI发布的人工智能文生视频大模型（但OpenAI并未单纯将其视为视频模型，而是作为“世界模拟器” ），于2024年2月15日（美国当地时间）正式对外发布。 Sora可以根据用户…

阅读更多...

三维测量技术及应用

三维测量技术及应用

接触式测量（Contact Measurement）： 坐标测量机（CMM, Coordinate Measuring Machine）：通过探针直接接触物体表面获取三维坐标数据。优点是精度高，但速度慢，对软质材料测量效果不佳&am…

阅读更多...

推荐文章

最新文章