【吴恩达机器学习笔记】六、过拟合及正则化

news2025/1/16 12:48:06

✍个人博客:https://blog.csdn.net/Newin2020?spm=1011.2415.3001.5343
📣专栏定位:为学习吴恩达机器学习视频的同学提供的随堂笔记。
📚专栏简介:在这个专栏,我将整理吴恩达机器学习视频的所有内容的笔记,方便大家参考学习。
📝视频地址:吴恩达机器学习系列课程
❤️如果有收获的话,欢迎点赞👍收藏📁,您的支持就是我创作的最大动力💪

六、过拟合及正则化

1. 过拟合问题

在开始介绍这节课内容之前,我们先来看一个线性回归的例子。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Mf4W8nIJ-1669683155508)(吴恩达机器学习.assets/image-20211105123753222.png)]

左图我们发现,所用的假设函数是一条直线,所以无法很好拟合数据,这我们称之为欠拟合(高偏差),中图即是最理想的拟合曲线,而右图的曲线就显得十分扭曲,但它经过了所有的数据点,可我们最后还是不能用它去预测新的数据,这我们称之为过拟合(高方差),当然除了线性回归问题,逻辑回归同样可能会出现过拟合的现象。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0qVHwqTb-1669683155511)(吴恩达机器学习.assets/image-20211105124601460.png)]

过拟合(Overfitting)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aXZ6JsNI-1669683155513)(吴恩达机器学习.assets/image-20211105124049027.png)]

这种问题,通常会出现在过量变量但数据过少的情况,J(θ)的值会接近于0,但却无法去预测新样本。

想要解决过拟合问题有下面两种方法:

  • 减少变量的数量

    • 可以人工的去选择一些可以删除的变量。
    • 也可以用之后要讲到的算法模型,去自动筛选变量。

    缺点:这种方法,可能会导致一些有用变量的丢失,失去了一些有效信息。

  • 正则化(Regularization)

    • 保留所有变量,但是减小量级(magnitude)或者参数θj的大小。

    优点:这种方法可以很好地确保那些对y的预测有帮助的变量不会丢失。

2. 正则化

正则化(Regularization)

通过减小对结果没什么用的θ值使其值接近于零,从而弱化其对结果的影响,简化函数。

线性回归的正则化

其正则化的代价函数如下:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PsPvLzVw-1669683155517)(吴恩达机器学习.assets/image-20211105133321077.png)]

在代价函数中表示正则化的是上图的公式中带λ的式子,因为不知道哪个参数会对结果产生影响,所以就交给模型去判断该减小哪个θ值,所以选择都进行减小。其中λ是用来平衡正则化式子与其左边优化式子的关系,而将θ平方是为了防止正负号影响结果。但是如果λ值过大的话,可能会使所有参数都趋于0,那得出的曲线就接近于一条曲线了。

  • 梯度下降

    在线性回归中使用正则化时,如果用梯度算法,则其中对J(θ)求θ偏导的式子也会有一点改变,实际上就在θj公式后面加一个(λ/m)θj小式子。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XrGBA05p-1669683155519)(吴恩达机器学习.assets/image-20211105141059080.png)]

​ 我们通过将含θj的项合并,可以得到1-α(λ/m),而这个式子其实之比1小一点点,可能是0.99,这样将0.99×θj每次 就只会缩小θj一点点,后面的式子都跟之前所示一样。

  • 正规方程

    在正规方程中用正则化,只需在原来的公式中加上一个λ×一个矩阵即可。

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-trWrQAkC-1669683155522)(吴恩达机器学习.assets/image-20211105142243701.png)]

    用正则化有一个好处就是可以解决一些矩阵不可逆的问题,因为前面我们讲到,如果样本数量比特征数量还要大时(XTX)-1是不可逆的,但是如果用正则化的话,只要保证λ大于0,就可以保证其中逆矩阵的式子一定可逆。

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0JeHD2pn-1669683155524)(吴恩达机器学习.assets/image-20211105142922329.png)]

逻辑回归的正则化

其正则化的代价函数如下:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dybDboon-1669683155526)(吴恩达机器学习.assets/image-20211105145131284.png)]

其实与线性回归的正则化代价函数的相似之处,都在原有函数后加上一个正则化公式。

  • 梯度下降

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0k6O9HEc-1669683155529)(吴恩达机器学习.assets/image-20211105145641496.png)]

​ 式子与线性回归的梯度下降很相似,表面上没什么区别,但还是那个原因,两者的假设函数不同。

  • 高级优化函数

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-r8fPi9fi-1669683155532)(吴恩达机器学习.assets/image-20211105151514222.png)]

    ​ 这里还是类似,同样是在公式后面加上了一个正则化的式子。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/44876.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JSON Web Token

目录1. 概念1. JWT 概述2. session认证流程2. JWT认证流程2. 使用JWT1. 获取令牌2. 验证令牌3. 封装工具类3. Springboot整合JWT1. 项目搭建2. 使用JWT3. 优化代码1. 概念 1. JWT 概述 JWT: 概念: 通过 JSON 形式作为 Web 应用中的令牌,用于…

[附源码]计算机毕业设计springboot贷款申请审核管理系统论文

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

「Vue3」手把手教你使用 Vite 快速搭建项目

本项目选型默认使用vue3 typescript vite 1. 使用vite初始化项目 vite创建地址,创建完成后有一个基本的项目结构了,如下图 2. 配置vite.config.ts,配置详解 import { defineConfig } from viteimport path from path;import vue from …

【PS-6】视图操作

目录 旋转视图工具 选项栏中的“滚动所有窗口 用【空格键】移动视图 将图片放大缩小的方法 1、缩放工具 2、通过鼠标右键对画面进行放大或缩小 3、【细微缩放】按钮 4、通过【CTRL /-】放大缩小 5、窗口→导航器 旋转视图工具 此工具常用于与数位板的结合使用 位置&…

北大惠普金融指数-匹配企业绿色创新指数2011-2020年:企业名称、年份、行业分类等多指标数据

1、数据来源:北京大学数字金融中心、国家统计局、国家专利产权局等部门公开数据 2、时间跨度:2011-2020年 3、区域范围:全国 4、指标说明: 中国内地31个省(直辖市、自治区,简称“省”)、337…

Rust机器学习之Linfa

Rust机器学习之Linfa 众所周知,Python之所以能成为机器学习的首选语言,与其丰富易用的库有很大关系。某种程度上可以说是诸如numpy、pandas、scikit-learn、matplotlib、pytorch、networks…等一系列科学计算和机器学习库成就了Python今天编程语言霸主的…

【MAX7800实现KWS20 demo演示】

【MAX7800实现KWS20 demo演示】1. 概述2. 关键字定位演示2.1 构建固件:2.2 选择板卡2.3 MAX78000 EVKIT2.3.1 MAX78000 EVKIT下载程序2.3.2 MAX78000 EVKIT 跳线设置2.3.3 MAX78000 EVKIT 操作2.4 MAX78000 Feather2.4.1 MAX78000 Feather羽毛板下载固件2.4.2 MAX78…

IBM MQ MQCSP

一,概念 1.1 用途 用途:MQCSP 结构使授权服务能够验证用户 ID 和密码。您在 MQCONNX 调用上指定 MQCSP 连接安全参数结构。 警告:在某些情况下,客户端应用程序的 MQCSP 结构中的密码将以纯文本形式通过网络发送。要确保客户端应…

【学习笔记58】JavaScript面向对象

一、认识面向对象 (一)面向过程编程 按照程序执行的过程一步一步的完成程序代码 (二)面向对象编程 面向对象编程是一种编程的方式/模式官方:对一类具有相同属性和功能的程序代码抽象的描述,实现代码编程…

Triangle Attack: A Query-efficient Decision-based Adversarial Attack

Triangle Attack: A Query-efficient Decision-based Adversarial Attack 三角攻击:一种查询高效的基于决策的对抗性攻击 Abstract 基于决策的攻击对实际应用程序构成了严重的威胁,因为它将目标模型视为一个黑箱,只访问硬预测标签。最近已经做出了很大…

【计组】指令和运算1--《深入浅出计算机组成原理》(二)

一、计算机指令 1、指令 从软件工程师的角度来讲,CPU就是一个执行各种计算机指令(Instruction Code)的逻辑.。 这里的计算机指令,也可以叫做机器语言。 不同发CPU支持的机器语言不同,如个人电脑用的是Intel的CPU&a…

同样Java后端开发三年,朋友已经涨薪到了30k,而我才刚到12K。必须承认多背背八股文确实有奇效!

程序猿在世人眼里已经成为高薪、为人忠诚的代名词。 然而,小编要说的是,不是所有的程序员工资都是一样的。 世人所不知的是同为程序猿,薪资的差别还是很大的。 众所周知,目前互联网行业是众多行业中薪资待遇最好的,…

2022年NPDP新版教材知识集锦--【第四章节】(2)

【概念设计阶段】(全部获取文末) 概念描述提供了产品概念的优点和特征的定性描述,其必要性体现在: ①为开发团队的所有成员以及与项目相关的成员提供了清晰性和一致性。 ②是向潜在客户解释产品的重要手段之一。 典型流程: 2.1概念工程 …

python使用websocket服务并在fastAPI中启动websocket服务

依赖 pip install websockets-routes 代码 import asyncio import websockets import websockets_routes from websockets.legacy.server import WebSocketServerProtocol from websockets_routes import RoutedPath# 初始化一个router对象 router websockets_routes.Router()…

Archlinux安装软件的那些事

个人主页:董哥聊技术我是董哥,嵌入式领域新星创作者创作理念:专注分享高质量嵌入式文章,让大家读有所得!文章目录1、ArchLinux1.1 ArchLinux原则1.2 软件包管理1.2.1 软件仓库1.2.2 包管理器2、Pacman2.1 pacman介绍2.…

什么是幂等性?四种接口幂等性方案详解!

幂等性在我们的工作中无处不在,无论是支付场景还是下订单等核心场景都会涉及,也是分布式系统最常遇到的问题,除此之外,也是大厂面试的重灾区。 知道了幂等性的重要性,下面我就详细介绍幂等性以及具体的解决方案&#…

SpringBoot中自动配置

第一种: 给容器中的组件加上 ConfigurationProperties注解即可 测试: Component ConfigurationProperties(prefix "mycar") public class Car {private String brand;private Integer price;private Integer seatNum;public Integer getSeat…

币圈已死,绿色积分是全新的赛道吗?

近几年来,移动互联网行业的迅猛发展,快速改变着社会业态。尽管如此,仍有大量企业线上线下处于割裂状态,2020 年一场疫情的突然爆发,并持续到 2022年,对零售行业造成流量崩塌、供应链中断、市场供需下滑等压…

现代 CSS 高阶技巧,完美的波浪进度条效果。

将专注于实现复杂布局,兼容设备差异,制作酷炫动画,制作复杂交互,提升可访问性及构建奇思妙想效果等方面的内容。 在兼顾基础概述的同时,注重对技巧的挖掘,结合实际进行运用,欢迎大家关注。 正…

金属非金属如何去毛刺 机器人浮动去毛刺

毛刺的产生 在金属非金属零件的加工中,由于切削加工过程中塑性变形引起的毛边,或者是铸造、模锻等加工的飞边,或是焊接挤出的残料,这些与所要求的形状、尺寸有所出入,在被加工零件上派生出的多余部分即为毛刺&#xf…