MachineLearningWu_9_overfitting

news2024/11/13 10:49:41

x.1 过拟合问题

在开始前,让我们先理解一下模型拟合过程中经常出现的三种情况,underfit, just right, overfit/high variance,underfit是指没有足够的特征来拟合现有数据或者iterations训练轮次过少,而overfit是指使用了远大于数据集特征的模型来拟合现有数据。

请添加图片描述

为了更好的理解,让我们再举例一个Classification的例子,

请添加图片描述

x.2 如何解决过拟合问题

对于解决过拟合问题,其中一个常用的方法是使用更多的training examples训练样本,

请添加图片描述

对于解决过拟合问题,我们还有一个方法就是前面提到的特征工程中,进行特征选择的过程,我们可以选择一些直觉上有用的特征以此来达到减少复杂度的目的,当然这种方式也存在一些不好的地方,例如一些有用的特征可能会丢失,

请添加图片描述

最后一类减少过拟合的方法叫做正则化,而实际上我们最长使用的正则化技术叫做L2正则化,它的原理是通过将部分特征的系数置为一个非常小的数以达到减少特征的作用,如下我们将x四次方的系数设置为0.0001以此达到最小化x四次方对f(x)造成的影响。注意,在实际情况中,我们往往只对weight的值进行L2正则化,而忽视bias,并不对bias的值进行正则化。

请添加图片描述

请添加图片描述

x.3 如何实现L2正则化

实现L2正则化,即将weight权重加入到损失函数中,例如我们不想要x的三次方和x的四次方,我们就把x的三次方和x的四次方前的可学习权重weight加入到我们的loss中,由于我们的策略要做的事情是argmin(loss),所以我们便会想方设法使得w3和w4小,如下,

请添加图片描述

但是往往你并不知道你需要对哪一个特征进行惩罚,所以我们一视同仁地对这些特征进行惩罚,即我们对所有的特征都进行惩罚如下,其中我们往往只对weight进行惩罚而忽视bias,这种全部惩罚的方式被实验证明是极好的。

请添加图片描述

我们对下面式子的直观理解是,当lambda=0时,等于不添加对权重的乘法,会偏向于overfit过拟合;而当lambda=无穷大时,几乎就等于将权重值全部置为0,会偏向于underfit欠拟合。所以lambda要合适的选择,用于权衡data和weight中的平衡。

请添加图片描述

x.4 将L2正则化应用于Linear Regression

接下来我们将梯度下降算法应用于更新的loss,由于我们只增加了对weight的惩罚,所以wj的偏微分会产生变化,如下所示,

请添加图片描述

针对wj的变换,我们做恒等变换得到 w j ( 1 − α ∗ λ / m ) + . . . wj(1-\alpha * \lambda / m) + ... wj(1αλ/m)+...,我们能够发现省略号…中的部分是不变的,即我们的L2正则化其实只改变了wj前的系数,例如wj * 0.9998,正则化本质上只做了shrink weight缩小权重的作用。

请添加图片描述

x.5 logistic regression

同样也可以将L2正则化应用于逻辑回归,和线性回归类似,只不过f(x)产生了变化,

请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/736630.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ASO优化之应用评论的重要性

应用的评级在吸引新用户使用我们应用程序方面发挥着非常关键的作用。许多用户会通过阅读应用的评分和评论来观察我们应用的独特性和功能。更多正面评价和5星级评级,能够给我们应用的访问者提高下载应用的积极性,同时也会增加信任感。 如果我们的应用的…

cloudstack使用nginx部署ui

一、源码打包 #在ui目录下 #安装依赖 npm install #启动项目 npm run serve 将打包后的文件复制到nginx的文件区域,示例使用/usr/local/code/front/ui/文件夹 二、配置nginx # For more information on configuration, see: # * Official English Documentation…

Vue3中父子组件实现数据双向绑定效果

父组件&#xff1a; <template><div class"user"><hy-form v-model"formData" /></div> </template><script lang"ts"> import { defineComponent, ref } from vue import HyForm from /base-ui/formexpor…

基于Hololen2 unity vuforia空间生成大型物体,以及打开内部浏览器的打开教程

1.简介 1.1 功能介绍 本文主要做了两个功能&#xff1a; 1.扫描一张二维码生成一个操作台&#xff08;桌子&#xff09;&#xff0c;这张桌子比二维码尺寸大非常多&#xff08;就是实际物体大小的桌子&#xff09;&#xff0c;所以需要定位 好桌子和操作台之间的位置关系。并且…

【计算机组成与体系结构Ⅰ】课后作业汇总

目录 1-1 1-2 2-1 3-1 3-2 4-1 4-2 5-1 6-1 6-2 7-1 7-2 1-1 作业1. 袁春风《计算机组成与系统结构》第2版或者第3版&#xff1a;第1章 习题 2&#xff08;1&#xff09;-&#xff08;3&#xff09; 冯诺依曼计算机由哪几部分组成&#xff1f;各部分的功能是什么&…

java.sql.SQLException: connection holder is null

一、工作中遇到的问题汇总 1、java.sql.SQLException: connection holder is null&#xff1b; 问题描述&#xff1a;对于大表进行查询、修改操作时&#xff0c;有时sql需要执行很长时间&#xff0c;这时就可能在执行到半路时、报错SQLException: connection holder is null。…

时间序列分析波动性预测GARCH模型

GARCH&#xff08;Generalized Autoregressive Conditional Heteroskedasticity&#xff09;模型是一种常用于预测金融时间序列波动性的统计模型。它是ARCH&#xff08;Autoregressive Conditional Heteroskedasticity&#xff09;模型的扩展&#xff0c;通过引入对过去波动性的…

python怎么获取免费代理IP

什么是免费代理IP 免费代理IP是指可以免费使用的代理服务器的IP地址。代理服务器充当客户端和目标服务器之间的中间人&#xff0c;通过转发请求和响应来实现网络数据的传输。使用代理IP可以隐藏真实的客户端IP地址&#xff0c;实现匿名访问网络资源。 免费代理IP通常由个人或组…

【Java】自定义对象作为HashMap的键,同时重写hashCode和equals方法

如果要将自定义类的实例 作为HashMap的 键&#xff0c;必须重写hashCode和equals方法 简单版本&#xff0c;看不懂看后面复杂版本解释 复杂版本解释 当我们用 HashMap存入自定义的类时&#xff0c;如果不重写这个自定义类的equals和hashCode方法&#xff0c;得到的结果会和我们…

3.精通RabbitMQ—基础 RabbitMQ知识、进阶 RabbitMQ知识

本文目录如下&#xff1a; 什么是 RabbitMQ?什么是 消息中间件?RabbitMQ 的应用场景&#xff1f;RabbitMQ 中主要包含哪几个部分&#xff1f; 精通 RabbitMQ&#xff0c;从认识开始 什么是 RabbitMQ? RabbitMQ 整体上是一个 生产者与消费者模型&#xff0c;主要负责 接收、…

Redis的一个大Key

什么是 redis 的大 key? redis 的大 key 不是指存储在 redis 中的某个 key 的大小超过一定的阈值&#xff0c;而是该 key 所对应的 value 过大对于 string 类型来说&#xff0c;一般情况下超过 10KB 则认为是大 key&#xff1b;对于set、zset、hash 等类型来说&#xff0c;一…

无线通信模块接口类型_USB/SDIO/UART接口wifi模块特性

无线通信模块接口,简单来说设备需要与外部设备交换数据的通讯接口,如工程师常提到的USB接口,UART接口,SDIO接口,I2S接口,I2C接口,WAN口,LAN口,SPI接口,以太网接口(RJ-45接口)等。 原文链接:http://www.skylab.com.cn/newsview-2768.html 1、USB接口 USB接口是平…

Git gui教程---第六篇 Git gui的使用 变动,提交

变动&#xff0c;提交 修改TEST.txt的内容&#xff0c;并且点击重新扫描&#xff0c;则TEST文件会出现在未缓存的窗口中 像前面教的一样&#xff0c;缓存后&#xff0c;添加描述后提交&#xff0c;并且打开历史记录可以查看到提交的变动。我这里会新增一个文件并且提交多几次&…

N天爆肝数据库——MySQL(2)

本篇文章&#xff0c;主要对DML DQL进行知识总结和学习。 期待和大家一起学习进步。DML-介绍 DML(数据库操作语言)&#xff0c;用来对数据库中表的数据 记录进行增删改操作。 添加数据&#xff08;INSERT&#xff09; 修改数据&#xff08;UPDATE&#xff09; 删除数据&#…

计算机毕业论文内容参考|基于Java的城乡低保信息管理系统的设计和实现

文章目录 导文摘要:前言:绪论:1课题背景:2国内外现状与趋势:3课题内容:相关技术与方法介绍:系统分析:系统设计:系统实现:系统测试:总结与展望:1本文总结:2后续工作展望:导文 这里是导文计算机毕业论文内容参考|基于Java的城乡低保信息管理系统的设计和实现 摘要:…

C++图形开发(10):移动的方块

文章目录 1.引入2.静止的方块3.移动的方块 1.引入 那么我们今天就来实现一下矩形的移动 注意&#xff1a;本篇文章的内容都是基于此前用空格控制的小球的基础上进行开发的&#xff0c;详见&#xff1a;C图形开发&#xff08;8&#xff09;&#xff1a;空格键控制小球起跳 先来…

PHP实现微信小程序推送消息至公众号

1、申请微信小程序和公众号必须是同一个主体 2、小程序和公众号必须要认证 3、公众号是服务号&#xff0c;接收消息必须关注公众号 4、公众号后台配置 开通模版服务 申请模版&#xff0c;获取模板消息的ID 关联小程序 获取公众号appid 5、小程序后台获取appid&#xff0c;a…

常用异常检测算法总结记录

这篇博文主要是延续前文系列的总结记录&#xff0c;这里主要是总结汇总日常主流的异常检测算法相关知识内容。 &#xff08;1&#xff09;基于统计方法的异常值检测 基于统计方法的异常值检测是一种常用的异常检测算法&#xff0c;它基于样本数据的统计特性来识别与其他样本显…

华为OD机试真题 Java 实现【阿里巴巴找黄金宝箱(I)】【2023 B卷 100分】,附详细解题思路

目录 一、题目描述二、输入描述三、输出描述四、解题思路五、Java算法源码六、效果展示1、输入2、输出3、说明 一、题目描述 一贫如洗的樵夫阿里巴巴在去砍柴的路上&#xff0c;无意中发现了强盗集团的藏宝地&#xff0c;藏宝地有编号从0~N的箱子&#xff0c;每个箱子上面贴有…

如何从一个仪表盘管理多个WordPress网站?

您是否正在寻找一种管理多个WordPress网站的简单方法&#xff1f; 监控多个网站并使其保持更新可能非常耗时。 幸运的是&#xff0c;有几种 WordPress 管理工具可以让您从单个仪表板管理多个 WordPress 网站变得非常容易。这将帮助您节省大量时间&#xff0c;同时使所有 Word…