超参数、划分数据集、偏差与方差、正则化

news2025/1/16 4:04:01

目录

1.超参数(hyperparameters)

参数(Parameters):...

超参数:能够控制参数W,b的参数,是在开始学习之前设置的参数

比如:学习率、梯度下降循环的数量#iterations、隐藏层数量#hidden layers、每一个隐藏层的隐藏单元数量#hidden units...

2.划分数据集

通常将数据集划分为训练集(train sets)验证集(validation set)测试集(test sets)

训练集用来执行训练算法,验证集用来选择表现最好的模型,测试集用来最后评估算法的运行情况。

划分比例:

小数据时代(100~1w条数据):60%/20%/20%

大数据时代(百万条级别):验证集和测试集的比例更小,毕竟验证集只是为了测试哪种算法的性能更好一些,测试集是为了评估最后选择的模型的性能。比如,100w条数据,验证集和测试集各1w就够了。

数据更大的话,99.5%/0.25%/0.25%或99.5%/0.4%/0.1%的比例也是可以的。

没有测试集也是可以的。

3.偏差与方差(bias and variance)

偏差(bias)用来描述训练集错误率,高偏差(high bias)意味着高训练集错误率(train set error),也就是欠拟合(underfitting)

方差(variance)用来描述对训练集中小波动的敏感度误差,高方差(high variance)意味着低训练集错误率(train set error)和高验证集错误率(validation set error),两者差距比较大,也就是过拟合(overfitting)。

Train set error

1%

15%

15%

0.5%

validation set error

11%

16%

30%

1%

high variance

high bias

high variance, high bias

low variance, low bias

解决高偏差(high bias):训练更大的网络(含有更多的隐藏层),尝试更先进的优化算法。

解决高方差(high variance):准备更多的数据来训练,采用正则化(regularization)来减少过拟合。

4.正则化(Regularization)

以逻辑回归为例

,l表示第几层

在一个隐藏单元上实现正则化

L2正则化:,λ是正则化参数(regularization parameter)。

L1正则化:

欧几里得范数(Euclidean norm),即距离范数,指在m维空间中两个点之间的真实距离。

绝对值范数(Absolute-value norm),表示输入特征x的个数。

在整个神经网络实现正则化

,弗罗贝尼乌斯范数(Frobenius norm):矩阵各项元素平方的和再开根。

矩阵的维度为(,),表示神经网络第l层所包含的隐藏单元数量,表示前一层的单元数量。结合上面逻辑回归的公式,可知公式中x的维度为(,1)。在每一个隐藏单元中,对于前一层的个输入,有个对应的参数

5.为什么正则化能减少过拟合

以逻辑回归和常用的L2正则化为例。

当提高λ时,为了减小损失函数J(w,b),需要减小,也就是要减小wij,直观一点理解,就是让一部分wij=0,甚至有的隐藏单元中的参数wij全是0,它的影响就可以忽略,从而让整个网络变得简单

此外,w变小,z变小,代入tanh激活函数中,激活函数在z比较小的部分近似线性函数,相较于复杂的非线性函数,显然更简单一些。

6.Droup 正则化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/162387.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

力扣sql基础篇(七)

力扣sql基础篇(七) 1 统计各专业学生人数 1.1 题目内容 1.1.1 基本题目信息 1.1.2 示例输入输出 1.2 示例sql语句 # 想要没有学生的部门也保存,就得以部门表作为主表 #字母表顺序就是升序 SELECT d.dept_name,IFNULL(s1.number,0) student_number FROM Department d LEFT …

2022. 12 青少年机器人技术等级考试理论综合试卷(二级)

2022.年12月青少年机器人技术等级考试理论综合试卷(二级) 一、 单选题(共 30 题, 共 60 分) 1.“机器人三原则” 是由谁提出的? ( ) A.美国人艾萨克 阿西莫夫 B.日本人森昌弘 C.美国人乔治 德沃尔 D.中国人…

谈谈 MongoDB 中连接池、索引、事务等问题

大家好,三分钟你将学会: MongoDB连接池的使用方式与常用参数查询五步走,能活九十九?MongoDB索引与MySQL索引有何异同?MongoDB事务与ACID什么是聚合框架?在最开始接触MongoDB的时候,是通过 Mong…

H3C V7MSR路由器定时限速的典型应用配置

某公司希望在上班时间对员工进行每IP限速,其他时间不限制。 1.主要配置如下: #创建关闭接口g0/1的限速功能 scheduler job close-car-g0/1 command 1 system-view command 2 interface g0/1 command 3 undo qos car inbound carl 1 #创建开启接口g0…

什么是CISP-ICSSE?到底该不该考?

CISP-ICSSE注册信息安全专业人员-工业控制系统安全工程师,英文为 Certified Information Security Professional-ICS Security Engineer,简称 CISP-ICSSE。 持证人员可以从事信息安全技术领域工业控制系统安全方向的工作,具备制定工 控安全威…

74. 序列模型

1. 序列数据 实际中很多数据是有时序结构的例如,电影的评价随时间变化而变化 拿奖后评分上升,直到奖项被忘记看了很多好电影后,人们的期望变高季节性:贺岁片、暑期档导演、演员的负面报道导致评分变低 2. 序列数据-更多例子 音…

【文件操作】C语言

目录1. 为什么使用文件2. 什么是文件2.1 程序文件2.2 数据文件2.3 文件名3. 文件的打开和关闭3.1 文件指针3.2 文件的打开和关闭4. 文件的顺序读写5. 文件的随机读写5.1 fseek5.2 ftell5.3 rewind6. 文本文件和二进制文件7. 文件读取结束的判定8. 文件缓冲区1. 为什么使用文件 …

NodeMCU esp8266的网络连入网络的模式方式即程序实例

接入WIFI模式 参考:http://www.taichi-maker.com/homepage/esp8266-nodemcu-iot/internet-basics/link-layer/ 模式1 – 无线终端模式(Wireless Station) 简单说就是把这个开发板做为终端连入WiFi 程序实例 需要注意:端口号…

TikTok的崛起历程:我们所有人都看到了这种潜力

武汉瑞卡迪电子商务有限公司:在短短五年里,TikTok已经爆发成为一种流行文化现象以及一个地缘政治闪爆点。它是全世界最热门的应用,被2/3的美国青少年所使用。它的超级吸引人的短视频格式已经让硅谷争相效仿,并使一夜成名变得比以前…

Linux常用命令——vi命令

在线Linux命令查询工具(http://www.lzltool.com/LinuxCommand) vi 功能强大的纯文本编辑器 补充说明 vi命令是UNIX操作系统和类UNIX操作系统中最通用的全屏幕纯文本编辑器。Linux中的vi编辑器叫vim,它是vi的增强版(vi Improved)&#xff…

SpringBoot启动原理解析

我们开发任何一个 Spring Boot 项目,都会用到如下的启动类 SpringBootApplication public class Application { public static void main(String[] args) { SpringApplication.run(Application.class, args);}}从上面代码可以看出,Annotation 定义&am…

继承是代码复用的最佳方案吗?

继承,一个父类可有许多个子类。父类就是把一些公共代码放进去,之后在实现其他子类时,少写一些代码。 代码复用,很多人觉得继承就是绝佳方案。若把继承理解成代码复用,更多是站在子类角度向上看。在客户端代码使用时&a…

2023云和恩墨生态产品发布会圆满落幕,三款全新产品初亮相,助力千行百业智能升级...

1月12日,以“多元共生,智创未来”为主题的2023云和恩墨生态产品发布会在线上成功召开,发布了三款全新产品:zData X 数据库一体机、zCloud for DBaaS平台和 zAIoT 机器数据智管产品。本次发布会还得到了来自中国信通院云大所、科大…

记一个奇怪的gcc编译优化:-ftree-vrp

记一个奇怪的gcc编译优化:-ftree-vrp最近有同事遇到一个gcc不同编译优化选项结果不一致的问题,从该问题反映出编程规范(我更倾向于华为内部使用的”编程军规“的叫法)的问题非常有参考意义,在此分享给大家。 程序可简…

通信原理与MATLAB(十四):HDB3的编解码

目录1.HDB3码的编码原理2.HDB3码的解码原理3.HDB3码的编解码的代码4.HDB3码的误码率曲线4.1原理4.2 HDB3码的误码率曲线的代码4.3 HDB3码的误码率曲线图1.HDB3码的编码原理 如下图所示,HDB3编码的步骤: (1)原码中连0的个数小于等于3,则和AMI…

力扣刷题记录——482. 密钥格式化、485.最大连续1的个数、492. 构造矩形

本专栏主要记录力扣的刷题记录,备战蓝桥杯,供复盘和优化算法使用,也希望给大家带来帮助,博主是算法小白,希望各位大佬不要见笑,今天要分享的是——《482. 密钥格式化、485.最大连续1的个数、492. 构造矩形》…

如何使用mybatis处理数据库关系中的多对一关系呢?

测试环境的搭建: 导入lombok: 不懂得小伙伴可移步这篇文章 新建实体类: 拿我们日常生活中最常见的举例:多个学生对应一个老师 对于学生这边而言,关联… 多个学生关联一个老师[多对一] 对于老师而言,集…

「智能农牧」智慧养殖系统实现数智化经营,提升管理效率

01 方案背景 当前我国农牧养殖业正在不断发展,农牧养殖业的发展到了粗放型管理向集约型管理的节点上,智慧养殖势在必行。 智慧养殖是“人流程管理”到“数字智能”、从精细化管理到数智化经营。过去养猪行业的核心优势是管理的精细化,其经营…

Linux 命令(244)—— reset 命令

文章目录1.命令简介2.命令格式3.选项说明4.常用示例参考文献1.命令简介 reset 用来重新初始化终端。 在有些情况,终端显示会混乱无比,比如不小心显示了一个二进制文件或使用 tput 进行了一些不符合预期的终端配置。在你不知道 reset 命令前&#xff0c…

Linux cat 命令

cat(英文全拼:concatenate)命令用于连接文件并打印到标准输出设备上。使用权限所有使用者语法格式cat [-AbeEnstTuv] [--help] [--version] fileName参数说明:-n 或 --number:由 1 开始对所有输出的行数编号。-b 或 --…