深度学习:08 训练、测试和验证集的说明

news2024/12/25 14:37:57

目录

用于深度学习的数据集

训练集

验证集

测试集

总结


用于深度学习的数据集

接下来,我将在这篇里面讨论在训练和测试神经网络期间使用的不同数据集。

出于模型的训练和测试目的,我们应该将数据分解为三个不同的数据集。这些数据集将包含以下内容:

  • 训练集
  • 验证集
  • 测试装置

让我们从讨论训练集开始。

训练集

作用如其名,这是用来训练模型的一组数据。在每个时期,我们的模型将在训练集中的相同数据上反复训练,并且它将继续学习这些数据的特征。

我最为希望的是,以后我们可以训练好我们的模型,让它准确预测到以前从未见过的新数据,它将根据对训练数据的了解做出这些预测。

现在让我们看到验证集。

验证集

验证集是一组独立于训练集的数据,用于在训练期间验证我们的模型。此验证过程有助于提供可能有助于我们调整超参数的信息,尤其是可以检验模型的鲁棒性。

在训练期间的每个epoch,模型将根据训练集中的数据进行训练,它还将同时对验证集中的数据进行验证。

在训练过程中,模型将对训练集中每个输入的输出进行分类。在此分类发生后,将计算损失, 并且模型中的权重将被调整。然后,在下一个训练中,它将再次对相同的输入进行分类。

 

在训练期间,模型也将对验证集中的每个输入进行分类。它将仅根据对训练集中正在训练的数据的了解进行分类。根据我们的验证数据计算的损失,模型中的权重不会更新。

请记住,验证集中的数据与训练集中的数据是分开的。因此,当模型验证此数据时,此数据不包含模型已从训练中熟悉的示例。

我们需要验证集的主要原因之一是确保我们的模型不会过度拟合训练集中的数据。后面我们会详细的去学习过拟合与欠拟合。过拟合的意思是,我们的模型非常擅长对训练集中的数据进行分类,但它无法对未经训练的数据进行概括和准确分类。

在训练时,如果我们在验证集上验证模型,并看到它为验证数据提供的结果与为训练数据提供的效果一样好,那么我们可以说明我们的模型没有过度拟合,鲁棒性较好。另一方面,如果训练数据的结果非常好,但验证数据的结果滞后,那么我们的模型就是过度拟合的,鲁棒性差。

现在让我们来看到测试集。

测试集

测试集也是一组数据,它用于在模型经过训练后测试模型。测试集独立于训练集和验证集之外。

使用训练和验证集对模型进行训练和验证后,我们将使用模型来预测测试集中未标记数据的输出。

测试集与其他两个集之间的一个主要区别是不应标记测试集。在此之前,必须标记训练集和验证集,以便我们可以看到训练期间给出的指标,例如每次epoch的损失和准确性。

当模型对测试集中的未标记数据进行预测时,这与我们将模型部署到现场时使用的过程类型相同。

 例如,如果我们使用一个模型对数据进行分类,而事先不知道数据的标签是什么,或者从来没有显示过它将要分类的确切数据,那么我们当然不会给我们的模型标记数据。

让模型能够分类的整个目标是在事先并不知道数据是什么的情况下进行分类的。

机器学习和深度学习的最终目标是构建能够很好地泛化的模型。

总结

下表总结了深度学习数据集:

深度学习数据集
  数据 更新权重                               描述
训练集      是用于训练模型,训练的目标是将模型拟合到训练集,同时仍泛化为看不见的数据。
验证集      不在训练期间用于检查模型的泛化程度。
测试集      不用于应用到生产环境之前测试模型的最终泛化能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/138258.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【小f的刷题笔记】(JS)阶乘 - 阶乘后的零 LeetCode172 阶乘函数后K个零 LeetCode793

【阶乘】 一、阶乘后的零: LeetCode172 链接: 172.阶乘后的零 题目: 思路: 0的产生是一定是因为2*5产生的,所以就是找因数 并且,可想而知,找的到因数5,必然找的到因数2与之搭配…

【MySQL】深入理解B+树索引

文章目录1. 前言2. 索引方案3. InnoDB的索引方案4. 索引的分类4.1 聚簇索引4.2 二级索引4.3 联合索引5. InnoDB中的B树索引的注意事项5.1 内节点中目录项记录的唯一主5.2 一个页至少容纳2条记录6. MyISAM中的索引⽅案简单介绍1. 前言 索引,是MySQL快速查询的秘籍。…

ARMv8/ARMv9:深入理解MPIDR_EL1寄存器中的affinity

快速链接: . 👉👉👉 个人博客笔记导读目录(全部) 👈👈👈 付费专栏-付费课程 【购买须知】:【精选】ARMv8/ARMv9架构入门到精通-[目录] 👈👈👈官方文档(ARM ARM文档)的介绍如下所示 翻译一下MPIDR_EL1相关的英文,如下所示: 作用: 在多处理器系统中,为调…

Xshell 连接虚拟机(Ubuntu、CentOS)

对于一些linux的初学者来说,在没有自己的服务器时可以选择使用虚拟机来代替(如ubuntu、centos等)进行相关的学习。下面介绍下如何使用xshell来远程连接虚拟机。 注意:下面我以Ubuntu来举例说明。 1、创建虚拟机 虚拟机的创建网络…

1、数据库安装修改root密码管理自启服务

MySQL的下载和安装 登录MySQL官网下载MySQL.zip包 MySQL :: Download MySQL Community Server 下载完毕可自行选择存储位置,进行解压 解压后配置环境变量 完成配置后在MySQL目录下新建一个my.ini配置文件 文件写入以下内容 [client] # 设置mysql客户端默认字符集…

面向对象2(static修饰变量和方法、Javabean类、测试类和工具类、对main方法的理解、继承、子类继承父类构造方法变量和方法)

1、static修饰变量和方法 JDK8以前,静态区在方法区里面,JDK8开始,静态区挪到了堆内存当中 理解: 因为静态方法没有this,而非静态方法是有一个隐含的参数this的,所以想在静态方法里面调用非静态变量或方法就…

电子招标采购系统源码之传统采购模式面临的挑战

采购类型多 采购制度:采购金额、部门、品类的差异导致管理标准不同。 采购流程:从供应商管理、寻源操作到合同签订、订单执行,业务流程长,审批节点多,传统管理透明度低,联动性差。 供应商管理难 寻源&#…

亚马逊云科技 Build On - Serverless助力企业降本增效

亚马逊云科技 Build On - Serverless开启零售新篇章梅开三度活动体验实验问题总结一点建议咖啡案例实验Serverless学习总结梅开三度 Hi,作为一名Builder,这也是第三次参加由AWS&CSDN共同举办的Build On活动,跟前几期一样,活动举办方也是…

Java集合ArrayList-学习笔记

目录 ArrayList 集合和数组的优势对比: 1.1 ArrayList类概述 1.2 ArrayList类常用方法 1.3 ArrayList存储字符串并遍历 1.4 ArrayList存储学生对象并遍历 1.5 查找用户的索引 1.6 判断用户的是否存在 ArrayList 集合和数组的优势对比: 集合长度可…

Ardupilot EKF3核心算法《状态量速度与位置预测方程》

目录 文章目录 目录摘要1. Ardupilot EKF3核心算法《状态量速度预测方程》2. Ardupilot EKF3核心算法《状态量位置预测方程》3. Ardupilot EKF3核心算法《状态量速度与位置预测方程》摘要 本节主要记录Ardupilot EKF3核心算法《状态量速度与位置预测方程》的过程,欢迎批评指正…

mysql生产数据库被误删

23年的头一天上班安装数据库,因为ssh工具来回切换失误,犯下不可饶恕的错误,居然将生产数据库全部删除,工作十几年头一次干这种蠢事,第一时间反应是一世英名毁于一旦,赶紧跑路。第二反应还是想办法看能否挽回…

aws eks 使用 cloudformation 创建并更新自管节点组

参考资料 更新现有自行管理的节点组 使用eks自管节点组能够最大程度控制节点的各项配置和参数,包括并不限于ami,节点类型等 但是使用自管节点也给用户带来了较大的维护和更新成本。对于节点组的更新操作,我们可以使用cloudformation的方式…

速览Visual Studio 2022 中的新增功能

目录 性能改进 Visual Studio 2022 为 64 位 在文件中更快地查找 Git 工具速度更快 生成新式应用 适用于 C、.NET 和热重载的更佳开发工具 Blazor & 的汇报ASP.NET 的 Razor 编辑器 热重载 创新触手可及 Git 多存储库支持和行暂存支持 IntelliCode 改进 为每个…

魔方(15)二、三、四、五阶棋盘魔方

棋盘魔方 这价格实在可恶,于是我拿现成的魔方自己贴贴纸。 二阶棋盘魔方A 有4个角块是3面黑,4个角块是3面白,而6个面都是棋盘色。 只需要2步就可以转化成: 所以任意状态只要转化成这个状态再加2步就能复原了。 二阶棋盘魔方B&a…

【C++函数对象】STL基础语法学习 | 仿函数谓词内建仿函数

目录 ●仿函数 1.概念 2.使用 ●谓词 1.一元谓词 2.二元谓词 ●内建仿函数 1.算数仿函数 2.关系仿函数 3.逻辑仿函数 ●仿函数 1.概念 重载函数调用操作符的类,其对象常称为函数对象。函数对象使用重载的()时,行为类似函数的调用,所…

技术更高,设计更远:华为全屋智能设计大赛的审美之跃

“人生到处知何以?应似飞鸿踏雪泥。泥上偶然留指爪,鸿飞那复计东西。”很多设计师朋友跟我说,苏轼这首《和子由渑池怀旧》是对设计与审美的最高理解。好的设计,应该仅仅留下一点点痕迹,同时在简约的表象下隐含大量的审…

高通平台开发系列讲解(USB篇)USB调试手段汇总说明 - 视频课

文章目录 一、USB AT数据流说明二、BUS Hound 工具说明三、sysfs相关USB调试节点四、USB usbmon工具使用五、USB usbmon日志解析六、UsbTreeView软件的使用七、视频讲解分享沉淀、分享、成长,让自己和他人都能有所收获!😄 📢 碰见USB AT不通怎么办?所以本篇章汇总了高通…

Vue与React中父子组件生命周期的执行顺序?【生命周期详细知识讲解!!!】

文章目录一、 Vue中父子组件生命周期1-1 加载渲染过程1-2 销毁过程1-3 展示案例二、 React中父子组件生命周期2-1 关于React新旧版生命周期介绍2-2 父子组件生命周期2-2-1 父子组件初始化2-2-2 子组件修改自身state2-2-3 父组件修改props2-2-4 卸载子组件一、 Vue中父子组件生命…

卷绕剩余长度计算FC(收放卷应用)

卷径实时计算方法详细内容请参看下面的文章链接: 卷径计算详解(通过卷绕的膜长和膜厚进行计算)_RXXW_Dor的博客-CSDN博客有关卷绕+张力控制可以参看专栏的系列文章,文章链接如下:变频器简单张力控制(线缆收放卷应用)_RXXW_Dor的博客-CSDN博客_收放卷应用张力控制的开闭环…

【EHub_tx1_tx2_E100】Ubuntu18.04 + ROS_ Melodic + LingAo IMU 测试及RVIZ展示

简介:介绍LingAo 的6自由度IMU模块 在EHub_tx1_tx2_E100载板,TX1核心模块环境(Ubuntu18.04)下测试ROS驱动,打开使用RVIZ 查看IMU数据,本文的前提条件是你的TX1里已经安装了ROS版本:Melodic。 关…