为什么有的深度学习训练，有训练集、验证集、测试集3个划分，有的只是划分训练集和测试集？

为什么有的深度学习训练，有训练集、验证集、测试集3个划分，有的只是划分训练集和测试集？

news2026/2/11 11:08:05

在机器学习和深度学习中，数据集的划分方式取决于任务需求、数据量以及模型开发流程的严谨性。

在这里插入图片描述

1. 三者划分：训练集、验证集、测试集

目的

训练集（Training Set）：用于模型参数的直接训练。
验证集（Validation Set）：用于调参和模型选择（如调整超参数、选择网络结构、防止过拟合）。
测试集（Test Set）：用于最终模型性能的无偏评估，模拟真实场景下的泛化能力。

为什么需要验证集？

避免过拟合测试集：如果仅用测试集评估模型并反复调整参数，模型可能间接“记忆”测试集的分布，导致评估结果虚高。
模型选择：验证集帮助选择最优超参数（如学习率、正则化系数）或模型架构（如ResNet vs. VGG）。

适用场景

数据量充足（如ImageNet、COCO等大规模数据集）。
需要严谨的模型开发流程（如学术研究、工业级应用）。
超参数调优复杂（如网格搜索、随机搜索）。

典型流程

训练模型（训练集）。
调参和模型选择（验证集）。
最终评估（测试集，仅一次）。

2. 两者划分：训练集和测试集

省略验证集的原因

数据量极小：若数据量过小（如仅几百样本），划分验证集可能导致训练数据不足，影响模型性能。
简化流程：在快速实验或简单任务中，可能直接使用测试集评估（但存在风险）。
交叉验证替代：若数据不足，常用K折交叉验证替代固定验证集。

潜在风险

数据泄露（Data Leakage）：若反复用测试集调整模型，可能高估模型真实性能。
缺乏模型选择依据：无法有效比较不同超参数或模型架构的优劣。

适用场景

数据量极小（如医学影像数据稀缺）。
快速原型验证（如教学示例、简单实验）。
结合交叉验证：如将训练集拆分为K个子集，轮流作为验证集（无需单独划分）。

关键区别与选择建议

划分方式	适用场景	优点	缺点
训练/验证/测试集	数据充足、严谨的模型开发	无偏评估、调参灵活	需要更多数据
训练/测试集	数据稀缺、快速实验	简单直接	风险高、无法调参

实际案例

三者划分：
- 在ImageNet竞赛中，训练集用于训练，验证集用于调参，测试集用于最终排名。
- Kaggle比赛中，选手在本地用验证集调参，提交结果后由平台用隐藏测试集评分。
两者划分+交叉验证：
- 在小数据集（如MNIST）上，可能将数据划分为训练集和测试集，同时通过交叉验证调参。

推荐做法：
如果数据量允许，始终使用训练集、验证集、测试集三者划分，确保模型开发的严谨性。
数据不足时：
优先使用交叉验证（如K折交叉验证），而不是简单地省略验证集。

最终，测试集应被视为“不可见数据”，仅在模型完全确定后使用一次，以反映真实泛化能力。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2328540.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

虚拟现实 UI 设计：打造沉浸式用户体验

虚拟现实 UI 设计：打造沉浸式用户体验

VR UI 设计基础与特点虚拟现实技术近年来发展迅猛，其独特的沉浸式体验吸引了众多领域的关注与应用。在 VR 环境中，UI 设计扮演着至关重要的角色，它是用户与虚拟世界交互的桥梁。与传统 UI 设计相比，VR UI 设计具有显著的特点。传…

阅读更多...

前端Uniapp接入UviewPlus详细教程！！！

前端Uniapp接入UviewPlus详细教程！！！

相信大家在引入UviewPlusUI时遇到很头疼的问题，那就是明明自己是按照官网教程一步一步的走，为什么到处都是bug呢？今天我一定要把这个让人头疼的问题解决了！ 1.查看插件市场重点： 我们打开Dcloud插件市场搜素uviewPl…

阅读更多...

【性能优化点滴】odygrd/quill在编译期做了哪些优化

【性能优化点滴】odygrd/quill在编译期做了哪些优化

Quill 是一个高性能的 C 日志库，它在编译器层面进行了大量优化以确保极低的运行时开销。以下是 Quill 在编译器优化方面的关键技术和实现细节： 1. 编译时字符串解析与格式校验 Quill 在编译时完成格式字符串的解析和校验，避免运行时开销&…

阅读更多...

02 反射泛型（II）

02 反射泛型（II）

目录一、反射 1. 反射引入 2. 创建对象 3. 反射核心用法二、泛型 1. 泛型的重要性 （1）解决类型安全问题 （2）避免重复代码 （3）提高可读性和维护性 2. 泛型用法 （1）泛型类 …

阅读更多...

元宇宙浪潮下，前端开发如何“乘风破浪”？

元宇宙浪潮下，前端开发如何“乘风破浪”？

一、元宇宙对前端开发的新要求元宇宙的兴起，为前端开发领域带来了全新的挑战与机遇。元宇宙作为一个高度集成、多维互动的虚拟世界，要求前端开发不仅具备传统网页开发的能力，还需要掌握虚拟现实（VR）、增强现实&#…

阅读更多...

2025年3月 Scratch 图形化（二级）真题解析中国电子学会全国青少年软件编程等级考试

2025年3月 Scratch 图形化（二级）真题解析中国电子学会全国青少年软件编程等级考试

2025.03Scratch图形化编程等级考试二级真题试卷一、选择题第 1 题甲、乙、丙、丁、戊五人参加100米跑比赛，甲说:“我的前面至少有两人，但我比丁快。”乙说:“我的前面是戊。”丙说:“我的后面还有两个人。”请从前往后（按照速度快慢&a…

阅读更多...

从代码学习深度学习 - GRU PyTorch版

从代码学习深度学习 - GRU PyTorch版

文章目录前言一、GRU模型介绍1.1 GRU的核心机制1.2 GRU的优势1.3 PyTorch中的实现二、数据加载与预处理2.1 代码实现2.2 解析三、GRU模型定义3.1 代码实现3.2 实例化3.3 解析四、训练与预测4.1 代码实现（utils_for_train.py）4.2 在GRU.ipynb中的使用4.3 输出与可视化4.4 解析…

阅读更多...

二叉树递归

二叉树递归

本篇基于b站灵茶山艾府的课上例题与课后作业。 104. 二叉树的最大深度给定一个二叉树 root ，返回其最大深度。二叉树的最大深度是指从根节点到最远叶子节点的最长路径上的节点数。示例 1： 输入：root [3,9,20,null,null,15,7] 输出&…

阅读更多...

反常积分和定积分的应用 2

反常积分和定积分的应用 2

世界尚有同类前言伽马函数的推论关于数学的思考平面图形的面积笛卡尔心形线伯努利双纽线回顾参数方程求面积星型线摆线旋转体体积一般轴线旋转被积函数有负数部分曲线的弧长最后一个部分内容-旋转曲面侧表面积直角坐标系极坐标系参数方程总结前言力大出奇迹。好好加油。 …

阅读更多...

Element-plus弹出框popover，使用自定义的图标选择组件

Element-plus弹出框popover，使用自定义的图标选择组件

自定义的图标选择组件是若依的项目的 1. 若依的图标选择组件 js文件，引入所有的svg图片 let icons [] // 注意这里的路径，一定要是自己svg图片的路径 const modules import.meta.glob(./../../assets/icons/svg/*.svg); for (const path in modules)…

阅读更多...

思维链 Chain-of-Thought（COT）

思维链 Chain-of-Thought（COT）

思维链 Chain-of-Thought（COT）：思维链的启蒙 3. 思维链 Chain-of-Thought（COT）存在问题？2. 思维链 Chain-of-Thought（COT）是思路是什么？1. 什么是思维链 Chain-of-Thoug…

阅读更多...

硬件电路(23)-输入隔离高低电平有效切换电路

硬件电路(23)-输入隔离高低电平有效切换电路

一、概述项目中为了防止信号干扰需要加一些隔离电路，而且有时传感器的信号是高有效有时是低有效，所以基于此背景，设计了一款方便实现高低电平有效检测切换电路。二、应用电路

阅读更多...

大模型学习二：DeepSeek R1+蒸馏模型组本地部署与调用

大模型学习二：DeepSeek R1+蒸馏模型组本地部署与调用

一、说明 DeepSeek R1蒸馏模型组是基于DeepSeek-R1模型体系，通过知识蒸馏技术优化形成的系列模型，旨在平衡性能与效率。 1、技术路径与核心能力基础架构与训练方法‌ ‌DeepSeek-R1-Zero‌：通过强化学习（RL）训练&…

阅读更多...

相机的曝光和增益

相机的曝光和增益

文章目录曝光增益增益原理主要作用增益带来的影响增益设置与应用曝光参考：B站优致谱视觉增益相机增益是指相机在拍摄过程中对图像信号进行放大的一种操作，它在提高图像亮度和增强图像细节方面起着重要作用，以下从原理、作用、影响以…

阅读更多...

Linux内核物理内存组织结构

Linux内核物理内存组织结构

一、系统调用sys_mmap 系统调用mmap用来创建内存映射，把创建内存映射主要的工作委托给do_mmap函数，内核源码文件处理：mm/mmap.c 二、系统调用sys_munmap 1、vma find_vma (mm, start); // 根据起始地址找到要删除的第一个虚拟内存区域 vma 2…

阅读更多...

(多看) CExercise_05_1函数_1.2计算base的exponent次幂

(多看) CExercise_05_1函数_1.2计算base的exponent次幂

题目： 键盘录入两个整数：底(base)和幂指数(exponent)，计算base的exponent次幂，并打印输出对应的结果。（注意底和幂指数都可能是负数） 提示：求幂运算时，基础的思路就是先无脑把指数转…

阅读更多...

Vuue2 element-admin管理后台，Crud.js封装表格参数修改

Vuue2 element-admin管理后台，Crud.js封装表格参数修改

需求表格数据调用列表接口，需要多传一个 Type字段，而Type字段的值需要从跳转页面Url上面获取到，并赋值给Type，再传入列表接口中，最后拿到表格数据并展示遇到的问题需求很简单，但是因为表格使用的是统…

阅读更多...

Tiktok矩阵运营中使用云手机的好处

Tiktok矩阵运营中使用云手机的好处

Tiktok矩阵运营中使用云手机的好处云手机在TikTok矩阵运营中能够大幅提高管理效率、降低封号风险，并节省成本，是非常实用的运营工具。TikTok矩阵运营使用云手机有很多优势，特别是对于需要批量管理账号、提高运营效率的团队来说。以下是几个…

阅读更多...

Linux下调试器gdb_cgdb使用

Linux下调试器gdb_cgdb使用

文章目录一、样例代码二、使用watchset var确定问题原因条件断点一、样例代码 #include <stdio.h>int Sum(int s, int e) {int result 0;int i;for(i s; i < e; i){result i;}return result; }int main() {int start 1;int end 100;printf("I will begin…

阅读更多...

Vite环境下解决跨域问题

Vite环境下解决跨域问题

在 Vite 开发环境中，可以通过配置代理来解决跨域问题。以下是具体步骤： 在项目根目录下找到 vite.config.js 文件：如果没有，则需要创建一个。配置代理：在 vite.config.js 文件中，使用 server.proxy 选项来…

阅读更多...

推荐文章

最新文章