【机器学习】验证集loss震荡（loss的其他问题）

news2026/2/10 2:25:15

训练过程中发现，train loss一直下降，train acc一直上升；但是val loss、val acc却一直震荡。loss一会上一会下，但是总体趋势是向下的。

“loss震荡但验证集准确率总体下降” 如何解决？

测试集准确率这样震荡是正常的吗？ - 李峰的回答 - 知乎

很多经验：loss问题汇总（不收敛、震荡、nan） - 飞狗的文章 - 知乎

训练过程中loss震荡特别严重，可能是什么问题？ - 孤歌的回答 - 知乎

模型训练中出现NaN Loss的原因及解决方法_loss为nan的原因_there2belief的博客-CSDN博客

学习率和loss的关系？

w1 = w0-学习率*梯度（ $\frac{\partial F}{\partial w_0}$ ）

loss = |ypred-ytrue|

训练深度学习模型loss为nan的原因

http://t.csdn.cn/jfNpF

模型时遇到个问题：在大样本训练模型时候的loss为nan，尝试了各种方法也没有什么起色，最终一起分析了一番拟确定了原因，这边就分享下可能的原因可供分析调整~

原因

1.模型问题

网络结构设计问题

通过弱化场景，简化样本的方式去检查是否为网络的问题

损失函数设置不合理
激活函数选择不当
参数初始化问题

2.数据问题

数据需归一化
- 减均值
- 除方差
- 加入normalization(BN\L2 norm等)
数据标签不在[0, num_classes)范围内
训练样本存在脏数据

这个是和师弟最终确定的原因，因为在实际业务中的真实数据需要耗费较多的时间去处理，不像open dataset那样已经帮你处理的干干净净，所以如上述的方法一一检查过了还是没有成效的话，一定要好好地检查下数据。

3.训练问题

loss为nan的说明loss发散，这个时候需要考虑下梯度爆炸的可能，那么相应的解法方式如下：

调小学习率lr
调小batch size
加入gradient clipping

什么是loss发散？（Loss变为NaN怎么办？）

因为学习率过大的话，每次参数更新步子迈得太大，loss直接不往极小值点走了，结果越更新离极小值点越远。这就是所谓的loss发散。发散着发散着loss越来越大，就变为NaN了。在这里插入图片描述

【算法】深度学习模型损失值loss不收敛，曲线震荡发散怎么办？_loss的发散问题_YaoYee_7的博客-CSDN博客

神经网络训练过程中先收敛，达到一个可观的性能后又发散了，loss曲线呈反"抛物线"型？ - 知乎

Loss变为NaN怎么办？_loss: nan_OhMyJayce的博客-CSDN博客

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/390107.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

python2.7/3.8版本安装教程

python2.7/3.8版本安装教程

Wiondos-Python环境安装 Python2.7 下载地址官网速度比较慢百度网盘提取码:Chen 安装Python2.7 直接next 选择安装目录注意这一步将最后一项勾选安装完成 cmd中输入python 检查pip是否安装 cmd中输入pip --version Python3.8 下载地址官网速度比较慢百度网…

阅读更多...

蓝桥杯C/C++程序设计往届真题汇总（进阶篇）

蓝桥杯C/C++程序设计往届真题汇总（进阶篇）

文章目录1. 最短路2. 数字三角形3. 递增序列4. 杨辉三角形5. 跳跃6. 路径7. 迷宫8. 装饰珠9. 明码10. 字串分值11. 作物杂交12. 承压计算13. 全球变暖14. 直线15. 平面切分1. 最短路题目描述： 如下图所示，G是一个无向图，其中蓝色边的长度是…

阅读更多...

线程池执行父子任务，导致线程死锁

线程池执行父子任务，导致线程死锁

前言， 一次线程池的不当使用，导致了现场出现了线程死锁，接口一直不返回。而且由于这是一个公共的线程池，其他使用了次线程池的业务也一直阻塞，系统出现了OOM，不过是幸好是线程同事测试出来的，没…

阅读更多...

RPC通信原理解析

RPC通信原理解析

一、什么是RPC框架？ RPC，全称为Remote Procedure Call，即远程过程调用，是一种计算机通信协议。比如现在有两台机器：A机器和B机器，并且分别部署了应用A和应用B。假设此时位于A机器上的A应用想要调用位于B机…

阅读更多...

第十一届蓝桥杯大赛青少组国赛Python真题2

第十一届蓝桥杯大赛青少组国赛Python真题2

第十一届蓝桥杯大赛青少组Python 真题第二题提示信息： 杨辉三角形，是二项式系数在三角形中的一种几何排列。中国南宋数学家杨辉在 1261 年所著的《详解九章算法》一书有明确记载。欧洲数学家帕斯卡在 1654 年发现这一规律，所以又叫做帕斯卡…

阅读更多...

Rabbit快速入门

Rabbit快速入门

入门案例需求：使用简单模式完成消息传递步骤： 创建工程（生成者、消费者） 分别添加依赖编写生产者发送消息编写消费者接收消息 3.1.2. 添加依赖往heima-rabbitmq的pom.xml文件中添加如下依赖： <dependenc…

阅读更多...

RabbitMQ的安装和配置

RabbitMQ的安装和配置

注意: 请使用资料里提供的CentOS-7-x86_64-DVD-1810.iso 安装虚拟机. 1. 安装依赖环境在线安装依赖环境： yum install build-essential openssl openssl-devel unixODBC unixODBC-devel make gcc gcc-c kernel-devel m4 ncurses-devel tk tc xz2. 安装Erlang 上…

阅读更多...

【完整版】国内网络编译，Ambari 2.7.6 全部模块源码编译笔记

【完整版】国内网络编译，Ambari 2.7.6 全部模块源码编译笔记

本次编译 ambari 2.7.6 没有使用科学上网的工具，使用的普通网络，可以编译成功，过程比 ambari 2.7.5 编译时要顺畅。以下是笔记完整版。如果想单独查看本篇编译笔记，可参考：《Ambari 2.7.6 全部模块源码编译笔记》该版本相对 2.7.5 版本以来，共有 26 个 contributors …

阅读更多...

使用labelImg标注自己的VOC数据集

使用labelImg标注自己的VOC数据集

文章目录1.下载labelImg2.准备文件夹3.打开软件4.软件使用1.下载labelImg 步骤：WindowsR打开运行界面→输入cmd打开命令行窗口→输入pip install labelImg命令（前提是python版本在3.0以上并安装anaconda，如果没有安装anaconda，输…

阅读更多...

cmd窗口中java命令报错。错误：找不到或无法加载主类 java的jdk安装过程中踩过的坑

cmd窗口中java命令报错。错误：找不到或无法加载主类 java的jdk安装过程中踩过的坑

错误: 找不到或无法加载主类 HelloWorld 遇到这个问题时，我尝试过网上其他人的做法。有试过添加classpath，也有试过删除classpath。但是依然报错，这里javac可以编译通过，说明代码应该是没有问题的。只是在运行是出现了错误。我安装…

阅读更多...

卷积神经网络的原理及实现

卷积神经网络的原理及实现

专栏：神经网络复现目录卷积神经网络本章介绍的卷积神经网络（convolutional neural network，CNN）是一类强大的、为处理图像数据而设计的神经网络。基于卷积神经网络架构的模型在计算机视觉领域中已经占主导地位，当今…

阅读更多...

【C3】进程休眠，时间和延时，延缓，/proc文件系统，内存分配，数据类型，/内核中断，通过IO内存访问外设

【C3】进程休眠，时间和延时，延缓，/proc文件系统，内存分配，数据类型，/内核中断，通过IO内存访问外设

9.实现进程休眠：条件不够歇一歇，把CPU让给其他进程有时候进程在读设备时，发现设备数据还没准备好，没办法正常读取设备。或在写设备时，发现设备缓冲区满，没办法正常写设备。在遇到这些情况时，进…

阅读更多...

SpringCloud之 Eureka注册中心

SpringCloud之 Eureka注册中心

文章目录Eureka注册中心一、服务注册与发现1.1 依赖导入①父工程 SpringCloud 版本管理②Eureka 服务端依赖③Eureka 客户端依赖1.2 服务注册①创建 Eureka 服务端的主类②设置 Eureka 服务端的配置文件③设置 Eureka 客户端的配置文件④关闭自我保护机制1.3 服务发现①远程调用…

阅读更多...

计算机视觉废钢堆提取问题

计算机视觉废钢堆提取问题

计算机视觉废钢堆提取问题背景介绍在钢铁炼制中，废钢是非常重要的原料，不同等级废钢对于钢成品影响很大，因此需要对废钢进行正确分类。某废钢料场中，卸料区域布置了多个摄像头，用于拍摄卸料场中废钢堆，…

阅读更多...

python 连接数据库

python 连接数据库

文章目录同步操作同步连Mysql同步连redis同步连mongodb异步操作异步连mysql异步连redis异步连mongodb同步操作同步连Mysql python 连接mysql可以使用pymysql、mysqlclient等。安装： # win pip install pymysql 连接mysql: # __author__ "laufing"…

阅读更多...

Java各种锁

Java各种锁

目录一、读写锁(ReentrantReadWriteLock) 二、非公平锁(synchronized/ReentrantLock) 三、可重入锁/递归锁(synchronized/ReentrantLock) 四、自旋锁(spinlock) 五、乐观锁/悲观锁六、死锁 1、死锁代码 2、死锁的检测(jps -l 与 jstack 进程号) 本文通过学习&#xff…

阅读更多...

Spring——Spring介绍和IOC相关概念

Spring——Spring介绍和IOC相关概念

Spring是以Spring Framework为核心，其余的例如Spring MVC， Spring Cloud，Spring Data，Spring Security SpringBoot的基础都是Spring Framework。 Spring Boot可以在简化开发的基础上加速开发。 Spring Cloud分布式开发 Spring有…

阅读更多...

SAP MM学习笔记6-SAP要怎么学

SAP MM学习笔记6-SAP要怎么学

SAP还是很复杂的，学习之前，了解学习技巧很重要。根据前辈经验，SAP学习技巧大致总结为如下三个，供大家参考。 1，忘了自己技术者的身份，控制追求技术细节的冲动软件行业经常听到一句话，什么都…

阅读更多...

Python进阶-----面对对象6.0（绑定方法[类方法、静态方法]与内置方法）

Python进阶-----面对对象6.0（绑定方法[类方法、静态方法]与内置方法）

目录前言： 1.绑定方法 （1）实例方法 （2）类方法 （3）静态方法 2.类型检测 （1）issubclass() 函数 （2）isinstance() 函数 3.内置方法&#xf…

阅读更多...

【Verilog】——赋值语句、结构语句、块语句

【Verilog】——赋值语句、结构语句、块语句

目录 1.常用语句 2.块语句 1.顺序块 2.并行块 3.结构语句 1.always 2.initial 4.赋值语句 1.非阻塞赋值 2.阻塞赋值 3.非阻塞赋值和阻塞赋值的区别 4.深入理解阻塞赋值和非阻塞赋值声明信号的时候统一大数在高位，小数在低位比如：reg [3:…

阅读更多...

推荐文章

最新文章