【PyTorch 新手基础】Regularization -- 减轻过拟合 overfitting

【PyTorch 新手基础】Regularization -- 减轻过拟合 overfitting

news2025/7/15 22:24:19

Overfit 过拟合，效果如最右图所示

常见应对方案如下：
- 增大数据集入手：More data or data argumentation
- 简化模型参数入手：Constraint model complexity (shallow model, regularization) or dropout
  - dropout: torch.nn.Dropout(0.1) 加一层 dropout 层, 设 dropout_prob = 0.1
  - 注意 1) 区别和 tensorflow 中 tf.nn.dropout(keep_prob) 设置的相反; 2) 只在 train 的时候 dropout，测试的时候要 model.eval() 切换评估模式无 dropout
- 减少训练时间入手：early stopping (用 validation set 做提前的训练终止)，是一个 trick

Regularization / weight decay : 使得在保持很好的 performance 的情况下用尽可能小的 weights
- L1-regularization: $\text{Loss} += \lambda\sum|\theta_i|$
- L2-regularization: $\text{Loss} +=\frac{1}{2}\lambda\sum\theta_i^2$ ，最常用，代码具体实现：给优化器 optimizer 设置 weight decay= $\lambda$ : 如 optim.SGD(net.parameters(), lr=learning_rate, weight_decay=0.01)
- 注：如果没有 overfitting 但是设置了 weight decay 可能会导致性能下降，要先判断清楚是否要使用

在这里插入图片描述

B站视频参考资料

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1819988.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

ElementPlus国际化（将组件的默认语言改为中文）

ElementPlus国际化（将组件的默认语言改为中文）

文章目录 1. Element-plus的默认语言2. 编辑 main.js 文件3. 效果（以分页条组件为例） 1. Element-plus的默认语言 Element-plus的默认语言是英语，可修改为其它语言 2. 编辑 main.js 文件 import {createApp} from vue import ElementPlus …

阅读更多...

【简单介绍下Sass，什么是Sass？】

【简单介绍下Sass，什么是Sass？】

🎥博主：程序员不想YY啊 💫CSDN优质创作者，CSDN实力新星，CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益，如有不足之处，欢迎在评论区提出…

阅读更多...

【ARM Cache 与 MMU/MPU 系列文章 1.2 -- Data Cache 和 Unified Cache 的区别是什么？】

【ARM Cache 与 MMU/MPU 系列文章 1.2 -- Data Cache 和 Unified Cache 的区别是什么？】

请阅读【ARM Cache 及 MMU/MPU 系列文章专栏导读】及【嵌入式开发学习必备专栏】文章目录 Data Cache and Unified Cache数据缓存 (Data Cache)统一缓存 (Unified Cache)数据缓存与统一缓存的比较小结 Data Cache and Unified Cache 在 ARM架构中，缓存&#xff08…

阅读更多...

景芯SoC A72的时钟树分析

景芯SoC A72的时钟树分析

innovus的ctslog中的Clock DAG信息可以报出来CTS主要运行步骤的关键信息，比如clustering，balancing做完后的clock tree的长度，clock tree上所用的buffer、inverter，icg cell数量，clock skew等信息。我们以景芯SoC A72 …

阅读更多...

掌握WhoisAPI，提升域名管理的效率

掌握WhoisAPI，提升域名管理的效率

在互联网时代，域名管理是网站运营中非常重要的一环。通过域名，我们能够轻松访问和识别不同的网站。然而，域名的注册和管理也是一项复杂的任务，特别是对于大规模拥有许多域名的企业来说。为了提升域名管理的效率，我们可…

阅读更多...

【Spring EL＜二＞✈️✈️ 】SL 表达式结合 AOP 注解实现鉴权

【Spring EL＜二＞✈️✈️ 】SL 表达式结合 AOP 注解实现鉴权

目录 🍻前言 🍸一、鉴权（Authorization） 🍺二、功能实现 2.1 环境准备 2.2 代码实现 2.3 测试接口 🍹三、测试功能 3.1 传递 admin 请求 3.2 传递普通 user 请求 🍻四、章末 &a…

阅读更多...

Linux Debian12使用podman安装pikachu靶场环境

Linux Debian12使用podman安装pikachu靶场环境

一、pikachu简介 Pikachu是一个带有漏洞的Web应用系统，在这里包含了常见的web安全漏洞。二、安装podman环境 Linux Debian系统如果没有安装podman容器环境，可以参考这篇文章先安装podman环境， Linux Debian11使用国内源安装Podman环境三…

阅读更多...

小而美的算法技巧：前缀和数组

小而美的算法技巧：前缀和数组

小而美的算法技巧：前缀和数组类似动态规划。 class NumArray {private int[] preSum;public NumArray(int[] nums) {preSumnew int[nums.length1];//preSum[0]的前缀和为0for(int i1;i<preSum.length;i){preSum[i]nums[i-1]preSum[i-1];//先计算累加和}}publi…

阅读更多...

Conda安装

Conda安装

conda可以做到不同项目就用不同虚拟环境，这样就能做到每个项目的依赖包都是相互独立一、windows Download Success | Anaconda 环境变量二、nano 本次安装Archiconda的外部python版本为python3.7.1

阅读更多...

h5页面上传图片安卓手机无法调用摄像头

h5页面上传图片安卓手机无法调用摄像头

<input type”file”> 在ios中，会而安卓中，没有这些选项解决方法： 给input 加上accept属性 <input type”file” accept”image/*” /> //调用相机 ，图片或者相册 （两者都行） 加上了cap…

阅读更多...

yolo-inference多后端+多任务+多算法+多精度模型框架开发记录(python版)

yolo-inference多后端+多任务+多算法+多精度模型框架开发记录(python版)

先贴出github地址，欢迎大家批评指正：https://github.com/taifyang/yolo-inference 不知不觉LZ已经快工作两年了，由于之前的工作内容主要和模型部署相关，想着利用闲暇时间写一些推理方面的经验总结，于是有了这个工程。其…

阅读更多...

将Firefox插件导入Edge/Chrome中

将Firefox插件导入Edge/Chrome中

目录前言导出火狐插件.xpi格式插件导入edge/chorme中错误示范1错误示范2修改过程manifest.jsondict文件夹修改backgroundScript.jsinjectedScript.jsdebug过程最终backgroundScript.js和injectedScript.js代码完工阶段修改后的源码前言因为博主本人想在edge/chrome中使用c…

阅读更多...

CPU基础扫盲：开发人员不得不了解的CPU那些事

CPU基础扫盲：开发人员不得不了解的CPU那些事

文章目录一、CPU简介1、单核CPU的组成2、多核CPU的组成3、存储器的层级架构4、CPU的X86和arm架构的区别（1）指令和指令集（2）主要的CPU架构指令集分类（3）CPU 32位和64位是指什么（4）安…

阅读更多...

『 Linux 』动态库的加载

『 Linux 』动态库的加载

文章目录动静态库的区别动态库-共享库动态库的加载动态库的管理总结动静态库的区别动态库(Dynamic Libraries) 链接方式动态链接,程序在运行时(而不是在编译时)与动态库链接; 操作系统负责加载动态库文件; 文件大小使用动态库的应用程序通常其可执行文件大小更小; 因…

阅读更多...

简单操作，智能自动化：Windows键鼠模拟软件

简单操作，智能自动化：Windows键鼠模拟软件

一个 Windows 自动化工具，可模拟键盘和鼠标，自动执行任何流程和动作，只需录制动作并运行即可，无需编写脚本，只需按录制，然后播放即可，大小仅 35 KB，且免费无广告。界面介绍 **打开…

阅读更多...

LLM下载、私有化部署与ollam应用

LLM下载、私有化部署与ollam应用

参考： Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人-CSDN博客本地快速安装运行史上最强开源LLaMa3大模型 - 廖雪峰的官方网站 (liaoxuefeng.com) 1.下载网站 1.https://www.hugging-face.org/ 2.https://hf-m…

阅读更多...

嵌入式linux中设备树使用of函数操作基本方法

嵌入式linux中设备树使用of函数操作基本方法

各位开发者大家好，今天主要给大家分享一下，如何使用of操作函数，获取对应设备树节点先关的属性信息。第一：of_find_property函数 of_find_property 函数用于在设备树中查找节点下具有指定名称的属性。如果找到了该属性，可以通过返回的属性结构体指针进行进一步的操作，比…

阅读更多...

强大高效，推荐这两款分析文章和抠图的AI工具

强大高效，推荐这两款分析文章和抠图的AI工具

ChatDOC ChatDOC是一款基于ChatGPT的AI阅读辅助工具，旨在通过与用户指定的文档进行对话来处理用户的专属数据。它能够帮助用户快速提取文档中的信息，支持多种文件格式，并提供准确的答案。此外，ChatDOC还具备智能格式化、自动摘要生…

阅读更多...

博客摘录「 AXI三种接口及DMA DDR XDMA介绍（应用于vivado中的ip调用）」2024年6月10日

博客摘录「 AXI三种接口及DMA DDR XDMA介绍（应用于vivado中的ip调用）」2024年6月10日

关键要点： 1.AXI Stream经过协议转换可使用AXI_FULL（PS与PL间的接口，如GP、HP和ACP）。 2.传输数据类里就涉及一个握手协议，即在主从双方数据通信前，有一个握手的过程。基本内容：数据的传输源会…

阅读更多...

A股上市公司MSCI ESG评级面板数据（2017-2023）

A股上市公司MSCI ESG评级面板数据（2017-2023）

数据简介：MSCI ESG（Environmental, Social, and Governance）评级是由 MSCI Inc. 提供的一项服务，旨在评估公司在环境、社会和治理方面的表现。MSCI 是一家全球领先的投资研究和指数提供商，其 ESG 评级被广泛用于评估企…

阅读更多...

推荐文章

最新文章