深度学习调参炼丹术(总结向)

深度学习调参炼丹术(总结向)

news2025/4/17 4:37:45

调参控制变量，每次调一个值。

1.初始化方式：FC/CNN用kaiming uniform或normalize，Emendding选截断normalize
2.activation function：sigmoid(淘汰)、tanh(淘汰)、relu(推荐)、leakey-relu
3.优化器：SGD+动量（对lr敏感，可以调很好但很难）、Adma（对lr不敏感，容易上手有上限）
4.lr：nlp在1e-5，cv在1e-3，最好多手动调。
5.Batch size：一般越大越好，GPU不行使用累计梯度，太小不收敛。
6.Dropout：注意dropout rate，不一定默认值最好。
7.input序列用LN，input非序列用BN
8.基于backbone的层次化neck(如FPN/PAN) 优于直接在最后输出的网络
9.reduce function中，attention 优于简单的pooling
10.数据增强要根据任务具体设计。

正确的调参之路：先过拟合，再尝试减小模型复杂度，加正则化
在这里插入图片描述

防止过拟合

1.减小模型复杂度
2.relu
3.pooling
4.dropout
5.L2正则：深度学习在softmax处的loss函数中加。
6.BN

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/188435.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

若依配置教程（三）新建模块

若依配置教程（三）新建模块

若依模块化管理，使代码更加规范化，方便在不同文件夹下进行修改和开发。接下来是新建模块的步骤： 文章目录**接下来是新建模块的步骤：**1.创建新的module2.配置pom.xml1.创建新的module 项目上鼠标右击： 然后修改项…

阅读更多...

Kettle 实战教程

Kettle 实战教程

Kettle 实战教程1.引言....................................................................................81.1 编写目的...........................................................81.2 阅读对象...........................................................91.3 术…

阅读更多...

DBCO-SS-Mal；DBCO二硫键-马来酰亚胺-点击化学

DBCO-SS-Mal；DBCO二硫键-马来酰亚胺-点击化学

DBCO-SS-Maleimide；Mal-SS-DBCO 英文 ：DBCO-SS-Maleimide 中文：二苯并环辛炔-二硫键-马来酰亚胺分子式：C30H30N4O5S2 分子量：590.71 存储条件：-20C，避光，避湿用途&#xff…

阅读更多...

做自媒体，有哪些好用的工具和软件，这6大自媒体工具，力荐！

做自媒体，有哪些好用的工具和软件，这6大自媒体工具，力荐！

工具一：效率控效率控是一个汇集很多工具的工具APP。使用它可以用来习惯养成，表情制作，二维码生成，倒数日，文字识别，配色方案等等。它特别一个亮点的功能是剪切板增强，还有一个特别实用的功能是…

阅读更多...

DevStyle，一个让Java开发更现代化的工具！

DevStyle，一个让Java开发更现代化的工具！

如果您喜欢Eclipse的强大功能，但对它的可用性和美观度没有很高的要求，那么从今天开始，请准备好从全新的角度来看待Eclipse。在之前暗黑的插件基础上，MyEclipse官方团队为大家带来了DevStyle。使用DevStyle，开发人员可以…

阅读更多...

小程序提升篇-组件

小程序提升篇-组件

提升篇学习目标如何自定义小程序组件小程序组件中behaviors的作用安装和配置vant-weapp组件库如何使用MobX实现全局数据共享如何对小程序API进行Promise化小程序组件学习目标创建并引用组件（全局、局部、usingComponent）修改组件样式（option-…

阅读更多...

Java JVM：字节码执行引擎（六）

Java JVM：字节码执行引擎（六）

执行引擎是 Java 虚拟机核心的组成部分之一，执行引擎由软件自行实现目录一、运行时栈帧结构二、方法调用三、基于栈的字节码解释执行引擎四、OSGI：灵活的类加载器架构一、运行时栈帧结构 Java 虚拟机以方法作为最基本的执行单元，“栈帧”则…

阅读更多...

如何用ffmpeg截取视频片段以及截取时间不准确的坑

如何用ffmpeg截取视频片段以及截取时间不准确的坑

之前在工作中，有遇到需要程序化截取视频片段的场景，这里使用ffmpeg命令行就可以很容易实现，这里也记录下我们使用过程中遇到的坑，希望对大家也有所帮助。举个例子，当我们要截取视频文件中input.mp4的第15秒到第9…

阅读更多...

【C语言练习】逻辑分析题

【C语言练习】逻辑分析题

目录题目一：求名次题目详情：解题思路：题目二：找凶手题目详情：解题思路：题目一：求名次题目详情： 5位运动员参加了10米台跳水比赛，有人让他们预测比赛结果： A…

阅读更多...

(02)Cartographer源码无死角解析-(52) 2D点云扫描匹配→ceres扫描匹配:CeresScanMatcher2D→栅格地图残差

(02)Cartographer源码无死角解析-(52) 2D点云扫描匹配→ceres扫描匹配:CeresScanMatcher2D→栅格地图残差

讲解关于slam一系列文章汇总链接:史上最全slam从零开始，针对于本栏目讲解(02)Cartographer源码无死角解析-链接如下: (02)Cartographer源码无死角解析- (00)目录_最新无死角讲解：https://blog.csdn.net/weixin_43013761/article/details/127350885 文末…

阅读更多...

上海洲邦携手图扑建设数字孪生工厂，获 2022 智能制造优秀场景

上海洲邦携手图扑建设数字孪生工厂，获 2022 智能制造优秀场景

前言 12 月 2 日，工信部公示了 2022 年度智能制造示范工厂揭榜单位和优秀场景名单。图扑软件和上海洲邦合作建设的宁波甬友数字孪生工厂被评为优秀场景，全国共有 369 个智能制造典型场景入选。《智能制造试点示范行动实施方案》包括智能制造优秀场景和…

阅读更多...

ESP-IDF:快速排序测试

ESP-IDF:快速排序测试

ESP-IDF:快速排序测试 /快速排序测试/ void printArray(int arr[], int len) { for (int i 0; i < len; i) { cout << arr[i] << " "; } cout << endl; } void QuickSort(int arr[], int start, int end) { int i start; int j end; // 找…

阅读更多...

【IoT】蔽障智能车设计：带有无线调试系统的蔽障小车

【IoT】蔽障智能车设计：带有无线调试系统的蔽障小车

说明近年来随着计算机在社会领域的渗透和大规模集成电路的发展，单片机的应用正在不断地走向深入，由于它具有功能强，体积小，功耗低，价格便宜，工作可靠，使用方便等特点，因此越来越广…

阅读更多...

Activiti7工作流-使用idea插件actiBPM设计请假流程---工作流工作笔记005

Activiti7工作流-使用idea插件actiBPM设计请假流程---工作流工作笔记005

首先我们看一下我们之前写的测试类, ProcessEngine 这个流程引擎,打开看源码可以看到有几个常用的, HistoryService就是用来管理之前_hi表的,关于历史的 TaskService用来管理任务的 RuntimeService用来管理_run那些运行时的表的然后我们还可以通过,上面定义的processEngi…

阅读更多...

程序员的成长离不开哪些软技能？

程序员的成长离不开哪些软技能？

道破一个残忍的真相：一个程序员的成长往往是软技能＞硬技能，想纯靠技术能力一路挺过35岁基本是不可能的任务，作为一个优秀的程序员，离不开以下这些软技能。较真所有在技术上的较真都是一次专业技能的提升&#xff0…

阅读更多...

Ruoyi-Cloud框架学习-【07 新增功能模块】

Ruoyi-Cloud框架学习-【07 新增功能模块】

根据该博客新建模块后，在添加具体的数据表实现增删改查在ruoyi-cloud中建立数据表新建business_device表中【与gen_table、gen_table_column在一个库】 CREATE TABLE business_device (id bigint NOT NULL AUTO_INCREMENT COMMENT 主键,name varchar(255) COLLA…

阅读更多...

USB转双串口芯片 CH342 兼容替代CP2105

USB转双串口芯片 CH342 兼容替代CP2105

概述CH342是一个USB总线的转接芯片，实现USB转两个异步串口。每个串口都支持高速全双工，支持奇偶校验，提供了常用的MODEM联络信号，用于为计算机扩展异步串口，或者将普通的串口设备或者MCU直接升级到USB总线。特点全速US…

阅读更多...

PySpark数据分析基础:核心数据集RDD原理以及操作一文详解(一)

PySpark数据分析基础:核心数据集RDD原理以及操作一文详解(一)

目录前言一、RDD概念二、RDD与DataFrame之间的区别特性区别本质区别三、PySpark中RDD的操作 1.aggregate 2.aggregateByKey 3.map 4.mapPartitions 5.getNumPartitions 6. glom() 点关注，防走丢，如有纰漏之处，请留言指教&am…

阅读更多...

＜每日算法 - JavaScript解析：用两个栈实现队列＞

＜每日算法 - JavaScript解析：用两个栈实现队列＞

每日算法 - JavaScript解析：用两个栈实现队列一、任务描述：拓展知识二、问题解析三、解决方案：参考文献往期内容 💨一、任务描述： 用两个栈实现一个队列。队列的声明如下，请实现它的两个函数 appendTail 和…

阅读更多...

JS扩展运算符(...)的用法

JS扩展运算符(...)的用法

参考链接： 本文可以说是完全抄写的参考链接的内容，本文的目的只用于自己进行记录，加深理解。原文参考链接一、定义： 扩展运算符(...)是ES6的新增语法，用于取出参数对象中的所有可遍历属性，然后拷贝到当前…

阅读更多...

推荐文章

最新文章