SGD原理及Pytorch实现

news2025/7/14 11:03:36

🎏目录

🎈1 SGD
🎄1.1 原理
🎄1.2 构造
🎄1.3 参数详解——momentum

✨1 SGD

🥚2.1 原理

SGD为随机梯度下降，原理可看刘建平老师博客。

🎃 2.2 构造

构造：

class torch.optim.SGD(
	params, 
	lr, 
	momentum=0, 
	dampening=0, 
	weight_decay=0, 
	nesterov=False
)

参数：

params：需要优化的参数
lr：float, 学习率
momentum：float，动量因子
dampening：float，动量的抑制因子
weight_decay：float，权重衰减
nesterov：bool，是否使用Nesterov动量

🎉 2.3 参数详解——`momentum`

一般随机梯度下降时，每次更新公式都是：
在这里插入图片描述
而增加动量后，公式是：

即在原值乘一个动量因子momentum（0<momentum<1），起到减速作用：

以一个例子说明，假设现梯度为5，经历两次梯度变化分别是-2和+3，momuntu=0.9。
传统下经历两次梯度变化，最终梯度应该是5=》3=》6。
使用momentum后本次梯度应该是5=》3=》0.9*3+3=5.7。局部上第二次梯度变化虽然仍是+3，但是由于使用了momuntu，整体上看是+2.7，起到一个减速作用。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/729716.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Blender--原理化体积

Blender--原理化体积

“原理化体积着色器将所有体积着色组件组合到一个易于使用的节点中。该节点含有散射，吸收和黑体辐射属性，因此，可以仅仅使用该着色器节点对烟雾和火焰等进行渲染。” 官方文档介绍：原理化体积 — Blender Manual 可以用于实现丁…

阅读更多...

Rainbond开源

Rainbond开源

Rainbond的 Gateway API 插件制作实践 Gateway API 作为新一代的流量管理标准，对原有 Ingress 的扩展不规范、移植性差等问题做出了改进。从兼容K8s生态和优化网关体验出发，Rainbond 支持以插件的形式扩展平台网关能力，目前已经有多家社区提供…

阅读更多...

启动项目报错,如何分析pom

启动项目报错,如何分析pom

报错信息如下 Caused by: java.lang.NoClassDefFoundError: org/springframework/core/metrics/ApplicationStartup 报错说找不到ApplicationStartup这个类，到项目中查看pom的dependency 我的项目引入了两个依赖 <parent><groupId>org.springframewor…

阅读更多...

vue使用富文本编辑器 Wangeditor 可显示编辑新增回显禁用

vue使用富文本编辑器 Wangeditor 可显示编辑新增回显禁用

1.效果图 2.安装依赖 npm install wangeditor 3.在main.js 全局引入富文本组件 import editorBar from "/components/editor/editor.vue";Vue.component(editorBar, editorBar) 全局引入页面使用 <editor-bar v-model"form.nr" :flag"false&quo…

阅读更多...

【高并发网络通信架构】1.Linux下实现单客户连接的tcp服务端

【高并发网络通信架构】1.Linux下实现单客户连接的tcp服务端

目录一，函数清单 1.socket 方法 2.bind 方法 3.listen 方法 4.accept 方法（阻塞函数） 5.recv 方法（阻塞函数） 6.send 方法 7.close 方法 8.htonl 方法 9.htons 方法 10.fcntl 方法二，代码实现…

阅读更多...

$0126 线性表$

0126 线性表

目录 2.线性表 2.1线性表的定义和基本概念 2.1部分习题 2.2线性表的顺序表示 2.2部分习题 2.3线性表的链式表示 2.3部分习题 2.线性表 2.1线性表的定义和基本概念 2.1部分习题 1.线性表是具有n个（）的有限序列 A.数据表 B.字符 C.…

阅读更多...

FPGA纯verilog实现UDP协议栈，sgmii接口SFP光口收发，提供工程源码和技术支持

FPGA纯verilog实现UDP协议栈，sgmii接口SFP光口收发，提供工程源码和技术支持

目录 1、前言2、我这里已有的UDP方案3、该UDP协议栈性能4、详细设计方案SFPGMII AXIS接口模块AXIS FIFOUDP协议栈1G/2.5G Ethernet PCS/PMA or SGMII 5、vivado工程1-->B50610 工程6、上板调试验证并演示准备工作查看ARPUDP数据回环测试 7、福利：工程代码的获取 …

阅读更多...

c++日程管理系统

c++日程管理系统

一.需求分析多功能日历（要求有简单ui） 要求： 1.使用c代码用visual stdio运行 2.用户登录注册 3.登录后给用户三大功能选择： （1）基本日历：显示日历,默认六月，每日有对应的日程 &…

阅读更多...

开源防病毒引擎ClamAV

开源防病毒引擎ClamAV

本文软件是应网友 Windows 的要求折腾的； 什么是 ClamAV ？ ClamAV 是一个开源 ( GPLv2 ) 反病毒工具包，专为邮件网关上的电子邮件扫描而设计。它提供了许多实用程序，包括灵活且可扩展的多线程守护程序、命令行扫描程序和用于自动数…

阅读更多...

尚硅谷Docker实战教程-笔记09【高级篇，DockerFile解析】

尚硅谷Docker实战教程-笔记09【高级篇，DockerFile解析】

尚硅谷大数据技术-教程-学习路线-笔记汇总表【课程资料下载】视频地址：尚硅谷Docker实战教程（docker教程天花板）_哔哩哔哩_bilibili 尚硅谷Docker实战教程-笔记01【基础篇，Docker理念简介、官网介绍、平台入门图解、平台架构图解】…

阅读更多...

LSTM介绍

LSTM介绍

LSTM ft表示遗忘门。LSTM对于每一次的输入，首先决定遗忘掉之前的哪些记忆。将ft和t-1时刻的细胞状态相乘，得出将遗忘哪些记忆。记忆门是用来控制是否将t时刻的数据并入细胞状态。tanh函数可以将此刻向量中的有效信息提取出来，为gt。sigmoid函数用于控制此刻多少记忆进入…

阅读更多...

阿里云ACE认证和华为云HCIE认证对比分析

阿里云ACE认证和华为云HCIE认证对比分析

最近有不少小伙伴私信问我，阿里云、腾讯云、华为云这几大厂商的云认证，哪一个更好，今天有空来跟大家认真地分析一下。 01-从云计算市场占有率来看作为国内云计算市场的探路人，阿里虽然一路走来有过很多坎坷，但也不负…

阅读更多...

Linux系统优化策略

Linux系统优化策略

Linux系统优化策略 1.禁用不需要的服务在Linux系统中禁用不需要的服务可以通过以下步骤进行： 使用以下命令查看当前正在运行的服务： systemctl list-unit-files --typeservice根据需要禁用特定的服务，使用以下命令： systemctl …

阅读更多...

【LeetCode周赛】2022上半年题目精选集——双指针

【LeetCode周赛】2022上半年题目精选集——双指针

文章目录 2271. 毯子覆盖的最多白色砖块数思路代码 2302. 统计得分小于 K 的子数组数目代码1——前缀和滑动窗口代码2——双指针 O ( 1 ) O(1) O(1)空间 （代码1的优化） https://leetcode.cn/circle/discuss/G0n5iY/ 2271. 毯子覆盖的最多白色砖块数 22…

阅读更多...

Win10安全中心怎么关闭？Win10安全中心关闭方法

Win10安全中心怎么关闭？Win10安全中心关闭方法

Win10安全中心怎么关闭？关闭Win10的安全中心可以帮助用户自定义系统的安全和防护设置，但有些用户不知道怎么操作才能关闭安全中心，首先用户需要打开Win10电脑的设置选项，接着打开安全中心，然后关掉安全中心的实时保护、…

阅读更多...

STM32CubeMX使用示例---生成LED闪烁工程

STM32CubeMX使用示例---生成LED闪烁工程

这里记录一下通过STM32CubeMX配置STM32G030C8T6，生成LED闪烁的示例工程的过程，用来学习使用STM32CubeMX； 以STM32G030C8T6 PB4 脚做LED 输出闪烁为例，外部8MHZ 晶振,系统主频64MHZ,LED 灯1 秒钟闪烁一次做一个示例程序。文章目录…

阅读更多...

Go语言程序设计（八）数据输入输出

Go语言程序设计（八）数据输入输出

Go语言提供了多种用于实现数据输入、输出的函数,这些函数在fmt包中实现。在输入、输出数据时,首先要导入fmt包,导入语句为: import "fmt" 一、标准输出函数数据输出(Data Output),是计算机对各类输入数据进行加工处理后,将结果以用户所要求的形式输出到标准输出设…

阅读更多...

OpenCV使用`clone()`函数来进行深度拷贝，拷贝后的`image_clone`修改不会影响原始图像`image`

OpenCV使用`clone()`函数来进行深度拷贝，拷贝后的`image_clone`修改不会影响原始图像`image`

这是完整的代码： #include <opencv2/opencv.hpp>int main() {// 创建一个白色的图像cv::Mat image(500, 500, CV_8UC3, cv

阅读更多...

SpringCloud微服务（三）RabbitMQ、SpringAMQP、elasticsearch、DSL、MQ、ES详细介绍

SpringCloud微服务（三）RabbitMQ、SpringAMQP、elasticsearch、DSL、MQ、ES详细介绍

目录一、初始MQ 同步调用异步调用什么是MQ 执行下面的命令来运行MQ容器： 如果冲突了，可以先查询 RabbitMQ概述常见消息模型 HelloWorld案例二、SpringAMQP 引入依赖 Work Queue 消费预取限制编辑发布、订阅发布订阅Fanout Ex…

阅读更多...

作物计数方法之合并信息生成json标签的方法

作物计数方法之合并信息生成json标签的方法

在研究农情的方向中，作物计数是一个很重要的方向，前文已经提到了一些要使用的方法前文链接：作物计数方法汇总_追忆苔上雪的博客-CSDN博客在研究计数过程中，还需要将上文处理过的数据信息存入json文件方便后续使用，这…

阅读更多...

推荐文章

最新文章