深度学习中的优化器原理(SGD,SGD+Momentum,Adagrad,RMSProp,Adam)

深度学习中的优化器原理(SGD,SGD+Momentum,Adagrad,RMSProp,Adam)

news2026/2/13 17:42:40

SGD 梯度下降

记住这里是 $\theta _{k-1}$ 减去 $eg$ ，因为梯度的方向指出了函数再给定上升最快的方向，或者说指引函数值增大的方向，所以我们需要沿着梯度的反方向走，才能尽快达到极小值（使其损失函数最小）。

SGD+Momentum

加上动量是为了解决在一个方向时，以梯度进行累加以更快的方法达到极值点；而在左右震荡区间内，却一正一负进行抵消，不会出现大幅震荡的情况。

需要注意的时：累加的是梯度，震荡的方向的梯度互相抵消，梯度小的方向逐渐累加

$\alpha$ 一般取0.9

Adagrad（自适应）

累加梯度平方，此时若 $g$ 的绝对值大，那么导致r变大，因为 $\sqrt{r_{k}+\sigma }$ 在分母，则对于 $\theta$ 的更新速率变低。Adagrad考虑的是全局信息，因为在累计平方梯度时只会越来越大，导致在最后步长越来越小，最终可能停下来。

RMSProp

针对于Adagrad的缺点，RMSProp提出了一个衰减系数， $\rho$ 一般设置为0.999。由此可以渐渐忘掉之前的信息

Adam

结合了RMSProp和SGD+Momentum的优点，又进行了小量的修正，作用：避免冷启动，开始时用大步长，迅速找到一个逼近全局最优解的地方。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/887026.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Linux 进程替换

Linux 进程替换

一、进程替换把一个进程替换为另外一个进程。对于进程，如果单纯只看复制或者单纯只看替换，没有太大的意义。将复制和替换结合在一起（forkexec），就是系统去产生一个全新进程的一种方式。将复制和替换结合在一起&…

阅读更多...

Android glide框架及框架涉及到的设计模式

Android glide框架及框架涉及到的设计模式

目录原文链接Android glide框架简单使用介绍Glide 框架整体结构设计Glide 框架的优点基本使用：Glide占位符 Android glide框架涉及到的设计模式原文链接 Android glide框架简单使用介绍 Glide：快速高效的Android图片加载库，可以自动加载…

阅读更多...

第十三课：QtCmd 命令行终端应用程序开发

功能描述：开发一个类似于 Windows 命令行提示符或 Linux 命令行终端的应用程序一、最终演示效果 QtCmd 不是因为它是 Qt 的组件，而是采用 Qt 开发了一个类似 Windows 命令提示符或者 Linux 命令行终端的应用程序，故取名为 QtCmd。上述演示…

阅读更多...

小程序 CSS-in-JS 和原子化的另一种选择

小程序 CSS-in-JS 和原子化的另一种选择

小程序 CSS-in-JS 和原子化的另一种选择小程序 CSS-in-JS 和原子化的另一种选择介绍快速开始 pandacss 安装和配置 0. 安装和初始化 pandacss1. 配置 postcss2. 检查你的 panda.config.ts3. 修改 package.json 脚本4. 全局 css 注册 pandacss5. 配置的优化与别名 weapp-pand…

阅读更多...

澎峰科技|邀您关注2023 RISC-V中国峰会！

澎峰科技|邀您关注2023 RISC-V中国峰会！

峰会概览 2023 RISC-V中国峰会（RISC-V Summit China 2023）将于8月23日至25日在北京香格里拉饭店举行。本届峰会将以“RISC-V生态共建”为主题，结合当下全球新形势，把握全球新时机，呈现RISC-V全球新观点、新趋势。本…

阅读更多...

spring ico容器 spring注入方式 spring与tomcat整合

spring ico容器 spring注入方式 spring与tomcat整合

一、简介 1、什么是spring？ Spring是一个开源的轻量级Java应用开发框架，它提供了一种简单、高效、灵活的方式来构建企业级应用程序。Spring框架的核心特点是依赖注入（Dependency Injection）和面向切面编程（Aspect-Ori…

阅读更多...

华为网络篇 RIP的负载均衡-29

华为网络篇 RIP的负载均衡-29

难度2复杂度2 目录一、实验原理二、实验拓扑三、实验步骤四、实验过程总结一、实验原理 RIP是使用跳数（经过路由的数量）作为metric值的，当网络上存在去往目标的路由有两条以上都是相同metric时，就出现了流量负载均衡。…

阅读更多...

星际争霸之小霸王之小蜜蜂（一）

星际争霸之小霸王之小蜜蜂（一）

目录前言一、安装pygame库 1、pygame库简介 2、在windows系统安装pygame库二、搭建游戏框架 1、创建游戏窗口 2、改变窗口颜色总结前言大家应该都看过或者都听说过python神书“大蟒蛇”，上面有一个案例是《外星人入侵》，游戏介绍让我想起了上…

阅读更多...

Quivr 基于GPT和开源LLMs构建本地知识库（更新篇）

Quivr 基于GPT和开源LLMs构建本地知识库（更新篇）

一、前言自从大模型被炒的越来越火之后，似乎国内涌现出很多希望基于大模型构建本地知识库的需求，大概在5月底的时候，当时Quivr发布了第一个0.0.1版本，第一个版本仅仅只是使用LangChain技术结合OpenAI的GPT模型实现了一个最基本的…

阅读更多...

Mariadb高可用MHA (四十二）

Mariadb高可用MHA (四十二）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档目录前言一、概述 1.1 概念 1.2 组成 1.3 特点 1.4 工作原理二、构建MHA 2.1 ssh免密登录 2.2 主从复制 2.3 MHA安装 2.3.1所有节点安装perl环境 2.3..2 node 2.3.…

阅读更多...

clickhouse-监控配置

clickhouse-监控配置

一、概述监控是运维的一大利器，要想运维好clickhouse,首先就要对其进行监控，clickhouse有几种监控数据的方式，一种是系统本身监控，一种是通过exporter来监控，下面分别描述一下二、系统自带监控我下面会对监控做一…

阅读更多...

github拉取自己的私有仓库(Token方式、本地秘钥方式)

github拉取自己的私有仓库(Token方式、本地秘钥方式)

github拉取自己的私有仓库(Token方式、本地秘钥方式) 问题背景日常开发和学习过程中，经常碰到需要从GitHub或者其他类似网站，拉取私有仓代码的需求。本文将总结常用的两种方式，Token方式和本地秘钥方式，方便后续查阅和优化。 …

阅读更多...

C++ 11 新特性学习笔记

C++ 11 新特性学习笔记

1、字符串原始字面量 R“()”用于取消转义，可用于路径表示运行成功这两个RawValue起到描述作用（可以不写），并不参与输出注意，这里输出中文乱码 2、nullptr NULL在C中表示0，在非C中表示万能指针 nullpt…

阅读更多...

Ordinals 之后，以太坊铭文协议 Ethscriptions 如何再塑 NFT 资产形态

Ordinals 之后，以太坊铭文协议 Ethscriptions 如何再塑 NFT 资产形态

随着加密市场的发展，NFT 赛道逐渐形成了其独有的市场。但在加密熊市的持续影响下，今年 NFT 赛道的发展充满坎坷与挑战。据 NFTGO 数据显示，截至 8 月 7 日，与去年相比，NFT 市值总计约 56.4 亿美元，过去 1 年…

阅读更多...

nginx部署时http接口正常，ws接口404

nginx部署时http接口正常，ws接口404

可以这么配置 map $http_upgrade $connection_upgrade {default upgrade; close; }upstream wsbackend{server ip1:port1;server ip2:port2;keepalive 1000; }server {listen 20038;location /{ proxy_http_version 1.1;proxy_pass http://wsbackend;proxy_redirect off;proxy…

阅读更多...

人工智能学习框架—飞桨Paddle人工智能

人工智能学习框架—飞桨Paddle人工智能

1.人工智能框架机器学习的三要素：模型、学习策略、优化算法。当我们用机器学习来解决一些模式识别任务时，一般的流程包含以下几个步骤： 1.1.浅层学习和深度学习浅层学习(Shallow Learning)：不涉及特征学习，其特征…

阅读更多...

python编程小游戏简单的,利用python编写小游戏

python编程小游戏简单的,利用python编写小游戏

这篇文章主要介绍了python编程小游戏简单的，具有一定借鉴价值，需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获，下面让小编带着大家一起了解一下。虽然大家老调侃程序员没头发，看起来比实际年龄大。但其实咱们却是非常有…

阅读更多...

RabbitMq:Topic exchange(主题交换机)的理解和使用

RabbitMq:Topic exchange(主题交换机)的理解和使用

RabbitMq:Topic exchange(主题交换机)的理解和使用在RabbitMq中，生产者的消息都是通过交换机来接收，然后再从交换机分发到不同的队列中去，在分发的过程中交换机类型会影响分发的逻辑，下面主要讲解一下主题交换机。主题交换…

阅读更多...

【制作npm包5】npm包制作完整教程，我的第一个npm包

【制作npm包5】npm包制作完整教程，我的第一个npm包

制作npm包目录本文是系列文章， 作者一个橙子pro，本系列文章大纲如下。转载或者商业修改必须注明文章出处一、申请npm账号、个人包和组织包区别二、了解 package.json 相关配置三、了解 tsconfig.json 相关配置四、 api-extractor 学习五、npm包…

阅读更多...

更多openEuler镜像加入AWS Marketplace！

更多openEuler镜像加入AWS Marketplace！

自2023年7月openEuler 22.03 LTS SP1正式登陆AWS Marketplace后，openEuler社区一直持续于在AWS上提供更多版本。目前，openEuler22.03 LTS SP1 ,SP2两个版本及 x86 arm64两种架构的四个镜像均可通过AWS对外提供，且在亚太及欧洲15个Region开放…

阅读更多...

推荐文章

最新文章