【机器学习】 7. 梯度下降法,随机梯度下降法SGD,Mini-batch SGD

【机器学习】 7. 梯度下降法,随机梯度下降法SGD,Mini-batch SGD

news2026/2/15 16:47:31

梯度下降法,随机梯度下降法SGD,Mini-batch SGD

梯度下降法
- 凸函数(convex)和非凸函数
- 梯度更新方向选择
- 步长的选择
随机梯度下降SGD(Stochastic Gradient Descent)
- 梯度下降法：
- SGD:
Mini-batch SGD

梯度下降法

从一个随机点开始
决定下降方向（重要）
确定步长（重要）
- 太小：迭代太多次，消耗过多资源
- 太大：容易越界，不稳定
不断更新，直到符合停止标准
- e.g. 变化足够小
  $f(w0) - f(w6)| < e = 10^{-3}$

凸函数(convex)和非凸函数

凸函数：最小二乘，岭回归，逻辑回归…
在这里插入图片描述
非凸函数：会在第一个最小的拐点停止，但是实际上还有更低点。

在这里插入图片描述

梯度更新方向选择

更新规则：
$w_{i+1} = w_i - α_i\frac{df}{dw}(w_i)$
-dw : 斜率的负数，决定更新的方向
如果 -dw > 0 则往左走
如果 -dw < 0 则往右走
α ：步长

公式推导：
Loss :
$f(x) = ||wx - y||^2_2$
求导：
$\frac{df}{dw}(w) = 2||wx-y||_2$
梯度更新：
$w_{i+1} = w_i - α||wx -y||$

2 包含在α里

步长的选择

$α_i = \frac{α}{n\sqrt{i}}$

α : 常量
n : 训练集数量
i : iteration 迭代次数
随着迭代次数增加，步长越来越小。

随机梯度下降SGD(Stochastic Gradient Descent)

梯度下降法：

$w_{i+1} = w_i - α_i\sum^n_{j=1}(w^T_ix^{(j)} - y^{(j)})x^{(j)}$
空间复杂度： O(nk)

SGD:

随机样本计算梯度，如果全部样本都计算梯度，计算量过大
$w_{i+1} = w_i - α_i(w^T_ix^{(j)} - y^{(j)})x^{(j)}$
空间复杂度： O(k) 【取消了sum】
$w_{i+1} = w_i + α_i▼f_j(w_i)$

j 表示随机抽取的样本

优点：
- 每次更快，计算量更少
缺点：
- 需要迭代更多次

Mini-batch SGD

$w_{i+1} = w_i - α_i\sum^n_{j∈B}(w^T_ix^{(j)} - y^{(j)})x^{(j)}$

只计算最小batch的梯度更新

优点
- 比SGD更大的计算量
- 比GD更小的计算量
缺点
- 多了一个参数 batch size

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2077219.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

关于kafka的分区和消费者之间的关系

关于kafka的分区和消费者之间的关系

消费者和消费者组当生产者向 Topic 写入消息的速度超过了消费者（consumer）的处理速度，导致大量的消息在 Kafka 中淤积，此时需要对消费者进行横向伸缩，用多个消费者从同一个主题读取消息，对消息进行分流。 …

阅读更多...

【JVM】OOM与调优(二)

【JVM】OOM与调优(二)

OOM与调优 6.JVM工具如jps 该命令是纯Java编写的 -q:只显示Java进程的ID -m:输出Java进程的ID main函数所在类的名字传递给main函数的参数 -l:输出Java进程的IDmain函数所在类的全限定名(包名类名) -v:输出Java进程的IDmain函数所在类的名称传递给JVM的参数应用&am…

阅读更多...

在野漏洞的应急响应流程

在野漏洞的应急响应流程

许多时候，对于负责安全工作又不太擅长安全漏洞技术的人员而言，如何应对突发漏洞是工作中主要的难点，这里的突发漏洞指的是两类：一类是通过新闻、咨询推送，被社会舆论所有关注的CVE漏洞，比如前段时间所谓的核…

阅读更多...

【YOLOv10改进[Conv]】感受野注意力卷积RFAConv（2024.3）| 使用RFAConv 改进v10目标检测效果 + 含全部代码和详细修改方式

【YOLOv10改进[Conv]】感受野注意力卷积RFAConv（2024.3）| 使用RFAConv 改进v10目标检测效果 + 含全部代码和详细修改方式

本文将进行在YOLOv10中使用RFAConv，助力YOLOv10目标检测效果，文中含全部代码、详细修改方式。助您轻松理解改进的方法。

阅读更多...

手撕M.2 的B-KEY M-KEY、M+B KEY定义

手撕M.2 的B-KEY M-KEY、M+B KEY定义

SSD 尺寸与规格我们在买ssd的时候，商家都会说什么ssd是2280还是2242规格的,这里的规格实际上就是代表的ssd的尺寸大小 M.2模组的尺寸目前有11种，用Type xxyy的方式表示，xx表示宽度，yy表示长度，单位为毫米。例如上面提…

阅读更多...

(mcu) 嵌入式基础简单入门（程序架构分析）

(mcu) 嵌入式基础简单入门（程序架构分析）

文章目录 💽前言💽软件框架📀工具环境📀模板工程📀编译后📀Code📀典例举例 💽Keil 使用notes⭐END🌟关注我 💽前言本文为一份简单入门笔记，以 st…

阅读更多...

算法-单词规律（290）

算法-单词规律（290）

leetcode题目链接这道题用哈希表来解决一个哈希表存放从单词到字符的映射，一个存放从字符到单词的映射，依照空格分隔字符，并将每个字符存放到vector字符数组， 遍历 pattern，对于每个字符 c 和对应的单词 w&#xf…

阅读更多...

带你快速了解WEB应用服务器TOMCAT

带你快速了解WEB应用服务器TOMCAT

目录一、WEB技术 1.1 HTTP协议和B/S 结构 1.2 前端三大核心技术 1.2.1 HTML 1.2.2 CSS（Cascading Style Sheets）层叠样式表 1.2.3 JavaScript 二 WEB框架 2.1 web资源和访问 2.2 后台应用架构 2.2.1 单体架构 2.2.2 微服务 2.2.3 单体架构和…

阅读更多...

机器学习第6章支持向量机

机器学习第6章支持向量机

这里写目录标题 6.1 间隔与支持向量6.2 对偶问题6.3 核函数6.4 软间隔与正则化6.5 支持向量回归 6.1 间隔与支持向量给定训练样本集 D { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x m , y m ) } , y i ∈ { − 1 , 1 } D\left \{ (x_{1},y_{1}),(x_{2},y_{2}) ,...,(x_{…

阅读更多...

禹晶、肖创柏、廖庆敏《数字图像处理》Otsu方法描述勘误

禹晶、肖创柏、廖庆敏《数字图像处理》Otsu方法描述勘误

最大化类间距离准则与最小错误率准则不等价。虚线处为最大类间距离，前景与背景直方图的交界处为最小错分概率，当部分前景错分为背景或者部分背景错分为前景时，一般会导致类间距离变小。所以两者接近，但不相等。禹晶、肖创柏、…

阅读更多...

《Spring Boot 集成 Swagger：打造高效接口文档与开发体验》

《Spring Boot 集成 Swagger：打造高效接口文档与开发体验》

Swagger 一.导语： 相信无论是前端还是后端开发，都或多或少地被接口文档折磨过。前端经常抱怨后端给的接口文档与实际情况不一致。后端又觉得编写及维护接口文档会耗费不少精力，经常来不及更新。其实无论是前端调用后端，还是后…

阅读更多...

MindSearch 部署

MindSearch 部署

任务按照教程，将 MindSearch 部署到 HuggingFace 并美化 Gradio 的界面，并提供截图和 Hugging Face 的Space的链接。创建开发机 & 环境配置 mkdir -p /root/mindsearch cd /root/mindsearch git clone https://github.com/InternLM/MindSearch.…

阅读更多...

dbsyncer同步mysql数据

dbsyncer同步mysql数据

1 概述 DBSyncer（代码地址：https://github.com/86dbs/dbsyncer）是一款开源的数据同步中间件，提供MySQL、Oracle、SqlServer、PostgreSQL、Elasticsearch(ES)、Kafka、File、SQL等同步场景。支持上传插件自定义同步转换业务&#…

阅读更多...

人脸质量评价：深入解析和实现

人脸质量评价：深入解析和实现

人脸质量评价：深入解析和实现引言随着人工智能和计算机视觉技术的飞速发展，人脸识别已成为许多领域的关键技术之一。然而，人脸识别的准确性高度依赖于输入的人脸图像质量。因此，人脸质量评价作为人脸识别前的预处理步骤&#…

阅读更多...

如何利用电商 API 数据分析助力精准选品！

如何利用电商 API 数据分析助力精准选品！

电商 API 数据分析在选品过程中起着至关重要的作用，它们之间有着密切的关系： 一、提供市场趋势洞察热门商品识别： 通过分析电商 API 中的销售数据，包括商品的销售量、销售额、销售频率等指标，可以快速准确地识别出当…

阅读更多...

清华计算几何-线段求交与BO算法

清华计算几何-线段求交与BO算法

单轴线段求交给定单边轴下, N定线段，检查出相交的线段. 解法一: 暴力求解遍历所有线段对，进行相交判断, 算法复杂度为O(n2) 解法二: LR扫描把每条线段的头尾认定为L和R。对所有点进行排序，如果每两个点满足LL或者RR，则对应…

阅读更多...

Leetcode JAVA刷刷站（97）交错字符串

Leetcode JAVA刷刷站（97）交错字符串

一、题目概述二、思路方向为了验证字符串 s3 是否由 s1 和 s2 交错组成，我们可以使用动态规划（Dynamic Programming, DP）的方法来解决这个问题。首先，我们需要定义状态 dp[i][j]，它表示 s1 的前 i 个字符和 s2 的前…

阅读更多...

DocuSign集成方案 | 结合 DocuSign 与 Oracle，加快业务完成速度！

DocuSign集成方案 | 结合 DocuSign 与 Oracle，加快业务完成速度！

DocuSign for Oracle 集成将 DocuSign 的电子签名功能与 Oracle 的项目生命周期管理 (PLM) 解决方案相结合 DocuSign 和 Oracle 是两家全球领先的技术公司，它们都致力于帮助企业简化和自动化流程。DocuSign 是电子签名领域的领导者，其解决方案可帮助企业…

阅读更多...

【操作系统】实验：进度调度（2）

【操作系统】实验：进度调度（2）

目录一、实验目的二、实验要求三、实验步骤四、核心代码五、记录与处理六、思考七、完整报告和成果文件提取链接一、实验目的 1、掌握高优先权调度算法 2、理解时间片、优先权、抢占等基本概念。二、实验要求 1. 优先权属于静态优先权； 2. 进入 …

阅读更多...

DevOps实现CI/CD实战（五）- Jenkins流水线Pipeline-更新中..

DevOps实现CI/CD实战（五）- Jenkins流水线Pipeline-更新中..

九、 Jenkins流水线pipeline Jenkins流水线任务介绍之前采用Jenkins的自由风格构建的项目，每个步骤流程都要通过不同的方式设置，并且构建过程中整体流程是不可见的，无法确认每个流程花费的间，并且问题不方便定位问题。Jenkins的…

阅读更多...

推荐文章

最新文章