优化算法(五)—梯度下降算法(附MATLAB程序)

news2025/1/19 23:16:57

梯度下降算法(Gradient Descent)是一种常用的优化算法,用于寻找函数的局部最小值。它通过沿着函数梯度的反方向迭代地调整变量,以逐步找到最优解。梯度下降广泛应用于机器学习和深度学习中,特别是在训练模型时优化损失函数。

一、基本原理

梯度下降算法是一种优化算法,用于最小化目标函数。其基本原理如下:

  1. 目标函数:设定一个需要最小化的函数(例如,损失函数)。

  2. 初始化:随机选择一个初始点(参数值)。

  3. 计算梯度:在当前点计算目标函数的梯度(即偏导数),表示函数在该点的上升方向。

  4. 更新参数:根据梯度调整参数,更新规则为:

其中,θ是参数,α是学习率,∇J是目标函数的梯度。

    5.迭代:重复步骤3和4,直到达到停止条件(如梯度足够小或达到最大迭代次数)。

梯度下降算法的关键在于选择合适的学习率和确保收敛到局部最优解。根据更新的方式,可以分为不同类型,如批量梯度下降、随机梯度下降和小批量梯度下降。

二、公式推导

梯度下降算法的推导主要围绕目标函数的最优化过程。我们以最小化目标函数 J(θ) 为例,下面是详细的推导过程。

1. 定义目标函数

假设我们要最小化的目标函数为 J(θ),其中 θ 是我们需要优化的参数。

2. 计算梯度

梯度是目标函数对参数的偏导数,表示在当前点上,函数最陡的上升方向。梯度的数学表示为:

这里,∇J(θ) 是一个向量,包含了目标函数在各个参数方向的导数。

3. 更新参数

我们希望通过沿着梯度的反方向更新参数,以减小目标函数的值。更新公式如下:

  • \theta _{old} 是当前的参数值。
  • \theta _{new}是更新后的参数值。
  • \alpha 是学习率,控制更新的步长。

4. 迭代过程

通过反复应用更新公式,可以不断调整参数,逐步逼近目标函数的最小值。迭代过程可以表示为:

其中 t表示迭代次数。

5. 收敛条件

迭代过程持续进行,直到满足某个停止条件,例如:

  • 梯度的范数小于某个阈值:
  • 参数的变化小于某个阈值:
  • 达到最大迭代次数。

6. 误差分析

选择合适的学习率α 是关键。过大的学习率可能导致发散,过小的学习率则可能使收敛速度缓慢。因此,有时会使用动态调整学习率的方法。

三、MATLAB仿真

下面是一个简单的MATLAB仿真程序,用于实现梯度下降算法以最小化一个二次目标函数J\left ( \theta \right )=\theta ^{2}

% 梯度下降算法示例
% 最小化目标函数 J(θ) = θ^2

% 初始化参数
theta = 10;        % 初始参数值
alpha = 0.1;      % 学习率
num_iterations = 100; % 迭代次数

% 存储每次迭代的目标函数值
J_history = zeros(num_iterations, 1);

% 梯度下降算法
for iter = 1:num_iterations
    % 计算目标函数 J(θ)
    J = theta^2; % 目标函数
    J_history(iter) = J; % 存储目标函数值

    % 计算梯度
    gradient = 2 * theta; % J(θ) 的导数

    % 更新参数
    theta = theta - alpha * gradient; % 更新公式

    % 输出当前迭代的信息
    fprintf('Iteration %d: theta = %.4f, J(θ) = %.4f\n', iter, theta, J);
end

% 绘制目标函数值随迭代次数变化的曲线
figure;
plot(1:num_iterations, J_history, 'b-', 'LineWidth', 2);
xlabel('Iteration');
ylabel('J(θ)');
title('Objective Function Value vs. Iteration');
grid on;

代码说明

  1. 初始化参数

    • theta 是优化的初始值。
    • alpha 是学习率。
    • num_iterations 是迭代次数。
  2. 循环进行梯度下降

    • 计算当前参数的目标函数值 JJJ。
    • 计算梯度(对于 J(θ)=,梯度是 2θ2\theta2θ)。
    • 更新参数 theta
  3. 输出和绘图

    • 在每次迭代中输出当前的参数值和目标函数值。
    • 最后绘制目标函数值随迭代次数变化的图。

如何运行

将以上代码复制到MATLAB的脚本文件中(例如 gradient_descent.m),然后运行即可查看梯度下降的过程及目标函数的收敛情况。

四、总结

梯度下降算法是优化问题中一种强大且有效的工具,通过简单的迭代过程,能够在多种应用中找到合适的解。在实际使用中,选择合适的学习率和优化策略是确保其有效性的关键。

优化算法以往链接:

优化算法(一)—遗传算法(Genetic Algorithm)附MATLAB程序-CSDN博客

优化算法(二)—粒子群优化算法(附MATLAB程序)-CSDN博客

优化算法(三)—模拟退火算法(附MATLAB程序)_模拟退火算法csdn-CSDN博客

优化算法(四)—蚁群算法(附MATLAB程序)-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2165255.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

面对淘宝镜像证书过期,npm怎么办?

前提;已经下载好node.js 目的:打开vue.js官网 在终端输入 npm create vuelatest ,这脚手架 创建vue工程 vue.js官网:https://cn.vuejs.org/guide/quick-start 问题:当你要创建vue工程 ,你在终端输入:npm create vue…

【Vision Transformer】辅助理解笔记

注:本文主要是对 PPT 部分内容的补充与拓展,建议结合使用(当然也完全可以单看)。 一、基础知识 1、从向量表示到词嵌入 这部分主要是参考如下文章,大部分图片均来自此文:The Illustrated Word2vec – Jay…

Element-plus安装及其基础组件使用

简而言之,在main.js中导出以下库,仅此,搞多了出错难排查 import ElementPlus from element-plus //导入ElementPlus 模块 import element-plus/dist/index.css //引入样式 app.use(ElementPlus) //注册库就能使用了 Element Plus 是一个基于 Vue 3 的组件…

Linux进阶命令-小结

作者介绍:简历上没有一个精通的运维工程师。希望大家多多关注作者,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。 经过上一章Linux日志的讲解,我们对Linux系统自带的日志服务已经有了一些了解。我们接下来将讲解一些进阶命令&am…

通过 OBD Demo 体验 OceanBase 4.3 社区版

本文作者:马顺华 引言 OceanBase 4.3 是一个专为实时分析 AP 业务设计的重大更新版本。它基于LSM-Tree架构,引入了列存引擎,实现了行存与列存数据存储的无缝整合。这一版本不仅显著提升了AP场景的查询性能,同时也确保了TP业务场景…

GPT-4o高级语音全量上线:自定义指令、记忆功能引爆新体验

千呼万唤,GPT-4o高级语音终于开始全量推出,Plus用户一周内都能用了! 没错,是Her是Her就是Her。 让大伙儿苦苦等了四个月,OpenAI这次发帖子也是变着法道歉。 晒的展示视频,咱就这句话听得真真切切&#xf…

Vue3 + ElementPlus 的后台菜单指引

文章目录 需求实现思路 需求 实现思路 引导页用 Drive.js 基本的使用操作这里写了一些菜单使用 ElementPlus 的组件,可以调用组件中暴露的这个方法,具体使用方法在这里说明 二者结合一下,就可以有这样的效果了

java项目之社区智慧养老监护管理平台设计与实现源码(springboot)

风定落花生,歌声逐流水,大家好我是风歌,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于springboot的社区智慧养老监护管理平台设计与实现。项目源码以及部署相关请联系风歌,文末附上联系信息 。 项目简介: 社区…

Java查找算法——(四)分块查找(完整详解,附有代码+案例)

文章目录 分块查找1.1普通分块查找 分块查找 1.1普通分块查找 分块原则: 块内无序,块间有序:前一块中的最大数据,小于后一块中所有的数据,块与块之间不能有数据重复的交集。块的数量一般等于数字个数开根号 核心思路&#xff…

有威胁的武器武装检测系统源码分享

有威胁的武器武装检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Comp…

双控开关接入NVBoard

导入NVBoard git仓库:https://github.com/NJU-ProjectN/nvboard 按照ysyx手册的要求,初始化NVBoard项目。 由于GitHub在国外,可能会超时无响应: 解决方案是修改代理。 当前的运行环境是VM VirtualBox虚拟机,网卡是…

MySQL高阶1949-坚定地友谊

目录 题目 准备数据 分析数据 实现 题目 如果 x 和 y 为 朋友 且他们 至少 有三个共同的朋友 &#xff0c;那么 x 和 y 之间的友谊就是 坚定的。 写一个解决方案来找到所有的 坚定的友谊。 注意&#xff0c;结果表不应该包含重复的行&#xff0c;并且 user1_id < us…

一些Spring面试题

Spring boot可以同时处理多少个请求? 用户进来先看目前数量是否小于最大连接数&#xff0c;多于【最大连接数最大队列数】的线程会等待&#xff0c;超过最大等待时间会TIME_OUT 81921008292

软件测试找工作|20道银行项目高频面试题

小编给大家上面试干货啦&#xff01;把前两天整理的银行项目面试题系列汇总给你们复习吼&#xff01; 先来看下面试题的目录叭...... 1、介绍一下贷款的项目&#xff1f; 贷款项目是银行业务中的重要组成部分&#xff0c;它是指银行向客户提供资金&#xff0c;让客户在约定的…

kubectl linux 安裝

添加 Kubernetes 的yum仓库&#xff0c;会覆盖 /etc/yum.repos.d/kubernetes.repo 中现存的所有配置 cat <<EOF | sudo tee /etc/yum.repos.d/kubernetes.repo [kubernetes] nameKubernetes baseurlhttps://pkgs.k8s.io/core:/stable:/v1.28/rpm/ enabled1 gpgcheck1 gpg…

Docker从入门到精通_01 Docker:引领云计算的新浪潮

Docker从入门到精通_01 Docker&#xff1a;引领云计算的新浪潮 云计算作为信息技术领域的重要支柱&#xff0c;正以前所未有的速度发展。然而&#xff0c;传统的虚拟化架构在资源利用、部署效率、应用扩展等方面已逐渐显露出其局限性。在这样的背景下&#xff0c;容器云技术应…

如何使用 python 调用 llama3 进行对话?

Meta 已将最新的 LLaMa3 进行了开源&#xff0c;因此&#xff0c;我们也可以方便的使用 Python 进行 LLaMa3 模型的调用和开发。 接下来&#xff0c;简单介绍如何通过 transformers 库来使用 LLaMa3。 1、导入库 首先&#xff0c;导入必要的库&#xff1a; pip3 install tra…

【2024】前端学习笔记10-基本选择器-组合选择器

学习笔记 基本选择器ID选择器 组合选择器后代选择器子选择器兄弟选择器 基本选择器 之前文章使用的分别为元素选择器和类选择器&#xff0c;这里不再过多记录。 元素选择器 p {color: blue;font-size: 14px; }在这个例子中&#xff0c;所有的<p>元素的文本颜色将被设置…

常见区块链数据模型介绍

除了加密技术和共识算法&#xff0c;区块链技术还依赖于一种数据模型&#xff0c;它决定了信息如何被结构化、验证和存储。数据模型定义了账户如何管理&#xff0c;状态转换如何发生&#xff0c;以及用户和开发者如何与系统交互。 在区块链技术的短暂历史中&#xff0c;数据…

如何开发数字药店与医保购药APP:技术架构与实现细节

本文将深入探讨数字药店与医保购药APP的技术架构及其实现细节&#xff0c;帮助开发者更好地理解该领域的技术需求。 一、技术架构概述 数字药店与医保购药APP的技术架构通常可以分为以下几个层次&#xff1a; 1.前端层&#xff1a; -用户界面 -用户体验 2.中间层&#xff…