最优化--梯度下降法--牛顿法(详解)

news2025/1/10 22:20:22

目录

梯度下降法

梯度下降法

 步骤

牛顿法

牛顿法的基本思想

牛顿法的优缺点

作用


梯度下降法

梯度下降法(Gradient Descent)是一种常用的优化算法,用于求解函数的最小值或最大值。它通过迭代的方式,不断更新参数的取值,使目标函数的值逐渐趋近于最优解。

梯度下降法的基本思想是,在每一次迭代中,通过计算目标函数对参数的梯度(即函数在当前参数取值处的变化率),然后沿着梯度的反方向进行参数更新,从而使目标函数的值逐步下降。这是因为梯度的方向指示了函数增长最快的方向,而我们希望找到函数的最小值,因此朝着梯度的反方向进行参数更新可以逐渐接近最优解。

 

在最小化损失函数时,可以通过梯度下降法来一步步的迭代求解,得到最小化的损失函

数和模型参数值。

梯度下降法

在机器学习中,对于很多监督学习模型,需要对原始的模型构建损失函数,接下来便是通

过优化算法对损失函数进行优化,最小化损失函数,以便寻找到最优的参数.于是,基于搜

索的梯度下降法就产生了。

梯度下降法是通过当前点的梯度的反方向寻找到新的迭代点,并从当前点移动到新的迭

代点继续寻找新的迭代点,直到找到最优解。

以下图为例:

上图中,η 称为学习率(learning rate),有时候也写作α,其取值影响获得最优解的速度

 

通过这个公式,在梯度下降法中不断搜索最佳的θ值。

 步骤

  1. 初始化参数:选择初始参数的取值。

  2. 计算梯度:计算目标函数对参数的梯度。梯度表示了函数在当前参数取值处的变化率。

  3. 参数更新:根据梯度的反方向,按照一定的步长(学习率)更新参数的取值。更新公式为:新参数 = 旧参数 - 学习率 × 梯度。

  4. 重复迭代:重复步骤2和步骤3,直到满足停止条件,例如达到最大迭代次数或目标函数的变化很小。

牛顿法

牛顿法(Newton's Method),也称为牛顿-拉弗森法(Newton-Raphson Method),是一种用于求解方程根或函数的最小值的迭代优化算法。它利用函数的二阶导数信息(Hessian矩阵)来逼近函数的局部性质,能够更快地收敛到最优解。

牛顿法的基本思想是通过构造函数的泰勒级数展开来近似原函数,并使用近似函数的根或最小值来逐步逼近原函数的根或最小值。在每一次迭代中,牛顿法使用当前点的切线来估计函数的根或最小值,并将切线与x轴的交点作为下一次迭代的点。这样,通过不断迭代,可以逐渐逼近函数的根或最小值。

 

牛顿法的基本思想

在现有的极小值估计值的附近对f(x)做二阶泰勒展开,进而找到极小点的下一个估计

值,反复迭代直到函数的一阶导数小于某个接近0的阀值。最终求出极小点的估计值。

牛顿法实现的动图如下所示:

注意

使用牛顿法时会用到hessian矩阵

牛顿法的优缺点

优点:

  • 牛顿法既用到了一阶导数的信息,也用到了二阶导数的信息
  • 牛顿法是用二次函数来代替目标函数,所以牛顿法的收敛速度是更快的

缺点:

  • hessian矩阵不一定可逆
  • 即使hessian矩阵可逆, 当 hessian 矩阵规模很大,非常耗时

作用

  1. 方程求解:牛顿法可以用于求解非线性方程的根。通过不断迭代,牛顿法可以快速逼近方程的根,尤其在初始点附近,收敛速度通常很快。因此,牛顿法在科学计算、物理建模等领域中广泛应用,例如求解非线性方程、求解微分方程的初值问题等。

  2. 优化问题:牛顿法可以用于求解函数的最小值或最大值。通过利用函数的二阶导数信息,牛顿法能够更快地收敛到函数的最优解。在优化问题中,牛顿法常用于求解无约束优化问题或约束优化问题的局部最优解。它在数学建模、机器学习、数据分析等领域中具有重要应用,例如最小二乘法、逻辑回归、神经网络等模型的参数优化。

  3. 数值分析:牛顿法是数值分析中的一种重要方法。它提供了一种逼近函数根或最优解的有效途径,通过迭代和近似计算,能够在有限步骤内得到满足要求的解。牛顿法是一种高效的数值计算方法,可以用于求解复杂的数学问题,如非线性方程组的求解、多元函数的最小值等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/699470.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

cmd获取apk签名hash、获取apk是否启用了V1\V2\V3\V4签名

1、从APK中获取签名hash keytool -printcert -jarfile apk路径 2、获取apk是否启用了V2\V3\V4签名 //在android sdk 目录,如 xxx\Sdk\build-tools\34.0.0 里,执行apksigner.bat verify -v apk路径

小白到运维工程师自学之路 第四十三集 (mariadb读写分离)

一、读写分离的优点 1. 负载均衡:将读操作分散到多个从库上,可以有效地分担主库的读负载,提高系统的 并发处理能力。 2. 提高读性能:从库可以通过增加硬件资源或者优化查询语句等方式来提高读操作的性 能,从而提升…

为什么用了代理ip访问网站还是被限制了

随着网络的发展和应用的普及,越来越多的用户开始使用代理ip来访问网站。代理ip可以隐藏真实IP地址,提供匿名性和访问自由,但有时候使用代理ip仍然会导致被禁止访问网站的情况发生。下面就让我们来分析一下吧。 代理ip被网站识别 一些网站通过…

从零详细地梳理一个完整的 LLM 训练流程

深度学习自然语言处理 分享知乎:何枝 在这篇文章中,我们将尽可能详细地梳理一个完整的 LLM 训练流程。包括模型预训练(Pretrain)、Tokenizer 训练、指令微调(Instruction Tuning)等环节。 文末进群&#xf…

两种特定网络环境下,如何实现外网SSH访问内网LINUX主机?

目前,大多数网友的网络环境分为两种,一种是没有公网IP,一种是动态公网IP环境。今天跟大家分享一下在这两种特定网络环境下,如何通过快解析内网穿透,实现外网SSH访问内网LINUX。 1.动态公网IP环境。路由器分配的是动态…

深入了解 KaiwuDB 负载行为数据采集

KAP 基于数据库系统内部反馈的各项数据指标,可帮助用户全面掌握 KaiwuDB 集群的整体运行情况,实时监测集群相关性能,可提供整体资源和集群状态角度的系统监控。 除此之外,KaiwuDB 数据库内部开发实现基于负载业务的行为数据采集功…

(九)栅格数据的空间分析——表面分析①

生成等值线 文章目录 生成等值线 1.等值线2.等值线质量3.控制等值线质量3.1对数据进行平滑处理3.2调整起始等值线 4.生成等值线4.1焦点统计4.2生成等值线 1.等值线 沿着特定等值线的折线 (polyline) 可识别出值相同的位置。等值线也是一种呈现表面的有效形式,因为它…

jmeter 报此错误 \report‘ as folder is not empty

jmeter 报此错误 \report’ as folder is not empty 解决方案 出现此错误的原因试因为同一个界面出现同样的文件,只要把文件删除,重新执行此命令即可。 删除文件框住得report和result.jtl 即可 执行成功

计算机图形学 3D渲染 笔记(一)

1 坐标系 大多数计算机屏幕采用的坐标系是以左上角为原点,水平(右)为x轴,纵向(下)为y轴3D图形学习中通常使用另一种坐标系, 即 正中心为原点,水平(右)为x轴&…

【算法题解】44. N 叉树的前序遍历(递归 + 迭代)

这是一道 简单 题 https://leetcode.cn/problems/n-ary-tree-preorder-traversal/ 题目 给定一个 n 叉树的根节点 root ,返回 其节点值的 前序遍历 。 n 叉树 在输入中按层序遍历进行序列化表示,每组子节点由空值 null 分隔(请参见示例&…

Golang源码探究——从Go程序的入口到GMP模型

在大多数的编程语言中,main函数都是用户程序的入口函数,go中也是如此。那么main.main是整个程序的入口吗, 肯定不是,因为go程序依赖于runtime,在程序的初始阶段需要初始化运行时,之后才会运行到用户的main函数&#xf…

【话题达人】做开发时遇到过无理的需求吗?面对这些无理需求你是怎么做的?

导读 工作过程中难免遇见一些“神奇的甲方”,他们总是会给你提出一些匪夷所思甚至无厘头的需求。你是否也有这样的经历,面对这样“无理的需求”你又是怎么做的呢? 面对这些无理需求时你是怎么做的? 首先深入了解需求&#xff0…

C++一键安装工具(vcpkg)

0. 简介 相较于python而言,C因为其复杂的环境安装一直受到很多人的诟病,比如说一个pcl的安装就需要有很多操作步骤。译过程仍然复杂和多样化。当了解了这些还不够,我们还需要考虑预先编译出哪种类型的开源库程序。比如:Debug还是…

快速掌握MongoDB数据库(入门一条龙)

目录 一、介绍 二、安装指导 2.1 下载 2.2 安装注意事项 2.3 配置环境变量 2.4 校验是否配置成功 2.5 启动服务器 2.6 打开客户端 2.7 退出 2.8 修改参数配置 2.9 设置开启自启动服务 三、MongoDB基本操作 3.1 基本概念 3.2 基本命令 3.3 数据库的crud命令 四、…

七、云尚办公-Activiti入门

云尚办公系统:Activiti入门 B站直达【为尚硅谷点赞】: https://www.bilibili.com/video/BV1Ya411S7aT 本博文以课程相关为主发布,并且融入了自己的一些看法以及对学习过程中遇见的问题给出相关的解决方法。一起学习一起进步!!&am…

《C++高级编程》读书笔记(十三:C++ I/O揭秘)

1、参考引用 C高级编程(第4版,C17标准)马克葛瑞格尔 2、建议先看《21天学通C》 这本书入门,笔记链接如下 21天学通C读书笔记(文章链接汇总) 1. 使用流 1.1 流的含义 C 中预定义的流 缓冲的流和非缓冲的流…

SpringBoot:配置Jetty容器

👨‍🎓作者:bug菌 ✏️博客: CSDN、 掘金、 infoQ、 51CTO等 🎉简介:CSDN、 掘金等社区优质创作者,全网合计7w粉,对一切技术都感兴趣,重心偏Java方向,目前运营…

c语言查漏补缺

例子一 #include<iostream> using namespace std;int main() {int a[5]{1,2,3,4,5};int* ptr (int*)(a1);printf("%d",*(ptr-1));return 0; }输出结果是&#xff1a;1&#xff0c;这个很好理解&#xff0c;数组名即数组的首地址&#xff0c;&#xff08;a1&a…

Android 13(T) - binder阅读(5)- 使用ServiceManager注册服务2

上一篇笔记我们看到了binder_transaction&#xff0c;这个方法很长&#xff0c;这一篇我们将把这个方法拆分开来看binder_transaction做了什么&#xff0c;从而学习binder是如何跨进程通信的。 1 binder_transaction static void binder_transaction(struct binder_proc *proc…

如何将自定义起步依赖打成包

说明&#xff1a;之前做过一个自定义的OSS起步依赖&#xff08;http://t.csdn.cn/9aYr5&#xff09;&#xff0c;但是当时只是新建了一个Demo模块来测试自定义起步依赖能成功使用&#xff0c;本文介绍如何把自定义的起步依赖打成jar包&#xff0c;供其他项目或其他人引入依赖就…