梯度下降（Gradient Descent）

梯度下降（Gradient Descent）

news2026/2/11 12:24:09

基本思想
梯度下降是一个用来求函数最小值的算法，本次，我们将使用梯度下降算法来求出代价函数的最小值。
梯度下降背后的思想是：开始时我们随机选择一个参数的组合，计算代价函数，然后我们寻找下一个能让代价函数值下降最多的参数组合。我们持续这么做直到到到一个局部最小值（local minimum），因为我们并没有尝试完所有的参数组合，所以不能确定我们得到的局部最小值是否便是全局最小值（global minimum），选择不同的初始参数组合，可能会找到不同的局部最小值。

想象一下你正站立在山的这一点上，站立在你想象的公园这座红色山上，在梯度下降算法中，我们要做的就是旋转360度，看看我们的周围，并问自己要在某个方向上，用小碎步尽快下山。这些小碎步需要朝什么方向？如果我们站在山坡上的这一点，你看一下周围，你会发现最佳的下山方向，你再看看周围，然后再一次想想，我应该从什么方向迈着小碎步下山？然后你按照自己的判断又迈出一步，重复上面的步骤，从这个新的点，你环顾四周，并决定从什么方向将会最快下山，然后又迈进了一小步，并依此类推，直到你接近局部最低点的位置。
公式
批量梯度下降（batch gradient descent）算法的公式为（tip：α后面的内容是偏微分）：

其中α是学习率（learning rate），它决定了我们沿着能让代价函数下降程度最大的方向向下迈出的步子有多大，在批量梯度下降中，我们每一次都同时让所有的参数减去学习速率乘以代价函数的导数。
如果α太小了，即我的学习速率太小，结果就是只能这样像小宝宝一样一点点地挪动，去努力接近最低点，这样就需要很多步才能到达最低点，所以如果太小的话，可能会很慢，因为它会一点点挪动，它会需要很多步才能到达全局最低点。
如果α太大，那么梯度下降法可能会越过最低点，甚至可能无法收敛，下一次迭代又移动了一大步，越过一次，又越过一次，一次次越过最低点，直到你发现实际上离最低点越来越远，所以，如果太大，它会导致无法收敛，甚至发散。
故此，α（学习率）要选的合适。
总结
这就是梯度下降算法，你可以用它来最小化任何代价函数，不只是线性回归中的代价函数。
在接下来的内容中，我们要用代价函数，回到它的本质，线性回归中的代价函数。也就是我们前面得出的平方误差函数，结合梯度下降法，以及平方代价函数，我们会得出第一个机器学习算法，即线性回归算法。

参考内容：
机器学习-吴恩达
机器学习笔记

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/757774.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Linux：squid透明代理

Linux：squid透明代理

在传统代理上进行修改并添加网卡这次不使用手动代理，而是把网关搞成代理在下面这个链接里的文章实验下进行修改 Linux：squid传统代理_鲍海超-GNUBHCkalitarro的博客-CSDN博客完成以后不用再win10上去配置，代理的那一步，然后…

阅读更多...

Python（十二）常见的数据类型

Python（十二）常见的数据类型

❤️ 专栏简介：本专栏记录了我个人从零开始学习Python编程的过程。在这个专栏中，我将分享我在学习Python的过程中的学习笔记、学习路线以及各个知识点。 ☀️ 专栏适用人群 ：本专栏适用于希望学习Python编程的初学者和有一定编程基础的人。无…

阅读更多...

TabLayout+ViewPager实现滚动页面

TabLayout+ViewPager实现滚动页面

目录一、TabLayout介绍二、TabLayout的常用属性和方法常用属性： 常用方法： 三、适配器介绍 （一）、PagerAdapter介绍： （二）、FragmentPagerAdapter介绍： （三&am…

阅读更多...

习题 1.26

习题 1.26

我们先来看看题目要求，题目住说将 square 调用换成了（* x x),结果导致执行时间变慢。根据以前学过的内容，我们知道在做显示乘法的时候，是直接进行计算的，而在做函数调用的时候，是先进行表达式展开的&…

阅读更多...

【MySQL】常见函数使用(二)

【MySQL】常见函数使用(二)

🚗MySQL学习第二站~ 🚩本文已收录至专栏：数据库学习之旅 ❤️文末附全文思维导图，感谢各位点赞收藏支持~ 就如同许多编程语言中的API一样，MySQL中的函数同样是官方给我们封装好的，可以直接调用的一段代码。…

阅读更多...

ZooKeeper ZAB

ZooKeeper ZAB

文章首发地址在接收到一个写请求操作后，追随者会将请求转发给群首，群首将探索性地执行该请求，并将执行结果以事务的方式对状态更新进行广播。一个事务中包含服务器需要执行变更的确切操作，当事务提交时，服务器就会将这…

阅读更多...

dp算法篇Day7

dp算法篇Day7

"抱紧你的我，比国王富有~" 31、最长定差子序列 (1) 题目解析从题目来看还是很容易理解的，就是找寻数组中构成差值相等的子序列。 (2) 算法原理 class Solution { public:int longestSubsequence(vector<int>& arr, int difference…

阅读更多...

多模态系列论文--ALBEF 详细解析

多模态系列论文--ALBEF 详细解析

ALBEF来自于Align before Fuse，作者团队全自来自于Salesforce Research。论文地址：Align before Fuse: Vision and Language Representation Learning with Momentum Distillation 论文代码：ALBEF 1 摘要最近图像文本的大规模的特征学习非…

阅读更多...

AI Chat 设计模式：7. 单例模式

AI Chat 设计模式：7. 单例模式

本文是该系列的第七篇，采用问答式的方式展开，问题由我提出，答案由 Chat AI 作出，灰色背景的文字则主要是我的旁白和思考。问题列表 Q.1 简单介绍一下单例模式A.1Q.2 详细说说饿汉式，并使用 c 举例A.2Q.3 好&#xff…

阅读更多...

【半监督医学图像分割 2022 IJCAI】UGPCL

【半监督医学图像分割 2022 IJCAI】UGPCL

文章目录【半监督医学图像分割 2022 IJCAI】UGPCL摘要1. 介绍2. 相关工作2.1 半监督医学图像分割2.2 对比学习2.3 不确定度估计 3. 方法3.1 解码器间的一致性学习3.2 不确定性引导的对比学习3.3 等变对比损失 4. 实验4.1 实验设置4.2 定量实验4.3 消融实验 5. 结论【半监督医…

阅读更多...

引爆用户流量，打造热门小红书创业项目

引爆用户流量，打造热门小红书创业项目

引爆用户流量，打造热门小红书创业项目在当今互联网时代，创业者们不断寻求新的商机和盈利模式。而小红书作为一个以分享购物心得、美妆、旅行等内容为主的社交平台，成为了众多创业者关注的焦点。如何通过小红书引爆用户流量，并打造…

阅读更多...

【框架篇】使用注解存储对象

【框架篇】使用注解存储对象

使用注解存储对象之前我们存储Bean时，需要在spring-config 中添加一行 bean注册内容才行，如下图所示： 问题引入：如果想在Spring 中能够更简单的进行对象的存储和读取，该怎么办呢？ 问题解答：实…

阅读更多...

Python应用实例（一）外星人入侵（十）

Python应用实例（一）外星人入侵（十）

外星人入侵（十） 1.记分1.1 显示得分1.2 创建记分牌1.3 在外星人被消灭时更新得分1.4 重置得分1.5 将消灭的每个外星人都计入得分1.6 提高分数1.7 舍入得分1.8 最高得分1.9 显示等级1.10 显示余下的飞船数 1.记分下面来实现一个记分系统，以实…

阅读更多...

动态规划01背包之1049 最后一块石头的重量 II（第11道）

动态规划01背包之1049 最后一块石头的重量 II（第11道）

题目： 有一堆石头，用整数数组 stones 表示。其中 stones[i] 表示第 i 块石头的重量。每一回合，从中选出任意两块石头，然后将它们一起粉碎。假设石头的重量分别为 x 和 y，且。那么粉碎的可能结果如下： …

阅读更多...

4029: 网格行走

4029: 网格行走

题目内容在一个 n n n \times n nn 的网格上行走，从 ( 1 , 1 ) (1, 1) (1,1) 走到 ( n , n ) (n, n) (n,n)。每次只能向下走一步或向右走一步。每个点 ( i , j ) (i, j) (i,j) 有权值 a i , j a_{i, j} ai,j，给定一个数 x x x，求…

阅读更多...

电机驱动系列（1）--例程下载演示

电机驱动系列（1）--例程下载演示

电机驱动系列（1） 使用设备连线实操感想使用设备硬件：野火骄阳板–STM32F407IGT6，野火无刷电机驱动板，PMSM电机软件：MCSDK，STM32CubeMX，Keil5软件安装注意事项：MCSDK-F…

阅读更多...

SOF-SLAM论文翻译

SOF-SLAM论文翻译

SOF-SLAM:面向动态环境的语义可视化SLAM 摘要-同时定位与绘图(SLAM)在计算机视觉和机器人领域中占有重要地位。为了便于分析，传统的SLAM框架采用了强静态世界假设。如何应对动态环境是一个非常重要的问题，越来越受到人们的关注。现有的动态场景SLAM系统…

阅读更多...

MySQL不适合创建索引的7种情况

MySQL不适合创建索引的7种情况

1. 在where中使用不到的字段，不要设置索引 WHERE条件（包括order by ，group by） 2. 数据量小的表最好不要使用索引表记录太少，比如少于1000个，创建索引会先查索引，再回表，查询花费…

阅读更多...

虚拟机安装及使用

虚拟机安装及使用

无论下载什么软件，最好都要单独设置个文件夹文章目录 VMware下载CentOS下载Xshell 7下载WinSCP下载linux命令 VMware下载提示：这里可以添加本文要记录的大概内容： VMware Workstation Pro安装一直傻瓜式安装可以上网找许可证秘钥 …

阅读更多...

asm: 实现打印“Hello, world!“

asm: 实现打印“Hello, world!“

使用汇编打印“Hello, world!“ 实现打印"Hello, world!"的汇编代码代码详细剖析实现打印"Hello, world!"的汇编代码我们来直接贴代码 section .textglobal _start _start:mov edx,lenmov ecx,msgmov ebx,1mov eax,4 int 0x80mov …

阅读更多...

推荐文章

最新文章