吴恩达2022机器学习专项课程(一) 4.2 梯度下降实践

news2024/12/23 1:18:29

问题预览/关键词

  1. 本节内容
  2. 梯度下降更新w的公式
  3. 梯度下降更新b的公式
  4. =的含义
  5. α的含义
  6. 为什么要控制梯度下降的幅度?
  7. 导数项的含义
  8. 为什么要控制梯度下降的方向?
  9. 梯度下降何时结束?
  10. 梯度下降算法收敛的含义
  11. 正确更新梯度下降的顺序
  12. 错误更新梯度下降的顺序

笔记

1.本节内容

如何实现梯度下降算法

2.梯度下降更新w的公式

在这里插入图片描述

3.梯度下降更新b的公式

在这里插入图片描述

4.=的含义

表示计算机中的赋值操作,不能理解成数学中的等于操作。

5.α的含义:

希腊字母,表示学习率,通常为0-1之间很小的数,如0.01。它用来控制梯度下降的幅度。α越大,下降的步子越大。α很小,则一点点向下走。

6.为什么要控制梯度下降的幅度

控制梯度下降的幅度:学习率过高,下降幅度太大,无法下降到最低点,学习率过低,下降幅度太小,影响算法性能。

  • 如何选择合适的α:4.4课节会详细说明。

7.导数项的含义

用来控制梯度下降的方向。

  • 计算J关于w的偏导数

在这里插入图片描述

  • 计算J关于b的偏导数。
    在这里插入图片描述

8.为什么要控制梯度下降的方向?

只有控制方向,才能尽快的到达函数的局部或全局最小值。

  • 为什么求导能控制方向?4.3课节会详细说明。

  • 导数如何计算?4.5课节会详细说明。

9.梯度下降何时结束

不断更新w和b直到算法收敛,梯度下降就可以停止了。

  • 自行设置停止条件,在第一周lab_05实验代码,设置迭代10000次后自动停止。在这里插入图片描述

10.梯度下降算法收敛

优化过程中,算法逐步逼近问题的最优解或局部最优解。在线性回归中,表示梯度下降更新的w和b,已经达到成本函数J的局部最小值,此时w,b不怎么改变了。

11.更新梯度下降的正确顺序

先用旧的w和b计算,计算完成在更新w和b,即同步更新。
在这里插入图片描述

12.更新梯度下降的错误顺序

计算w然后更新w,导致计算b的过程里使用了新的w,旧的w被忽略了,导致w,b没有同步更新。
在这里插入图片描述

总结

梯度下降的具体操作是要更新w,b,公式为计算学习率乘以J关于w或b的偏导数,然后将结果赋值给新的w和b,一直重复上述过程,直到w,b的值不怎么改变了。公式中的=符号表示赋值操作,α(学习率)控制梯度下降的步幅,导数项控制梯度下降的方向。在更新w,b的时候,我们要做到同步更新。先计算旧的w,b,然后将结果更新给新的w,b。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1553711.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

6.RGB转YCbcr

1.方法 RGB转灰度有很多种方式   1.将RGB中任意分量拿出来当做灰度值。   2.取RGB三通道的均值来当灰度值。   3.将RGB转YUV(YCbCr)然后取Y分量作为灰度值。   其余的几种实现方式较为简单,这里不做介绍。重点实现RGB转YCbCr。 1.1 YUV(YCbCr)格式 Y表示亮…

Web开发-Django学习笔记

客户端如何获取服务端的数据信息? 通常 是 HTTP网络协议,通过网络传输数据信息。 客户端通过HTTP协议发送请求信息给服务端,并从服务端接收响应信息。 Web 前端开发: (HTML、CSS、JS)文件部署在后端服务…

华为广告打包报错,问题思考

华为广告打包时报错 fata日志不一样能反映出完整的错误日志信息,仅看fata日志具有误导性,有可能指向错误的方向。 通过看完整的日志可见,错误的原因为 Caused by: java.lang.ClassNotFoundException: com.huawei.hms.ads.base.R$dimenfata日…

Java基础概念(二)

idea 工欲善其事,必先利其器,所以在真正编写代码之前先下载idea工具,idea是用于java语言开发的集成环境,是业界目前公认的用于Java开发最好的工具,把代码编写、编译、运行、调试等功能综合到一起的开发工具 下载地址…

解决npm init vue@latest证书过期问题:npm ERR! code CERT_HAS_EXPIRED

目录 一. 问题背景 二. 错误信息 三. 解决方案 3.1 临时解决办法 3.2 安全性考量 一. 问题背景 我在试图创建一个新的Vue.js项目时遇到了一个问题:npm init vuelatest命令出现了证书过期的错误。不过这是一个常见的问题,解决起来也简单。 二. 错误…

uni-app项目打包步骤和踩过的坑(一)

最近接了一个前同事留下的uni-app的项目,之前没有接触过,好在以前的工作中用到过vue做过前台开发,虽然时间不长,但是有些方面还是可以借鉴的。经过前几篇文章的介绍,我已经补完了后台服务代码,打算发布到设…

QT布局管理和空间提升为和空间间隔

QHBoxLayout:按照水平方向从左到右布局; QVBoxLayout:按照竖直方向从上到下布局; QGridLayout:在一个网格中进行布局,类似于HTML的table; 基本布局管理类包括:QBoxLayout、QGridL…

AI人像写真解决方案,满足企业多样化视觉需求

美摄科技,作为一家专注于人工智能技术研发与应用的高新企业,深知企业对于高质量、高效率视觉内容的需求,特推出AI人像写真解决方案,为企业打开全新的视觉营销通道。 我们的AI人像写真解决方案,基于深度学习和计算机视…

3D分割项目 | 基于Pytorch+3DUnet实现的3D体积语义分割算法

项目应用场景 用于 3D 体积语义分割场景,适用于各种物体的 3D 语义分割,比如大米、大豆的体积分割等 项目效果: 项目流程 > 具体参见项目内README.md (1) 安装 conda install -c conda-forge mamba mamba create -n pytorch-3dunet -c p…

第十四届蓝桥杯JavaA组省赛真题 - 互质数的个数

解题思路: 快速幂 欧拉函数 快速幂比较常见于数据较大的取模场景,欧拉函数感觉还是有点抽象 注意: 取模的时候就不要简写了,例如:res res * a % mod;不要写成res * a % mod; import java.util.Scanner;public c…

cesium vue 绘制标记实体(撒点),监听鼠标左击事件

添加实体 const viewer new Cesium.Viewer(cesiumContainer, {})viewer.entities.add()查看实体 const viewer new Cesium.Viewer(cesiumContainer, {}) const billboard viewer.entities.add({...})viewer.zoomTo(billboard)删除实体 根据实体删除 if (billboard.value…

ElementUI 周组件展示成月的第几周

ElementUI 周组件展示成月的第几周 组件展示 <el-date-picker unlink-panels :clearable"false" change"weekChange":editable"false" :type"dateType":value-format"valueFormat" :format"format"v-if&qu…

怎样一次性给多篇word文档标注拼音?一键批量注音

随着办公自动化的普及&#xff0c;我们经常会遇到需要处理大量Word文档的情况。在这些文档中&#xff0c;有时需要将文字标注上拼音&#xff0c;特别是在处理一些包含生僻字或需要拼音辅助阅读的文档时。然而&#xff0c;手动一篇篇地给Word文档标注拼音不仅效率低下&#xff0…

深度剖析MySQL锁:解开数据库并发控制的神秘面纱

MySQL 锁是 MySQL 数据库管理系统中为了实现并发控制和数据一致性的机制。在多用户并发访问数据库时&#xff0c;锁可以确保多个事务在对同一数据进行操作时不会相互干扰&#xff0c;以防止数据不一致的现象发生。 一、锁分类 MySQL支持多种类型的锁&#xff0c;主要包括…

DataX-Oracle新增writeMode支持update

目录 前言 第一步下载源码 第二步修改源码 1、Oraclewriter 2、WriterUtil 2.1、修改getWriteTemplate方法 2.2、新增onMergeIntoDoString与getStrings方法 3、CommonRdbmsWriter 3.1、修改startWriteWithConnection 3.2、修改doBatchInsert 3.3、修改fillPreparedStatem…

苹果应用商店上架利器:推荐几款常用的应用发布工具

摘要 移动应用app上架是开发者关注的重要环节&#xff0c;但常常会面临审核不通过等问题。为帮助开发者顺利完成上架工作&#xff0c;各种辅助工具应运而生。本文探讨移动应用app上架原理、常见辅助工具功能及其作用&#xff0c;最终指出合理使用工具的重要性。 引言 移动应…

洛谷_P1803 凌乱的yyy / 线段覆盖_python写法

P1803 凌乱的yyy / 线段覆盖 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 这道题是不是用python做只能做到70分啊&#xff1f;&#xff1f; n int(input()) data [] for i in range(n):data.append(list(map(int,input().split())))data.sort(keylambda x:x[1])ans 1 mi…

Solidity Uniswap V2 Router swapTokensForExactTokens

最初的router合约实现了许多不同的交换方式。我们不会实现所有的方式&#xff0c;但我想向大家展示如何实现倒置交换&#xff1a;用未知量的输入Token交换精确量的输出代币。这是一个有趣的用例&#xff0c;可能并不常用&#xff0c;但仍有可能实现。 GitHub - XuHugo/solidit…

景联文科技高质量大模型训练数据汇总!

3月25日&#xff0c;2024年中国发展高层论坛年会上&#xff0c;国家数据局局长刘烈宏在“释放数据要素价值&#xff0c;助力可持续发展”的演讲中表示&#xff0c;中国10亿参数规模以上的大模型数量已超100个。 当前&#xff0c;国内AI大模型发展仍面临诸多困境。其中&#xff…

批量剪辑视频,批量调整片头片尾时长,批量剪辑更高效!

在视频剪辑的世界里&#xff0c;有时候我们需要对视频的片头片尾进行精细调整&#xff0c;以适应不同的需求和创意。然而&#xff0c;传统的视频剪辑软件往往操作繁琐&#xff0c;效率低下&#xff0c;让人望而却步。今天&#xff0c;我要为您介绍一种全新的批量剪辑方式&#…