【mechine learning-九-梯度下降】

【mechine learning-九-梯度下降】

news2026/2/14 7:37:43

梯度下降

更加通用的梯度下降算法
- 算法步骤

上一节讲过，随机的寻找w和b使损失最小不是一种合适的方法，梯度下降算法就是解决解决这个问题的，它不仅可以用于线性回归，还可以用于神经网络等深度学习算法，是目前的通用性算法。

更加通用的梯度下降算法

之前二维关于w和b的损失函数（无特殊说明，均以均方误差成本函数为例）如下：，
在这里插入图片描述
但是在更多的例子里，或者说更加复杂的神经网络里面，w是很多个，目前很多模型都是超过几千亿参数：

已经无法使用随机法来解决最小化J这个损失，必须用更加通用的梯度下降算法来解决最小化损失的问题。

算法步骤

在这里插入图片描述
假设某一个模型的成本函数也就是Loss fuction如上（不是线性回归也不是均方误差）：
如何从这里面找到J的最小值呢？方法如下：

设定w和b初始值。如图中左边这条线的起点。
从现在的位置旋转360度，找到J下降最快的点，向下走一步。（这意味着你走的是最快下山的路）
以下降后的位置，重复上述步骤，直到发现走到了一个局部最小的山谷底，也就是J的具备最小值。

梯度下降有意思的一件事情，假设随机选择的起始点是另外一个位置，比如右面这条线的起始点，那么找到的就是右边这个局部的最低点，这两个是完全不同的最低点。至于具体怎么实现算法留在下一节。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2138748.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【QT】定时器使用

【QT】定时器使用

文章目录关于 Qt 定时器使用的注意细节总结实例-检查工具使用周期时间是否合理UI设计头文件 remind.h源文件 remind.cpp实现效果关于 Qt 定时器使用的注意细节总结一、创建与初始化使用 QTimer 类来创建定时器。可以在构造函数中指定父对象，确保定时器在正确的…

阅读更多...

跨境电商代购新纪元：一键解锁全球好物，系统流程全揭秘

跨境电商代购新纪元：一键解锁全球好物，系统流程全揭秘

添加图片注释，不超过 140 字（可选） 在全球化日益加深的今天，跨境电商代购成为了连接消费者与世界各地优质商品的桥梁。本文将在CSDN平台上，深入剖析跨境电商代购系统的功能流程，带您一窥其背后的技术奥秘与…

阅读更多...

vue3+ant design vue实现可编辑表格弹出气泡弹出窗~

vue3+ant design vue实现可编辑表格弹出气泡弹出窗~

1、这里主要是介绍下::v-deep伪元素的作用。用于穿透组件作用域，以便在组件内部修改样式。用来覆盖Ant Design Vue组件库中的样式 <a-table:dataSource"dataList":columns"columns":scroll"{ x: 100% }":pagination"false&q…

阅读更多...

架构师备考的一些思考（四）

架构师备考的一些思考（四）

前言对于数学，我们之前学的是对的，但不是真的，所以我们没有数学思维。对于计算机，我们学校教的是对的，但不是真的，所以仅仅从学校学习知识的应届毕业生，不论985,211，本科&#xff…

阅读更多...

优化深度学习模型训练过程：提升PASCAL VOC 2012数据集上Deeplabv3+模型训练效率的策略

优化深度学习模型训练过程：提升PASCAL VOC 2012数据集上Deeplabv3+模型训练效率的策略

创作不易，您的打赏、关注、点赞、收藏和转发是我坚持下去的动力！ 优化说明： 避免重复下载和解压数据集：将downloadTrue改为downloadFalse，防止每次运行代码都重新下载和解压数据集，从而节省时间。使用pin…

阅读更多...

8. Transforms的使用(三)-- Resize

8. Transforms的使用(三)-- Resize

Transforms的使用（三） 1. 为什么要使用Resize 在模型的训练过程中往往需要图片数据的维度相同，才能适应深度学习模型中的相关神经网络结构，这时候就需要使用Resize保证所有的图片保持相同的尺寸2. 使用Resize调整图片的尺寸在pytorch2.3的版本上，Resize()支持对Tensor类…

阅读更多...

k8s Service 服务

k8s Service 服务

文章目录一、为什么需要 Service二、Kubernetes 中的服务发现与负载均衡 -- Service三、用例解读1、Service 语法2、创建和查看 Service 四、Headless Service五、集群内访问 Service六、向集群外暴露 Service七、操作示例1、获取集群状态信息2、创建 Service、Deployment3、创…

阅读更多...

分贝转换 1 mVpp = 9.03dBmV

分贝转换 1 mVpp = 9.03dBmV

分贝转换 1 mVpp 9.03dBmV 函数发生器调节如下参数在频谱仪器上能看到9.03dBmv的电压值函数发生器产生 30mVpp 频谱仪会显示多少dBmV 函数发生器调节如下参数 输出频率：10 MHz 波形类型：正弦波 阻抗：50 Ω 幅度：1 mVpp …

阅读更多...

【笔记】CCF直播：《如何在国际会议上有效交流》（2024-9-15）

【笔记】CCF直播：《如何在国际会议上有效交流》（2024-9-15）

目录一、提问的勇气二、提问什么三、其他主题的报告为什么听四、会议前怎么读大量论文？五、workshop为什么参加？Poster环节？六、提问环节七、其他今天听了《如何在国际会议上有效交流》的直播讲座，记录一些笔记。一、提问的勇…

阅读更多...

Gitlab及Git使用说明

Gitlab及Git使用说明

目录 1 Gitlab及Git介绍说明 5 1.1 什么是 Gitlab 5 1.2 什么是Git 5 1.3 Git 家族成员 5 1.4 Gitlab版本 5 1.5 Gitlab 优势 5 1.6 Gitlab 主要服务构成 6 1.7 Gitlab 简单工作流程 6 1.8 Gitlab用户角色 6 2 Gitlab安装与使用 7 2.1 Gitlab安装说明（管理员&#…

阅读更多...

文心智能体应用：美国旅游助手的诞生

文心智能体应用：美国旅游助手的诞生

创造灵感在如今的数字化时代，旅行体验越来越依赖于智能技术的辅助。从机票预订到行程安排，再到当地美食推荐，智能助手在旅行中的作用愈发重要。尤其在美国这样一个广袤且多样化的国家，拥有一个智能旅行助手能够极大地提升游客的…

阅读更多...

地震勘探原理视频总结（1-6）

地震勘探原理视频总结（1-6）

目录一、为什么要学好这门课？ 1.1 为什么要学这门课（为啥学）？ 1.2 课程包括哪些主要内容（学什么）？ 1.3 如何学好这门课（怎么学）？ 二、石油的生成与聚集…

阅读更多...

网络安全有救了，37所高校新增网络安全空间安全专业

网络安全有救了，37所高校新增网络安全空间安全专业

《网安面试指南》http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247484339&idx1&sn356300f169de74e7a778b04bfbbbd0ab&chksmc0e47aeff793f3f9a5f7abcfa57695e8944e52bca2de2c7a3eb1aecb3c1e6b9cb6abe509d51f&scene21#wechat_redirect 《Java代码审…

阅读更多...

Google提出 Speculative RAG：通过草稿机制增强检索增强生成

Google提出 Speculative RAG：通过草稿机制增强检索增强生成

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领…

阅读更多...

【自动化测试】自动化测试的价值和误区以及如何高效实用地落地自动化测试

【自动化测试】自动化测试的价值和误区以及如何高效实用地落地自动化测试

引言自动化并不仅仅是机器“点点点”的操作。虽然从表面上看，自动化测试确实涉及到了机器按照预设的脚本进行一系列的操作，但它的内涵远比这要丰富得多高效实用地落地自动化测试，需要从策略规划、工具选择、团队协作、持续改进等多个方面进…

阅读更多...

黑神话悟空：上架27天后，玩家群体分析

黑神话悟空：上架27天后，玩家群体分析

按9月13日的统计，仅在steam平台上，售出1900w份，约65亿人民币。 （游戏于2024年8月20日发售） 由于黑神话的关卡是线性的，即必须一关打过才能打下一关，和游戏的成就系统对应，所以可以…

阅读更多...

C++：入门基础

C++：入门基础

一.C参考文档 https://legacy.cplusplus.com/reference/ https://zh.cppreference.com/w/cpp https://en.cppreference.com/w/ 二.C的第一个程序 #include <iostream> using namespace std;int main() {cout << "Hello world!" << en…

阅读更多...

Node.js的学习2——内置模块（一）

Node.js的学习2——内置模块（一）

Node.js的内置模块 module模块global全局变量Console控制台Errors错误模块捕获异常异步方法通过回调函数传递异常事件触发器对象异常捕获 module模块使用module模块可以查看Node.js所有的内置模块、在所有模块中都可以使用的全局变量、程序在运行过程中可能会出现的四类错误。…

阅读更多...

Git项目管理工具

Git项目管理工具

分布式版本控制系统

阅读更多...

快速生成服务器响应json-server的安装和使用

快速生成服务器响应json-server的安装和使用

json-server介绍地址:https://www.geeksforgeeks.org/json-server-setup-and-introduction/ 1.json-server是什么? 基于自定义的json文件,快速生成服务端响应,可用于前端调试接口 2.安装和卸载json-server 2.1 安装: 使用npm命令: npm install -g json-server 2.2 卸载 npm …

阅读更多...

推荐文章

最新文章