梯度下降学习

news2025/4/23 18:02:42

前言：初步学习梯度下降，不断根据梯度修改我们的参数，经过多次轮次得到使得我们损失函数最小的时候参数，后续我们可以通过类似的道理，更新我们的参数

假设我们的损失函数是 $y = x1^2 + x2^2$ ,我们的 $x 1$ 和 $x 2$ 取什么值的时候能够让 $y$ 最小值

def fun(x):
    return x[0]**2 + x[1]**2

这是我们的损失函数

def numerical_gradient(fun,x):
    h = 1e-4
    grad = np.zeros_like(x)
    for i in range(len(x)):
        tmp = x[i]
        x[i] = tmp + h
        fxh1 = fun(x)
        
        x[i] = tmp - h
        fxh2 = fun(x)
        grad[i] = (fxh1 - fxh2)/(h*2)
        x[i] = tmp
    return grad

这是计算梯度

def gradient_descent(f,init_x,lr=0.001,step_num=100):
    x = init_x
    for i in range(step_num):
        grad = numerical_gradient(f,x)
        x -= lr * grad
    return x

上面是通过梯度进行数据的更新，朝着梯度的反方向进行改进

下面我们进行测试

在这里插入图片描述
最后我们的答案无限接近 $(0, 0)$

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2190673.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

什么是 HTTP Get + Preflight 请求

当在 Chrome 开发者工具的 Network 面板中看到 GET Preflight 的 HTTP 请求方法时，意味着该请求涉及跨域资源共享 (CORS)，并且该请求被预检了。理解这种请求的背景，主要在于 CORS 的工作机制和现代浏览器对安全性的管理。下面是在 Chrome …

常用排序算法（下）

目录 2.5 冒泡排序 2.6 快速排序 2.6 1 快速排序思路详细步骤 2.6 2 快速排序递归实现 2.6 3快速排序非递归： 快排非递归的优势非递归思路 1. 初始化栈 2. 将整个数组的起始和结束索引入栈 3. 循环处理栈中的子数组边界 4. 单趟排序 5. 处理分区后的子…

Linux驱动开发(速记版)--热插拔

第九十六章热插拔简介热插拔是指在设备运行时安全地插入或拔出硬件，无需关闭或重启系统。它提供了方便性和灵活性，允许快速更换或添加硬件而无需中断任务。以下是一些应用场景及支持热插拔所需的条件： 应用场景： USB设备&…

python中，try-except捕获异常的意义（通过ai智库学习）

python中，不但可以用try-except捕获异常， 还可以自定义异常提示字符串，更可以自定义捕获异常后的处置。 (笔记模板由python脚本于2024年10月03日 06:47:06创建，本篇笔记适合喜欢研究python的coder翻阅) 【学习的细节是欢悦的历程】…

交叠型双重差分法

交叠型双重差分法（Staggered Difference-in-Differences, Staggered DiD）是一种扩展的双重差分（Difference-in-Differences, DiD）方法，用于处理多个时间点的政策干预或处理组（treatment group）并…

每日读则推(四)

Whats this...? | An invitation letter n.邀请函 n.邀请(invite v.邀请) Can a tool grasp the meaning in a song? v. 握紧,理解 n.紧握,理解(力) Can it feel the melody, where emotions belong? …

// // Created by 徐昌真 on 2024/10/5. // #include <iostream> #include <cstring> using namespace std;//定义一个结构体(类) struct Info{char _name[20];int _role; //老师是0 同学是1union { //用union存放score和course 节省内存int score;char course[2…

全球十大独角兽（完整榜单），你猜中国占几席？

全球十大独角兽 10月3日，OpenAI 宣布已完成 66 亿美元融资，估值达 1570 亿美元，成为全球第三的独角兽。给新来的读者重温一下"独角兽"的定义：估值超过10亿美元的未上市企业。你可能会好奇，OpenAI 是第三&a…

Linux·进程概念(下)

1. 进程优先级优先级就是获得某种资源的先后顺序，因为CPU资源是有限的，因此各个进程之间要去争取CPU的资源。那么针对Linux操作系统下的PCB中，也就是task_struct结构体中，使用了int类型的变量记录了每个进程的优先级属性&#x…

WIFI网速不够是不是光猫的“路由模式”和“桥接模式”配置错了？

光猫（光纤调制解调器）是一种用于将光纤信号转换为数字信号的设备，通常用于家庭或企业网络中。光猫可以在不同的工作模式下运行，其中最常见的两种模式是“路由模式”和“桥接模式”。以下是这两种模式的详细解释及其优缺点。一、路…

python实现单例模式的常用三种方法-基于new/使用装饰器以及Python中的值类型、引用类型以及类的静态变量、读取进程和线程ID

一、python实现单例模式的常用三种方法-基于__new__,使用装饰器涉及到类的使用就会有类的实例化，就会有类单例实现的需求，因为重复实例化会浪费资源。python中的单例模式与别的语言相比，单例实现的方法更丰富。虽然python实现单例的模式的方…

MobaXterm使用

Linux连接工具MobaXterm详细使用教程-CSDN博客

Elasticsearch学习笔记(五）Elastic stack安全配置二

一、手动配置http层SSL 通过前面的配置，我们为集群传输层手动配置了TLS，集群内部节点之间的通信使用手动配置的证书进行加密，但是集群与外部客户端的http层目前还是使用的自动配置，集群中HTTP的通信目前仍然使用自动生成的证书ht…

【韩顺平Java笔记】第7章：面向对象编程(基础部分)【227-261】

文章目录 227. 重载介绍228. 重载快速入门229. 重载使用细节230. 重载课堂练习1231. 232. 重载课堂练习2,3233. 可变参数使用233.1 基本概念233.2 基本语法233.3 快速入门案例 234. 可变参数细节235. 可变参数练习236. 作用域基本使用237. 作用域使用细节1238. 作用域使用细节2…