随即近似与随机梯度下降

news2024/9/21 2:50:26

一、均值计算

  • 方法1:是直接将采样数据相加再除以个数,但这样的方法运行效率较低,要将所有数据收集到一起后再求平均。
    在这里插入图片描述

  • 方法2:迭代法
    在这里插入图片描述

二、随机近似法: Robbins-Monro算法(RM算法)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

    1. g(w)是有界且递增的
    1. ak的和等于无穷,并且ak平方和小于无穷。我们会发现在许多强化学习算法中,通常会选择 ak作为一个足够小的常数,因为 1/k 会越来越小导致算法效率较低 。尽管在这种情况下第二个条件没有被满足,但算法仍然可以有效地工作,因为实际迭代的次数是有限。
    1. 关于系数 η ,表明 η 的期望为0,方差有界

RM算法是个迭代式的算法,对 w* 第 k 次的估计是 wk,第 k+1 次的估计是 wk+1,则有
在这里插入图片描述在这里插入图片描述最开始的时候我输入 w1,得到 g~1,然后带入到下式的右侧,得到 w2,再把 w2 输入,再得到 g~2,再带入下式的右侧,得到 w3,以此类推。最后我们会得到 {wk} 的序列和 {g~k} 的序列。RM 算法就是通过这样一种方式来求解的

随机梯度下降(SDG)

SGD 是 RM 算法的特殊情况,mean estimation 算法也是 SGD 的特殊情况
在这里插入图片描述
求解这个问题有多种方法,下面给出三种方法:

方法1:梯度下降(gradient descent,GD)

因为我们的目标是最小化一个目标函数,所以要用梯度下降;如果目标是最大化一个目标函数,就要用梯度上升。
在这里插入图片描述
在这里插入图片描述
缺点:难以获得期望值(expected value)。对此有两种解决方法:第一种方法,如果有模型就可以求出来;第二种方法,如果没有模型,用数据求

方法2:批量梯度下降(batch gradient descent,BGD)
在这里插入图片描述
缺点:每次迭代都需要对每个 wk 进行多次采样。在每次更新 wk 的时候都要采样 n 次或者多次。这在实际中还是不实用,那么来到了方法3

方法3:随机梯度下降(stochastic gradient descent,SGD)
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2098368.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PDF转换器,真心推荐这几款

PDF转换器,在现代办公环境中,PDF文件格式因其高保真性和跨平台兼容性而广受欢迎。但在实际工作中,我们常常需要将PDF文件转换为其他格式,这就需要用到PDF转换器。市场上的PDF转换器种类繁多,功能各异,如何选…

SpringCloud中什么是服务雪崩,常见的解决方案有哪些?(面试版)

雪崩:微服务调用链路中某个服务的故障,导致整个链路中的所有微服务都不可用。(其实就是一个服务的问题 导致 另一个访问它的服务出问题) 常见的解决方案: 1. 请求限流:限制访问 微服务请求(接口) 的并发…

OBCE实验指导手册V3 (4012问题分析手动实践)

实验环境 oceanbase 企业版V3 1-1-1 实验步骤 步骤1 创建MySQL 租户 ob_mysql,租户资源规格大小为 1C2G CREATE RESOURCE UNIT memory_test MAX_CPU 1, MAX_MEMORY 2G, MAX_IOPS 128,MAX_DISK_SIZE 10G, MAX_SESSION_NUM 64, MIN_CPU1, MIN_MEMORY2G, MIN_IOPS128;…

C++基础【字符串】(Ac-Wing)

字符串加空格 #include <iostream> #include <cstring> #include <algorithm>using namespace std;int main() {string s;getline (cin, s);for (int i 0; i < s.size(); i )cout << s[i] << " "; }字符串插入 #include<bits/…

通过旋转、平移求取矩形顶点坐标

前言 旋转和平移是几何变换中两个基本的操作&#xff0c;它们可以用来改变图形的位置和方向 一、旋转 旋转是指将图形绕某一点&#xff08;通常是原点或中心点&#xff09;旋转一定的角度。旋转会改变图形的方向&#xff0c;但不会改变其形状或大小。 在二维空间中&#xf…

材料力学:5.2 纯弯曲时的正应力

(1)曲率与弯矩之间的关系 图5.2.10静力关系 建立如图5.2.10&#xff08;c&#xff09;所示的xyz坐标&#xff0c;设工件截面的弯矩为 M M M &#xff0c;其与外力偶矩 M e M_e Me​ 等值反向。设截面处工件的曲率半径为 ρ \rho ρ &#xff0c;该工件的弹性模量为 E E …

springsecurity快速入门

Spring Security 是一个功能强大且高度可定制的安全框架&#xff0c;主要用于保护基于 Spring 的应用程序。它提供了一整套用于身份验证、授权、加密、会话管理等功能的工具和 API&#xff0c;从而帮助开发者快速、有效地保护应用程序。 Configuration EnableWebSecurity pu…

YOLO系列和RT-DETR转onnx和tensorrt,测FPS

RT-DETR(RT-DETR: DETRs Beat YOLOs on Real-time Object Detection) 和YOLOv8等在最后加nms RT-DETR转onnx和tensorrt和 RT-DETR转onnx和tensorrt 步骤流程&#xff1a; 1. nvidia驱动&#xff0c;cuda&#xff0c;cudnn三者的版本是相互对应的&#xff0c;必须要确保版本匹…

有什么简单方便的cad编辑器?2024快速进行cad编辑的软件合集

有什么简单方便的cad编辑器&#xff1f;2024快速进行cad编辑的软件合集 在建筑、工程、设计等领域&#xff0c;CAD&#xff08;计算机辅助设计&#xff09;软件是必不可少的工具。然而&#xff0c;面对复杂的CAD文件&#xff0c;有时我们只需要简单的编辑功能&#xff0c;而不…

nginx配置代理https端口的要点

今天配置了一个nginx代理端口&#xff0c;从http转成https的过程&#xff0c;刚开始以为很复杂&#xff0c;后面发现其实就那几个关键点&#xff0c;配置好了&#xff0c;就可以直接跳转 server的监听端口 我们常规nginx监听的端口都是http协议的&#xff0c;没有特殊说明&am…

Javascript实现笛卡儿积算法

在根据商品属性计算SKU时&#xff0c;通常会对商品不同选项的不同属性进行笛卡儿积运算。 function cartesian(elements) {if (!Array.isArray(elements))throw new TypeError();var end elements.length - 1,result [];function addTo(curr, start) {var first elements[s…

电话催收的优劣势

电话催收相比其他催收方式有哪些优势和劣势&#xff1f; 电话催收是催收业务这个场景最常用的一个方式&#xff0c;因为它无可替代。唯一还有催回欠款可能的&#xff0c;就是上门催&#xff0c;那成本太高了&#xff0c;一般不会选择。 优势方面 电话催收的主要优点包括成本低…

C语言实现SHA-256算法校验文件(win32-API)

一、前言 在数字化时代&#xff0c;信息安全与数据完整性成为了不可忽视的关键议题。在众多保障数据完整性的方法中&#xff0c;散列函数扮演着至关重要的角色。SHA-256&#xff08;Secure Hash Algorithm 256&#xff09;作为一种先进的散列算法&#xff0c;以其高度的安全性…

【C++】stack、queue、priority_queue的模拟实现

目录 一、stack &#x1f31f;stack的简单介绍 &#x1f31f;stack的基本使用 &#x1f31f;stack的模拟实现 &#x1f31f;stack模拟实现的完整代码 &#x1f31f;容器适配器 二、queue &#x1f31f;queue的简单介绍 &#x1f31f;queue的基本使用 &#x1f31f;q…

springboot酒店管理系统

springboot221酒店管理系统 摘 要 时代的发展带来了巨大的生活改变&#xff0c;很多事务从传统手工管理转变为自动管理。自动管理是利用科技的发展开发的新型管理系统&#xff0c;这类管理系统可以帮助人完成基本的繁琐的反复工作。酒店是出门的必需品&#xff0c;无论出差还是…

娱乐小项目-树莓派履带小车

快速使用 1.小车上电&#xff0c;开关在电源插口旁边 2.上电之后用电脑查看局域网WIFI&#xff0c;密码是12345678&#xff0c;固定IP是192.168.50.1 3.安装VNC软件&#xff1a;20240324_树莓派履带车\工具 4.打开VNC软件 5.在这个界面下 按ctrlaltt&#xff0c;弹出终端 6.输…

内存管理篇-20 Linux虚拟内存管理

1.虚拟地址的经典布局 这里的内容比较少。只要就是内核用户空间的划分。内核空间又有自己的划分。也需要注意一下每个区域的性能。理论上线性映射是最简单的&#xff0c;所以性能最高。同时&#xff0c;注意内核空间是可以配置的&#xff0c;并不是都3:1。 2.ARM32下的内存…

使用cURL探索WebSocket连接的奥秘

更多内容访问个人网站&#xff1a;孔乙己大叔 在现代Web开发中&#xff0c;实时通信已经成为不可或缺的一部分。WebSocket协议因其能够提供低延迟、全双工的通信能力&#xff0c;而被广泛应用于各种实时应用场景中&#xff0c;如在线聊天、实时通知、游戏等。虽然WebSocket主要…

React 实现PDF预览(数据源使用文件流而不是url)

一 前提 应公司要求&#xff0c;需要进行上传文件&#xff08;pdf&#xff09;的预览功能&#xff0c;网上大部分都是使用url作为预览数据源&#xff0c;但是现在后端那边只返回了pdf文件流&#xff0c;所以本文主要是用文件流来预览pdf。 二 首先需要获取pdf文件流&#xff…

四款经典的防泄密软件,企业防泄密必备软件

防泄密软件有哪些呢&#xff1f;以下是四款经典的防泄密软件介绍&#xff0c;每款软件都将从其主要功能、特点以及适用场景等方面进行详细阐述。 1. 安企神 主要功能&#xff1a; 文件加密&#xff1a;提供全面的文件加密解决方案&#xff0c;支持对敏感文件进行加密处理&…