Stochastic Approximation 随机近似方法的详解之（一）

Stochastic Approximation 随机近似方法的详解之（一）

news2026/2/13 0:09:10

随机近似的定义：它指的是一大类随机迭代算法，用于求根或者优化问题。

Stochastic approximation refers to a broad class of stochastic iterative algorithms solving root finding or optimization problems.

temporal-difference algorithms是随机近似算法的一个特殊情景。

启发例子：均值估计

假设有限集合为 $\mathcal{X}$ ，考虑随机变量 $X$ 是定义在这个集合的随机变量。我们的目的是估测 $\mathbb{E}[X]$ ，我们是从样本中抽样的方法用样本均值 $\overline{x}$ 近似这个期望的值。 $\overline{x}$ 怎么来算呢？
抽取所有样本然后求均值的方法对于样本量巨大的情况显得很慢。
我们可以考虑用增量迭代（incremental and iterative）的方法：

先说结论，对一个新来的抽样样本，我们可以用这样的方法更新均值：

在这里插入图片描述

证明如下：

$w_{k+1}=\frac{1}{k} \sum_{i=1}^k x_i=\frac{1}{k}\left(\sum_{i=1}^{k-1} x_i+x_k\right)=\frac{1}{k}\left((k-1) w_k+x_k\right)=w_k-\frac{1}{k}\left(w_k-x_k\right)$

整个过程数学展开如下：
在这里插入图片描述
相比全部抽样完了再计算均值，这个方法的好处在于每到达一个样本就可以实时的更新均值，使用部分样本计算出来的样本均值可以立马使用。随着抽样的进行，均值的计算结果会越来越精确。

重点！！而上面的均值迭代更新公式可以更一般地表示为：在这里插入图片描述
当这个系数 $\alpha_k$ 满足一些条件的时候，这个更新公式是会收敛到 $\mathbb{E}[X]$ 的。

至此，我们已经见识了（6-2）和（6-4）两种随机迭代算法。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/382392.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

原子级操作快速自制modbus协议

原子级操作快速自制modbus协议

原子级操作手把手搞懂modbus协议文章目录[toc]1 modbus协议基础概念1.1 使用场所1.2 主从协议站1.3 modbus帧描述1.4 数据模式1.5 modbus状态机2 modbus协议2.1 功能码2.2 公共功能码2.3 数据域格式3 modbus从站程序设计3.1 接口初始化3.2 数据处理部分查表法设置超时时间3.2 主…

阅读更多...

堆的概念结构及实现

堆的概念结构及实现

文章目录1.堆的概念及结构2.堆的实现2.1父子节点之间的关系2.2堆的向上排序算法2.3 堆的删除2.4堆的向下排序算法2.5入堆2.6堆的创建2.6.1通过入堆实现（通过向上堆排序）2.6.2通过向下排序实现2.6.3两种方法比较2.7代码实现2.7.1函数声明2.7.2函数实现2.7…

阅读更多...

前端开发与vscode开发工具介绍

前端开发与vscode开发工具介绍

文章目录1、前端开发2、vscode安装和使用2.1、下载地址2.2、插件安装2.3、设置字体大小2.4、开启完整的Emmet语法支持2.5、创建项目2.6、保存工作区2.7、新建文件夹和网页1、前端开发前端工程师“Front-End-Developer”源自于美国。大约从2005年开始正式的前端工程师角色被行…

阅读更多...

【Python入门第二十一天】Python 数组

【Python入门第二十一天】Python 数组

请注意，Python 没有内置对数组的支持，但可以使用 Python 列表代替。数组数组用于在单个变量中存储多个值： 实例创建一个包含汽车品牌的数组： cars ["Porsche", "Volvo", "BMW"]运行实例 …

阅读更多...

【我的车载技术】 Android AutoMotive 之 init与zygote内核原理

【我的车载技术】 Android AutoMotive 之 init与zygote内核原理

init概述 init是一个进程，确切地说，它是Linux系统中用户空间的第一个进程。由于Android是基于Linux内核的，所以init也是Android系统中用户空间的第一个进程，它的进程号是1。作为天字第一号的进程，init被赋予了很多极其…

阅读更多...

FFmpeg最常用命令参数详解及应用实例

FFmpeg最常用命令参数详解及应用实例

FFMPEG堪称自由软件中最完备的一套多媒体支持库，它几乎实现了所有当下常见的数据封装格式、多媒体传输协议以及音视频编解码器，提供了录制、转换以及流化音视频的完整解决方案。 ffmpeg命令行参数解释 ffmpeg -i [输入文件名] [参数选项] -f [格式] [输出…

阅读更多...

lambada表达式

lambada表达式

负壹、函数式编程 Java为什么要支持函数式编程？ 代码简洁函数式编程写出的代码简洁且意图明确，使用stream接口让你从此告别for循环。多核友好 Java函数式编程使得编写并行程序从未如此简单，你需要的全部就是调用一下parallel()方法。 Jav…

阅读更多...

C++ -- STL简介、string的使用

C++ -- STL简介、string的使用

什么是STL STL(standard template libaray-标准模板库)：是C标准库的重要组成部分，不仅是一个可复用的组件库，而且是一个包罗数据结构与算法的软件框架。 STL的版本原始版本：Alexander Stepanov、Meng Lee 在惠普实验室完成的原…

阅读更多...

Person p=new student()是什么意思

Person p=new student()是什么意思

记住：父类引用子类对象 Student t new Student(); 实例化一个Student的对象，这个不难理解。但当我这样定义时：Person p new Student(); 这代表什么意思呢？ 很简单，它表示我定义了一个Person类型的引用，指…

阅读更多...

内大892复试真题16年

内大892复试真题16年

内大892复试真题16年 1. 输出三个数中较大数2. 求两个数最大公约数与最小公倍数3. 统计字符串中得字符个数4. 输出菱形5. 迭代法求平方根6. 处理字符串(逆序、进制转换)7. 寻找中位数8. 输入十进制输出n进制1. 输出三个数中较大数问题代码 #include <iostream>usin…

阅读更多...

如何保护页面端的企业邮箱

如何保护页面端的企业邮箱

作为日常工作交流中不可或缺的工具，电子邮件的安全性一直是备受关注的话题。页面是企业邮箱用户日常邮箱使用的重要接入终端，企业邮箱承载着企业的重要业务内容和关键数据。这个环节的安全问题会对企业产生深远的影响，信息安全建设的重要性不…

阅读更多...

CharGPT无法替代的职场发展底层逻辑

CharGPT无法替代的职场发展底层逻辑

什么是职场发展的两大底层逻辑？ 一为对事，一为对人，二者不可偏废，否则就会成为“职场上的瘸子”。 01 在刚开始工作的很长一段时间里，我遇到了同一个问题 - 虽然我对自己的工作认真负责，但职业发展却并…

阅读更多...

移动硬盘文件或目录损坏且无法读取？分享恢复数据的方法

案例：移动硬盘提示无法访问，文件或目录损坏且无法读取？ “这个移动硬盘两年没用了，今天拿出来找文件，插上电脑后移动硬盘打不开，提示无法访问，文件或目录损坏且无法读取。硬盘里有重要文件&…

阅读更多...

在字节跳动做了5年软件测试，12月无情被辞，想给划水的兄弟提个醒

在字节跳动做了5年软件测试，12月无情被辞，想给划水的兄弟提个醒

先简单交代一下背景吧，某不知名 985 的本硕，17 年毕业加入字节，以“人员优化”的名义无情被裁员，之后跳槽到了有赞，一直从事软件测试的工作。之前没有实习经历，算是5年的工作经验吧。这5年之间完成了一次…

阅读更多...

SpringBoot异常处理

SpringBoot异常处理

目录一、错误处理 1. 默认规则 2. 定制错误处理逻辑二、自定义异常处理 1. 实现 ErrorController 2. RestControllerAdvice/ControllerAdvice ExceptionHandler 实现自定义异常 3. 新建 UserController.class 测试 3 种不同异常的处理 4. 最终效果如下补充 1. 参…

阅读更多...

【数据结构】八大经典排序总结

【数据结构】八大经典排序总结

文章目录一、排序的概念及其运用1.排序的概念2.常见排序的分类3.排序的运用二、常见排序算法的实现1.直接插入排序1.1排序思想1.2代码实现1.3复杂度及稳定性1.4特性总结2.希尔排序2.1排序思想2.3复杂度及稳定性2.4特性总结3.直接选择排序3.1排序思想3.2代码实现3.3复杂度及稳定…

阅读更多...

《数据治理行业实践白皮书》正式发布，开辟数据治理新范式（附下载）

《数据治理行业实践白皮书》正式发布，开辟数据治理新范式（附下载）

近日，作为首届未来数商大会协办单位之一，袋鼠云承办“首届未来数商大会——业数融合创新论坛”，与参会嘉宾共同探讨数据驱动企业业务增长提效的新思路。袋鼠云联合创始人、易知微CEO 宁海元发表主题演讲《数智视融合，构建数字产业…

阅读更多...

Docker安装Cassandra数据库，在SpringBoot中连接Cassandra

Docker安装Cassandra数据库，在SpringBoot中连接Cassandra

简介 Apache Cassandra是一个高度可扩展的高性能分布式数据库，旨在处理许多商用服务器上的大量数据，提供高可用性而没有单点故障。它是NoSQL数据库的一种。首先让我们了解一下NoSQL数据库的作用。 NoSQL 数据库 NoSQL数据库（有时称为“Not …

阅读更多...

YOLO5-V7.0的python代码转成exe，方便离线部署

YOLO5-V7.0的python代码转成exe，方便离线部署

思路：用Pyinstaller打包，但有一些坑，踩完坑后成功运行，写个踩坑指南分享下。前提：已经在conda 环境下安装完可以运行的yolo5代码，例如你的虚拟python环境叫yolo5，主代码是XXX.py（这…

阅读更多...

数字IC手撕代码--低功耗设计 Clock Gating

数字IC手撕代码--低功耗设计 Clock Gating

背景介绍芯片功耗组成中，有高达 40%甚至更多是由时钟树消耗掉的。这个结果的原因也很直观，因为这些时钟树在系统中具有最高的切换频率，而且有很多时钟 buffer，而且为了最小化时钟延时，它们通常具有很高的驱动强度。 …

阅读更多...

推荐文章

最新文章