【机器学习之---数学】随机游走

news2024/11/30 18:48:00

every blog every motto: You can do more than you think.
https://blog.csdn.net/weixin_39190382?type=blog

0. 前言

随机游走

1. 概念

1.1 例1

在你的饮食俱乐部度过了一个富有成效的晚上后,你在不太清醒的状态下离开了。因此,你会醉醺醺地在展望大道上闲逛。首先,你可能会随机向右走一步。然后,忘记你在哪里,你可能会向左转一步。完全迷失了方向,你又随机迈出了一步…例如,对于一些步骤,您可能最终会像这样走

image-5

让我们把它当作一个随机过程来建模。饮食俱乐部的位置是S_0(你在零步后的初始位置)。在第k步中,移动的量为 X k X_k Xk,可以是正的,也可以是负的(取决于向左还是向右移动)。n步后的位置 S n S_n Sn

S n = S 0 + x 1 + . . . + X n S_n = S_0+x_1+...+X_n Sn=S0+x1+...+Xn

当你喝醉的时候,你会完全忘记你每走一步都在哪里。因此,我们对步骤 X 1 X_1 X1, X 2 X_2 X2,…进行建模。为独立同分布(i.i.d)随机变量,与初始位置 S 0 S_0 S0无关。这给了我们第一个随机漫步的例子

1.2 例2

假设你和你的朋友玩下面的游戏。在每一轮中,每个玩家下注1美元,并独立地投掷一枚均匀硬币。如果硬币正面朝上,那么你赢了,也就是说,你拿回你的1美元,同时你也得到你朋友的1美元。如果硬币反面出现,那么你的朋友就赢了钱。你反复玩这个游戏,直到你们中的任何一个人决定是时候减少损失了

为了将你在游戏中的财富建模为一个随机过程,让我们假设你以50美元的初始财富开始游戏。请注意,你在每一轮的净收益是+1或1。让Xi成为你在第i轮的净收益。因为硬币是公平的,你输或赚1美元的概率是一样的

P ( X i = 1 ) = P ( X i = − 1 ) = 1 2 P(X_i =1) = P(X_i=-1) = \frac{1}{2} P(Xi=1)=P(Xi=1)=21

我们假设, S 0 S_0 S0, X 1 X_1 X1, X 2 X_2 X2,…是独立的。因此,第n轮之后的财富 S n S_n Sn由,

S n = S 0 + x 1 + . . . + X n S_n = S_0+x_1+...+X_n Sn=S0+x1+...+Xn

一个可能的结果如下:

image-6

在这两个例子中,我们从起始点S0开始,制作了一系列独立同分布(i.i.d)步骤 X k X_k Xk。这样的过程被称为随机漫步。在第二个例子中,随机漫步只产生大小为1的步的情况特别重要;这叫做简单随机漫步

1.3 定义

定义如下:

随机游走 S n , n ≥ 0 {S_n},n\geq0 Sn,n0为随机过程

S n = S 0 + x 1 + . . . + X n S_n = S_0+x_1+...+X_n Sn=S0+x1+...+Xn
其中, X 1 , X 2 , . . . X_1,X_2,... X1,X2,...是独立同分布(i.i.d)随机变量,与 S 0 S_0 S0无关。

2. 边界

2.1 会达到边界吗?

我们必须研究的第一个问题是,随机漫步是否真的会碰到边界 { a , b } \{a, b\} {a,b},也就是说,是否 T < ∞ T< \infin T< 。当然,到达边界的概率原则上可能取决于起始点S0。因此,让我们引入函数:

f ( i ) : = P ( T = ∞ , S 0 = i ) , a ≤ i ≤ b f(i) := P(T=\infin, S_0=i) , \qquad a\leq i \leq b f(i):=P(T=,S0=i),aib

也就是说, f ( i ) f(i) f(i) 是我们从未碰到边界a或b中的任何一个的概率 (换句话说,随机漫步永远严格地停留在这两个边界之间),假设我们从点 S 0 = i S0 = i S0=i 开始。我们想要计算这些概率。为此,我们将引入一个非常有用的工具来研究随机漫步的行为:第一步分析(the first-step analysis)

让我们首先解释一下第一步分析背后的思想。假设我们从点 a < i < b a < i < b a<i<b严格地在边界之间开始。那么我们能到达边界的最早时间是在随机漫步的一步之后。此外,由于这是一个简单的对称随机漫步,在一步之后,我们可能到达的位置只有两个,每个位置出现的概率都是相等的:

image

因为随机漫步的每一步都是独立同分布的,所以随机漫步在每一步之后都会在当前位置重新开始。举个例子,如果在第一步中我们从 i → i + 1 i \rightarrow i+1 ii+1开始,那么从这一点开始,随机漫步就像从i+1开始的随机漫步一样。特别地,第一步是 i → i + 1 i \rightarrow i + 1 ii+1,那么之后不到达边界的概率是f (i + 1),对于其他可能的步骤也是如此

image-1

如图,我们可以得到:

f ( i ) = P ( T = ∞ ∣ S 1 = i + 1 , S 0 = i ) P ( S 1 = i + 1 ∣ S 0 = i ) + P ( T = ∞ ∣ S 1 = i − 1 , S 0 = i ) P ( S 1 = i − 1 ∣ S 0 = i ) f(i)= P(T=\infin|S_1=i+1, S_0=i)P(S_1=i+1|S_0=i)+P(T=\infin|S_1=i-1, S_0=i)P(S_1=i-1|S_0=i) f(i)=P(T=∞∣S1=i+1,S0=i)P(S1=i+1∣S0=i)+P(T=∞∣S1=i1,S0=i)P(S1=i1∣S0=i)

其中,
P ( S 1 = i + 1 ∣ S 0 = i ) = 1 2 P ( S 1 = i − 1 ∣ S 0 = i ) = 1 2 P(S_1=i+1|S_0=i)= \frac{1}{2} \qquad \qquad P(S_1=i-1|S_0=i)= \frac{1}{2} P(S1=i+1∣S0=i)=21P(S1=i1∣S0=i)=21

同时,有
P ( T = ∞ ∣ S 1 = i + 1 , S 0 = i ) = f ( i + 1 ) P ( T = ∞ ∣ S 1 = i − 1 , S 0 = i ) = f ( i − 1 ) \begin{align} P(T=\infin|S_1=i+1, S_0=i)=f(i+1) \\ P(T=\infin|S_1=i-1, S_0=i)=f(i-1) \end{align} P(T=∞∣S1=i+1,S0=i)=f(i+1)P(T=∞∣S1=i1,S0=i)=f(i1)

因此,

f ( i ) = 1 2 f ( i + 1 ) + 1 2 f ( i − 1 ) , a < i < b f(i)= \frac{1}{2}f(i+1)+\frac{1}{2}f(i-1),\qquad a < i < b f(i)=21f(i+1)+21f(i1),a<i<b

另一方面,假设我们从S0 = a或S0 = b开始,那么我们一开始就已经从边界开始了,所以我们从未到达边界的概率为零。特别地,这意味着f (a) = f (b) = 0。因此,我们的第一步分析使我们得到以下等式

{ f ( i ) = 1 2 f ( i + 1 ) + 1 2 f ( i − 1 ) , a < i < b f ( a ) = f ( b ) = 0 \begin{cases} f(i)= \frac{1}{2}f(i+1)+\frac{1}{2}f(i-1),\qquad a < i < b \\ f(a)=f(b)=0 \end{cases} {f(i)=21f(i+1)+21f(i1),a<i<bf(a)=f(b)=0

通过变换方程我们知道,f(i)位于f(i-1)和f(i+1)中间位置。同时,在一条直线上。

image-2

所以,f(i)是直线。又,f(a)=f(b)=0,可得f(i)=0:

image-3

P ( T = ∞ ∣ S 0 = i ) = 0 , f o r a l l a ≤ i ≤ b P(T=\infin|S_0=i)=0, \qquad for all a \leq i \leq b P(T=∞∣S0=i)=0,forallaib

所以,随机漫步最终总是到达a或b,而不管它的起点是什么。

2.2 会达到哪一个边界

既然我们知道我们最终总会碰到边界a或b中的一个,我们可能想知道我们先碰到哪一个?例如,在赌博问题中, T < ∞ T <\infin T<表示你最终要么赢得100美元要么破产。在实践中,您可能对这些结果中哪一种更有可能发生非常感兴趣。

为了深入了解这个问题,让我们用数学术语来表达它。在我们到达a或b的第一时间T,值 S T S_T ST显然必须是a或b。我们感兴趣的是计算 S T = b S_T = b ST=b的概率,比如(在这种情况下,随机行走在到达a之前到达b)。由于这个概率可能再次取决于我们开始随机行走的位置,让我们定义这个函数

r ( i ) : = P ( S T = b ∣ S 0 = i ) r(i) := P(S_T=b|S_0 = i) r(i):=P(ST=bS0=i)

为了计算r(i),我们可以再次使用第一步分析。如果a < i < b,那么一步之后我们可以最早到达其中一个边界。一步之后,我们在i + 1或i -1处的概率相等,在a之前到达b的概率分别由r(i + 1)和r(i - 1)给出。正如上文所述,我们因此发现

r ( i ) = 1 2 r ( i + 1 ) + 1 2 r ( i − 1 ) , a < i < b r(i) = \frac{1}{2}r(i+1)+\frac{1}{2}r(i-1), \qquad a < i < b r(i)=21r(i+1)+21r(i1),a<i<b

这里不同的是边界条件。在这种情况下,如果我们从S0 = b开始,那么我们显然会在a之前到达b(因为我们已经从b开始了!),所以r(b) = 1。另一方面,如果S0 = a,那么显然a在b之前,所以r(b) = 0。因此,我们得到以下线性方程

{ r ( i ) = 1 2 r ( i + 1 ) + 1 2 r ( i − 1 ) , a < i < b f ( a ) = 0 , f ( b ) = 1 \begin{cases} r(i)= \frac{1}{2}r(i+1)+\frac{1}{2}r(i-1),\qquad a < i < b \\ f(a)=0, \quad f(b)=1 \end{cases} {r(i)=21r(i+1)+21r(i1),a<i<bf(a)=0,f(b)=1

同样,我们可以通过变换方程将r(i)表示为一条直线。同时r(a)=0,r(b)=1,如下:

image-4

最终公式如下:

P ( S T = b ∣ S 0 = i ) = r ( i ) = i − a b − a , a ≤ i ≤ b P(S_T=b|S_0=i)= r(i) = \frac{i-a}{b-a}, \qquad a \leq i \leq b P(ST=bS0=i)=r(i)=baia,aib

我们越接近b,我们越有可能在a之前碰到b,而我们越接近a,我们越有可能在b之前碰到a,这和直觉上一致。

上面的赌博游戏,直到你破产或达到100美元的财富。让它成为游戏结束的时间。我们已经证明了 T < ∞ T <\infin T<(游戏最终结束),你获得100美元的概率是:

P ( S T = 100 ∣ S 0 = i ) = i 100 , 0 ≤ i ≤ 100 P(S_T=100|S_0=i) = \frac{i}{100}, \quad 0 \leq i \leq 100 P(ST=100∣S0=i)=100i,0i100

即,如果你开始有i美元,你最终有100美元的概率是i/100。

让我们计算一下期望,

E ( S T ∣ S 0 = i ) = 0 ∗ P ( S T = 0 ∣ S 0 = i ) + 100 ∗ P ( S T = 100 ∣ S 0 = i ) = i E(S_T|S_0=i) = 0*P(S_T=0|S_0=i)+100*P(S_T=100|S_0=i) = i E(STS0=i)=0P(ST=0∣S0=i)+100P(ST=100∣S0=i)=i

最终,你的拥有的钱和初始状态一样。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1555718.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JUC:wait/notify用法并写一个简单消息队列(生产者消费者问题)

文章目录 wait/notifyapiwait vs sleep手写消息队列 wait/notify 这块比较简单&#xff0c;就不在把所有例子都写上了。 要注意区分waitSet和EntryList中的线程&#xff0c;一个获得了锁但是wait释放了锁进入等待notify唤醒状态&#xff0c;一个是正在等待获得锁。 不过相同点…

算法之并查集

并查集&#xff08;Union-find Data Structure&#xff09;是一种树型的数据结构。它的特点是由子结点找到父亲结点&#xff0c;用于处理一些不交集&#xff08;Disjoint Sets&#xff09;的合并及查询问题。 Find&#xff1a;确定元素属于哪一个子集。它可以被用来确定两个元…

wps斜线表头并分别打字教程

wps斜线表头怎么做并分别打字&#xff1a; 1、首先选中我们想要设置的表头。 2、接着右键选中它&#xff0c;点击“设置单元格格式” 3、然后点击上方“边框”选项卡。 4、随后选择图示的斜线&#xff0c;点击“确定” 5、设置完成后&#xff0c;我们只要在其中打字就可以在斜…

vue-v-for遍历index与id

一.遍历列表key的作用&#xff08;index作为key&#xff09; 虚拟DOM上有key,是虚拟的&#xff0c;但是真实DOM上没有&#xff0c;key是Vue内部的 当使用index作为key的时候&#xff0c;Vue会根据初识数据生成一个初始的虚DOM&#xff0c; 然后在页面上映射出真实DOM 如果向数据…

vue 窗口内容滚动到底部

onMounted(() > {scrollToBottom() }) // 滚动到底部方法 const scrollToBottom () > {// 获取聊天窗口容器let chatRoom: any document.querySelector(".chat-content");// 滚动到容器底部chatRoom.scrollTop chatRoom.scrollHeight; } 效果 聊天窗口代码…

HashMap关键源码带读

文章目录 目录 文章目录 前言 1 . 成员变量 灵魂五问 第一问: 默认初始化容量为啥是16? 第二问: 最大容量为什么必须是2的幂? 第三问: 链表转红黑树的阈值为什么是8? 第四问: 红黑树转链表的阈值为什么是6? 第五问: 默认加载因子为什么是0.75? 2. 成员方法 eq…

Discuz采集发布插件

Discuz&#xff08;简称DZ&#xff09;是一款知名的开源论坛系统&#xff0c;广泛应用于各类网站社区。对于许多站长来说&#xff0c;保持论坛内容的更新是一项挑战&#xff0c;特别是在内容量庞大的情况下。为了解决这个问题&#xff0c;有一类特殊的插件是用于在Discuz论坛中…

《QT实用小工具·四》屏幕拾色器

1、概述 源码放在文章末尾 该项目实现了屏幕拾色器的功能&#xff0c;可以根据鼠标指定的位置识别当前位置的颜色 项目功能包含&#xff1a; 鼠标按下实时采集鼠标处的颜色。 实时显示颜色值。 支持16进制格式和rgb格式。 实时显示预览颜色。 根据背景色自动计算合适的前景色…

国内好用的chatGPT和AI绘图工具

分享一个比较好用的AI 分享一个比较好用的AI&#xff0c;只是需要开通会员&#xff0c;目前官网的价格是&#xff1a;298&#xff0c;开通之后可以使用chatgpt4、AI绘画、图片融合等等&#xff01;不开通的话是可以免费使用15次的&#xff0c;下面是一些介绍图片&#xff01;链…

安全团队需要重点演练的四大威胁

文章目录 前言一、勒索软件攻击二、第三方风险三、内部威胁四、分布式拒绝服务攻击(DDoS)前言 桌面演练(推演)是一种重要的安全演习形式,参演人员利用演练方案、流程图、计算机模拟、视频会议等辅助手段,针对事先假定的演练情景,讨论和推演应急决策及现场处置,从而促使相…

点点数据K参数加密逆向分析(RPC方案跟加密算法还原)

文章目录 1. 写在前面2. 接口分析3. 断点分析4. RPC调用5. 算法还原 【&#x1f3e0;作者主页】&#xff1a;吴秋霖 【&#x1f4bc;作者介绍】&#xff1a;擅长爬虫与JS加密逆向分析&#xff01;Python领域优质创作者、CSDN博客专家、阿里云博客专家、华为云享专家。一路走来长…

蓝桥杯物联网竞赛_STM32L071_13_定时器

CubeMx配置LPTIM: counts internal clock events 计数内部时钟事件 prescaler 预分频器 updata end of period 更新期末 kil5配置&#xff1a; 中断回调函数完善一下&#xff1a; void HAL_LPTIM_AutoReloadMatchCallback(LPTIM_HandleTypeDef *hlptim){if(cnt ! 10) cnt…

用Python实现办公自动化(自动化处理Excel工作簿)

自动化处理Excel工作簿 &#xff08;一&#xff09;批量生产产品出货清单 以“出货统计表”为例&#xff0c; 需求&#xff1a;将出货记录按照出货日期分类整理成多张出货清单 “出货统计表数据案例” “产品出货清单模板” 1.提取出货统计表的数据 “Python程序代码” # 使用…

计算机毕业设计Python+Spark知识图谱高考志愿推荐系统 高考数据分析 高考可视化 高考大数据 大数据毕业设计 机器学习 深度学习 人工智能

学院&#xff08;全称&#xff09;&#xff1a; 专业&#xff08;全称&#xff09;&#xff1a; 姓名 学号 年级 班级 设计&#xff08;论文&#xff09; 题目 基于Spark的高考志愿推荐系统设计与实现 指导教师姓名 职称 拟…

机器学习之聚类算法、随机森林

文章目录 随机森林决策树基础特征值问题&#xff1f; 聚类算法 随机森林 决策树 基础 概念&#xff1a;从根节点一步步走到叶子节点&#xff08;决策&#xff09;&#xff1b; 组成&#xff1a;根节点第一个选择的节点&#xff1b;叶子节点最终的决策结果&#xff1b;非叶子…

分文件编程——Makefile

1.分文件编程 1.1源文件&#xff1a; .c结尾的文件 包含main函数的.c 包含子函数的.c 1.2头文件&#xff1a; .h结尾的文件 文件包含 头文件、宏定义、typedef、结构体、共用体、枚举、函数声明… 调用时用#include"xx.h" #include< >与#include " &q…

关系数据库理论

函数依赖: 关系数据库的规范化理论是数据库逻辑设计的工具。 关系模式由五部分组成&#xff0c;是一个五元组&#xff1a; R(U, D, DOM, F)  关系名 R 是符号化的元组语义  U 为一组属性  D 为属性组 U 中的属性所来自的域  DOM 为属性到域的映射  F 为属…

JUC/多线程原理(三)

一、Monitor 原理 二、synchronized 原理 (一)、基础 synchronized 即使内部抛出异常也会释放锁 (二)、轻量级锁 轻量级锁的使用场景&#xff1a;如果一个对象虽然有多线程要加锁&#xff0c;但加锁的时间是错开的&#xff08;也就是 没有竞争 &#xff09;&#xff0c;那么…

目前现货黄金行情技术分析

目前行情黄金可以投资吗&#xff1f;不论是黄金价格怎么波动&#xff0c;总是有投资者问这个问题&#xff0c;原因是他们搞不清现状&#xff0c;弄不懂当前的市场形势&#xff0c;对于技术分析和基本分析的方法也不甚了解&#xff0c;因此缺乏对未来行情判断的能力。下面我们就…

E2697A安捷伦E2697A高阻抗适配器

181/2461/8938产品概述&#xff1a; E2697A高阻抗适配器允许将需要高阻抗输入的探头&#xff08;例如无源探头、电流探头&#xff09;连接到Infiniium 54850、80000和90000系列高性能示波器。E2697A高阻抗适配器扩展了Agilent Infiniium高性能示波器的功能&#xff0c;使其成为…