第21章 随机游走

news2025/1/17 2:56:49

第21章 随机游走

随机游走的建模场景是某个对象按照随机选择的方向行走一个步数序列。

21.1赌徒破产

假设一个赌徒一开始有n美元赌注,他要进行一系列1美元投注。如果他赢得一局,则拿回他的赌注外加1美元。如果他输了,那么他将失去1美元。

我们可以将这个场景建模为实线上整数点之间的随机游走。任何时候,线上的位置对应于赌徒手上的现金。赌徒一直下注,直到他没钱了,或者资本增加至目标金额T美元。每一次赌局赢得概率是p,且相互独立,我们想知道资本增加至T美元的概率。

下图描绘了赌徒的1美元赌博情形。随机游走的边界为0和T。

image-20230104142224068

对于无偏博弈,资本增加到T美元的概率取决于你的初始资金和目标T。假设想赢100美元,初始资金是500美元。这时他赢100美元的概率是5/6。如果他以100 万美元开始,目标仍是赢100美元,他概率是1M / (1M+100) > 0.9999。

但是,对于不公平的博弈,我们就不能按照上面的方法去计算了。

21.1.1避免破产的概率

定理21.1.1:在赌徒破产博弈中,初始资本为n,目标为T,每一局获胜的概率为p,

image-20230104143237636

其中r:= q/p。

21.1.2获胜概率递推

线性递推为这类基本问题提供了一种有条不紊的方法。

赌徒获胜的概率是初始资本n、目标T (T≥n)和每一局获胜概率p(失败的概率为q)的函数。给定p和T令 w n w_n wn是初始资本为n美元时赌徒获胜的概率。

根据全概率公式,他获胜的概率是 w n = p W n + 1 + q W n − 1 w_n= pW_{n+1}+ qW_{n-1} wn=pWn+1+qWn1。求解 w n + 1 w_{n+1} wn+1,得

image-20230104144138706

其中r等于q/p。

假设:

image-20230104144702806

w n w_n wn的母函数,使用母函数方法可得:

image-20230104144730947

当p ≠ q时,我们可以解得:

image-20230104144849957

当p = q时,解得: w n = n / T w_n = n/T wn=n/T

求得的结果与上一小节中相匹配。

21.1.3 有偏情形的简单解释

有偏博弈中赌徒获胜的概率表达式21.1不太好解释。当赌徒的初始资本很大,游戏对赌徒有不利的偏差时,这个上界更简单、更紧凑。那么r >1,式21.1的分子和分母均为正,分子较小。所以

image-20230104145203105

推论21.1.2在初始资本为n、目标为T、单次获胜概率为p <1/2的赌徒破产博弈中,

image-20230104145221651

其中r::= q/p >1。

为什么游戏对他稍有不公,赌徒就不太可能赚钱?为了直观地回答这个问题,我们考虑赌徒钱包的两种作用力。首先,运气好坏导致赌徒的资本随机上下波动。第二,赌徒的资本将会有一个稳定的向下漂移,因为负面偏差意味着每一局平均损失几美分。情况如图21.2所示。

在公平的比赛中,没有漂移;波动是唯一的影响。在没有向下漂移的情况下,我们前面的直觉是正确的。如果赌徒以万亿美元开始,那么几乎肯定会有一次幸运的摆动,把他的资本提高100美元。

21.1.4步长多长

我们已经知道了赌徒在公平和不公平的游戏(博弈)中获胜的概率wn,现在再来考虑他平均需要多少局才能获得胜利或者破产。线性递推方法在这里也很有用。对于固定的p和T,令en为赌徒从初始资本n美元到游戏结束时的赌局数目。从而得到:

image-20230104150352860

线性递推为:

image-20230104150425595

从以上线性递推可以得到如下定理。
定理21.1.3:在初始资产为n,目标为T,每一局获胜概率为p的赌徒破产博弈中,

image-20230104150705076

在无偏情况下,上式可以简写成

image-20230104150728900

21.1.5赢了就退出

假设赌徒永远不会赢了就跑。也就是说,他以n >0美元开始,不管任何目标T,他都直玩到彻底破产,这称为无限赌徒破产博弈。

引理21.1.4 如果赌徒以1美元或更多钱开始,进行无限赌徒破产博弈,那么他将以概率1破产。

我们知道在一场公平的比赛中,他输的概率是1- n/T。如果选择足够大的T,这个数字可以任意接近1。因此,在没有任何目标的情况下,他失败的概率有一个任意接近1的下限所以实际上一定是1。

引理21.1.5如果赌徒以1美元或更多钱开始进行无限公平博弈,那么他能玩的预期次数是无限的。

21.2图的随机游走

万维网的超链接结构可以用有向图来表示。顶点表示网页,如果网页x有一个指向网页y的超链接,则存在一条从顶点x到顶点y的有向边。

21.2.1网页排名初探

考虑网页图,我们在搜索引擎中搜索,你认为哪个顶点(或网页)应该排在第一名?

将x的网页排名( page rank)定义为indegree(x),即指向x的链接数。这一想法将网页链接看成重要性投票—网页得票越多它越重要。

不幸的是,这个想法存在一些问题。假设你想让自己的网页排名靠前一点,你只要创建很多僵尸网页,链接到你的网页就可以了。

还有一个问题:如果一个网页有很多指向其他网页的链接,那么这个网页的影响力就会过大。

21.2.2网页图的随机游走

改进方法:除了顶点的入度以外,还考虑了网页图上随机游走后到达每条边的概率。具体来说,他们将用户行为建模成以均匀分布的概率点击网页上的每一个链接。例如,你现在在x网页,给每条边x →y赋予一个以当前网页x为条件的条件概率:

image-20230104152751798

于是,用户行为可以模拟为网络图上的随机游走。对所有指向y的边进行加和,可以计算到达特定网页y的概率:

image-20230104152823503

考虑到没有向外链接的网页,在网页图中加入了超点,每个顶点都有一条指向超点的边。而且,超点以相等的概率指向其他每一个顶点,这样随机游走就可以在任意顶点重新开始。这一改造保证了网页图是强连通的。

如果一个网页中没有超链接,那么这个网页指向超点的边的概率等于1。如果网页中有超链接,那么指向超点的边的概率是某个特殊给定的概率。在最初的 Page Rank版本中,这个概率是0.15。即,每个出度n≥1的顶点,指向超点的边的概率等于0.15;而其他n个出边仍然是等概率的,即其他每条边的概率是0.85/n。

21.2.3平稳分布与网页排名

网页排名背后基本的思想是找到网页图的平稳分布,所以让我们来定义平稳分布。

假定随机游走始终不会离开图上的顶点,即要求

image-20230104154540583

定义21.2.1:有向图的顶点概率分配是一个平稳分布,如果对所有顶点x

image-20230104154243975

Sergey和 Larry将他们的网页排序定义为一个平稳分布。他们通过解线性方程组来确定这个平稳分布:对每个顶点x,找到非负数 Rank(x),使得

image-20230104154600057

这些数还必须满足附加约束:

image-20230104154622880

他们设计出来的网页排序算法总能找到有意义的解。强连通图有唯一的平稳分布,引入超点保证了这一点。而且,从任意顶点开始,进行足够长的随机游走,最后位于每个网页的概率会越来越接近平稳分布。注意,没有超点的普通有向图可能不具备以下这两个性质:( 1)它们没有唯一的平稳分布;(2)即使存在平稳分布,从某些顶点出发经过随机游走后,不能收敛到平稳分布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/158798.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL中InnoDB的事务隔离

文章目录前言一、事务介绍二、事务的四大特性三、事务的隔离性四、事务隔离的实现前言 我们在实际开发中&#xff0c;执行某个业务&#xff0c;肯定不是简单的操作某一句SQL语句&#xff0c;而是多条SQL语句。那么这多条SQL语句必须是全部成功执行&#xff0c;或者全部失败。才…

[L1 - 10分合集]吃鱼还是吃肉

L1-063 吃鱼还是吃肉 分数 10 作者 陈越 单位 浙江大学 题目&#xff1a; 国家给出了 8 岁男宝宝的标准身高为 130 厘米、标准体重为 27 公斤&#xff1b;8 岁女宝宝的标准身高为 129 厘米、标准体重为 25 公斤。 现在你要根据小宝宝的身高体重&#xff0c;给出补充营养的建议…

最近发现关于计算机网络的1个秘密

最近闲着没啥事翻开之前谢希仁老师第7版的《计算机网络》这本书,结果发现了1个惊天的秘密。 首先是互联网与互连网的区别,一般我们常说的互联网是Internet,是指因特网,其起源于阿帕网。或许很多读者看到这里就觉得有什么秘密可言,不都是常识了吗?看你大惊小怪的。 我们不妨看看…

spring cloud、gradle、父子项目、微服务框架搭建---rabbitMQ延时队列(七)

总目录 https://preparedata.blog.csdn.net/article/details/120062997 文章目录总目录一、rabbit延时插件下载二、rabbit插件安装三、项目中配置延时队列四、定义消息通道五、生成消息六、监听消息&#xff0c;进行消费延时队列的配置是对上片文章的延伸扩展 https://prepare…

paddledetection推理代码结构

https://github.com/PaddlePaddle/PaddleDetection/blob/release%2F2.5/deploy/pipeline/README.mdhttps://github.com/PaddlePaddle/PaddleDetection/blob/release%2F2.5/deploy/pipeline/README.md GitHub - leeguandong/Xiaobao: videoclip&#xff0c;视频剪辑应用videocl…

Go 1.19.3 error原理简析

Go error是一个很痛的话题(真心难用) 标准库 error 的定义 // The error built-in interface type is the conventional interface for // representing an error condition, with the nil value representing no error. type error interface {Error() string }error 是一个…

windows10安装wireshark

win10安装wireshark并使用windows10安装wireshark下载WIRESHARK下载Win10Pcapwindows10安装wireshark 你好&#xff01; 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章&#xff0c;了解一下Markdown的基本语法知…

javaEE 初阶 — JUC(java.util.concurrent) 的常见类

文章目录1. Callable 接口1.1 Callable 的用法2. ReentrantLock2.1 ReentrantLock 的缺陷2.1 ReentrantLock 的优势3. 原子类4. 信号量 Semaphore5. CountDownLatch6. 相关面试题1. Callable 接口 类似于 Runnable 一样。 Runnable 用来描述一个任务&#xff0c;描述的任务没有…

【Spring源码】21. 关于循环依赖的N个问题

完成了applyMergedBeanDefinitionPostProcessors()方法&#xff0c;后面有一段关于判断Bean是否需要提前曝光的逻辑&#xff08;如下图红框框中部分&#xff09;在这段逻辑中涉及到了著名的循环依赖&#xff0c;提到循环依赖基本必讲三级缓存&#xff0c;好吧&#xff0c;这篇就…

CANOpen中SDO和PDO的COB-ID理解

CAN 总线是一种串行通信协议&#xff0c;具有较高的通信速率的和较强的抗干扰能力&#xff0c;可以作为现场总线应用于电磁噪声较大的场合。由于 CAN 总线本身只定义ISO/OSI 模型中的第一层&#xff08;物理层&#xff09;和第二层&#xff08;数据链路层&#xff09;&#xf…

(8)go-micro微服务Mysql配置

文章目录一 gorm介绍二 gorm安装1.1 下载依赖1.2 使用MySQL驱动三 CURD操作1. 查询1.1 单行查询1.2 多行查询2. 插入数据3. 更新数据4. 删除数据四 初始化连接五 使用六 最后一 gorm介绍 Go语言中的database/sql包提供了保证SQL或类SQL数据库的泛用接口&#xff0c;并不提供具…

redis: jedis连接超时(需要手动注入连接超时检测的配置)

相关版本说明 服务端&#xff1a; redis_version: 6.2.8 客户端&#xff1a; springBoot: 2.7.7 jedis: 3.8.0 问题 偶发redis连接超时&#xff0c;刷新就又好了&#xff0c;服务日志错误信息如下&#xff1a; JedisConnectionException: Unexpected end of stream.原因 …

Linux利用httpd搭建局域网yum源

本例环境&#xff1a;vmwareworkstation16 proCentOS7.9 mast节点&#xff1a;192.168.195.110 用于配置httpd并发布本地yum源 node节点&#xff1a;192.168.195.111 用于验证mast节点的yum源是否可用 思路&#xff1a;1.在mast节点挂载/上传镜像后配置本地yum源 2.利用本…

JSP三种脚本

脚本可以编写Java语句、变量、方法或表达式。 1.普通脚本 语法: <% Java代码%> <% page contentType"text/html;charsetUTF-8" language"java" %><html><head> <title>Title</title></head><body>&l…

对u盘的分区进行删除和格式化

一、说明 当usb盘&#xff0c;或者SD卡用作启动盘后&#xff0c;将出现多个盘符、多个分区&#xff1b;若将此盘重新当文件盘&#xff0c;需要删除以前的分区&#xff0c;并重新格式化后&#xff0c;才能使用。 二、使用Diskpart在Windows 10中对USB进行分区删除 2.1 尝试磁盘…

重启之后,台式机网络不能连接怎么办

目录 1.问题 2.排查过程 3.心得 1.问题 前天电脑意外断电后,再启动发现网络变成了未连接状态.查看本地连接显示已启动,但IPv4和IPv6未连接.当时做了一些尝试,没有收到效果,直到今天问题才得以解决. 2.排查过程 Windows网络诊断为:DNS服务器未响应.后来花了一部分时间在DNS…

ruoyi-vue集成magic-api(一)

ruoyi虽然带了强大的代码生成器&#xff0c;面对比较通用的CRUD还是游刃有余的&#xff0c;但在项目开发阶段&#xff0c;需求总是经常变化的&#xff0c;数据结构和逻辑也经常变化&#xff0c;我们需要的是快速验证功能逻辑&#xff0c;代码生成器可帮不上忙&#xff0c;每次需…

一、java编写登录功能

java编写登录功能 文章目录java编写登录功能前言编程学习记录一、登录逻辑简述二、代码实现1.创建USER表2.前端代码3.创建User类4.创建LoginServlet类5.创建JDBCUtils类6.创建UserDao类7.创建FailServlet类9.创建SuccessServlet 类11.配置tomcat 服务12.启动服务前言 编程学习…

SpringCloud Netfllix复习之Hystrix

文章目录写作背景Hystrix是什么Hystrix的核心功能上手实战RestTemplate整合HystrixOpenFeign整合HystrixOpenFeign与Hystrix整合的各种参数如何配置&#xff1f;源码验证基于HystrixCommand注解实现熔断源码分析初始化资源线程池的源码OpenFeign与Hystrix整合执行请求的源码写作…

Java多线程:创建多线程的“四种“ 方式

Java多线程&#xff1a;创建多线程的"四种" 方式 每博一文案 白马笑西风写道&#xff1a;江南有杨柳&#xff0c;有燕子&#xff0c;金鱼......汉人中有的是英俊勇武的少年&#xff0c;倜傥潇洒的少年...... 但这个美丽的姑娘就像故高昌国人那样固执&#xff1a;&qu…