离散数学---概率, 期望

news2024/11/22 16:27:22

本文根据 MIT 计算机科学离散数学课程整理(Lecture 22 ~ Lecture 24)。

1 非负整数期望性质

用 N 表示非负整数集合,R 是 N 上的随机变量,则 R 的期望可以表示成:E(R)=\sum_{i=0}^{\infty} P(R>i)=\sum_{i=1}^{\infty} P(R \ge i)

证明:

E(R)=\sum_{i=0}^{n\to \infty} i \cdot P(R=i) =\\ P(R=1) + \\ P(R=2) + P(R=2) + \\ P(R=3) + P(R=3) + P(R=3) + \\ \\ ...\\ \\ P(R=n) + ... + P(R=n)\\

换一个形式,把每一列写到一起,既 E(R)=\sum_{i=1}^{\infty} \sum_{j=i}^{\infty} P(R=j)=\sum_{i=1}^{\infty} P(R \ge i)

 同时期望也可以写成 E(R)=\sum_{i=0}^{\infty} \sum_{j=i+1}^{\infty} P(R=j)=\sum_{i=0}^{\infty} P(R > i)

应用:

对于一个系统,每一个单位时间都有 p 的概率损坏,求系统发生损坏的期望时间。

随机变量为单位时间,满足非负整数,故 E(T)=\sum_{i=0}^{\infty} i \cdot P(T=i) = \sum_{i=1}^{\infty} P(T \ge i)=\sum_{i=1}^{\infty} (1-p)^i=\frac{1}{p}-1

 2 期望的线性性质

对于随机变量 x_1,x_2,...,x_n 满足 E(x_1+x_2+...+x_n)=E(x_1)+E(x_2)+...+E(x_n)

对于常数 a, b 有 E(a\cdot R+b)=a\cdot E(R)+b 

证明:

只需证明对于随机变量 X 和 Y,满足 E(X+Y)=E(X)+E(Y)

E(X+Y)=\sum_{x\in X} \sum_{y\in Y} (x+y)\cdot P(X=x,Y=y) \\ = \sum_{x\in X} \sum_{y\in Y} x\cdot P(X=x,Y=y) + \sum_{y\in Y} \sum_{x\in X} y\cdot P(X=x,Y=y) \\ = \sum_{x\in X} x \sum_{y\in Y} P(X=x,Y=y) + \sum_{y\in Y} y \sum_{x\in X} P(X=x,Y=y) \\ = \sum_{x\in X} x \cdot P(X=x) + \sum_{y\in Y} y \cdot P(Y=y) =E(X)+E(Y)

应用:

帽子检查问题(Hat-Check Problem):标号为 1~n 的球放置在对应标号为 1~n 的位置,把所有的球重新排列,R 表示球在原来正确对应编号位置的个数,求 R 的期望。

T_i 表示第 i 个球是否在正确的位置,可以求得分布为:

T_i = \left\{\begin{matrix} 1,p=\frac{1}{n} \\ 0,p=1-\frac{1}{n} \end{matrix}\right.

则有:E(T_i)=\frac{1}{n},根据期望线性性质有:E(R)=E(T_1+T_2+...+T_n)= \sum_{i=1}^{n}E(T_i)=1

实际上可以求得R 的概率分布为:

P(R=k)=\left\{\begin{matrix} \frac{1}{k!(n-k)} \quad k \le n-2 \\ \frac{1}{n!} \quad k=n-1,n \end{matrix}\right.

对于  k\le n-2

P(R=k)= \binom{n}{k} \cdot \frac{1}{n} \cdot \frac{1}{n-1} \cdot ... \cdot \frac{1}{n-k+1} \cdot \frac{n-k-1}{n-k} \cdot ... \cdot \frac{1}{2} \cdot 1 \\ =\frac{n!}{k! \cdot (n-k)!} \cdot \frac{(n-k-1)!}{n!} \\ =\frac{1}{k!(n-k)}

3 事件发生的期望次数

给定概率空间为 S,事件 A_1,A_2,...,A_n \subseteq S,用随机变量 T 表示事件发生的个数,则有:

1. 这些事件发生个数的期望值为事件发生概率相加,即: E(T)=\sum_{i=1}^{n} P(A_i)

2. P(T=0) \le e^{-E(T)} 

证明: 

定义:T_i(w)=\left\{\begin{matrix} 1 \quad w \in A_i \\ 0 \quad w \notin A_i \end{matrix}\right.

则有:E(T)=\sum_{i=1}^{n} E(T_i)=\sum_{i=1}^{n} P(T_i=1)=\sum_{i=1}^{n} P(A_i)

 P(T=0) =\prod_{i=1}^{n}(1-P(A_i)) \\ \le \prod_{i=1}^{n} e^{-P(A_i)} \\ = e^{-\sum_{i=1}^{n}P(A_i) }\\ =e^{-E(T)}

应用:

抛 n 个硬币,求硬币朝上的个数期望。

用 A_i 表示事件为第 i 个硬币朝上,期望可以表示成事件概率之和:E=\sum_{i=1}^{n} P(A_i)=\frac{n}{2}

实际上不使用该性质,期望可以直接表示成:E=\sum_{i=1}^{n} i \cdot \binom{n}{i} \cdot 2^{-n},经过化简得到结果也是 \frac{n}{2}

 E=\sum_{i=1}^{n} i \cdot \binom{n}{i} \cdot 2^{-n}=\sum_{i=1}^{n} i \cdot \binom{n}{n-i} \cdot 2^{-n}=\sum_{i=1}^{n} (n-i) \cdot \binom{n}{i} \cdot 2^{-n}=n \cdot 2^{-n}\sum_{i=1}^{n} \binom{n}{i}-\sum_{i=1}^{n} i \cdot \binom{n}{i} \cdot 2^{-n}=n\cdot 2^{-n}\cdot 2^{n}-E=n-E

所以:2E=n \to E=\frac{n}{2} 

 4 期望乘法规则

如果随机变量 R_1,R_2,...,R_n 相互独立,则有 E(R_1 \cdot R_2\cdot ...\cdot R_n)=E(R_1)\cdot E(R_2)\cdot ...\cdot E(R_n)

证明:

只需证明对于两个相互独立的随机变量 X 和 Y,有 E(X\cdot Y) = E(X) \cdot E(Y) 成立。

由独立的概率性质可知:P(X = x, Y = y) = P(X = x) \cdot P(Y = y)

则有:

E(X\cdot Y) = \sum_{x} \sum_{y} x\cdot y \cdot P(X = x, Y = y) \\ = \sum_{x} \sum_{y} xy \cdot P(X = x) \cdot P(Y = y) \\ =\left( \sum_{x} x \cdot P(X = x) \right) \cdot \left( \sum_{y} y \cdot P(Y = y) \right)\\ =E(X)\cdot E(Y)

 5 马尔可夫不等式 (Markov's Thm.)

 对于非负随机变量 R,\forall x > 0, P(R \ge x) \le \frac{E(R)}{x}

证明 

E(R)=E(R|R\ge x)\cdot P(R\ge x)+E(R|R<x)\cdot P(R<x)

大于等于 x 的部分,显然期望也大于等于 x,即 E(R|R\ge x) \ge x 

由非负的前提, E(R|R<x) \ge 0E(R|R<x)\cdot P(R<x) \ge 0

E(R)\ge x\cdot P(R\ge x),即 P(R \ge x) \le \frac{E(R)}{x}

推论

令 x=c\cdot E(R), c >0,得到推论:P(R\ge c\cdot E(R))\le \frac{1}{c}

6 切比雪夫不等式 (Chebyshev's Thm.)

对任意随机变量 R,\forall x>0 ,P(\left | R-E(R) \right | \ge x ) \le \frac{Var(R)}{x^2},其中 Var(R) 表示 R 的方差。

证明

P(\left | R-E(R) \right | \ge x ) = P( (R-E(R))^2 \ge x^2),令 T=(R-E(R))^2 \ge0,满足马尔可夫使用条件, 则有 P(T \ge x^2) \ge \frac{E(T)}{x^2}=\frac{Var(R)}{x^2}

 推论

记 \sigma (R) 为 R 的标准差,且满足 \sigma(R) > 0,令 x=c\cdot \sigma(R),c>0,得到推论 P(|R-E(R)|\ge c\cdot \sigma(R)) \le \frac{1}{c^2}

对于 \sigma(R) =0 的特殊情况,P(|R-E(R)|\ge 0) =1,推论表达式并不成立。然而原表达式为 P(0\ge x) =0 \le 0 ,是成立的。

7 一侧切比雪夫不等式 (Cantelli's inequality)

对任意随机变量 R,\forall x>0,有

P( R-E(R) \ge x ) \le \frac{Var(R)}{x^2+Var(R)} \\ P( R-E(R) \le -x ) \le \frac{Var(R)}{x^2+Var(R)}

证明

下面证明 P( R-E(R) \ge x ) \le \frac{Var(R)}{x^2+Var(R)},反向同理。

令 T=R-E(R),即证明:P(T \ge x ) \le \frac{Var(R)}{x^2+Var(R)}

若 T<0,则 P( R-E(R) \ge x )=0,显然成立。下面考虑T \ge0 的情况。 

下面证明:\forall x>0,y>0,P(T+y\ge x+y)\le\frac{Var(R)+y^2}{(x+y)^2}

令 Z=T+y

P(T+y\ge x+y)=\sum_{z\ge x+y}P(Z=z)\le \sum_{z\ge x+y}\frac{z^2}{(x+y)^2}\cdot P(Z=z)\le \frac{1}{(x+y)^2}\cdot \sum_{z\in Z}z^2\cdot P(Z=z)\\ =\frac{E(Z^2)}{(x+y)^2}= \frac{E(T^2)+y^2+2\cdot y\cdot E(T)}{(x+y)^2}=\frac{Var(R)+y^2}{(x+y)^2}

 令 f(y)=\frac{Var(R)+y^2}{(x+y)^2},y>0

问题转化为证明:f(y)\le \frac{Var(R)}{x^2+Var(R)}

 f^{'}(y)=\frac{2\cdot x\cdot y-2\cdot Var(R)}{(x+y)^3},求得极小值点为:y_{min}=\frac{Var(R)}{x},代入得到 f(y_{min})=\frac{x^2\cdot Var(R)+Var^2(R)}{x^4+Var^2(R)+2\cdot x^2\cdot Var(R)} = \frac{Var(R)\cdot (x^2+Var(R))}{(x^2+Var(R))^2} = \frac{Var(R)}{x^2+Var(R)}

f(y)\le f(y_{min})=\frac{Var(R)}{x^2+Var(R)}

8 切诺夫界 (Chernoff bound)

T_1,T_2,...,T_n 之间相互独立,T_i 服从伯努利分布 (T_i \in \{0,1\}),记 T=\sum_i^nT_i\forall c >1,记 z=c\cdot ln(c)+1-c,则有 P(T\ge c\cdot E(T)) \le e^{-z\cdot E(T)}

证明

P(T\ge c\cdot E(T))=P(c^T\ge c^{c\cdot E(T)})

其中 c^T \ge 0,满足马可夫不等式条件,则有:P(c^T\ge c^{c\cdot E(T)})\le \frac{E(c^T)}{c^{c\cdot E(T)}}

E(c^T)=E(\prod_{i=1}^{n}c^{T_i} )=\prod_{i=1}^{n}E(c^{T_i})

E(c^{T_i})=c^1\cdot P(T_i=1)+c^0\cdot P(T_i=0)

注意到 P(T_i=0)=1-P(T_i=1)E(T_i)=P(T_i=1)

得到: E(c^{T_i})=1+(c-1)\cdot E(T_i)

由不等式:x+1\le e^x,得到:E(c^{T_i}) \le e^{(c-1)\cdot E(T_i)}

E(c^T)=\prod_{i=1}^{n}E(c^{T_i})\le e^{(c-1)\cdot \sum_{i=1}^n E(T_i)}=e^{(c-1)\cdot E(T)}

\frac{E(c^T)}{c^{c\cdot E(T)}}\le \frac{e^{(c-1)\cdot E(T)}}{c^{c\cdot E(T)}} = e^{-(c\cdot ln(c)+1-c)\cdot E(T)}=e^{-z\cdot E(T)}

拓展

T_1,T_2,...,T_n 之间相互独立,T_i  满足 0 \le T_i \le 1,上式仍然成立。

9 案例应用一

加州大学伯克利分校某计科教授论文中,对于 RISC 和 Z8002 两种指令集架构做出了如下统计:

对最后一项比值求和取均值得到 1.2 ,于是给出结论为: Z8002 的平均代码量比 RISC 长 20%。

然而如果把统计量改为 \frac{RISC}{Z8002} ,区平均值求得 1.105,按照该逻辑结论应为: RISC 的平均代码量比 Z8002 长 10.5%。

问题在于,对于统计量 Z 和 R,如果 E(\frac{Z}{R})=k ,并不能推出 \frac{E(Z)}{E(R)} = k,即 E(\frac{Z}{R})=k \nvdash \frac{E(Z)}{E(R)} = k

论文中求得 E(\frac{\text{Z8002}}{\text{RISC}})=1.2 ,并不能说明 \frac{E(\text{Z8002})}{E(\text{RISC})}=1.2

10 案例应用二

如果有 n 个作业,表示为 b_1,b_2,..,b_n,m 个网络服务器,表示为 s_1,s_2,..,s_m。服务器需要处理作业请求,b_i 需要服务器处理时间为 l_i(0\le l_i \le1),记 l=\sum_{i=1}^n l_i。采用什么方法把任务分配给服务器,使得每个服务器处理的期望时间为 \frac{l}{m} 。

采用将 n 个作业随机分配给 m 个服务器的方法,可以达到期望时间。

用 R_{i,j} 表示作业 b_j 被分配给服务器 s_i 处理,由于是随机分配,可以得到分布:

R_{i,j}=\left\{\begin{matrix} l_j \quad , p=\frac{1}{m} \\ 0 \quad , p=1-\frac{1}{m} \end{matrix}\right.

E(R_{i,j})=\frac{l_j}{m}

第 i 个服务器的总期望负载期望表示为:  \sum_{j=1}^nE(R_{i,j})

而且有: \sum_{j=1}^nE(R_{i,j})=\sum_{j=1}^n\frac{l_j}{m}=\frac{l}{m}

可以证明,发生服务器负载比期望大很多的概率很小。用 R_i 表示第 i 个服务器的实际负载,则有:

P(\max_{i=1}^m R_i \ge c \cdot \frac{l}{m} )\\ =P(\bigcup_{i=1}^{m} R_i \ge c \cdot \frac{l}{m}) \\ \le \sum_{i=1}^m P(R_i\ge c \cdot \frac{l}{m})

  R_i=\sum_{j=1}^nE(R_{i,j}) ,而且有 0 \le R_{i,j} \le 1,根据切洛夫界拓展,可知:

\sum_{i=1}^m P(R_i\ge c \cdot \frac{l}{m}) \le m\cdot e^{-z\cdot \frac{l}{m} }

 假设取 c=1.1,z\approx 0.0048e^{-z\cdot \frac{l}{m} } \approx e^{-0.0048} \le \frac{1}{160000}

 如果使用 1000 台服务器,粗略估计最坏服务器超过负载均衡 10% 的概率也是很小的值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2245427.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

GPU服务器厂家:科研服务器领域机遇与博弈,AMD 新UDNA 架构

科研服务器作为推动科学研究进步的核心基础设施&#xff0c;其性能与架构的创新对于整个科研生态有着极为关键的影响。AMD 全新推出的 UDNA 架构&#xff0c;引发了广泛的关注与讨论。 AMD UDNA 架构于科研服务器的产品数据与市场格局 AMD 在计算机硬件领域的影响力持续攀升&a…

STM32H7开发笔记(2)——H7外设之多路定时器中断

STM32H7开发笔记&#xff08;2&#xff09;——H7外设之多路定时器中断 文章目录 STM32H7开发笔记&#xff08;2&#xff09;——H7外设之多路定时器中断0.引言1.CubeMX配置2.软件编写 0.引言 本文PC端采用Win11STM32CubeMX4.1.0.0Keil5.24.2的配置&#xff0c;硬件使用STM32H…

【Linux】Linux入门实操——定时任务调度

一、crond调度 1. 概述 任务调度: 是指系统在某个时间执行的特定的命令或程序。任务调度分类 1. 系统工作 : 有些重要的工作必须周而复始地执行。如病毒扫描等 2. 用户工作 &#xff1a;用户可能希望执行某些程序&#xff0c;比如对mysql数据库的备份。 2. 基本语法 cron…

找到字符串中所有字母异位词(java)

题目描述&#xff1a; 给定两个字符串 s 和 p&#xff0c;找到 s 中所有 p 的 异位词的子串&#xff0c;返回这些子串的起始索引。不考虑答案输出的顺序。 字母异位词 是由重新排列源单词的所有字母得到的一个新单词 示例 1: 输入: s "cbaebabacd", p "abc&…

Leetcode226. 翻转二叉树(HOT100)+Leetcode221. 最大正方形(HOT100)

链接 题解&#xff1a; 本题是要镜像反转二叉树&#xff0c;相当于从中间一分&#xff0c;然后把左子树和右子树对调&#xff0c;但又不是简单的对调&#xff0c;还要继续反转子树的子树&#xff0c;所以要用递归。 我们特判root是否为空&#xff08;否则出现nullptr->nul…

ISUP协议视频平台EasyCVR私有化视频平台新能源汽车充电停车管理方案的创新与实践

在环保意识提升和能源转型的大背景下&#xff0c;新能源汽车作为低碳出行的选择&#xff0c;正在全球迅速推广。但这种快速增长也引发了充电基础设施短缺和停车秩序混乱等挑战&#xff0c;特别是在城市中心和人口密集的居住区&#xff0c;这些问题更加明显。因此&#xff0c;开…

国际知名摄影测量与遥感专家、瑞士苏黎世联邦理工学院终身教授Armin Gruen莅临大势智慧参观交流

11月18日&#xff0c;瑞士苏黎世联邦理工学院终身教授、国际摄影测量与遥感学会荣誉会员、武汉大学测绘遥感信息工程国家重点实验室客座教授Armin Gruen莅临武汉大势智慧科技有限公司&#xff08;以下简称“大势智慧”&#xff09;参观交流。大势智慧董事长黄先锋亲自接待了Arm…

RTSP播放器EasyPlayer.js播放器分辨率高的视频在设置container的宽高较小时,会出现锯齿状的画面效果

流媒体播放器的核心技术及发展趋势展现了其在未来数字生活中的无限潜力。随着技术的不断进步和市场的持续发展&#xff0c;流媒体播放器将在内容创新、用户体验优化以及跨平台互通等方面取得新的突破。对于从业者而言&#xff0c;把握这些趋势并积极应对挑战将是实现成功的关键…

C# 数据结构之【树】C#树

以二叉树为例进行演示。二叉树每个节点最多有两个子节点。 1. 新建二叉树节点模型 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks;namespace DataStructure {class TreeNode{public int Data { get;…

Sqlite: Java使用、sqlite-devel

这里写目录标题 一、简介二、使用1. Java项目中&#xff08;1&#xff09;引入驱动&#xff08;2&#xff09;工具类&#xff08;3&#xff09;调用举例 2. sqlite-devel in linuxsqlite-devel使用 三、更多应用1. 数据类型2. 如何存储日期和时间3. 备份 一、简介 非常轻量级&…

MySQL深入:B+树的演化、索引和索引结构

提示&#xff1a;内容是读《MySQL技术内幕&#xff1a;InnoDB存储引擎》&#xff0c;笔记摘要 文章目录 二叉查找树平衡二叉树(AVL) B树(BTree)B树(BTree)InnoDB B树索引索引结构&#xff08;InnoDB B树&#xff09;B树存放的数据量 二叉查找树 在二叉查找树中&#xff0c;左子…

C语言-11-18笔记

1.C语言数据类型 类型存储大小值范围char1 字节-128 到 127 或 0 到 255unsigned char1 字节0 到 255signed char1 字节-128 到 127int2 或 4 字节-32,768 到 32,767 或 -2,147,483,648 到 2,147,483,647unsigned int2 或 4 字节0 到 65,535 或 0 到 4,294,967,295short2 字节…

“乐鑫组件注册表”简介

当启动一个新的开发项目时&#xff0c;开发者们通常会利用库和驱动程序等现有的代码资源。这种做法不仅节省时间&#xff0c;还简化了项目的维护工作。本文将深入探讨乐鑫组件注册表的概念及其核心理念&#xff0c;旨在指导您高效地使用和贡献组件。 概念解析 ESP-IDF 的架构…

【人工智能】PyTorch、TensorFlow 和 Keras 全面解析与对比:深度学习框架的终极指南

文章目录 PyTorch 全面解析2.1 PyTorch 的发展历程2.2 PyTorch 的核心特点2.3 PyTorch 的应用场景 TensorFlow 全面解析3.1 TensorFlow 的发展历程3.2 TensorFlow 的核心特点3.3 TensorFlow 的应用场景 Keras 全面解析4.1 Keras 的发展历程4.2 Keras 的核心特点4.3 Keras 的应用…

Sigrity SPEED2000 TDR TDT Simulation模式如何进行时域阻抗仿真分析操作指导-差分信号

Sigrity SPEED2000 TDR TDT Simulation模式如何进行时域阻抗仿真分析操作指导-差分信号 Sigrity SPEED2000 TDR TDT Simulation模式如何进行时域阻抗仿真分析操作指导-单端信号详细介绍了单端信号如何进行TDR仿真分析,下面介绍如何对差分信号进行TDR分析,还是以下图为例进行分…

Django一分钟:django中收集关联对象关联数据的方法

场景&#xff1a;我有一个模型&#xff0c;被其它多个模型关联&#xff0c;我配置了CASCADE级联删除&#xff0c;我想要告知用户删除该实例之后&#xff0c;哪些关联数据将会被一同删除。 假设我们当前有这样一组模型&#xff1a; class Warehouse(models.Model):""…

Flink学习连载第二篇-使用flink编写WordCount(多种情况演示)

使用Flink编写代码&#xff0c;步骤非常固定&#xff0c;大概分为以下几步&#xff0c;只要牢牢抓住步骤&#xff0c;基本轻松拿下&#xff1a; 1. env-准备环境 2. source-加载数据 3. transformation-数据处理转换 4. sink-数据输出 5. execute-执行 DataStream API开发 //n…

利用开源的低代码表单设计器FcDesigner高效管理和渲染复杂表单结构

FcDesigner 是一个强大的开源低代码表单设计器组件&#xff0c;支持快速拖拽生成表单。提供丰富的自定义及扩展功能&#xff0c;FcDesigner支持多语言环境&#xff0c;并允许开发者进行二次开发。通过将表单设计输出为JSON格式&#xff0c;再通过渲染器进行加载&#xff0c;实现…

【三合黑马指标】指标操盘技术图文教程,三线粘合抓黑马,短线买点持股辅助,通达信炒股软件指标

如上图&#xff0c;副图指标【三合黑马指标】&#xff0c;三条线彩线1-2-3&#xff0c;四条虚线代表四种短线技术做多信号&#xff0c;最底部的凸起形态线短线做多确认信号 。 黑马牛股选股技巧&#xff0c;可以选择周线三线粘合状态&#xff0c;在粘合时选股关注&#xff0c;如…

nwjs崩溃复现、 nwjs-控制台手动操纵、nwjs崩溃调用栈解码、剪切板例子中、nwjs混合模式、xdotool显示nwjs所有进程窗口列表

-1. nwjs在低版本ubuntu运行情况 ubuntu16.04运行nw-v0.93或0.89报错找不到NSS_3.30、GLIBC_2.25 uname -a #Linux Asus 4.15.0-112-generic #113~16.04.1-Ubuntu SMP Fri Jul 10 04:37:08 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux cat /etc/issue #Ubuntu 16.04.7 LTS \n \l…