人工智能数学基础--概率与统计10:离散随机变量的概率函数及常见的二项分布、泊松分布

news2024/9/21 12:30:55

一、离散随机变量的概率函数及分布函数

  1. 设X为离散随机变量,其全部可能取值为{a1,a2,…},则:pi=P(X=ai) &nsp&nsp&nsp&nsp
    (i=1,2,…)称为X的概率函数,也称为随机变量X的概率分布

  2. 设X为随机变量(包括离散和非离散),则函数:P(X≤x) = F(x) &nsp&nsp&nsp&nsp (-∞ < x <∞) 称为X的分布函数

3.结合概率函数和分布函数的定义,对于离散随机变量,有: P(i) = P(X=i) = F(i)-F(i-1);

  1. 对任何随机变量X,其分布函数F(x)是单调非降的,且X->∞时,F(x)->1,X->-∞时,F(x)->0。

二、二项分布

2.1、定义

假设某事件A在一次试验中发生的概率为p,将该试验独立重复n次,以X记A在试验中发生的次数,X取值范围为0,1,…,n,考虑事件{X=i}出现的概率pi(表示X=i时的概率),则有:
在这里插入图片描述
X所遵循的上述公式分布称为二项分布,常记为B(n,p),X服从二项分布记为:X ~ B(n,p) 。之所以成为二项分布,是因为该概率与(a+b)n 的二项式展开系数相同。

2.2、证明

重复试验n次,事件发生概率为p,发送i次,则未发生次数为n-i次,其每次的概率为1-p,由于事件发生i次时,对于不同的顺序有不同组合,因此发生i次的概率即为B(n,p)。

2.3、二项分布的两个条件

上述二项分布的定义中隐含了两个二项分布的条件,这也是二项分布使用的两个重要条件:

  1. 各次试验的条件是稳定的,即有稳定的概率p在各次试验中保持不变;
  2. 各次试验的独立性。

例如产品的废品率在同样的生产条件下应该是固定的,做废品率检测时,抽取的产品每次抽检后放回,则认为抽检是独立的,其概率会服从二项分布。但如果不放回,则不是独立的,因为抽检减少的数量会影响到下次抽检,如果此时抽检数量远少于产品总数,也可以近似认为是独立的,仍近似服从二项分布。

三、泊松分布

3.1、定义

若随机变量X的可能取值为0、1、2、…,且概率分布为:P(X=i)=eλi/i! ,则称X服从泊松分布,常记为:X~P(λ),注意此处的λ要求为大于0的常数。

3.2、泊松分布概率函数的推导

泊松分布适用于表示一定时间或空间内出现的事件个数,如一定时间范围内某交通路口的事故数。假设观察的时间段为[0,1),取一个很大的自然数n,将[0,1)等分成n段,标记为l1、l2、…,则:
l1=[0,1/n),l2 = [1/n,2/n),…,li = [(i-1)/n,i/n),…,ln=[(n-1)/n,1)
做几个假定:

  1. 在每段li内,恰发生一个事故的概率近似地与这段的时间长1/n成正比,即可取为λ/n。又假定n很大每段时间很小时,在一段时间内最多只发生一次事故,则不发生事故的概率为1-λ/n;
  2. 在每段时间内是否发生事故是独立的。

按照上述假定,则可以把在[0,1)内发生事故的次数X视作在n个时段内有事故的时段数,且其服从二项分布B(n,λ)。于是P(X=i) = B(n,p)=b(i;n,p),即:

在这里插入图片描述
当n->∞时:
在这里插入图片描述
因此可以得到:P(X=i) = ( i n ) ( λ n ) i ( 1 − λ n ) n − i → e − λ λ i / i ! ^n_i)(\frac{λ}{n})^i(1-\frac{λ}{n})^{n-i} →e^{-λ}λ^i/i! in)(nλ)i(1nλ)nieλλi/i!

老猿注:上图中这两个极限的值对于忘记极限知识的人来说推导还是要花点时间的,如果不清楚的请参考《由二项分布推导泊松分布中的两个使用公式的证明:https://blog.csdn.net/LaoYuanPython/article/details/127877254》。

3.3、泊松分布使用场景

上面已经介绍泊松分布适用于表示一定时间或空间内出现的事件个数,从上面的推导过程可以看到,泊松分布可以作为二项分布的极限得到,一般地说,如果X~B(n,p),其中n很大,p很小,而np=λ不太大时,则X的分布接近于泊松分布P(λ)。有此基础,则可以将一些满足上面条件的二项分布转换为泊松分布去计算。

我们来看一个例子:
现在需要100个符合规格的元件。从市场上买的该元件有废品率0.01,故如只买100个,则它们全都符合规格的机会恐怕不大,为此我们买100+a个,a这样取,以使“在这100+a个元件中至少有100个符合规格”这个事件 A 的概率不小于0.95。问a至少要多大?

解答

在此假定各元件是否合格是独立的,以X记在这100+a个元件中所含的废品数,则X有二项分布B(100+a,0.01)。
事件A 即事件(X≤a}于是A的概率为:
P ( A ) = ∑ i = 0 a P ( X = i ) = ∑ i = 0 a ( i 100 + a ) ( 0.01 ) i ( 0.99 ) 100 + a − i P(A)=\sum\limits_{i=0}^a P(X=i)=\sum\limits_{i=0}^a(^{100+a}_{\quad i})(0.01)^i(0.99)^{100+a-i} P(A)=i=0aPX=i=i=0a(i100+a)(0.01)i(0.99)100+ai

为确定最小的a使P(A)≥0.95,得从a=0开始对a=0,1,2,···依次计算上式右边的值,直到算出≥0.95的结果为止,这很麻烦。
由于100+a 这个数较大而0.01很小,(100+a)(0.01)=1+a(0.01)大小适中,可近似地用泊松分布计算。
由于平均在100个产品中只有1个废品,a谅必相当小,故可以用1近似地取代1+a(0.01)。由此X近似地服从泊松分布P(1)。
因而
P ( X ≤ a ) ≈ ∑ i = 0 a e − 1 / i ! P(X≤a) ≈ \sum\limits_{i=0}^ae^{-1}/i! P(Xa)i=0ae1/i!
计算出当a=0,1,2,3时,上式右边分别为0.368.0.736.0.920 和0.981。故取a=3已够了。

四、小结

本文介绍了离散随机变量的概率函数、概率分布的定义,并介绍了两个很重要的离散随机变量的概率分布:二项分布和泊松分布,实际上泊松分布是二项分布的极限形式。

更多人工智能数学基础请参考专栏《人工智能数学基础》。

写博不易,敬请支持:

如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!

关于老猿的付费专栏

  1. 付费专栏《https://blog.csdn.net/laoyuanpython/category_9607725.html 使用PyQt开发图形界面Python应用》专门介绍基于Python的PyQt图形界面开发基础教程,对应文章目录为《 https://blog.csdn.net/LaoYuanPython/article/details/107580932 使用PyQt开发图形界面Python应用专栏目录》;
  2. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10232926.html moviepy音视频开发专栏 )详细介绍moviepy音视频剪辑合成处理的类相关方法及使用相关方法进行相关剪辑合成场景的处理,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/107574583 moviepy音视频开发专栏文章目录》;
  3. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python初学者疑难问题集》为《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的伴生专栏,是笔者对OpenCV-Python图形图像处理学习中遇到的一些问题个人感悟的整合,相关资料基本上都是老猿反复研究的成果,有助于OpenCV-Python初学者比较深入地理解OpenCV,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/109713407 OpenCV-Python初学者疑难问题集专栏目录 》
  4. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10762553.html Python爬虫入门 》站在一个互联网前端开发小白的角度介绍爬虫开发应知应会内容,包括爬虫入门的基础知识,以及爬取CSDN文章信息、博主信息、给文章点赞、评论等实战内容。

前两个专栏都适合有一定Python基础但无相关知识的小白读者学习,第三个专栏请大家结合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的学习使用。

对于缺乏Python基础的同仁,可以通过老猿的免费专栏《https://blog.csdn.net/laoyuanpython/category_9831699.html 专栏:Python基础教程目录)从零开始学习Python。

如果有兴趣也愿意支持老猿的读者,欢迎购买付费专栏。

老猿Python,跟老猿学Python!

☞ ░ 前往老猿Python博文目录 https://blog.csdn.net/LaoYuanPython ░

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/13069.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【lombok】equals相等返回false contains包含返回false? lombok注解的一个天坑

最近在写代码的时候 遇到个奇怪的问题 使用 list.contains(obj) 方法判断&#xff0c;明明是两个内容一样的对象&#xff0c;却返回了false 这里用伪代码还原一下场景&#xff1a; // 从数据库取的所有数据 List<SysMenuDTO> allList getDataFromDB(); // 一个id等于1…

【Detectron2】代码库学习-3. LazyConfig 配置文件

目录1. 配置文件2. LazyConfig 导入导出3. 递归实例化4. 基于LazyConfig的训练步骤4.1 导入依赖库4.2 日志初始化4.3 训练4.4 评估4.5 训练流程4.6 主函数入口5. TipsDetectron2是Facebook AI Research(FAIR)推出的基于Pytorch的视觉算法开源框架&#xff0c;主要聚焦于目标检测…

进程的通信 - 邮槽

邮槽 邮槽是Windows系统提供的一种单向进程间的通信机制。对于相对简短的地坪率信息发送&#xff0c;使用邮槽通常比命名管道或者Unix域套接字更简单 使用邮槽通信的进程分为服务端和客户端。邮槽由服务端创建&#xff0c;在创建时需要指定邮槽名&#xff0c;创建后服务端得…

PIC单片机-测试例程汇总

内容包括PIC单片机常用外设的测试例程。紫色文字是超链接&#xff0c;点击自动跳转至相关博文。持续更新&#xff0c;原创不易&#xff01;目录&#xff1a;一、端口的定义与while(1)的使用二、延时1、通过语句延时程序&#xff08;带参数&#xff09; 2、通过语句延时程序&…

N3-PEG-NHS,Azide-PEG-NHS,叠氮-聚乙二醇-活性酯可用来修饰蛋白质

一、详情介绍 1、名称 英文&#xff1a;N3-PEG-NHS&#xff0c;Azide-PEG-NHS 中文&#xff1a;叠氮-聚乙二醇-活性酯 2、描述 Azide-PEG-NHS的分子量&#xff1a;Azide-PEG-NHS 1k&#xff0c;叠氮-聚乙二醇-活性酯 2k&#xff0c;叠氮-PEG-活性酯 5k&#xff0c;N3-PEG-…

rr来debug你的C/C++程序(Linux)

如何用rr来debug你的C/C程序(Linux) 想象一下如果你的程序某时会崩溃&#xff0c;但是不能稳定复现&#xff0c;你会如何debug它? 用传统debugger面临的问题就是你不知道这次运行的时候能不能复现&#xff0c;你猜测可能某段代码出现了问题&#xff0c;所以进行了一番检查。…

柔性制造物料抓取及加工系统设计

目 录 摘 要 I Abstract II 1 绪论 1 1.1 选题背景及意义 1 1.2 国内外研究现状 2 1.3六自由度并联机器人介绍 3 1.4研究主要内容 6 1.4.1主要设计要求 6 1.4.2技术参数 7 2柔性制造物料抓取及加工系统的结构及工作原理 8 2.1 并联运动机构概述 8 2.2 六自由度并联加工机器人总…

LTR (Learning to Rank): 排序算法 poitwise, pairwise, listwise常见方案总结

目录1 Learing to Rank介绍2 The Pointwise Approach3 The Pairwise Approach3.1 RankNet4 The Listwise Approach4.1 直接优化评测指标4.1.1 LambdaRank4.1.2 LambdaMART4.2 定义Listwise损失函数4.2.1 ListNet4.2.2 ListMLE5 排序评估指标5.1 Mean Reciprocal Rank (MRR)5.2 …

46-文本编辑器及文本处理

46-文本编辑器及文本处理常见文本编辑器linux文本编辑器介绍Linux文本编辑器-emacsLinux文本编辑器-nanoLinux文本编辑器- geditLinux文本编辑器- keditLinux文本编辑器- viLinux文本编辑器- vim使用vim编辑器vim基础操作-打开文件vim基础操作-移动光标vim基础操作–数据操作vi…

解决——》CommunicationsException:Communications link failure

推荐链接&#xff1a; 总结——》【Java】 总结——》【Mysql】 总结——》【Spring】 总结——》【SpringBoot】 总结——》【MyBatis、MyBatis-Plus】 解决——》CommunicationsException:Communications link failure1、操作2、现象3、原因4、解决1&…

大一新生HTML期末作业 学生个人网页设计作业 HTML5响应式个人简历网站模板 web前端网页制作课作业

&#x1f389;精彩专栏推荐&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 &#x1f482; 作者主页: 【主页——&#x1f680;获取更多优质源码】 &#x1f393; web前端期末大作业…

【linux】登录审计

linux登录审计 桥接模式配置互联 VMware的“虚拟网络编辑器” 输入’nm-connection-editor’&#xff0c;配置以太网 为以太网连接配置网卡 配置ipv4 互ping ssh远程登录 ssh -l 用户名 ip地址exit退出ssh远程 [alexalexw-device ~]$ ssh -l alex 1.1.1.2 The au…

数据挖掘——RFM客户价值模型及航空公司客户分析实例

引言 背景信息时代的来临使得企业营销焦点从产品转向了客户&#xff0c;客户的管理关系成为企业的核心问题。客户的关系管理问题是客户分群。通过客户分群&#xff0c;进而区分无价值客户和高价值客户。高价值客户代表他们的消费会给企业带来利益最大。企业需要针对不同类别的…

易基因|病毒抗性:全基因组DNA甲基化揭示草鱼年龄相关病毒易感性的表观遗传机制

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 2022年06月02日&#xff0c;淡水生态与生物技术国家重点实验室&#xff08;中国科学院水生生物研究所&#xff09;何利波副研究员为第一作者和通讯作者&#xff0c;汪亚平研究员为共同通…

智慧市政解决方案-最新全套文件

智慧市政解决方案-最新全套文件一、建设背景二、思路架构三、建设方案四、获取 - 智慧市政全套最新解决方案合集一、建设背景 随着中国经济的快速发展&#xff0c;城市化步伐不断加快&#xff0c;为了适应城市发展与管理的需求&#xff0c;解决城市市政管理过程中的问题&#…

PDPS软件:机器人控制输送带运行虚拟仿真操作方法

目录 概述 旋转台设备运动机构介绍 旋转台设备模型导入与安装 旋转台设备操作创建 机器人控制旋转台设备离线程序命令添加 仿真运行 概述 旋转台也是工业机器人生产线中常用的外围设备&#xff0c;工件安装在旋转台的夹紧机构上&#xff0c;旋转台通过旋转实现工作位置的…

【Linux】进程地址空间

文章目录一、前言二、什么是进程地址空间三、进程地址空间如何进行管理四、为什么会存在进程地址空间五、进程地址空间区域的严格划分一、前言 学习Linux系统编程一共要翻越三座大山 – 进程地址空间、文件系统以及多线程&#xff0c;这三部分内容很难但是非常重要&#xff1b…

[附源码]Python计算机毕业设计java高校社团管理系统

项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等等。 环境需要 1.运行环境&#xff1a;最好是python3.7.7&#xff0c;…

GitCode / 1024程序员开源挑战赛(10.23-11.14)

目录 csdn也有云计算了 这个挑战赛&#xff0c;主要是向大家宣布了&#xff0c;咱们csdn也有自己的云计算了&#xff01; 比较有特色的 云容器 云IDE 猿如意 也是有个有特色的工具&#xff0c;可以试用下。​编辑 问题 csdn也有云计算了 这个挑战赛&#xff0c;主…

0097 弗洛伊德算法,马踏棋盘算法

import java.util.Arrays; /* * 弗洛伊德算法 * 1.和迪杰斯特拉算法一样&#xff0c;弗洛伊德算法也是一种用于寻找给定的加权图中顶点间最短路径的算法 * 2.迪杰斯特拉算法用于计算图中某一顶点到其他顶点的最短路径 * 弗洛伊德算法计算图中各个顶点之间的最短路径 * …