【AI知识点】二项分布(Binomial Distribution)

news2024/10/6 5:21:53

二项分布(Binomial Distribution) 是概率论和统计学中描述独立重复的伯努利试验中成功次数的离散概率分布。它是基于多次独立的伯努利试验的扩展,用于描述在 n n n 次试验中发生成功的次数。

1. 二项分布的定义

二项分布用于描述在 n n n 次独立的伯努利试验中,成功发生的次数。每次伯努利试验只有两种结果——成功失败,成功的概率为 p p p,失败的概率为 1 − p 1 - p 1p

概率质量函数(PMF)

如果随机变量 X X X 表示 n n n 次独立的伯努利试验中成功的次数,且成功的概率为 p p p,那么 X X X 服从二项分布,记为:

X ∼ Bin ( n , p ) X \sim \text{Bin}(n, p) XBin(n,p)

二项分布的概率质量函数(PMF)为:

P ( X = k ) = ( n k ) p k ( 1 − p ) n − k P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k} P(X=k)=(kn)pk(1p)nk

其中:

  • X X X 是成功的次数。
  • n n n 是试验次数(即进行的独立伯努利试验的总次数)。
  • p p p 是每次试验成功的概率。
  • ( n k ) \binom{n}{k} (kn)组合数,表示从 n n n 次试验中选择 k k k 次成功的方式数,公式为:

( n k ) = n ! k ! ( n − k ) ! \binom{n}{k} = \frac{n!}{k!(n-k)!} (kn)=k!(nk)!n!


2. 二项分布的性质

a. 期望值(Expectation)

二项分布的期望值表示在 n n n 次试验中成功的平均次数。二项分布的期望值 E ( X ) E(X) E(X) 为:

E ( X ) = n p E(X) = np E(X)=np

这意味着,成功的平均次数是试验次数 n n n 和单次成功概率 p p p 的乘积。例如,投掷硬币 10 次,如果每次正面的概率为 0.5,则出现正面的期望次数是 10 × 0.5 = 5 10 \times 0.5 = 5 10×0.5=5

b. 方差(Variance)

方差描述成功次数的波动性或离散程度。二项分布的方差 V a r ( X ) Var(X) Var(X) 为:

V a r ( X ) = n p ( 1 − p ) Var(X) = np(1 - p) Var(X)=np(1p)

方差表明,成功次数的波动性取决于试验次数 n n n、成功概率 p p p 和失败概率 1 − p 1 - p 1p

c. 标准差(Standard Deviation)

标准差是方差的平方根,用于衡量成功次数的波动程度:

σ ( X ) = n p ( 1 − p ) \sigma(X) = \sqrt{np(1 - p)} σ(X)=np(1p)

d. 二项分布的形状

  • p = 0.5 p = 0.5 p=0.5 时,二项分布是对称的,成功和失败的概率相等。此时,分布的平均值位于 n / 2 n/2 n/2 附近。
  • p > 0.5 p > 0.5 p>0.5 时,分布向右偏斜,成功的次数更可能接近 n n n
  • p < 0.5 p < 0.5 p<0.5 时,分布向左偏斜,成功的次数更可能接近 0。

图例说明如下:

这张图展示了三种不同参数设置下的二项分布,其中横坐标表示随机变量(成功次数),纵坐标表示每个随机变量对应的概率(即发生特定成功次数的概率)。

在这里插入图片描述
图片来源:https://medium.com/@abhishekjainindore24/all-about-binomial-distribution-ba476ea4642f

图中展示了三个不同的二项分布:

  1. 绿色柱形图 p = 0.5 p = 0.5 p=0.5 n = 20 n = 20 n=20,表示进行了 20 次试验,每次成功的概率为 0.5。分布呈对称形状,均值大约在 10 次成功附近( n × p = 20 × 0.5 = 10 n \times p = 20 \times 0.5 = 10 n×p=20×0.5=10)。

  2. 棕色柱形图 p = 0.7 p = 0.7 p=0.7 n = 20 n = 20 n=20,表示进行了 20 次试验,每次成功的概率为 0.7。分布向右偏斜,表示成功次数更多,均值接近 14 次( n × p = 20 × 0.7 = 14 n \times p = 20 \times 0.7 = 14 n×p=20×0.7=14)。

  3. 紫色柱形图 p = 0.5 p = 0.5 p=0.5 n = 40 n = 40 n=40,表示进行了 40 次试验,每次成功的概率为 0.5。分布较宽且更加集中,均值大约在 20 次成功附近( n × p = 40 × 0.5 = 20 n \times p = 40 \times 0.5 = 20 n×p=40×0.5=20)。

总结:

  • n n n(试验次数):随着 n n n 增大,分布变得更加集中和对称。
  • p p p(成功概率):随着 p p p 增大,分布向右偏斜,成功次数的期望值增加。

3. 二项分布的例子

二项分布适用于任何重复的独立伯努利试验,即每次试验结果只可能是成功或失败,并且每次试验的成功概率 p p p 是相同的。

例子1:投掷硬币

假设我们进行 10 次独立的投掷硬币实验,每次投掷硬币的正面朝上的概率为 p = 0.5 p = 0.5 p=0.5。令 X X X 表示正面朝上的次数,则 X ∼ Bin ( 10 , 0.5 ) X \sim \text{Bin}(10, 0.5) XBin(10,0.5)

计算恰好有 6 次正面朝上的概率:

P ( X = 6 ) = ( 10 6 ) ( 0.5 ) 6 ( 0.5 ) 4 = 10 ! 6 ! 4 ! ( 0.5 ) 10 = 0.205 P(X = 6) = \binom{10}{6} (0.5)^6 (0.5)^4 = \frac{10!}{6!4!} (0.5)^{10} = 0.205 P(X=6)=(610)(0.5)6(0.5)4=6!4!10!(0.5)10=0.205

即,在 10 次投掷硬币中,有 6 次正面朝上的概率为 0.205。

例子2:考试通过率

假设某场考试的通过率为 80%,某班有 10 个学生参加考试。我们可以用二项分布来描述通过考试的学生人数。令 X X X 表示通过考试的学生人数,则 X ∼ Bin ( 10 , 0.8 ) X \sim \text{Bin}(10, 0.8) XBin(10,0.8)

计算恰好有 8 个学生通过考试的概率:

P ( X = 8 ) = ( 10 8 ) ( 0.8 ) 8 ( 0.2 ) 2 = 0.302 P(X = 8) = \binom{10}{8} (0.8)^8 (0.2)^2 = 0.302 P(X=8)=(810)(0.8)8(0.2)2=0.302

即,恰好有 8 个学生通过考试的概率为 0.302。


4. 二项分布的推导

二项分布是通过 n n n 次独立的伯努利试验推导出来的,每次试验的结果是独立的成功或失败。

a. 组合数的解释

( n k ) \binom{n}{k} (kn) 代表从 n n n 次试验中选择 k k k 次成功的方式数。组合数的公式为:

( n k ) = n ! k ! ( n − k ) ! \binom{n}{k} = \frac{n!}{k!(n-k)!} (kn)=k!(nk)!n!

它表示有多少种方式可以从 n n n 次试验中选择 k k k 次成功。

b. 成功和失败的概率

成功发生 k k k 次的概率为 p k p^k pk,而失败发生 n − k n-k nk 次的概率为 ( 1 − p ) n − k (1-p)^{n-k} (1p)nk。二项分布的概率质量函数是这三部分的乘积:

P ( X = k ) = ( n k ) p k ( 1 − p ) n − k P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k} P(X=k)=(kn)pk(1p)nk

这就是二项分布的公式,表示在 n n n 次试验中恰好有 k k k 次成功的概率。


5. 二项分布与其他分布的关系

a. 伯努利分布

二项分布是伯努利分布的推广。伯努利分布表示单次伯努利试验的成功或失败,而二项分布表示多次独立的伯努利试验中的成功次数。

  • 如果 n = 1 n = 1 n=1,则二项分布退化为伯努利分布。

b. 泊松分布

n n n 很大而 p p p 很小时,且 n ⋅ p = λ n \cdot p = \lambda np=λ 是常数时,二项分布趋近于泊松分布。这种情况下,二项分布可以用来近似泊松分布,描述稀有事件的发生次数。

c. 正态分布

当试验次数 n n n 很大时,二项分布可以近似为正态分布。这是因为根据中心极限定理,当 n n n 较大时,二项分布的形状逐渐趋于对称,并且接近正态分布。

  • n p > 5 np > 5 np>5 n ( 1 − p ) > 5 n(1 - p) > 5 n(1p)>5 时,二项分布可以用正态分布进行近似。

6. 二项分布的实际应用

a. 质量控制

在质量控制中,二项分布用于描述生产线中合格产品和不合格产品的数量。例如,从生产线上随机抽取 100 个产品,检查其中有多少个合格产品,这可以用二项分布来建模。

b. 市场营销

二项分布用于建模市场营销中的成功概率。例如,在发送电子邮件广告时,可以用二项分布来计算有多少人会响应广告。

c. 生物统计

在生物统计学中,二项分布用于建模二元结果(如存活/死亡、健康/疾病等)的实验。例如,进行 100 次药物实验,记录有多少病人康复。


7. 总结

二项分布 是描述多次独立伯努利试验中成功次数的离散概率分布。它通过组合数计算成功次数的方式数,并将成功和失败的概率组合在一起,得到在 n n n 次试验中成功 k k k 次的概率。二项分布广泛应用于统计学、质量控制、市场营销、医学实验等领域,用于建模多次重复试验中某个事件发生的次数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2191168.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

利用GPU进行训练

文章目录 一、GPU训练模型二、对比使用gpu和cpu进行训练所花费的时间三、GPU训练模型的第二种表达方式 一、GPU训练模型 GPU只能够训练三种变量&#xff0c;分别是&#xff1a; 网络模型 数据&#xff08;输入&#xff0c;标注targets&#xff09; 损失函数 使用方式是.cuda…

精品WordPress主题/响应式个人博客主题Kratos

Kratos 是一款专注于用户阅读体验的响应式 WordPress 主题&#xff0c;整体布局简洁大方&#xff0c;针对资源加载进行了优化。 Kratos主题基于Bootstrap和Font Awesome的WordPress一个干净&#xff0c;简单且响应迅速的博客主题&#xff0c;Vtrois创建和维护&#xff0c; 主…

rockylinux9安装软件报错

1、rocky linux9再安装软件的时候报错&#xff1a; [rootClient119 yum.repos.d]# yum -y install epel-release [rootClient119 yum.repos.d]# yum -y install libcgroup Extra Packages for Enterprise Linux 9 - x86_64 …

【MySQL 09】表的内外连接

目录 1.内连接 创建表&#xff08;案例准备&#xff09; 案例&#xff1a; 2.外连接 2.1左外连接 案例&#xff1a; 2.2右外连接 案例&#xff1a; 1.内连接 内连接实际上就是利用where子句对两种表形成的笛卡儿积进行筛选,我们前面学习的查询都是内连接,也是在开发过…

什么是pip? -- Python 包管理工具

前言 不同的编程语言通常都有自己的包管理工具&#xff0c;这些工具旨在简化项目的依赖管理、构建过程和开发效率&#xff0c;同时促进代码的复用和共享。每个包管理工具都有其独特的特点和优势&#xff0c;开发者可以根据自己的编程语言和项目需求选择合适的包管理工具。 pip是…

R语言的下载、安装及环境配置(RstudioVSCode)

0x01 R语言篇 一、软件介绍 R for Windows是一个免费的用于统计计算和统计制图的优秀工具&#xff0c;是R语言开发工具。它拥有数据存储和处理系统、数组运算工具&#xff08;其向量、矩阵运算方面功能尤其强大&#xff09;、完整连贯的统计分析工具、优秀的统计制图等功能。…

Spring Cloud之OpenFeign的具体实践

1 基本概念 OpenFeign基于Feign框架开发&#xff0c;而Feign是Netflix开源的一个声明式Web服务客户端。OpenFeign通过定义接口、注解和动态代理等方式&#xff0c;将服务调用的过程封装起来&#xff0c;使得开发者只需要定义服务接口&#xff0c;而无需关心底层的HTTP请求和序列…

qt 使用svg 图标的使用

1. 添加模块 在cmakeList.txt 中添加svg模块 2. 使用示例 这里已给已初始化的按钮设置图标为例&#xff1a; int width 12;int height 12;QSvgRenderer *minRenderer new QSvgRenderer(QString(":/resources/icon/min_window.svg"));QPixmap pixmap(width, h…

CSS——属性值计算

CSS——属性值计算 今天来详细讲解一下 CSS的属性值计算过程&#xff0c;这是 CSS 的核心之一&#xff08;另一个是视觉可视化模型&#xff0c;个人理解&#xff0c;这个相对复杂&#xff0c;以后再讲&#xff09;。 基本概念 层叠样式表&#xff1a;Cascade Style Sheet&am…

【YOLO学习】YOLOv5口罩检测实战

文章目录 1. 环境配置2. 下载代码3. 安装库3.1 安装pytorch3.2 安装其他库 4. 测试5. 数据标注6. 模型训练7. 界面可视化 1. 环境配置 1. 先参考其他文章安装 Anaconda 或者 Miniconda&#xff0c;我安装的是 Miniconda。 2. 更换国内源&#xff0c;以加快速度 。可以参考下面这…

使用Buildpacks构建Docker镜像

## 使用Buildpacks构建Docker镜像 ![](../assets/运维手册-Buildpacks-Buildpacks.io.png) ### Buildpacks简介 与Dockerfile相比&#xff0c;Buildpacks为构建应用程序提供了更高层次的抽象。具体来说&#xff0c;Buildpacks&#xff1a; * 提供一个平衡的控制&#xff0c;…

Koa2项目实战2(路由管理、项目结构优化)

添加路由&#xff08;处理不同的URL请求&#xff09; 路由&#xff1a;根据不同的URL&#xff0c;调用对应的处理函数。 每一个接口服务&#xff0c;最核心的功能是&#xff1a;根据不同的URL请求&#xff0c;返回不同的数据。也就是调用不同的接口返回不同的数据。 在 Node…

1C++入门基础(一)

文章目录 什么是C?C的发展史C关键字(C98)命名空间命名空间的定义命名空间的使用 C中的输入和输出缺省参数缺省参数的概念缺省参数分类全缺省参数半缺省参数 函数重载函数重载的概念函数重载的原理(名字修饰) extern#1. 符号的声明与定义#1.1 变量的声明与定义#1.2 函数的声明和…

均值模板和二阶差分模板的频率响应

均值模板和二阶差分模板都是偶对称。实偶函数的傅里叶变换仍是实偶函数。 给个证明过程 实偶函数 一个函数 f ( x ) f(x) f(x) 被称为实偶函数&#xff0c;如果它满足以下条件&#xff1a; f ( − x ) f ( x ) f(-x) f(x) f(−x)f(x) 傅里叶变换 对于一个实偶函数 f (…

实验 | 使用本地大模型从论文PDF中提取结构化信息

非结构文本、图片、视频等数据是待挖掘的数据矿藏&#xff0c; 在经管、社科等研究领域中谁拥有了_从非结构提取结构化信息的能力_&#xff0c;谁就拥有科研上的数据优势。正则表达式是一种强大的文档解析工具&#xff0c;但它们常常难以应对现实世界文档的复杂性和多变性。而随…

【Codeforces】CF 2007 E

E. Iris and the Tree #树形结构 #贪心 #数学 题目描述 Given a rooted tree with the root at vertex 1 1 1. For any vertex i i i ( 1 ≤ i ≤ n 1 \leq i \leq n 1≤i≤n) in the tree, there is an edge connecting vertices i i i and p i p_i pi​ ( 1 ≤ p i ≤…

Python使用matplotlib绘制图形大全(曲线图、条形图、饼图等)

matplotlib 的主要组成部分是 pyplot&#xff0c;它是一个类似于 MATLAB 的绘图框架。pyplot 提供了一个 MATLAB 式的接口&#xff0c;可以隐式地创建图形和轴&#xff0c;使得绘图变得简单。 以下是一个简单的 matplotlib 使用示例&#xff0c;用于绘制一条简单的折线图&…

Linux:进程间通信之信号量

system V的进程间通信除了共享内存&#xff0c;还有消息队列和信号量 IPC&#xff08;进程间通信的简称&#xff09; 消息队列 消息队列提供了一个从一个进程向另外一个进程发送一块数据的方法 每个数据块都被认为是有一个类型&#xff0c;接收者进程接收的数据块可以有不同…

Electron 使⽤ electron-builder 打包应用

electron有几种打包方式&#xff0c;我使用的是electron-builder。虽然下载依赖的时候让我暴躁&#xff0c;使用起来也很繁琐&#xff0c;但是它能进行很多自定义&#xff0c;打包完成后的体积也要小一些。 安装electron-builder&#xff1a; npm install electron-builder -…

cherry-markdown开源markdown组件详细使用教程

文章目录 前言开发定位目标调研技术方案前提工作量安排数据库表设计实现步骤1、引入依赖2、实现cherry-markdown的vue组件&#xff08;修改上传接口路径&#xff09;3、支持draw.io组件4、支持展示悬浮目录toc前端使用&#xff1a;编辑状态使用cherry-markdown的vue组件前端使用…