概率基础——指数分布
介绍
指数分布是一种连续概率分布,描述了独立随机事件之间的时间间隔。它常被用来模拟随机事件的等待时间,例如到达下一位顾客的等待时间、设备故障的间隔时间等。指数分布具有无记忆性的特点,即在给定时间内没有发生事件并不会影响下一次事件发生的概率。
理论及公式
指数分布的概率密度函数(PDF)为:
f ( x ; λ ) = λ e − λ x f(x;\lambda) = \lambda e^{-\lambda x} f(x;λ)=λe−λx
其中, x ≥ 0 x \geq 0 x≥0 表示时间间隔, λ > 0 \lambda > 0 λ>0是指数分布的参数,也称为速率参数。参数 λ \lambda λ 表示单位时间(或单位长度)内发生事件的平均次数。
指数分布的参数
- 速率参数 λ \lambda λ:单位时间(或单位长度)内发生事件的平均次数。速率参数 λ \lambda λ越大,事件发生的速率越快;速率参数 λ \lambda λ越小,事件发生的速率越慢。
举例
假设某个公交车站的乘客到达时间间隔符合指数分布,参数 λ = 0.1 \lambda = 0.1 λ=0.1,即平均每10分钟会有一个乘客到达。我们希望了解乘客到达的等待时间分布情况,以便优化公交车站的客流管理。
Python绘制不同参数的概率密度曲线
接下来,我们将使用Python来绘制不同参数的指数分布的概率密度曲线。
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import expon
# 定义不同参数的速率参数
lambdas = [0.5, 1, 2]
# 生成x轴的取值范围
x = np.linspace(0, 5, 1000)
# 绘制概率密度曲线
plt.figure(figsize=(10, 6))
for lam in lambdas:
y = expon.pdf(x, scale=1/lam)
plt.plot(x, y, label=f'lambda={lam}')
plt.title('Exponential Distribution PDF with Different Lambda')
plt.xlabel('x')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.show()
以上代码将绘制出三条不同参数
λ
\lambda
λ的指数分布概率密度曲线,参数
s
c
a
l
e
=
1
/
λ
scale=1/\lambda
scale=1/λ。从图中可以看出,不同参数的指数分布曲线具有不同的速率,速率参数
λ
\lambda
λ 越大,曲线下降越快,事件发生的速率越快。
对指数型随机变量进行采样生成,对
λ
=
1
\lambda=1
λ=1的指数分布进行采样生成,代码如下:
from scipy.stats import expon
import matplotlib.pyplot as plt
import numpy as np
expon_rv = expon()
expon_rvs = expon_rv.rvs(size=100000)
x = np.linspace(0, 10, 1000)
plt.plot(x, expon_rv.pdf(x), 'r', lw=3, alpha=0.6, label="$\\lambda$=1")
plt.hist(expon_rvs, bins=100, density=True, alpha=0.75, edgecolor='black')
plt.grid(ls='--')
plt.legend()
plt.show()
总结
本文介绍了指数分布及Python实现,利用了函数包的各个方法计算出各个理论统计值,利用采样样本数据计算出来的值和理论值基本算都是相等的。