1.1 要概率分布有什么用?
个人理解:每种概率分布对应描述了某种特定事件发生的规律,像是一个模板,只要某种事件符合该分布的要求,那么就可以用对应的概率分布计算此事件的概率
1.2 为什么非要确定一个分布?
我们可以用某个累积分布函数图像来拟合统计数据,从而找到这些数据符合哪个概率分布的规律,从而做出预测。由累积分布得到概率密度可以了解数据变化速度方面的情况
例子:Weibull分布常用于生存数据的拟合,描述死亡人数的变化规律
因某病死亡的44名患者生存情况
下图来自《白话统计》
经过多个分布对上述数据的拟合,最终Weibull分布的拟合效果最佳,从而我们知道生存情况大致符合Weibull分布
由累积分布函数得到概率密度函数,从而更好反应死亡速度的变化
1.3 如何确定一个概率分布?
所有分布都有固定的形状,只要确定了相应的参数,我们就可以确定它的分布函数的样子,一旦数据上升为分布的层面,一切问题将变得简单
Weibull分布的形状由参数
λ
\lambda
λ反映曲线位置,参数
p
p
p控制曲线形状
下图来自《白话统计》