累积分布函数(CDF)有什么意义?
参考文献:姜咏梅. 浅析分布函数的意义与应用[J]. 科学与财富,2014(10):207-207,208. DOI:10.3969/j.issn.1671-2226.2014.10.183.
关于PMF、PDF、CDF的介绍,移步至我的笔记:概率质量函数(PMF)、概率密度函数(PDF)、累积分布函数(CDF)
为什么要引入CDF?
文献中提到一句话:概率质量函数PMF(分布律)不能描述连续型随机变量,概率密度函数PDF不能描述离散型随机变量,为了用一个统一的方式既可以描述离散型随机变量又可以描述连续型随机变量,由此引入累积分布函数。
下图是阅读文献时的旁批
PMF和PDF关心的是随机变量取某个值的概率。
PMF描述离散型随机变量,可以直接得到具体取到某个值的概率
PDF描述连续型随机变量,关于如何处理连续值的概率问题,这里有个悖论(详见如何处理连续值的概率问题?(概率密度))为解决此悖论,最终选取了概率密度作为纵轴,这时曲线下面积则代表取到某值的概率
CDF关心的是随机变量落入某个范围的概率。
现实中我们通常关心随机变量落入某个区间内的概率,比如世界上18岁的人身高在小于等于180这个范围内的概率是多少?我们不关心具体的数字,而是关心其占比。
下图来自所提文献
笔者随意列举的例子
下图中的例子引用自:怎样通俗地理解分布函数?