本篇的思维导图:
数据的分散趋势
数据的分散趋势是用来刻画数值型变量偏离中心的程度,最为常用的分散趋势指标有标准差、极差、四分位差等。通过这些指标可以反映样本之间的差异大小,如果指标值越大,说明样本之间差异越明显,反之差异越小。
方差与标准差
方差的计算体现在两个步骤:一是计算数值型变量的样本值xi与其算术平均值μ的差的平方(体现各样本与中心的偏离);二是在平方的基础上计算平均水平(体现偏离程度的中心化)。标准差则是方差的二次方根,在实际应用中,往往更偏向于标准差。关于方差与标准差的计算公式如下: