本篇的思维导图:
探索性数据分析:数据的描述
数据的描述是为了让数据使用者或开发者更加了解数据,进而做到“心中有数”,其描述过程侧重于统计运算和统计绘图。通过统计运算可以得到具体的数据特征,如反映集中趋势中的均值水平、中位数、分位数和众数等;反映分散趋势的方差、极差、四分位差和变异系数等。通过统计绘图可以得到直观的数据规律和知识,如利用直方图发现数据的分布形态,利用散点图得出变量之间的相关关系以及利用折线图呈现数据在时间维度上的波动趋势等。
数据的集中趋势
数据的集中趋势也称为中心趋势,反应的是数据的中心代表值,最为典型的中心代表值为平均值,因为在一个数据向量中,所有的元素都以平均值为中心做上下波动。当然,除了平均值还有其他常用的代表值,如中位数、分位数和众数等。