一、相关分析
相关分析:
衡量事物之间或称变量之间线性相关的强弱,并适当的统计指标表示出来的过程
相关系数:
连续变量的相关分析:
- 连续变量即数据变量,它的取值之间可以比较大小,可以用加减法计算出差异的大小。
- 当两个变量都是正态连续变量,而且两者之间呈线性关系。通常选用Pearson相关系数来衡量
等级变量的相关分析:
当测量得到的数据不是等距或等比数据,而是具有等级顺序的数据;或者得到的数据是等距或等比数据,但其所来自的总体分布不是正态的,不满足皮尔森相关系数(积差相关)的要求。
质量相关分析:
质量相关是指一个变量为质,另一个变量为量,这两个变量之间的相关。
质与量的相关主要包括二列相关、点二列相关、多系列相关
偏相关分析:
偏相关系数的性质:
- 偏相关系数分布的范围再-1到1之间
- 偏相关系数的绝对值越大,表示其偏相关程度越大
- 偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数
二、方差分析
方差比较的基本思想:
- 比较两类误差,以检验均值是否相等
- 比较的基础是方差化
随机误差:
- 因素的同一水平(总体)下,样本各观察值之间的差异
- 比如,同一行业不同企业呗投诉次数是不同的
- 这种差异可以看成是随机因素的影响,成为随机误差
系统误差:
- 因素的同一水平(总体)下,样本各观察值之间的差异
- 比如,同一行业不同企业呗投诉次数是不同的
- 这种差异可能是由于抽样的随机性所造成的,也可能是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,成为系统误差
单因素方差分析:
SST = SSA + SSE
SST反映数据总的误差程度;SSE反映随机误差的大小;SSA反映随机误差和系统误差的大小
方差分析中的多重比较:
多因素方差分析: