实验目的: 1.掌握主成分分析的基本思想; 2.熟悉掌握SPSS软件进行主成分分析的基本操作; 3.利用实验指导的实例数据,上机熟悉主成分分析方法. 实验内容: 下表是我国2005年第1、2季度各地区城镇居民家庭收支基本情况的统计数据。根据这些数据进行主成分分析,并依据分析结果对地区城镇居民家庭收支情况进行排序和分类。
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
实验前预习: 主成分分析的基本思想; SPSS软件进行主成分分析的基本操作; | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
程序测试、运行结果及分析: 主成分分析 (我国2005年第1、2季度各地区城镇居民家庭收支基本情况) 操作步骤:
勾选“将标准化值另存为变量”
点击提取,方法选择为主成分,勾选碎石图。 最后点击继续和确定。 运行结果与分析:
由KMO 和巴特利特检 由KMO 和巴特利特检验p值小于0.05则表示有显著性,而KMO取样适切性量数。大于0.6比较适合,但其值为0.377所以数据不适合做主成分分析。
主成分得分公式为f=w1*x1+w2*x2+…+wn*xn其中wj=为主成分矩阵的值与该成分特征值(2.605和0.390)的开根值,代表权重。每个主成分矩阵的值都要除以该成分特征值的开根值得到主成分公式的系数。 再次输入成分矩阵的系数数据 通过spss转换功能进行计算w1和w2(主成分公式的系数)最终的到主成分F1和F2的系数w1和w2 所以主成分方程为: F1=0.072*x1 +0.438*x2-0.457*x3+0.542*x4 +0.549*x5 F2=0.791*x1+0.517*x2 +0.116*x3-0.246*x4-0.177*x5 综合得分为:(其系数来源于两个主成分对总体的贡献度) F=0.521*F1+0.278*F2 然后通过spss计算F的具体数值 对最后F值进行排序,便可以对对应城市进行排序,最终得到如下城市排名:
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
讨论:
1、主成分分析能降低所研究的数据空间的维数。即用研究m维的Y空间代替p维的X空间(m <p),而低维的Y空间代替高维的x空间所损失的信息很少。 2、有时可通过因子负荷的结构,弄清X变量间的某些关系。 3、多维数据的一种图形表示方法。 4、由主成分分析法构造回归模型。把各主成分作为新自变量代替原来自变盈X做回归分析。 5、用主成分分析筛选回归变量。回归变量的选择有着重的实际意义,为了使模型本身易于做结构分析、控制和预报,好从原始变量所构成的子集合中选择最佳变量,构成最佳变量集合。用主成分分析筛选变量,可用较少的计算量来选择量,获得选择最佳变量子集合的效果。
主成分得分公式为f=w1*x1+w2*x2+…+wn*xn其中wj=为主成分矩阵的值与该成分特征值(2.605和0.390)的开根值,代表权重。每个主成分矩阵的值都要除以该成分特征值的开根值得到主成分公式的系数。 最后的综合得分为每个主成分与其对总体的贡献度百分比的乘积之和即(其系数来源于两个主成分对总体的贡献度)F=a1*F1+a2*F2+…+an*Fn对综合得分进行排序便可以对最终所对应的数据进行排名。 |