主成分分析是一种降维(去除噪声和不重要信息)方法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关。
适用性:当研究的问题涉及到多变量且变量之间存在很强的相关性。
问题的提出:用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息。
主成分分析法就是把原来多个变量划分为少数几个综合指标的一种统计分析方法。
主城分析法的目的:数据的压缩;数据的解释
PCA的计算步骤 :
论文中可以将上述特征值,特征向量,贡献率等值进行展示
主成分分析说明:主成分的解释其含义(加在论文中)一般多少带点模糊性,不像原始变量你那么清楚。确切,这是变量降维过程中不得不付出的代价。主成分分析的困难之处主要在于要能够给出主成分的较好解释,所提取额主成分中如有一个主成分解释不了,整个主成分分析也就失败了。
该方法取得成功:一是靠原始变量的合理选取,二是靠“运气”。
MATLAB:
主成分分析的滥用:主成分得分
主成分分析用于聚类
主成分回归可用于解决多重共线性问题(逐步回归也可以)