Matlab 主成分分析法

news2024/11/15 2:07:09

主成分分析

本文将介绍主成分分析(PCA),主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。 一般来说,当研究的问题涉及到多变量且变量之间存在很强的相关性时,我们可考虑使用主成分分析的方法来对数据进行简化。

一、主成分分析简介

主成分分析是一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关。这种将把多个变量化为少数几个互相无关的综合变量的统计分析方法就叫做主成分分析。

二、主成分分析的思想

数学降维

在这里插入图片描述

三、主成分分析的计算步骤

  1. 对原始数据进行标准化处理
  2. 计算标准化样本的协方差矩阵R
  3. 计算R的特征值和特征向量
  4. ·计算主成分贡献率以及累计贡献率
  5. 写出主成分表达式
  6. 根据系数分析主成分代表的意义(很重要,就是解释主成分变量的意义和作用)
  7. 利用主成分的结果进行后续的分析
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

在这里插入图片描述

四、案例分析

通过excel或者提供的数据进行导入,建立矩阵x,然后标准化矩阵X,接下来的实验都是对标准化矩阵进行的操作。

 R = corrcoef(x);% 计算样本相关系数矩阵R 

在这里插入图片描述
在这里插入图片描述

code

在这里插入图片描述

clear;clc
 load data1.mat   % 主成分聚类
%  load data2.mat   % 主成分回归

% 注意,这里可以对数据先进行描述性统计
% 描述性统计的内容见第5讲.相关系数
[n,p] = size(x);  % n是样本个数,p是指标个数

%% 第一步:对数据x标准化为X
X=zscore(x);   % matlab内置的标准化函数(x-mean(x))/std(x)

%% 第二步:计算样本协方差矩阵
R = cov(X);

%% 注意:以上两步可合并为下面一步:直接计算样本相关系数矩阵
R = corrcoef(x);
disp('样本相关系数矩阵为:')
disp(R)

%% 第三步:计算R的特征值和特征向量
% 注意:R是半正定矩阵,所以其特征值不为负数
% R同时是对称矩阵,Matlab计算对称矩阵时,会将特征值按照从小到大排列哦
% eig函数 特征值,特征向量
[V,D] = eig(R);  % V 特征向量矩阵  D 特征值构成的对角矩阵


%% 第四步:计算主成分贡献率和累计贡献率
lambda = diag(D);  % diag函数用于得到一个矩阵的主对角线元素值(返回的是列向量)
lambda = lambda(end:-1:1);  % 因为lambda向量是从小大到排序的,我们将其调个头
contribution_rate = lambda / sum(lambda);  % 计算贡献率
cum_contribution_rate = cumsum(lambda)/ sum(lambda);   % 计算累计贡献率  cumsum是求累加值的函数
disp('特征值为:')
disp(lambda')  % 转置为行向量,方便展示
disp('贡献率为:')
disp(contribution_rate')
disp('累计贡献率为:')
disp(cum_contribution_rate')
disp('与特征值对应的特征向量矩阵为:')
% 注意:这里的特征向量要和特征值一一对应,之前特征值相当于颠倒过来了,因此特征向量的各列需要颠倒过来
%  rot90函数可以使一个矩阵逆时针旋转90度,然后再转置,就可以实现将矩阵的列颠倒的效果
V=rot90(V)';
disp(V)


%% 计算我们所需要的主成分的值
m =input('请输入需要保存的主成分的个数:  ');
F = zeros(n,m);  %初始化保存主成分的矩阵(每一列是一个主成分)
for i = 1:m
    ai = V(:,i)';   % 将第i个特征向量取出,并转置为行向量
    Ai = repmat(ai,n,1);   % 将这个行向量重复n次,构成一个n*p的矩阵
    F(:, i) = sum(Ai .* X, 2);  % 注意,对标准化的数据求了权重后要计算每一行的和
end

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/697820.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于SpringBoot+vue的职称评审管理系统设计与实现

博主介绍: 大家好,我是一名在Java圈混迹十余年的程序员,精通Java编程语言,同时也熟练掌握微信小程序、Python和Android等技术,能够为大家提供全方位的技术支持和交流。 我擅长在JavaWeb、SSH、SSM、SpringBoot等框架…

钳式高频电流探头测量电流和提高灵敏度的方法

高频电流探头是一款可以同时测量直流和交流的高频电流探头。高频电流探头采用先进的磁电传感器,通过测试电流所产生的磁场信号实现对电流信号的准确测量,产品坚固耐用,能够大大减少了操作难度,提高测量的准确性。 为了测量数据准确…

Python笔记-1

Python安装问题 1.python是一门解释性的计算机程序语言。 2.IDLE就是我们写Python程序的地方(小型的集成开发环境,编辑器)。 3.Pycharm是一个大型的集成开发环境(IDLE的扩展,不仅可以写,还能管理、调试&am…

树莓派安装DoraClient,连接DoraCloud云桌面

Raspberry Pi(树莓派) 是为学习计算机编程教育而设计的只有信用卡大小的微型电脑,自问世以来受众多计算机发烧友和创客的追捧,曾经一“派”难求。 DoraCloud是一款多平台的桌面虚拟化管理软件,支持Hyper-V、VMware、P…

Dell Precision 系列工作站指示灯故障诊断参考指南

Dell Precision工作站上用于诊断启动过程中“无法开机自检”故障的各种方法的参考指南 Dell Precision 工作站系统一直以来都有内置诊断指示灯。这些可能是蜂鸣音、显示不同状态和颜色的电源按钮、特定的诊断 LED 指示灯或它们的组合,以便指示在开机自检 &#xff…

Zookeeper集群的特点

一、Zookeeper集群的特点 Zookeeper:一个领导者 (Leader),多个跟随者 (Follower) 组成的集群集群中只要有半数以上节点存活,Zookeeper集群就能正常服务。所以Zookeeper适合安装奇数台服务器全局数据一致:每个Server保存一份相同的数据副本,C…

vue拿到下拉框el-select的选择项的value和label

此场景分为两种情况 1.单独一个下拉框时 2.el-table每行数据都有下拉框时 这里只介绍第 2 种情况,方法都是一样的 思路: 1.首先选择下拉框事件拿到选择的这行数据scope.row 2.其次去遍历绑定的下拉框数据,使用find(&#xff0…

VS中显示矩阵的每个值

VS矩阵值显示 https://github.com/cdcseacave/Visual-Studio-Visualizers#readme 终端中打开输入: git clone https://github.com/cdcseacave/Visual-Studio-Visualizers.git将上面的网址内容下载

PMP考试核心知识点100条汇总(3)

21、项目章程作用 正式宣布项目的存在。 正式任命项目经理,授权其使用组织的资源开展项目活动。 项目章程是由管理层签发的,项目经理是项目章程的执行者。 项目章程所规定的应该是一些比较大的、原则性的问题,通常不会因项目变更而需要对项目…

git常用命令之Merge

5. Merge 场景1:本地分支间合并 命令作用延展阅读git merge dev在master分支执行该命令,则把dev分支内容merge到master分支上自证 场景2:远程release分支合并到本地dev分支 命令作用延展阅读方式1:最省事方式1. git checkout …

C语言-基础语法学习-2 一级指针

目录 指针 C语言指针笔记用指针指向一块地址指针变量指向数组指针变量和常量指针函数指针注意事项 指针 基本概念 指针定义:使用符号声明指针变量,例如int * ptr;。 指针初始化:指针变量可以通过赋值操作初始化为某个变量的地址,…

让你的pytest日志更有序:配置和使用技巧

简介:pytest是一个成熟的全功能的Python测试工具,它覆盖了所有大小和级别的测试需求。从简单的单元测试到复杂的功能测试,都能得心应手。本文将重点介绍如何配置pytest以捕获和存储日志,让你的测试日志更有序。 历史攻略&#xf…

微信小程序页面导航

1.声明式导航 1.1声明式跳转Tab页面 1.1.1配置的Tab页面 1.1.2页面跳转书写 <navigator url"/pages/home/home" open-type"switchTab">跳转首页</navigator> 1.2.3页面展示 1.2声明式跳转到非Tab页面 1.2.1页面跳转代码 <navigator ur…

mediaSoup编译流程(ubuntu20.04不用翻墙,以及踩坑记录)

ubuntu20.04&#xff0c;一定要确保能够ping通github.com因为我们有很多依赖包需要从上面下载 首先安装node.js >16版本 sudo apt-get update curl -sL https://deb.nodesource.com/setup_16.x | sudo -E bash - sudo apt-get install -y nodejs 为node换源 查看node…

数学建模—层次分析法

数模算法1&#xff1a;层次分析法 适用问题&#xff1a;评价类问题&#xff0c;决策&#xff08;方案选择类&#xff09; ** input**&#xff1a;判断矩阵&#xff08;A&#xff09; AHP处理 output:权重&#xff08;得分&#xff09;向量 1.整体导图 2.算法步骤及代码 2.1算…

从关键新闻和最新技术看AI行业发展(2023.5.22-6.22第一期) |【WeThinkIn老实人报】

Rocky Ding WeThinkIn 写在前面 【WeThinkIn老实人报】是WeThinkIn的全新栏目&#xff0c;旨在整理&挖掘AI行业的关键新闻和最新技术&#xff0c;同时Rocky会对这些关键信息进行解读&#xff0c;力求让读者们能从容跟随AI科技潮流。也欢迎大家提出宝贵的优化建议&#xff0…

Git:Rebase和Merge之间的区别

一、merge merge的原理是找到这两个分支的祖先commit&#xff0c;在两个分支最新的commit进行三方对比合并 例如下图&#xff0c;共同的祖先commit2,master最新commit6&#xff0c;develop最新commit5&#xff0c;merge会基于2&#xff0c;5&#xff0c;6这三个commit进行对比&…

多模态信息融合研究

1、主要研究方向 多模态学习可以划分为以下五个研究方向&#xff1a; 多模态表示学习 Multimodal Representation&#xff1a;主要研究如何将多模态的数据所蕴含的语义信息通过embedding的方式实现向量化&#xff0c;便于后续的计算&#xff1b; 模态转化 Translation&#…

BN层的参数γ、β以及前、后向传播

γ、β 存在问题 在对输入做完标准化后&#xff0c;可能会出现以下情况&#xff1a;网络中间某一层学习到特征数据本身分布在sigmoid激活函数的两侧&#xff0c;标准化会强制把输入的均值限制为0、标准差限制为1&#xff0c;这样就把数据变换成分布在sigmoid激活函数的中间部…

补充python部分细节性知识点

未完&#xff0c;持续更新中。。。 一、数据类型 1.浮点型&#xff1a;float 使用浮点型的变量相加之后可能会存在值不准确的问题&#xff0c;可以考虑引入decimal模块,decimal其实也是一种数据类型&#xff0c;是十进制的数据类型&#xff0c;实际上就是将flaot类型进行一次…