基于spss的多元统计分析 之 主成分分析(5/8)

news2024/11/15 7:10:39

实验目的:

1.掌握主成分分析的基本思想;

2.熟悉掌握SPSS软件进行主成分分析的基本操作;

3.利用实验指导的实例数据,上机熟悉主成分分析方法.

实验内容:

下表是我国2005年第1、2季度各地区城镇居民家庭收支基本情况的统计数据。根据这些数据进行主成分分析,并依据分析结果对地区城镇居民家庭收支情况进行排序和分类。

地区

平均每户人口(人)

平均每户就业人口(人)

平均每一就业者负担人数(人)

平均每人实际可支配收入(元)

平均每人消费性支出(元)

北京

2.9

1.6

1.8

8845.1

6249.3

天津

2.9

1.4

2

6189.1

4549.1

河北

2.9

1.5

1.9

4582.9

3317.3

山西

3

1.5

2

4359.7

3066.8

内蒙

2.9

1.5

1.9

4712.1

3557.8

辽宁

2.9

1.4

2

4501.2

3530.7

吉林

3

1.5

1.9

4293.7

3271.5

黑龙江

2.8

1.3

2.2

3902.3

2858.7

上海

3

1.6

1.9

9656.5

6623.3

江苏

2.9

1.4

2.1

6371.1

4222.1

浙江

2.8

1.4

1.9

8921.2

6127.5

安徽

3

1.6

1.9

4311.6

3121.4

福建

3.1

1.6

1.9

6471.8

4292.3

江西

2.9

1.5

1.9

4369.7

2945.1

山东

2.9

1.7

1.7

5357.7

3517.6

湖南

3

1.5

2

4558.5

3338.1

湖北

2.9

1.4

2.1

5010.7

3616.4

广东

3.3

1.7

1.9

7828.8

5941.7

广西

3

1.5

2

4876.8

3508.5

海南

3.6

1.6

2.3

4323

2975.4

重庆

3.1

1.6

1.9

5283.8

4187.8

四川

2.9

1.4

2

4333.5

3326.7

贵州

3.1

1.4

2.1

4177.4

3066.3

云南

3

1.3

2.2

4619.8

3415.4

西藏

3.4

1.7

2

4668.8

4467.1

陕西

3

1.5

2

4342.7

3186.6

甘肃

2.9

1.5

1.9

4031.8

3113.2

青海

3

1.3

2.3

3971.8

3070.3

宁夏

2.9

1.3

2.2

4078.3

3133.7

新疆

3

1.5

2.1

4018.4

3015.1

实验前预习:

主成分分析的基本思想;

SPSS软件进行主成分分析的基本操作;

程序测试、运行结果及分析:

主成分分析

(我国2005年第1、2季度各地区城镇居民家庭收支基本情况)

操作步骤:


  1. 录入数据:在变量视图将地区变量类型更改为字符串,其他类型为数字,再将题目数据复制粘贴到spss。
  1. 数据标准化:

 勾选“将标准化值另存为变量”


最后在数据视图得到新的标准化值数据列。

  1. 因子分析
将分析变量全部移入变量框,在相关性矩阵框中勾选系数和kmo检验

点击提取,方法选择为主成分,勾选碎石图。

最后点击继续和确定。

运行结果与分析:

KMO 和巴特利特检验

KMO 取样适切性量数。

.377

巴特利特球形度检验

近似卡方

149.179

自由度

10

显著性

.000

由KMO 和巴特利特检

  由KMO 和巴特利特检验p值小于0.05则表示有显著性,而KMO取样适切性量数。大于0.6比较适合,但其值为0.377所以数据不适合做主成分分析。

相关性矩阵

Zscore(平均每户人口(人))

Zscore(平均每户就业人口(人))

Zscore(平均每一就业者负担人数(人))

Zscore(平均每人实际可支配收入(元))

Zscore(平均每人消费性支出(元))

相关性

Zscore(平均每户人口(人))

1.000

.530

.244

-.051

.039

Zscore(平均每户就业人口(人))

.530

1.000

-.638

.322

.363

Zscore(平均每一就业者负担人数(人))

.244

-.638

1.000

-.437

-.425

Zscore(平均每人实际可支配收入(元))

-.051

.322

-.437

1.000

.969

Zscore(平均每人消费性支出(元))

.039

.363

-.425

.969

1.000

总方差解释

成分

初始特征值

提取载荷平方和

总计

方差百分比

累积 %

总计

方差百分比

累积 %

1

2.605

52.092

52.092

2.605

52.092

52.092

2

1.390

27.794

79.886

1.390

27.794

79.886

3

.937

18.746

98.631

4

.045

.896

99.528

5

.024

.472

100.000

提取方法:主成分分析法。

  显示提取的主成分,SPSS默认提取特征值大于1的主成分,本题提取了两个主成分其特征值分别为2.605和1.390。前两个主成分的贡献率分分别为52.092%和27.794%,累计贡献率不足80%,没有基本保留了原来指标的信息,假如其贡献率超过85%,这样就由原来的5个指标转化为2个新指标,起到了降维的作用。碎石图则展示了每组的特征值可以用于验证图表总方差检验的特征值是否造假。

成分矩阵a

成分

1

2

Zscore(平均每户人口(人))

.116

.933

Zscore(平均每户就业人口(人))

.707

.610

Zscore(平均每一就业者负担人数(人))

-.737

.137

Zscore(平均每人实际可支配收入(元))

.874

-.290

Zscore(平均每人消费性支出(元))

.886

-.209

提取方法:主成分分析法。

a. 提取了 2 个成分。

主成分得分公式为f=w1*x1+w2*x2+…+wn*xn其中wj=为主成分矩阵的值与该成分特征值(2.605和0.390)的开根值,代表权重。每个主成分矩阵的值都要除以该成分特征值的开根值得到主成分公式的系数。

再次输入成分矩阵的系数数据

通过spss转换功能进行计算w1和w2(主成分公式的系数)


最终的到主成分F1和F2的系数w1和w2

所以主成分方程为:

F1=0.072*x1 +0.438*x2-0.457*x3+0.542*x4 +0.549*x5

F2=0.791*x1+0.517*x2 +0.116*x3-0.246*x4-0.177*x5

综合得分为:(其系数来源于两个主成分对总体的贡献度)

F=0.521*F1+0.278*F2


然后通过spss计算F的具体数值

对最后F值进行排序,便可以对对应城市进行排序,最终得到如下城市排名:

城市

综合得分

排名

城市

综合得分

排名

广东

2.08

1

湖南

-0.17

16

上海

1.7

2

陕西

-0.23

17

北京

1.51

3

山西

-0.25

18

西藏

1.33

4

江西

-0.28

19

福建

0.91

5

甘肃

-0.29

20

山东

0.89

6

江苏

-0.34

21

重庆

0.73

7

新疆

-0.46

22

浙江

0.57

8

贵州

-0.59

23

海南

0.51

9

辽宁

-0.6

24

安徽

0.21

10

湖北

-0.65

25

吉林

-0.07

11

四川

-0.66

26

广西

-0.09

12

云南

-1.06

27

内蒙

-0.1

13

宁夏

-1.35

28

天津

-0.14

14

青海

-1.37

29

河北

-0.17

15

黑龙江

-1.58

30

讨论:

  • 主成分分析的应用

1、主成分分析能降低所研究的数据空间的维数。即用研究m维的Y空间代替p维的X空间(m <p),而低维的Y空间代替高维的x空间所损失的信息很少。

2、有时可通过因子负荷的结构,弄清X变量间的某些关系。

3、多维数据的一种图形表示方法。

4、由主成分分析法构造回归模型。把各主成分作为新自变量代替原来自变盈X做回归分析。

5、用主成分分析筛选回归变量。回归变量的选择有着重的实际意义,为了使模型本身易于做结构分析、控制和预报,好从原始变量所构成的子集合中选择最佳变量,构成最佳变量集合。用主成分分析筛选变量,可用较少的计算量来选择量,获得选择最佳变量子集合的效果。

  • 主成分得分公式的计算

主成分得分公式为f=w1*x1+w2*x2+…+wn*xn其中wj=为主成分矩阵的值与该成分特征值(2.605和0.390)的开根值,代表权重。每个主成分矩阵的值都要除以该成分特征值的开根值得到主成分公式的系数。

最后的综合得分为每个主成分与其对总体的贡献度百分比的乘积之和即(其系数来源于两个主成分对总体的贡献度)F=a1*F1+a2*F2+…+an*Fn对综合得分进行排序便可以对最终所对应的数据进行排名。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/673886.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C++篇】OOP中部分:继承和派生

友情链接&#xff1a;C/C系列系统学习目录 知识总结顺序参考C Primer Plus&#xff08;第六版&#xff09;和谭浩强老师的C程序设计&#xff08;第五版&#xff09;等&#xff0c;内容以书中为标准&#xff0c;同时参考其它各类书籍以及优质文章&#xff0c;以至减少知识点上的…

2023年05月份青少年软件编程Python等级考试试卷六级真题(含答案)

2023-05 Python六级真题 分数&#xff1a;100 题数&#xff1a;38 测试时长&#xff1a;60min 一、单选题(共25题&#xff0c;共50分) 1. 明明每天坚持背英语单词&#xff0c;他建立了英语单词错题本文件“mistakes.txt”&#xff0c;将每天记错的单词增加到该文件中&#x…

ROS:launch文件演示

目录 前言一、添加launch文件夹二、新建launch文件三、编辑launch内容四、 执行文件 前言 一个程序中可能需要启动多个节点&#xff0c;比如:ROS 内置的小乌龟案例&#xff0c;如果要控制乌龟运动&#xff0c;要启动多个窗口&#xff0c;分别启动 roscore、乌龟界面节点、键盘…

【数据分享】1929-2022年全球站点的逐日降雪深度数据(Shp\Excel\12000个站点)

气象数据是在各项研究中都经常使用的数据&#xff0c;气象指标包括气温、风速、降水、能见度等指标&#xff0c;说到气象数据&#xff0c;最详细的气象数据是具体到气象监测站点的数据&#xff01; 对于具体到监测站点的气象数据&#xff0c;之前我们分享过1929-2022年全球气象…

感应电动机起动动态计算(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

#家庭网络配置(华为路由与交换机)

#家庭网络配置 #三层交换机配置 #打开HDCP功能 #进入系统视图 <Huawei>system-view #关闭系统提示信息 [Huawei]undo info-center enable #打开DHCP 使能 [Huawei]dhcp enable #创建vlan 10 vlan 20 vlan 2 [Huawei]vlan batch 2 10 20 #进入 vlan 并配置ip 与 dhcp […

【机器学习】十大算法之一 “神经网络”

作者主页&#xff1a;爱笑的男孩。的博客_CSDN博客-深度学习,活动,python领域博主爱笑的男孩。擅长深度学习,活动,python,等方面的知识,爱笑的男孩。关注算法,python,计算机视觉,图像处理,深度学习,pytorch,神经网络,opencv领域.https://blog.csdn.net/Code_and516?typeblog个…

使用Postman模拟文件上传和下载

介绍 Postman是一款强大的HTTP请求模拟工具&#xff0c;它可以帮我们在没有前端界面的情况下模拟发送HTTP请求&#xff0c;非常适合API开发和测试。在本篇文章中&#xff0c;我将向你展示如何使用Postman进行文件的上传和下载。 文件上传 启动Postman&#xff0c;点击“新建请…

Linux的基础操作

0.前言 您好&#xff0c;这里是limou3434的一篇关于Linux基础操作的博文。感兴趣的话&#xff0c;可以看看我的其他博文系列。本次我给您带来的是Linux下的几个基础命令&#xff0c;学会这些命令您就可以开始在Linux管理和操作一些文件了。 注意&#xff1a;本次演示环境是在…

【HTML】常用标签

文章目录 1.标题字标签h1-h62.段落标签p3.换行标签br4.格式化标签5.图片标签6.超链接标签a7.表格标签单元格合并行合并列合并 8.无序列表9.有序列表10.自定义列表11.表单标签11.1 form标签11.2 表单控件11.2.1 input标签11.2.2 label标签11.2.3 select标签11.2.4 textarea标签 …

2023年为什么你需要学习GPU?

2023年为什么你需要学习GPU&#xff1f;掌握这一绝对重要的技能&#xff0c;开启你的未来之旅&#xff01; 亲爱的朋友们&#xff0c;时光飞逝&#xff0c;2023年已经悄然而至。在这个充满机遇和挑战的数字时代&#xff0c;学习GPU成为了你无法忽视的重要任务。为什么呢&#x…

《大话设计模式》笔记

1. 简单工厂模式 1.1 面向对象的好处 考虑通过封装、继承、多态把程序的耦合度降低&#xff0c;使用设计模式使得程序更加的灵活&#xff0c;容易修改&#xff0c;并且易于复用。 1.2 复制 Vs 复用 有人说初级程序员的工作就是 CtrlC 和 CtrlV&#xff0c;这其实是非常不好…

通过僵尸扫描判断目标主机端口开放状态

环境准备 使用scapy工具发包 攻击主机IP: 192.168.133.66 僵尸主机IP: 192.168.133.67 &#xff0c;僵尸主机不主动与任何机器通信&#xff0c;且满足IP数据包ID自增** 注&#xff1a;用nmap 判断主机是否满足僵尸主机条件&#xff0c;一般早期的windwos XP系统IP数据包ID…

MySQL优化--主从同步,分库分表

目录 MySQL主从同步原理 MySQL主从复制的核心就是二进制日志 面试回答 分库分表 分库分表的时机 分库分表的策略 垂直分库 垂直分表 水平分库 水平分表 分库分表的策略 分库之后的问题 面试回答 MySQL主从同步原理 如果项目上线了&#xff0c;通常情况下&#xf…

【Python开发】FastAPI 11:构建多文件应用

以往的文件都是将对外接口写在一个文件里边&#xff0c;而作为应用来说&#xff0c;接口是不可避免分散到多个文件中的&#xff0c;比如某文件负责注册登录模块&#xff0c;某文件负责内管模块&#xff0c;某文件负责业务模块等。FastAPI 也提供了APIRouter 这一工具来进行灵活…

kafka消息队列的初步探索

消息队列的作用就是提高运行速度&#xff0c;防止线程堵塞。 kafka的作用 异步 通过在消息队列发送消息的方式&#xff0c;将对应的业务作为监听者&#xff0c;此时我们只需要考虑发送消息的时间即可&#xff0c;大大提高了运行的速度。 解耦 如果使用原来的直接调用对应业务的…

【libdatachannel】pycharm运行streamer的信令服务及streamer与js客户端联调

启动py服务器 ssl必须额外指定 # Usage: ./server.py [[host:]port] [SSL certificate file]文档给出了服务的启动命令&#xff1a; python3 -m http.server --bind 127.0.0.1 8080 直接运行&#xff1a; python的信令服务 #!/usr/bin/env python # # Python signaling server…

需求分析引言:架构漫谈(二)非功能性需求

上一篇文章&#xff0c;简要介绍了架构的概念和架构设计流程&#xff0c;并简单介绍了需求分析的内容&#xff0c; 并在最后指出&#xff1a;需求分析的产出物&#xff0c;要包括非功能性需求&#xff0c;常见的非功能性需求如下&#xff1a; 完成任务的速度结果的精度操作的安…

MySQL实战解析底层---为什么表数据删掉一半,表文件大小不变

目录 前言 参数innodb_file_per_table 数据删除流程 重建表 Online 和 inplace 前言 数据库占用空间太大&#xff0c;我把一个最大的表删掉了一半的数据&#xff0c;怎么表文件的大小还是没变&#xff1f;这与数据库表的空间回收有关这里还是针对MySQL中应用最广泛的InnoD…

结构型设计模式07-享元模式

&#x1f9d1;‍&#x1f4bb;作者&#xff1a;猫十二懿 ❤️‍&#x1f525;账号&#xff1a;CSDN 、掘金 、个人博客 、Github &#x1f389;公众号&#xff1a;猫十二懿 享元模式 1、享元模式介绍 享元模式是一种结构型设计模式&#xff0c;旨在**通过共享对象来减少内存使…