对应分析介绍及SPSS案例分析

news2024/11/25 22:47:05

在开展统计分析的过程中,分类变量(定序和定类变量)是我们研究的一个重点。通常我们分析分类变量间关系时,最常用的分析方法是卡方检验,其次是逻辑回归和对数线性模型等。

如果类别变量的分类较少,我们可以通过卡方检验判断行变量和列变量间是否相互独立,同时还可以通过查看列联表或进行进行事后两两比较,判断各变量的不同组别间具体存在怎样的差异

 

但如果涉及的分类变量较多时,卡方检验能给的信息就很有限了,它并不能告诉我们两个变量之间具体存在怎样的联系。而逻辑回归方法和对数线性模型等方法的操作和解释相对比较复杂,学起来比较让人头疼。所以今天我想向大家介绍对应分析方法。

对应分析方法又称相应分析,它善于展示两个/多个分类变量各类间的关系,能够将交叉列联表的数据信息转化为二维散点图,直观、简单的描述庞杂的列联表数据中所蕴含的对应关系。

它是于1970年由法国统计学家J.P.Beozecri提出来的,起初在法国和日本最为流行,后来引入到美国,是在R型和Q型因子分析基础上发展起来的一种多元统计方法。

简单对应分析是分析某一研究事件两个分类变量间的关系,其基本思想以点的形式在较低纬的空间中表示列联表的行和列中各元素的比例结构,可以在二维空间更加直观的通过空间距离反映两个分类变量间的关系。属于分类变量的典型相关分析。

Fisher在1940采集了5387名苏格兰人的眼睛和头发颜色数据,并利用对应分析方法分析了眼睛颜色和头发之间是否存在显著关系,这是利用对应分析方法开展的经典案例。有关这个案例的分享很多,感兴趣的读者可以到网上搜索查看。



 

案例数据集介绍

接下来我将用SPSS中的自带数据集coffee.sav向大家介绍对应分析方法。

研究者收集了4662份有关6个冰咖啡品牌与23张感知图像的数据,其中6个品牌分别表示为AA、BB、CC、DD、EE和FF,23张感知图像表示的是不同的形象特征。研究者希望知道这6个冰咖啡品牌和23种感知图像之间是否存在何种联系,即不同的冰咖啡品牌是否更倾向于某种品牌形象。

打开数据集:

选择文件 -> “欢迎”对话框(SPSS25及以上版本),在欢迎对话框中选择样本文件, 选择coffee.sav,选择打开。SPSS会自动打开这份数据文件。

.

 

该数据集的部分数据截图如下所示:

 



 

数据分析1:个案加权

当涉及到分类变量的频数分析时,一般都需要对数据进行加权处理。(扩展阅读:加权到底是怎么回事儿?

在本案例中,频率变量记录了不同品牌与不同图像属性相关的频数,因此我们需要对频率变量进行加权。

加权操作步骤:选择菜单数据 ->个案加权,将频率变量拖入频率变量,点击确定。对话框如下图所示:

 




 

数据分析2:卡方检验

因为对应分析不能用于相关关系的假设检验,所以在开展对应分析之间需要先对数据进行卡方检验,判断行变量和列变量之间是否独立。只有两变量之间存在显著联系,才能开展下一步的对应分析。

卡方检验操作步骤:选择菜单分析 -> 描述统计  -> 交叉表,将图像品牌变量分别放入行列对话框;点击统计按钮,在统计复选框中勾选卡方,点击继续,点击确定。对话框如下图所示:

 

得到的分析结果如下:

 

从上方的卡方检验分析表来看,卡方值为3746.968,P值=0.000(<0.05),说明图像和品牌变量之间存在显著关联。

但究竟存在怎样的关联呢?卡方检验不能给我们答案,接下来,我们需要采用更复杂的对应分析方法才能得到进一步的分析结果。

数据分析3:对应分析

对应分析的操作步骤1

选择菜单分析 -> 降维  -> 对应分析,将图像品牌变量分别选入行和列;

 

对应分析的操作步骤2

在相应的行和列下面定义范围,根据选取的变量分别填入最小值和最大值;其中图像变量的定义范围是1~23,品牌变量的定义范围是1~6;

 

对应分析的操作步骤3

点击模型按钮,进入模型复选框;对话框如下图所示:

 

解的维数:相当于因子分析和主成分分析中的维数,通常默认为2,也可以根据累计方差(一般大于85%即可)来选择;
距离度量:像本案例中的分类变量一般都选择“卡方”,而数值变量则选择“欧式距离”;
标准化方法:选择“除去行列平均值“;

标准化方法:

a:除去行列平均值:行和列均中心标准化;

b:除去行平均值:对行中心标准化;

c:除去列平均值:对列中心标准化; 

d:使行总计相等,并除去平均值:使行的边际相等,对行中心化;

e:使列总计相等,并除去平均值:使列的边际相等,对列中心化;

正态化方法:选择默认值“对称”;

正态化方法: 

a:对称法:适用于行列变量间有相关关系; 

b:行(列)主成分:适用于行(列)变量间有一定的差别; 

c:主成分法:既考虑行,也考虑到列;

对应分析的操作步骤4

点击统计按钮,进入统计复选框,勾选前3个选项即可:

 

统计量: 

a:对应表:生成行列对应表; b:行点概述:行变量的因子分析表; c:列点概述:列变量的因子分析表;d:对应表的排列:研究一定维数的对应表(此处的维数应小于对应表中的最大维数);e:行概要:行变量的频数分布表; f:列概要:列变量的频数分布表; g:置信统计量:显示在95%置信区间下的统计量。

对应分析的操作步骤5

点击按钮,进入图形复选框,选择如下默认选项即可:

 

图形复选框:

a:双标图(必选):可以在双坐标轴上,同时展示行列变量在坐标系中的距离关系; b:行(列)点:行(列)变量的散点图; c:标识标签宽度:为≤20的整数; d:折线图(通常不选):已转换的行(列)类别是指由行(列)的因子构成的折线图;e:图维数直接选择默认选项“显示解中的所有的维”即可; f:限制维数:最低维数通常设定为1,最高维数设定为总体样本量-1;

上述5步均设置完成后,点击继续,点击确定,即可得到对应分析结果,其中主要包括6个图表。

分析结果解析

(1)信用表

 

对应分析结果中首先会输出该模块的版权信息,说明该模块是由荷兰的了Leiden大学Leiden SPSS课题组编制的。这部分信息与我们的分析结果无关,可以忽略。

(2)交叉列联表

 

上表是图像变量和品牌变量组成的交叉列联表,交叉单元格内的数值代表频数,在之前的卡方检验环节也有输出。

对应分析后续的计算完全是基于该交叉列联表展开,所以它在分析环节十分重要。

不过这个列联表呈现的数字信息较多,阅读效果并不直观,我们没有必要对它花太多时间,稍加浏览无异常值即可。

 

上表是对应分析的结果汇总表。在对应分析中,最多可提取的维数等于两变量最小类别数-1。但往往前2~3个维度就携带了绝大多数的信息,因此可以只对前几个维度进行观察。

在本案例中,变量的最小类别数是6,所以摘要表中提取了5个维数。前3个维数的累积携带了91.3%的原始信息量,即已经携带了绝大部分的信息,因此我们只需要对前3个维度进行进一步考察。

最后一行显示的是上方交叉列联表的卡方检验结果,这部分与我们之前单独开展的卡方检验结果一样,说明品牌变量和图像变量之间存在显著关联,使对应分析结果有实际意义。

(4)行(列)点总览

 

上面的两个表是行变量和列变量各类别的分析结果概况,由于各类别均以散点的形式在空间中呈现,故称行/列点总览。表中主要给出各类别在各维度上的评分,以及相应的贡献量两大类信息。

 

以上面的“列点总览表”为例:

数量”实际上就是指各类别的构成比,如:品牌AA占总数的构成比是21.7%,以此类推。构成比越高,说明越不易受个别极端样本值的影响。

“维得分”给出了各类别在相关维度上的评分,如:品牌AA在二维空间中的坐标值是(-0.782,-0.073),依次类推,根据坐标值能得到最终的对应分析散点图。

然后给出“惯量”在列变量中的分解情况,它反映了总惯量(0.804)中分别由各列变量类别提供的部分,数值越大,说明该类别对惯量的贡献越大,此处贡献最大的是品牌CC。

贡献”给出在各维度上信息量在各类别间的分解情况。“点对维的惯量表示分类变量中每个类别对维度的贡献,如:本例中可见第1维度的信息主要被CC、DD这2个品牌所携带,说明这2个类别在第1维度上表现较好;第2维度的信息主要被EE、FF这2个品牌所携带,说明这2个类别在第2维度上表现较好

维对点的惯量”正好相反,表示每个类别信息分别在两个维度的比例,例如品牌AA的信息在第1个维度中占74.4%,在第2个维度只有0.4%。

(5)对应分析散点图

 

在上图的对应分析散点图中,分别向X轴和Y轴加入参考线,两条参考线相交于原点(0,0),原点表示没有任何倾向,没有任何关联的一个中心位置。

散点图显示“新鲜的”和“丑的”都非常接近原点;在散点图的左上角,“强悍”、“男人”、“工作的”靠得较近;左下角是“甜的”、“肥的”、“孩子”、“优质的”靠得较近;“健康”、“低脂”、“营养”、“新的”集中在散点图的右侧。

 

左上角的品牌EE所展示的品牌联想多与男性、强硬,工作相关;AA品牌是最受欢迎的,也被认为是咖啡因含量最高的;BB和FF品牌让人更多的联想到“甜的”、“优质的”、“使人发胖的”等关键词;CC和DD品牌虽然被认为是新的和健康的,但也是最不受欢迎的。

同时,为了进一步的解释,我还在散点图上绘制了一条经过原点的斜45°的直线。你会发现这条线穿过了男性形象和雅皮士这两个属性,而且男性品牌的联想模式与雅皮士品牌的联想模式相互对立。也就是说,“强硬的”、“男人”最常与EE品牌相关,最少与CC品牌相关,而雅皮士最常与CC品牌相关,最少与EE品牌相关。

通过上述的对应分析散点图,我们就可以非常直观而简明的得到品牌与图像之间的关联特征。


对应分析の注意事项

  1. 对应分析不能用于相关关系的假设检验。它虽然可以揭示变量间的联系,但仍然只是一种统计描述方法,不能说明两个变量之间的联系是否显著,因而在做对应分析之前,可以用卡方统计量检验两个变量的是否独立。
  2. 对应分析输出的图形通常是二维的,这是一种降维的方法,将原始的高维数据按一定规则投影到二维图形上。而投影可能引起部分信息的丢失。
  3. 对极端值敏感,应尽量避免极端值的存在。如有取值为零的数据存在时,可视情况将相邻的两个状态取值合并。对于小样本不推荐使用。
  4. 原始数据的无纲量化处理。运用对应分析法处理问题时,各变量应具有相同的量纲(或者均无量纲)。
  5. 无法自动判断最佳维度数,所需维度数需要研究者根据专业知识自行决定。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/881644.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Mac平台最佳PDF编辑软件,Qoppa PDF Studio Pro助您实现PDF文件的完美编辑

Qoppa PDF Studio Pro是一款功能强大的PDF编辑软件,现已推出Mac版本!无论是个人用户还是企业用户,都能够从中受益。 Qoppa PDF Studio Pro为用户提供了一系列丰富的编辑工具,可以轻松地对PDF文件进行编辑、注释和标记。 用户可以…

概述、搭建Redis服务器、部署LNP+Redis、创建Redis集群、连接集群、集群工作原理

Top NSD DBA DAY09 案例1:搭建redis服务器案例2:常用命令限案例3:部署LNPRedis案例4:创建redis集群 1 案例1:搭建redis服务器 1.1 具体要求如下 在主机redis64运行redis服务修改服务运行参数 ip 地址192.168.88.6…

一.net core 自动化发布到docker (Jenkins安装)

目录 1.安装Jenkins 参考资料:https://www.jenkins.io/doc/book/installing/docker/#downloading-and-running-jenkins-in-docker 1.Open up a terminal window.(打开一个终端窗口。) 2.Create a bridge network in Docker using the following docker network create comma…

AD23使用笔记

1. 如何修改原理图的页面 2. 原理图DRC:快捷键T D ; 或者:菜单→工程→validate pcb project,,,,,,,,, Altium Designer原理图错误编译检查_ad原理图如何编译和查错_y惘然__的博客-CSDN博客 3.

Vscode终端显示调整

前面博主介绍了如何修改vscode如何修改终端背景颜色以及报错信息颜色,详见: vscode终端背景颜色修改以及报错信息颜色修改_追忆苔上雪的博客-CSDN博客 但是Vscode默认情况下不像pycharm那样占满整个下方,显得有点窄 下图是vscode终端 下图是…

应急响应-Webshell

文章目录 一、Webshell概述什么是WebshellWebshell分类基于编程语言基于文件大小/提供的功能多少 Webshell 检测方法 二、常规处置方法三、技术指南1、初步预判2、 Webshell排查3、Web日志分析(查找攻击路径及失陷原因)4、系统排查4.1 Windows4.2 Linux …

本地工具是什么意思?本地工具与远程工具一样吗?

不少刚入行的小伙伴,不知道本地工具是什么意思?以为本地工具与远程工具是一样的、今天我们小编就给大家来简单说说。 本地工具是什么意思?本地工具与远程工具一样吗? 【回答】:本地工具是指软件安装在每个用户终端上&…

Keil开发STM32单片机项目的三种方式

STM32单片机相比51单片机,内部结构复杂很多,因此直接对底层寄存器编码,相对复杂,这个需要我们了解芯片手册,对于复杂项目,这些操作可能需要反复编写,因此出现了标准库的方式,对寄存器…

医药反腐正当时!以此为鉴,企业采购腐败怎么防?

近日,医药行业正在经历一场力度空前的反腐风暴。今年以来,全国通报的多起医药腐败案件中,主要涉及通过在药品采购、医疗器械及耗材采购等事项上为他人谋取利益,收受贿赂等问题,涉及金额算下来更是惊人。 医药行业的采购…

深入源码分析kubernetes informer机制(三)Resync

[阅读指南] 这是该系列第三篇 基于kubernetes 1.27 stage版本 为了方便阅读,后续所有代码均省略了错误处理及与关注逻辑无关的部分。 文章目录 为什么需要resyncresync做了什么 为什么需要resync 如果看过上一篇,大概能了解,client数据主要通…

OpenSSL 远程升级到 3.2.1

OpenSSL 远程升级到 3.2.1 文章目录 OpenSSL 远程升级到 3.2.1背景升级 OpenSSL1. 查看 OpenSSL版本2. 下载最新稳定版本 OpenSSL3. 解压缩,安装4. 配置 背景 最近的护网行动,被查出来了好几个关于OpenSSH的漏洞。需要升级OpenSSH,升级OpenS…

Postman通用接口加密解决方案

前言: 很对小伙伴对于psotman接口加密不知道如何解决,这里给大家出了一个全网最详细的解决方案,希望能帮助到大家 问题 postman内置加密Api,但不支持RSA加解密码。如何用postman进入rsa加解密?postman中request对象…

【机器学习5】数据处理(二)Pandas:表格处理

Pandas:表格处理 🌟🌟Pandas三种数据类型✨✨Series数据结构✨✨ DataFrame数据结构🌙🌙DataFrame数据的选取🌕🌕DataFrame的构建🌕🌕选取多行🌕🌕选取某一列…

Qt应用开发(基础篇)——滚屏区域类 QScrollArea

一、前言 QScrollArea类继承于QAbstractScrollArea,QAbstractScrollArea继承于QFrame,是Qt滚动视图的常用部件。 滚屏区域基类 QAbstractScrollArea 框架类 QFrame QScrollArea类提供了对另一个小部件的滚动视图,基础功能、滚动条控制、界面策…

Java后端开发需要学什么知识?这些足以影响你的成就

Java后端开发需要学什么知识?如果你的理想是成为一名优秀的Java程序员,那么确实是需要具备一定的技术实力的,后端开发涉及到处理服务器端逻辑、数据库操作、性能优化、安全性等方面,因此需要掌握一定的技术知识和技能。 需要掌握哪些后端开发…

数据分片概述、环境准备、部署MyCAT服务、全局表、分片表、ER表

Top NSD DBA DAY08 案例1:部署mycat服务案例2:测试配置 1 案例1:部署mycat服务 1.1 问题 把主机mysql60 配置为 MySQL59 的从服务器把主机mysql62 配置为 MySQL61 的从服务器把主机mycat63 配置为mycat服务器客户端192.168.88.50访问myca…

实验记录——TT

8月份的小小实验 安装虚拟环境下载相关软件功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一个注脚注释也…

Flask Web开发实战(狼书)| 笔记第1、2章

前言 2023-8-11 以前对网站开发萌生了想法,又有些急于求成,在B站照着视频敲了一个基于flask的博客系统。但对于程序的代码难免有些囫囵吞枣,存在许多模糊或不太理解的地方,只会照葫芦画瓢。 而当自己想开发一个什么网站的时&…

关于 Windows 11 的云端备份

一、Windows 云端备份不是Windows 11专享 Windows 11即将正式推出一项云端备份功能,它的作用是为您备份几乎所有内容 - 不仅仅是您的文件和文件夹,还包括应用程序、系统设置、登录详细信息等,以便您可以立即启动并运行新电脑。这些详细信息与…

【Vue2】动态组件的使用-切换组件和keep-alive,以及异步组件

目录 想实现切换不同列表展示不同数据方法一方法二,动态组件动态组件的父组件如何传的值动态组件的子组件如何接受传的值 认识keep-alive缓存组件的生命周期 异步组件,单独打包,实现webpack分包,如何对组件进行单独打包&#xff0…