6、数据的合并

news2024/10/5 13:14:43

目录

一、添加变量即横向合并。

二、添加个案即纵向合并


在实际工作中,为了提高效率,经常需要将一份数据分成几部分分别录入,或为了便于分析,又将几个数据文件合并成一个总的数据文件。为此,SPSS提供了两种合并数据文件的方式:添加变量、添加个案

一、添加变量即横向合并。

将不同的变量合并到一个数据文件,进行左右对接。

键变量的介绍

1. 若两个要合并的数据文件,不是按照记录编号的对应规则进行合并,则至少要有一个相同名称的公共变量(SPSS24中称为键变量)。(一般来说,若需要对数据合并,在录入时都会按照记录编号的对应规则录入数据,用键变量合并较少使用,所以只在后文说明方法,不举具体案例。)

2. 若使用相同键变量合并,键变量必须按升序排列。

案例将某班的化学成绩和英语成绩合并成一个数据文件。

Ps:首先观察两个数据文件,两个数据文件中的成绩都为按照学生编号从1-20进行排列,不用考虑按键变量合并。

操作步骤

Step1. 打开化学成绩.sav ,数据——合并文件——添加变量

Step2.此时出现“变量添加”窗口,有两种打开另一个数据文件的方式。

一种为打开数据集,需要事先在SPSS中打开另一个数据文件(本例为英语成绩),此时就会在打开数据集的对话框中出现另一个数据文件,点击数据文件,继续即可。

另一种为点击外部SPSS Statistics数据文件,此方法无需事先打开另一数据文件,只需知道数据文件存放在哪里,在浏览里选择即可(本例的英语成绩所在位置为桌面),最后点击【继续

Step3.此时出现下面的“变量添加”窗口,本例不用键变量合并也无需修改,按【确定】即可。

 

以下分别对每个对话框进行解释:

【合并方法】对话框。有三种合并方式,请按需合并,其中键值就是【键变量】框中的变量,默认是【基于键值的一对一合并】。

变量框中的排除的变量】对话框。变量为两个要合并的数据文件中变量名称相同的变量(即重复的变量名),此对话框里的变量将不会出现在合并后的数据文件中。若想要将此对话框中的变量纳入合并后的数据文件,则需要选中变量,点击重命名,重新命名后再移入到新的活动数据集对话框中。(从实际经验中,很少会出现此情况)

变量框中的【包含的变量】对话框。变量为合并后的数据文件中包含的变量。“*”表示此变量为当前文件中的变量,“+”表示此变量为外部文件中的变量。在本案例中编号和化学成绩为当前文件中的变量,英语成绩为外部文件中的变量,符合实际情况。

变量框中的键变量】对话框。若需要使用键变量进行合并时,需要注意该对话框中下方的注意事项。

在对话框中设置完成后(在这里默认设置即可),点击【确定】,输出合并结果。

二、添加个案即纵向合并

只合并两个数据文件中相同变量下的数据,进行纵向连接。

案例:某班共30名学生,将30名学生的化学成绩分成了两个数据文件,要求将学生编号为1-20的数据文件和编号为21-30的数据文件合并,形成一个30名学生的数据文件。

操作步骤

Step1.打开编号1-20.sav,数据——合并文件——添加个案

Step2.此时的操作步骤与横向合并的相同,本例点击外部SPSS Statistics数据文件,点击【浏览】,本例编号21-30数据文件的位置为桌面,点击【继续

Step3.此时出现下面“添加个案”对话框,本例直接确定即可。

以下分别对每个对话框进行解释:

【非成对变量】对话框。变量为两个要合并的数据文件中没有相同名称的变量,所以不能被系统自动匹配,若在此对话框中的两个数据变量,变量意义相同但是名字不同,需要纵向合并,则同时选中两个变量名,点击配对,进行强行匹配。

Ps:为了操作方便,两个数据文件中相同含义的变量,命名应相同,类型和长度也最好相同。

【新的活动数据集中的变量】对话框。变量为两个数据文件中名称相同的变量,也是合并后的数据文件中所包含的变量。

“*”、“+”、【指示个案变量】的含义与横向合并中的意义相同。

合并结果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/191317.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【7】【vue】【vue3】

1、项目结构: asserts用来存放静态资源的(一些图片,公共的css文件等) components用来存放vue的组件(vue是组件开发) App.vue是主入口组件 (根组件,所有组件都是从这里开始&#xff…

在 PyTorch 中使用梯度检查点在GPU 上训练更大的模型

作为机器学习从业者,我们经常会遇到这样的情况,想要训练一个比较大的模型,而 GPU 却因为内存不足而无法训练它。当我们在出于安全原因不允许在云计算的环境中工作时,这个问题经常会出现。在这样的环境中,我们无法足够快…

万向节锁问题

以前一直听说过万向节锁当时觉得问题太难就没去认真分析最近在B站找了一些视频看懂了。简单来说旋转是有顺序的,比如transform面板有三个旋转分量,你先调整y,再调整x,最后调整z按照正常思路来说,调整x轴是在y轴旋转的基…

想成为数据分析师,看这里,数据分析必备的43个Excel函数

目录 前言 函数分类: 关联匹配类清洗处理类逻辑运算类计算统计类时间序列类 前言 Excel是我们工作中经常使用的一种工具,对于数据分析来说,这也是处理数据最基础的工具。 很多传统行业的数据分析师甚至只要掌握Excel和SQL即可。 对于初学者…

【DataX】datax | datax-web | win搭建datax-web环境

一、环境准备 1、jdk8 2、maven 3、mysql7 4、python3 5、window10 6、idea 7、2345解压(win支持tar.gz解压) 8、git 二、操作步骤 1、datax操作步骤 1)下载datax http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz 2&am…

ES6 环境下 Openlayers 集成使用 ol-ext 以及在线示例

ES6 环境下 Openlayers 集成使用 ol-ext 以及在线示例ol-ext 简介版本说明打包后体积集成方式在线示例最近打算重新封装一下 Openlayers,方便前端人员使用,基础功能没什么可说的,毕竟 Openlayers 的示例和 API 已经非常友好了。 想增加一些地…

2023-01-31 CSDN问答中如何防止和惩罚 “偷代码操作“

CSDN问答中如何防止和惩罚 "偷代码操作"前言一. 代码隐藏保护(CSDN官方回复目前无此功能)二. 先占位后抄袭的处理三. 编辑记录是照妖镜总结前言 随着问答的参与时间累积, 逐渐的碰到了一些问题, 常在河边走, 怎能不湿鞋, 原先看到抄代码结果原创没被采纳, 只能报以同…

AcWing 10. 有依赖的背包问题(分组背包问题 + 树形DP)

AcWing 10. 有依赖的背包问题(分组背包问题 树形DP)一、问题二、分析1、整体分析2、状态表示3、状态转移4、循环设计5、初末状态三、代码一、问题 二、分析 1、整体分析 这道题其实就是作者之前讲解过的一道题:AcWing 487. 金明的预算方案…

【双向链表】数据结构双向链表的实现

前言: 前一期我们已经学习过单链表了,今天我们来学习链表中的双向链表! 目录1.概念以及结构2.双向链表结点结构体3.接口实现3.1动态申请一个结点3.2初始化链表3.3打印链表3.4双向链表尾插3.5 双向链表尾删3.6双向链表头插3.7双向链表头删3.8双…

Linux常用命令——pvscan命令

在线Linux命令查询工具(http://www.lzltool.com/LinuxCommand) pvscan 扫描系统中所有硬盘的物理卷列表 补充说明 pvscan命令会扫描系统中连接的所有硬盘,列出找到的物理卷列表。使用pvscan命令的-n选项可以显示硬盘中的不属于任何卷组的物理卷,这些…

OAuth2代码演示

目录 1 创建项目结构 1.1 客户 1.2 认证服务器 1.3 资源拥有者 1.4 资源服务器 client 客户 authorization-server 认证服务 resource-owner 资源所有者 resource-server 资源服务器 工作流程: 客户向资源所有者申请授权码 资源所有者下发授权码 客户拿到授权…

springboot+mongodb初体验

MongoDB 是一个基于分布式文件存储的数据库。由 C 语言编写,旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。 MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。 1、mongodb服务…

JavaScript 算术运算符

JavaScript 算术运算符 加减乘除以及取模&#xff08;求余数&#xff09;、、– <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta http-equiv"X-UA-Compatible" content"IEedge" />…

代码随想录算法训练营第十六天 | 104.二叉树的最大深度、559.n叉树的最大深度,111.二叉树的最小深度,222.完全二叉树的节点个数

Day15 周日休息一、参考资料二叉树的最大深度 &#xff08;优先掌握递归&#xff09;题目链接/文章讲解/视频讲解&#xff1a; https://programmercarl.com/0104.%E4%BA%8C%E5%8F%89%E6%A0%91%E7%9A%84%E6%9C%80%E5%A4%A7%E6%B7%B1%E5%BA%A6.html 二叉树的最小深度 &#xff08…

车载网络 - BootLoader - CAN/CANFD刷写前提

刷写作为车载网络测试极其重要的一个模块一直拖到今天才开始写,之前确实没有一个太好的想法怎么介绍这一块,虽然现在也没有想出来怎么写能够更好的介绍这块的内容,不过我也尽量用通俗的语言让大家看懂。 刷写流程 刷写流程我也根据用例的设计分为3个阶段:前置条件、刷写程序…

UDP+有穷自动状态机构造网络指令系统

UDP有穷自动状态机构造网络指令系统 项目背景 某展厅的小项目&#xff0c;使用Unity制作了一个视频播放器&#xff0c;作为受控端&#xff0c;需要接收解说员手中的“PAD”或“触控屏电脑”等设备发来的控制指令。要求指令系统满足以下功能&#xff1a; 能够随意切换要播放的…

剑指Offer 第17天 Top K问题 优先级队列解决数据流中位数

目录 剑指 Offer 40. 最小的k个数 剑指 Offer 41. 数据流中的中位数 剑指 Offer 40. 最小的k个数 输入整数数组 arr &#xff0c;找出其中最小的 k 个数。例如&#xff0c;输入4、5、1、6、2、7、3、8这8个数字&#xff0c;则最小的4个数字是1、2、3、4。 示例 1&#xff1a; …

图像处理中的微分算子

摘要 微分算子在图像处理中的作用主要是用在图像的边缘检测&#xff0c;而图像边缘检测必须满足两个条件&#xff1a;一能有效的抑制噪声&#xff0c;二能必须尽量精确定位边缘位置。现在常用的微分算子主要有&#xff1a;Sobel算子&#xff0c;Robert算子&#xff0c;Prewitt…

【数据结构-JAVA】堆和优先级队列

前面介绍过队列&#xff0c;队列是一种先进先出(FIFO)的数据结构&#xff0c;但有些情况下&#xff0c;操作的数据可能带有优先级&#xff0c;一般出队 列时&#xff0c;可能需要优先级高的元素先出队列&#xff0c;该中场景下&#xff0c;使用队列显然不合适&#xff0c;比如&…

Hugo博客教程(一)

秋风阁——北溪入江流&#xff1a;https://focus-wind.com/ 秋风阁——计算机视觉实验&#xff1a;边缘提取与特征检测 文章目录Hugo博客教程&#xff08;一&#xff09;博客静态博客静态博客的优缺点常见的静态博客HexoHugo动态博客动态博客的优缺点常见的动态博客WordPressTy…