文章目录
- 数据文件的特点
- 建立SPSS数据文件步骤
- 数据文件的结构
- 变量的规则
- 数据的录入和保存
- 录入数据
- 保存文件
- 数据的编辑
- 数据定位
数据文件的特点
SPSS数据库文件包括文件结构
和数据
两部分
SPSS数据文件中的一列数据称为一个变量。每个变量都应有一个名称,即:变量名,变量名是存取SPSS每个变量的唯一标识。
SPSS数据文件中的一行数据称为一条个案(Case)。所有个案组成了 SPSS数据文件的数据部分
建立SPSS数据文件步骤
STEP1
定义SPSS数据文件的结构
STEP2
输入分析数据
数据文件的结构
SPSS数据文件的结构是对每列变量及其相关属性的描述,它包括:变量名、变量类型、变量宽度、变量名标签、变量值标签、变量列格式、变量缺失值、变量度量方法等信息,虚线框内的可以忽略。
变量的规则
1.变量名
-
不能多于8个字符
-
首字符应以英文字母开头,后面可以跟除了“ !、?、* ”之外的字母或数字
-
下划线、圆点不能为变量名的最后一个字母
-
变量名不区分大小写字母
-
变量名不能与SPSS内部特有的具有特定含义的保留字符相同,如:ALL、BY、AND、NOT、OR 等
-
SPSS 默认的变量名为以 VAR 个宁母开头,后面跟补足5位的数字如:VAR00001、VAR00012 等
2.变量的类型和宽度
-
数值型
- 标准数值型
- 逗号数值型
- 点数值型
- 科学计数法型
- 美元数值型
- 用户自定义型:编辑-选项-货币
-
字符型
字符型数据的默认显示宽度为8个字符位,它不能够进行算术运算,并区分大小写字母。字符型数据在SPSS据处理过中是应用一对双引号起来的,面在入数时不应输人双引号,否则,双引号将会作为字符型数据的一部分。 -
日期型
3.变量名标签
变量名标签是对变量名含义的进一步解释说明,可以用中文,总长度可达 120 个字符,但在统计分析结果的显示中,一般不可能显示如此长的变量名标签信息。变量名标签这个属性是可以省略定义的,但建议最好给出各变量名的标签
4.变量值标签
变量值标签是对变量取值含义的解释说明信息。例如:对于性别数据,假定用1表示男,用2表示女。变量值标签可以用中文。变量值标签这个属性是可以省略定义的,但建议对顺序水准和名义水准变量最好给出变量值标签
5.变量缺失值
缺失值在统计分析中是无法直接采用的。在 SPSS 中处理的方法是:在遗漏的数据处填充人某个特定的标记数据。在进行统计分析时,SPSS 将区别对待缺失值和正常的分析数据。
SPSS 中缺失值可以有三种指定方法:
- 对个字符型或数值型变量,缺失值可以是1至3个特定的值离散值
- 对一个数值型变量,缺失值可以在1个连续的闭区内
- 对个数值型变量,缺失值可以在2个连续的开间内,并可同时指定一个离散值
还有另外一种是系统缺失值,用一个圆点表示。这个圆点不等于0,也不等于.00,而是系统默认的缺失值,它一般出现在数值型变量数据中。
注意:字符型变量中的空格或空不是系统缺失值。
6.变量列格式
包括变量的列宽度和数据的对齐方式
7.变量度量方法
统计分析数据的度量方法可以大致分为定度量和非定度量两类,对应的数据就是定距数据和非定距数据。
- 定距离数据是指,如人的身高、体重、血压等的连续型数据,也包括如职工人数、课程门数等的离散化的数据。
- 非定数据包括:顺序水准的数据名水准的数据。
- 顺序水准的数据,如:高、中、低级职称分别用 1、2、3 等表示,年龄段分别用“老”、“中”、“青”等表示。
- 名义水准的数据,男、女性别分别用 1、2表示,民族用“汉”、“回”、“满”等表示。这里,无论是数值型还是字符型都不存在内部固有的大小或高低顺序,而只是一种名义上的指代。
数据的录入和保存
录入数据
1.逐行录入
2.录入带有变量值标签的数据
在菜单选项把显示变量值标签的开关打开
录入相应的变量之后可以看到在数据单元中显示的是变量值对应的变量值标签
如:性别的变量值标签:
录入性别后,可以在数据单元看到‘男’对应的标签是1
保存文件
在保存SPSS数据文件时可以保存成多种形式,如.sav、Excel工作表格式.xlsx、数据库文件格式.dbf、文本格式.dat等
在实际工作中,可以将数据保存成两份,一份为SPSS数据文件格式,另一份为其他软件可以读取的数据文件格式,方便数据共享。
数据的编辑
数据定位
1.人工定位
适用于数据量较少的情况,可以使用鼠标或键盘的PgUp
和PgDn
按钮
2.自动定位
当数据量较大时,可以根据个案号码和变量值数据进行定位
-
按个案号码自动定位
将光标框在某个变量列的任何一个个案上
菜单选项:编辑-转到个案
输入需要跳转到的个案号
如果选择“转到变量”可以使选择的变量列高亮
-
按变量值数据自动定位
将光标框在某个变量列的任何一个个案上
菜单:编辑-查找
输入需要定位的变量值,会自动在第一步选择的列上进行搜索7