《SPSS零基础入门教程》学习笔记——02.数据管理

news2024/11/17 1:55:14

文章目录

  • 2.1 连续变量的离散化
  • 2.2 自动重编码、编秩与数值计数
  • 2.3 几个常用过程
  • 2.4 多个数据文件的操作
  • 2.5 数据字典
  • 2.6 数据核查
    • (1)数据验证模块
    • (2)数据检验
  • 2.7 数据准备

  • 计算新变量(转换 -> 计算变量)
    计算新变量

2.1 连续变量的离散化

  • 可视化离散(转换 -> 可视分箱)
  • 最优离散化(转换 -> 最优分箱)
    连续变量的离散化

2.2 自动重编码、编秩与数值计数

  • 变量的重新编码(转换 -> 重新编码为相同的变量 / 重新编码为不同变量 / 自动重新编码)
  • 个案等级排序(转换 -> 个案排秩)
  • 对个案内值的计数(转换 -> 对个案中的值进行计数)
    自动重编码、编秩与数值计算

2.3 几个常用过程

  • 数据排序(数据 -> 个案排序 / 变量排序)
  • 文件拆分(数据 -> 拆分文件)
  • 选择个案(数据 -> 选择个案)
  • 个案加权(数据 -> 个案加权)
  • 分类汇总(数据 -> 汇总)
    几个常用过程

2.4 多个数据文件的操作

  • 数据文件的合并(数据 -> 合并文件 -> 添加个案 / 添加变量)
  • 数据文件的结构重组(数据 -> 重构)
  • 数据转置(数据 -> 转置)
    多个数据文件的操作

2.5 数据字典

  • 定义变量属性(数据 -> 定义变量属性)
  • 复制数据属性(数据 -> 复制数据属性)
  • 新建自定义属性(数据 -> 新建定制属性)
    数据字典

2.6 数据核查

(1)数据验证模块

  • 定义验证规则(数据 -> 验证 -> 定义规则)
  • 进行数据验证(数据 -> 验证 -> 验证数据)
  • 加载预定义规则(数据 -> 验证 -> 装入预定义规则)
    数据验证模块

(2)数据检验

  • 标识重复个案(数据 -> 标识重复个案)
  • 标识异常个案(数据 -> 标识异常个案)
  • 双录核查(数据 -> 比较数据集)
    数据检验

2.7 数据准备

  • 数据自动准备(转换 -> 准备数据以进行建模 -> 交互式 / 自动 / 逆转换得分)
    数据自动准备
  • 使用变量集(实用程序 -> 定义变量集)
    使用变量集

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2046650.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VueUse 基于 Vue 3 Composition API 的高质量 Hooks 库

VueUse 是什么? VueUse 是基于 Vue 3 Composition API 的高质量 Hooks 库。例如获取滚动的距离 VueUse 官网:VueUse | VueUse VueUse 什么使用? 1、通过npm安装 VueUse npm i @vueuse/core 2、搜索需要使用的函数,例如搜索 useScroll 滚动 3、使用useScroll 滚动函数 …

使用RKNN在Orange Pi 5 (RK3588s) 上部署推理PPO深度学习模型

文章目录 一、前言1️⃣、Orange Pi 是什么?2️⃣、PPO 是什么?3️⃣、RKNN 是什么?3️⃣、ONNX 是什么? 二、项目简介三、部署流程1️⃣、PPO 网络结构2️⃣、PPO 输出模型,模型转换,以及对比检查3️⃣、.…

httplib库:用C++11搭建轻量级HTTP服务器

目录 引言 一. httplib库概述 二. httplib核心组件 2.1 数据结构 2.2 类和函数 2.3 服务器搭建 ​编辑 结语 引言 在现代软件开发中,HTTP服务是网络应用的基础。对于需要快速搭建HTTP服务器或客户端的场景,使用成熟的第三方库可以极大提高开发效…

微软运行库全集合:一站式解决兼容性问题

开发者在部署应用程序时经常遇到因缺少运行库而引发的兼容性问题。为了解决这一问题,电脑天空推荐微软常用运行库合集,一个集成了微软多个关键运行库组件的软件包。 📚 包含组件概览: Visual Basic Virtual Machine:…

电销机器人助力企业节约成本提升业绩

电销系统机器人 的出现对企业来说不但仅是提高一点工作效率这么简单。首先从拨打电话上来看,电销系统机器人每日能够拨打几千通、上万通电话无上线,都可自行设置,并且并不会感觉到累,更不会由于被挂掉电话而影响心情,这…

KNN算法-opencv的运用

文章目录 opencv介绍与安装KNN算法中opencv的运用1.数据介绍2.图片处理3.图像切分与重组4.分配标签5.模型构建与训练6.预测结果7.模拟测试8.代码及详注 opencv介绍与安装 OpenCV(Open Source Computer Vision Library,开源计算机视觉库)是一…

ShareSDK Twitter

创建应用 1.登录Twitter控制台并通过认证 2.点击Developer Portal进入Twitter后台 3.点击Sign up for Free Account创建应用 4.配置应用信息 以下为创建过程示例,图中信息仅为示例,创建时请按照真实信息填写,否则无法正常使用。 权限申请…

智能安全守护,寺庙安全用电解决方案

在四川省蓬溪县城北,高峰山以其千年的历史沉淀和独特的文化风貌,默默诉说着道教与佛教交融的传奇。然而,2017年5月31日凌晨的一声巨响,打破了这里的宁静,一场突如其来的大火,让这座承载着无数信徒信仰与梦想…

10步搞定Python爬虫从零到精通!

学习Python网络爬虫可以分为以下几个步骤,每一步都包括必要的细节和示例代码,以帮助你从零开始掌握这一技能。 第一步:理解网络爬虫基础 什么是网络爬虫? 网络爬虫是一种自动化程序,用来从互联网上收集数据.它通过发送 HTTP 请求…

大学生科创项目在线管理系统的设计与实现

TOC springboot267大学生科创项目在线管理系统的设计与实现 第1章 绪论 1.1选题动因 当前的网络技术,软件技术等都具备成熟的理论基础,市场上也出现各种技术开发的软件,这些软件都被用于各个领域,包括生活和工作的领域。随着电…

爬虫案例4——爬取房天下数据

简介:个人学习分享,如有错误,欢迎批评指正 任务:从房天下网中爬取小区名称、地址、价格和联系电话 目标网页地址:https://newhouse.fang.com/house/s/ 一、思路和过程 目标网页具体内容如下: ​​​​ …

揭秘面试必备:高频算法与面试题全面解析

干货分享,感谢您的阅读! (暂存篇---后续会删除,完整版和持续更新见高频面试题基本总结回顾(含笔试高频算法整理)) 备注:引用请标注出处,同时存在的问题请在相关博客留言…

Web安全:SqlMap工具

一、简介 sqlmap 是一款开源的渗透测试工具,可以自动化进行SQL注入的检测、利用,并能接管数据库服务器。它具有功能强大的检测引擎,为渗透测试人员提供了许多专业的功能并且可以进行组合,其中包括数据库指纹识别、数据读取和访问底层文件系统…

SystemUI手势操作隐藏显示导航栏

在Android 12中,通过SystemUI手势操作来隐藏和显示导航栏主要涉及对系统UI的定制和编程控制。以下是一些实现这一功能的方法: 第一类. 使用WindowInsetsController Android 12引入了一个新的WindowInsetsController类,它允许开发者更好地控…

加速科技精彩亮相2024中国(深圳)集成电路峰会

8月16日,2024中国(深圳)集成电路峰会(简称“ICS2024峰会”)在深圳如期开展,为行业带来一场技术盛宴。在这场盛会中,加速科技携2款核心产品——ST2500EX、ST2500E重磅亮相,凭借领先的…

【leetcode详解】特殊数组II : 一题代表了一类问题(前缀和思想)

前缀和的优势 给定一个数组,前缀和的特点在于,任意给出一对始末位置,能够用O(1)的时间复杂度得到始末位置之间所有元素的某种关系。 题型分析 这道题目正是“给出始末位置,检测其中元素特点”那一类,那我们就想&#…

【机器学习西瓜书学习笔记——概率图模型】

机器学习西瓜书学习笔记【第十四章】 第十四章 概率图模型概率图模型分类14.1 隐马尔可夫模型贝叶斯网络马尔科夫链隐马尔科夫模型 14.2 马尔可夫随机场( M R F MRF MRF)马尔可夫场定理算法原理概率推理参数学习算法对比 14.3 条件随机场( C R F CRF CRF)优缺点优点缺点 链式条…

Redis -LFU(Least Frequently Used,最少使用频率)缓存淘汰算法

在 Redis 的 LFU(Least Frequently Used,最少使用频率)缓存淘汰算法中,lru 字段被拆分成两部分:高 16 位存储 ldt(Last Decrement Time),低 8 位存储 logc(Logistic Coun…

【图像特效系列】卡通特效的实践 | 包含代码和效果图

目录 一 卡通特效 代码 效果图 图像特效系列主要是对输入的图像进行处理,生成指定特效效果的图片。图像素描特效会将图像的边界都凸显出来;图像怀旧特效是指图像经历岁月的昏暗效果;图像光照特效是指图像存在一个类似于灯光的光晕特效,图像像素值围绕光照中心点呈圆形范…

【就业】中国铁路人才招聘

中国国家铁路集团有限公司,是中国财政部直接出资的大型国有企业,与国资委直接管理的央企不同,它是由财政部代表国务院履行出资人职责 ,由中央管理的国有独资公司。其前身是由国家铁道部政企分离后剥离出来的全民所有制企业&#x…