数据分析与SAS学习笔记6

news2024/10/1 5:31:33

数据集整理:

目的:对数据集中的数据进行预处理,使数据更适合统计分析过程对数据格式的要求;

常见整理要求:

1)建立新的变量,衍生变量,删除某些原变量;

2)求子集;

3)矩阵和数组变换(例如转置);   # 行变列、列变行

4)排序;

5)分组;         # 类似SQL语句中的SQL;

6)数据集连接;

7)数据集合并;

8)写入文件;

用赋值语句建立衍生的新变量:

代码说明:

1)z=x+y;y=y+1; 是赋值语句;

2)@@ 表示读数据不换行;

代码说明:

1)求和,没有写S=0,因为每次循环读的话,S都会被赋值为0,反而不对;

2)从结果,我们还是很好理解S+X的意思。就是S=S+X;S+X是简写;

3)就是对X进行不断的求和;

RETAIN语句:

用于给变量赋初值,并且使变量保持其变化。

一个很好说明问题的例子:

 代码说明:

1)z=0;可以看到z的值,就是z的值;

2)s的值是x的求和;

3)关键是y初值为8,每次循环,y都会把x加上去。第二次循环的时候,retain不会被执行,y会保留上面的值。这个跟求和有区别。这个retain可以给y赋予初值。

删除变量:DROP语句:

代码说明:

1)total=sum(s1,s2,s3): 增加了一个total变量;

2)然后再将s1, s2, s3Drop掉了。

保留变量:KEEP语句:

 代码说明:

1)KEEP保存什么变量。

2)set score:上一个已有的数据集;

3)keep name mean; 需要name,mean,其他的自然被我删除掉了。

4)mean=total/3; 求平均。

条件语句:IF-THEN:循环语句,数组

条件语句:IF-THEN

 

 代码说明:

1)data score1: 目标数据集;

2)set sp.score:  是打开sp.score为当前数据集;这个数据集中包含了num/name/Computer/C_Language/English/ave

3)if语句的意思:判断ave是否大于85分,在观测行中观察进行判断,然后put语句输出语句,缺省是输出到日志窗中输出学号,名称和平均分。

条件语句:IF-THEN-ELSE:这是一个双分支的语句:

注意的是,在Then和else之后只允许使用一个语句,如果当条件成立时要执行几个语句,则应该把要同时执行的几个语句用do-end括起来。

 

 求子集IF语句:

 代码说明:

1)data child;  这是在读数据;

2)我们要产生婴儿数据集,获得月份小于12的婴儿,相当于做了一个筛选;只要写上if语句进行筛选;SAS另外还可以加where语句;where语句看朱世武的书;SQL在制定语言的标准是参考了SAS的用法。SAS的影响力是非常大的。where作为课后的阅读作业;

删除观测值:DELETE语句:

 代码说明:

1)delete是删除行;

2)do-end; put num,在日志窗中输出学号。然后删除此观测值;

循环语句:
GOTO实现的循环

DO/END循环

DO WHILE 循环

DO UNTIL 循环

在SAS中有非常丰富的循环语句用法。

GOTO语句:

 

 

代码说明:

1)goto语法是在C语言中包含,但是在编程中是要尽量避免使用goto语句。计算机科学家不要用goto语句,使得代码非常难读。

2)在K:冒号后面要有空格,才行,不然会有报错。调试的时候需要注意下。

DO/END循环:

整个循环体只产生了一个观测,它是循环结束时循环变量的取值。如果要每次循环都往数据集里输出数据,可以使用output语句。(包括前面goto实现的循环也是这样。)

代码说明:

1)这个类似其他语言的for循环语句,我们指定了循环变量,指定一个变化的范围和步长。SAS指定这些内容还是比较灵活的。

2)1 to 8 by 2: 1 3 5 7

3)16 to 18:  16 17 18

do while 循环体:

 

 

代码说明:

1)LT: 小于5。

2)put:默认输出到日志窗口。

OUTPUT语句:

 

代码说明:

1)put是直接输出到日志窗口;

2)output:就是把当前的变量往数据集中写,生成一个观测行,每次都会生成一个观测值。显示地显示的输出。

DO UNTIL循环:

 代码说明:

1)当条件成立的时候,我们就退出循环;

2)while是当条件成立的时候,就执行循环;

 

代码说明:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/352948.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Jira Server一年后“停服” 中国用户如何减损失降影响

近日Jira官方再次表示:在“2024年2月15日之后,用户所使用的 Server 版本的安全漏洞将不再有官方的修复方案,产品的 Bug 也不再被修复。在支持日期结束后,Atlassian 和Marketplace 合作伙伴将不再为任何问题、安全更新或关键漏洞的…

spring-web DispatcherServlet 源码分析

说明 本文基于 jdk 8, spring-framework 5.2.x 编写。author JellyfishMIX - github / blog.jellyfishmix.comLICENSE GPL-2.0 DispatcherServlet 的继承实现层次 关注点应放在 Servlet, GenericServlet, HttpServlet, HttpServletBean, FrameworkServlet, DispatcherServle…

关于Ubuntu20.04文件系统思考

文章目录问题产生Ubuntu文件系统中普通用户可读写地址Ubuntu文件系统Ubuntu文件系统详解一级目录二级目录查找Ubuntu中软件安装位置Ubuntu修改文件权限问题产生 使用electron框架开发桌面端跨平台软件时,当开发完成的程序部署到Ubuntu上,系统无法产生日…

推荐3款远程办公软件

一款好用的远程办公软件能够大大的提高我们的办公效率,在这篇文章中,我们将为您推荐几款常见又好用的远程办公软件,以帮助您能更加高效的远程办公。电脑远程办公软件有很多,本文主要从团队沟通软件、视频会议软件、远程控制软件等…

距离不是拦截我们前进的主因,与社科院杜兰金融硕士一起奔赴山海

最近有咨询社科院杜兰金融管理硕士项目的同学反馈他在西安,读研来北京上课太远了。一直在纠结要不要申请,其实距离不是问题,相向而行才是关键。在项目就读的同学好多也是来自外地,他们克服了种种困难来到项目学习,就是…

kubernetes教程 --service详解

Service 介绍 在kubernetes中,pod是应用程序的载体,我们可以通过pod的ip来访问应用程序,但是pod的ip地址不是固定的,这也就意味着不方便直接采用pod的ip对服务进行访问。 为了解决这个问题,kubernetes提供了Service…

行业分析| 智能无人自助设备

智能无人自助设备运用二维码技术、音视频通信技术和AI智能技术等相结合,提供了无人超市、自动售货机、智能快递柜等。当下很多商业地区或社区,都放置了智能无人自助设备,不仅可以为商家节省时间和精力、提升运营环境,也可以为众多…

宽刈幅干涉雷达高度计SWOT(Surface Water and Ocean Topography)卫星进展(待完善)

> 以下信息搬运自SWOT官方网站等部分文献资料,如有侵权请联系:sunmingzhismz163.com > 排版、参考文献、部分章节待完善 > 2023.02.17.22:00 初稿概况 2022年12月16日地表水与海洋地形卫星SWOT (Surface Water and Ocean Topography)在加利福尼…

SpringCloud(一)注册中心

注册中心eureka服务端客户端负载均衡nacos服务端客户端nacos分级存储模型配置集群属性nacos环境隔离-namespace临时实例和非临时实例Eureka和Nacos的异同负载均衡策略饥饿加载eureka 服务端 依赖 <!-- eureka注册中心服务端依赖--><dependencies><depe…

【数据结构与算法】1.树、二叉树、字典树、红黑树

文章目录简介1.树 (Tree)2.二叉树&#xff08;Binary Tree&#xff09;2.1.二叉树数据结构2.2.二叉树的三种遍历方式3.二叉查找树(Binary Search Tree)3.1.二叉查找树的概念和定义3.2.二分查找算法4.字典树(Trie)5.红黑树(Red-Black Tree)简介 本章主要讲解一些树的基本概念,二…

windows10/11,傻瓜式安装pytorch(gpu),在虚拟环境anaconda

安装anaconda地址 &#xff1a;Anaconda | The Worlds Most Popular Data Science Platform安装选项全默认点击next就行。查看支持cuda版本cmd命令行输入nvidia-smi。下图右上角显示11.6为支持的cuda版本。要是显示没有nvidia-smi命令。得安装nvidia驱动&#xff0c;一般情况都…

字符串匹配 - Overview

字符串匹配(String Matchiing)也称字符串搜索(String Searching)是字符串算法中重要的一种&#xff0c;是指从一个大字符串或文本中找到模式串出现的位置。字符串匹配概念字符串匹配问题的形式定义&#xff1a;文本&#xff08;Text&#xff09;是一个长度为 n 的数组 T[1..n]&…

Nodejs的安装

1. Nodejs的真正用途 a. 一个javascirpt的运行环境 b. 运行在服务器&#xff0c;作为web server c. 运行在本地&#xff0c;作为打包&#xff0c;构建工具 2. Nodejs的下载和安装 a. 普通方式&#xff08;访问官网&#xff09; 下载对应系统版本即可&#xff08;个人学习可无需…

【数据结构与算法分析】介绍蛮力法以及相关程序案例

文章目录蛮力法之排序选择排序冒泡排序实际应用蛮力法之最近对和凸包问题最近对问题凸包问题蛮力法(brute force)&#xff0c;其本质跟咱常说的暴力法是一样的&#xff0c;都是一种简单直接地解决问题的方法&#xff0c;通常直接基于问题的描述和所涉及的概念定义进行求解。 蛮…

【嵌入式】HC32F460串口接收超时中断+DMA

一 项目背景 项目需要使用一款UART串口编码器&#xff0c;编码器的数据以波特率57600持续向外发送。但这组数据包没有固定的包头和校验尾&#xff0c;仅仅是由多圈圈数和单圈角度组成的六字节数据码&#xff0c;这样接收到的数组无法确定实际的下标&#xff0c;所以这边考虑用串…

8月起,《PMBOK®指南(第七版)》将被采用,考PMP的注意了!

PMP第七版教材采用时间定了&#xff01;&#xff01;&#xff01;2023年【8月开始】第一次使用第七版教材&#xff0c;通知明显指出&#xff0c;第六版的关键知识任然还是有效的。第七版做的调整还是蛮大的&#xff0c;首次提出了项目管理的 12 项原则和8个项目绩效域&#xff…

Java基础语法小结来啦

简单的来说&#xff0c;一个java的程序他是有一系列对象的集合组成&#xff0c;通过对这些对象相互间调用的方式协同工作&#xff0c;下面就是我有关于Java基础语法的一些小结。 一、return简单使用 下面来一个Java程序&#xff0c;表示的是在self1这个包中我们创建了一个名叫…

Skywalking ui页面功能介绍

菜单栏 仪表盘&#xff1a;查看被监控服务的运行状态&#xff1b; 拓扑图&#xff1a;以拓扑图的方式展现服务之间的关系&#xff0c;并以此为入口查看相关信息&#xff1b; 追踪&#xff1a;以接口列表的方式展现&#xff0c;追踪接口内部调用过程&#xff1b; 性能剖析&am…

GEE学习笔记 八十:批量下载影像

最近问如何批量导出集合的小伙伴非常多&#xff0c;一个一个回复太麻烦&#xff0c;我这里直接给一段例子代码吧&#xff1a; var l8 ee.ImageCollection("LANDSAT/LC08/C01/T1_SR"); var roi /* color: #d63000 */ee.Geometry.Polygon( [[[115.64960937…

从0到1一步一步玩转openEuler--17 openEuler DNF(YUM)检查更新

文章目录17.1 检查更新17.2 升级17.3 更新所有的包和它们的依赖DNF是一款Linux软件包管理工具&#xff0c;用于管理RPM软件包。DNF可以查询软件包信息&#xff0c;从指定软件库获取软件包&#xff0c;自动处理依赖关系以安装或卸载软件包&#xff0c;以及更新系统到最新可用版本…