数据分析与SAS学习笔记2

news2024/11/18 14:38:18

SAS在企业使用的情况:

SAS是一个很昂贵的商业软件。在企业中使用SAS比较多,在企业界中是比较流行,在学术界使用R比较多。

SAS简介:统计分析系统

 处理生物分析数据。

SAS成为统计领域的国际标准软件,服务全球50000多家企业。

在医学和金融领域,在进行数据分析的时候,要求使用SAS软件。

数据分析软件的基本问题:

1)怎么建立数据集?

ETL,SAS有专门的语句和过程做这个事情。

2)怎样进行数据分析(自己写代码,或者利用现有函数)?

SAS语言有自己的特点。丰富的解读结果。统计指标。

3)输出图表

输出图表比较简陋,专门花钱买数据展现模块,有非常好的效果。

SAS基本界面:

编辑窗、输出窗、日志窗

SAS资源管理器

SAS处理流程:

数据步 过程步:

 一个完整的数据步和过程步:

代码说明:

1)$符号表示这个变量是一个字符串类型;宽度缺省是8个字符;空格作为分隔符;cards和run之间数据;内置数据集第一行循环读取;读到student数据集中。把整个内置数据全部读完。

2) 变量是列;正常是叫变量。

3)每一行是一个观测值、样本;

4)student是数据集;放在磁盘里的文件。专门SAS的一种格式;如果打开文件,发现是二进制的,是乱码。

5)proc: 过程步:print:输出过程,将student数据集进行输出,keep我们只要显示id name和score这三个变量。

6)obs:观测:每一行是一个观测值,每一行是一个样值。noobs:无观测值。

7)预先创建逻辑库mydb;

SAS是商业软件,是按年来付费的。

SAS的模块:

逻辑库:

对应于一条物理路径的逻辑名,用于存放SAS数据集合数据文件。

这种数据集只能在SAS中进行读取。

建立逻辑库:

1)先在硬盘上建立相应目录;

2)在编辑窗中输入libname命令;

3)按F8或者提交按钮提交命令;

libname mydb 'c:\mydb';

代码说明:

1)末尾要加分号;

 内置逻辑库:Maps、sashelp、sasusers都是内置,里面还有样本数据。

work是临时逻辑库:加入我们建的数据集临时放在临时逻辑库中,

逻辑库名丢弃;可使用libname重新建立连接;

使用图形界面建立逻辑库:

鼠标指向逻辑库,在右键菜单选择“删除”;

删除后目录和数据在物理上依然存在,只是拆除了连接;

那些保存在硬盘上数据,只要通过在硬盘上进行删除才行。

人工建立的逻辑库都是永久的。

逻辑库连接数据库:

libname oradb oracle user=scott password=tiger path=orcl;

以上命令可以直接连接Oracle数据库,其他数据库操作类似。

代码说明:path:连接实例。

变量:数据集中列、属性等。统计学中就叫变量。

命名规则:以字母或下划线开头,由字母、下划线、数字等组成,不区分大小写。

不要使用中文作为变量名。SAS中是不区分大小写的。

变量赋值。

SAS中的变量就是数据集中的列,值就是一行观测值。

代码解读:

1) 数据集是sfz;是在临时逻辑库work中;

2)length 语句定义了一个变量id, $表示这是一个字符串变量,18表示18个字符这么长;如果是数值型数据,小数点后面为4位。

3)input语句是指定我们读入数据的列是怎么切割的,先读入id,然后再读入sex列,分隔符是空格,没有特殊说明的话,sex后面有一个$,说明是一个字符型变量。

4)字符串变量默认是8个字符,没有这个length语句,就只有8个字符,使用length语句调整变量的长度。

5)在cards和run之间定义了内置数据,读数据的方法是每次一行,到run,然后到数据步开始位置,然后再读入第二行,到run,然后再到数据步开始位置;

6)proc print就是打印当前数据集;就是我们刚刚操作的sfz数据集。

Date、time、datetime类型:

 1)标准时间的时间戳方法;

读文本文件中的数据:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/348618.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

顶象业务安全大讲堂全新升级,挖洞大神喊你来get 挖洞秘籍啦!

CSDN直播间: 红队外网打点与情报收集策略——「业务安全大讲堂第二季第1期」https://live.csdn.net/room/dingxiangtech/rBN4xrOp 顶象业务安全大讲堂第二季将于2月23日重磅回归,本季业务安全大讲堂继续以业务安全为主题,为大家带来业务安全…

网络渗透之信息搜集

网络渗透之信息搜集一、信息搜集1.1 概念1.2 分类1.3 收集那些信息二、域名信息收集2.1 域名介绍2.2 域名分类2.3 域名信息查询- whois2.3.1 whois2.3.2 whois查询2.3.3 whois查询方法2.4 域名信息收集-备案信息三、子域名信息收集四、IP地址信息收集4.1 IP反查域名4.2 域名查询…

UVa 1343 The Rotation Game 旋转游戏 IDA* BFS 路径还原

题目链接:The Rotation Game 题目描述: 给定二十四个整数,这二十四个整数由八个一,八个二,八个三组成,从左到右,从上到下依次描述下图方格中的数字: 例如上图左边对应的输入就是[1,…

Java中List排序的3种方法!

引用:https://blog.csdn.net/sinat_32849897/article/details/122098256 在某些特殊的场景下,我们需要在 Java 程序中对 List 集合进行排序操作。比如从第三方接口中获取所有用户的列表,但列表默认是以用户编号从小到大进行排序的&#xff0c…

acwing 2 普通背包 2维做法的坑

背包问题应该都挺熟了,但还是放一下题目 无论是一维还是二维的解法,思路都比较一致,就是用一个二维的dpdpdp矩阵,dp[i][j]dp[i][j]dp[i][j] 的定义为前 iii 个元素的最优组合在容量为 jjj 的背包的最大价值。 这个定义非常的巧妙…

前缀和-蓝桥杯

一、前缀和的概念数组a[0]~ a[n-1],前缀和sum[i]等于a[0] ~ a[i]的和:sum[0] a[0]sum[1] a[0] a[1]sum[2] a[0] a[1] a[2] ......在O(n)时间内求所有前缀和: sum[i] sum[i-l] a[i]a[0]一般不用。二、前缀和与区间问题预计算出前缀和,能快速计算出区…

C语言结构体(初阶)声明、初始化、成员访问、传参

目录结构体类型的声明结构体变量的定义和初始化结构体成员访问结构体传参1.结构体类型的声明//1. struct Book {char name[20];int price; //成员列表 }b3,b4,b5;//全局变量 int main() {struct Book b1;//b1,b2局部变量struct Book b2;return 0; }//2. struct Book {char n…

重磅!ChatGPT席卷全球,Salesforce将推出EinsteinGPT!

2月9日,Salesforce首席执行官Marc Benioff在Twitter上发布了这样一则推文,表示将于3月7日的TrailblazerDX 23上发布Salesforce EinsteinGPT,随后Salesforce的官方Twitter也进行了转发。 虽然还没有正式的新闻稿,但不少业内人士猜测…

C++【模板初阶】

✨个人主页: Yohifo 🎉所属专栏: C修行之路 🎊每篇一句: 图片来源 No one saves us but ourselves, no one can and no one may. We ourselves must walk the path. 除了我们自己,没有人能拯救我们&#xf…

FreeRTOS-Tickless低功耗模式 | FreeRTOS十四

目录 说明: 一、低功耗模式简介 1.1、STM32低功耗模式 二、Tickless模式 2.1、Tickless模式如何功耗 2.2、Tickless模式设计思想 2.3、为了降低功耗,又不影响系统运行,怎么能做到呢? 三、Tickless模式修改配置 3.1、配置…

如何提升 ETF 期权隐含波动率和希腊值的计算速度?

期权的隐含波动率可以反应市场对未来的预期,通常使用牛顿法和二分法来计算。这两种方法都需要频繁迭代,且迭代次数不能确定,核心代码无法向量化,因此只能通过循环来逼近求解。这就导致在期权相关计算中,隐含波动率往往…

PO模式在Selenium中简单实践

初识PO模式 PO(PageObject)是一种设计模式。简单来说就是把一些繁琐的定位方法、元素操作方式等封装到类中,通过类与类之间的调用完成特定操作。 PO被认为是自动化测试项目开发实践的最佳设计模式之一。 在学习PO模式前,可以先…

InstructGPT笔记

一、InstructGPT是在GPT3上微调,ChatGPT是在GPT3.5上微调 二、该论文展示了怎么样对语言模型和人类意图之间进行匹配,方法是在人类的反馈上进行微调。 **三、方法简介:**收集很多问题,使用标注工具将问题的答案写出来&#xff0…

大数据面试题flume篇

1.Flume 的Source,Sink,Channel 的作用?你们Source 是什么类型? 1. 作用 (1)Source组件是专门用来收集数据的,可以处理各种类型、各种格式的日志数据,包括 avro、thrift、exec、jm…

Nginx介绍及安装(windows版,Linux版)

目录 一、Nginx介绍 1、Nginx优势 2、Nginx作用 3、部署静态资源 4、代理 5、负载均衡 二、Nginx安装步骤(windows版) 三、Nginx安装步骤(Linux版) 1、官网下载安装包,下载完之后上传到Linux系统上 2、在Lin…

股票量化策略是如何被执行出来的?

在股票量化方面,很多投资者是不知道怎么样挖掘量化策略,便在量化交易接口方面会通过股票交易接口将数据慢慢挖掘出来,就简单的通过api接口调用数据方面,直接通过交易接口端输出交易持仓数据,并且通过交易系统对数据的筛…

什么是“镜像浏览”?文件夹加密后的镜像浏览有什么用?

电脑中的文件夹经常用来储存各种重要文件,加密保护成为很多人的选择,而夏冰加密软件拥有各种适用于不同场景的文件夹加密软件,备受用户喜爱。在我们打开加密文件夹之后,我们可以在加密控制面板中发现“镜像浏览”的按钮&#xff0…

Sharding-jdbc

一、概念理解垂直切分:包含垂直分库和垂直分表1.1、垂直分库 :专库专用(按照业务类型对表分类)1.2、垂直分表:基于数据表的列(字段)为依据切分的,是一种大表拆小表的模式。1.3、垂直…

【Python--torch(激活函数说明+代码讲解)】激活函数(sigmoid/softmax/ELU/ReLU/LeakyReLU/Tanh)

【Python–torch】激活函数(sigmoid/softmax/ELU/ReLU/LeakyReLU/Tanh) 文章目录【Python--torch】激活函数(sigmoid/softmax/ELU/ReLU/LeakyReLU/Tanh)1. 介绍2. 常用激活函数说明2.1 Sigmoid2.1.1 公式2.1.2 图像2.1.3 代码解读2.2 Softmax2.2.1 公式2.2.2 代码解读2.3 ELU2.…

荧光探针Pyrene-PEG2-Propargyl,芘甲酰胺-二聚乙二醇-丙炔

Pyrene-PEG2-Propargyl物理参数: CAS号:N/A | 英文名:Pyrene-PEG2-Propargyl |中文名:芘甲酰胺-二聚乙二醇-丙炔分子式:C24H21NO3分子量:371.44纯度标准:95%外形颜色:淡黄色或白色固…