数据分析与SAS学习笔记1

news2024/11/24 23:04:34

数据分析的六层模型:

1)数据源层:数据分析的数据源;DBA;初加工;对数据源按某些规则进行抽取,ETL;

2)数据仓库层:OLAP的功能,联机事务处理。OLTP、OLAP:联机分析处理。对大量的数据进行计算,对我们的决策做一定的支持。多维建模的能力,多维查询的能力;数据集市:小型的数据仓库,大型数据仓库的一部分;提取出来,放到仓库中供我们进行使用。

3)数据浏览:统计分析、查询和报告;计算一些常见的统计、来分析数据的状态。求平均值、求方差、标准值、count。排序、剧组的统计;select语句进行查询;多维的查询、切片、赚取;

4)data mining:数据挖掘:目标不明确、手段不明确、挖出一些有趣的知识。我们有一些方法,我们预先不知道,得到什么结果我们也不知道。

5)数据表现层:我们怎么把这些数据展现给大家看,以更直观的方式展现给用户;

6)决策:老板决策的工作;

数据分析:我们的课程:统计分析、数据挖掘、数据展现这三层。

数据分析:

使用统计方法,有目的地对收集到数据进行分析处理,并且解读分析结果。

1)方差:数据的分散程度,集中程度越高。

2)标准差:计算方法;

3)偏度、 峰度等;

常用算法:

 数据分析和数据挖掘的算法并没有明显的界限。

传统的数据分析、比较现代的数据挖掘;

数据分析工具:

SAS在Data Exploration、Data Mining、Data presentations,这是它最擅长的部分。

SAS是用来进行数据分析的过程,主要进行建模,进行抽样,拿出样品,对样品进行分析建模,做一个预测模型、分类、神经网络。做出来之后SAS的使命也就结束了。

数据挖掘是以查找隐藏在数据中的信息为目标的技术,是应用算法从大型数据库中提取知识的过程,这些算法确定信息项之间的隐形关联,并且向用户显示这些关联。

数据挖掘的思想来源:假设检测、模式识别、人工智能、机器学习

常见数据挖掘任务:关联分析、聚类分析、孤立点分析等等。

展现层:

老土的报表:

大家不喜欢看这种图表。

常见的报表:

 这种报表就比刚才的数字要直观很多。

 仪表盘:对仪表盘特别敏感。所有的状态参数一目了然。把数据画成仪表盘。

一些有趣的图表: 

某条微薄的扩散路径。

网站点击的热力图。

这个图就非常直观地展示了一个网站,用户的关注点击的区域。

商业智能:

Business  Intelligence ,BI

BI=数据仓库(存储层)+ 数据分析和数据挖掘(分析层)+ 报表(展现层)

我们的课程的位置

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/346407.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

这才叫装机必备 , 这4款电脑软件超级实用,用一次就爱上

好用又免费的软件犹如被掩盖的珍珠,一旦发现了,让你满眼欣喜。 1、HiBit Uninstaller 这是一款大小不到10M的超实用卸载软件,完全免费无任何广告,兼顾垃圾清理、流氓软件卸载等超多实用功能,流氓软件卸载能力比某安全卫…

T-SQL基础(SQL高级编程语言)(二)

一、常量、变量 1. 常量 又称为字面值或标量值,程序运行过程中值不变’O’Bbaar’,如果单引号中的字符串包含引号,可以使用两个单引号表示嵌入的单引号。 2.变量 ​ 变量名不能与系统变量相同://img- 变量的声明赋值与使用 case※※ ​ case语句上…

实例一:MATLAB APP design- 简单的函数表达式运算(Y=X1^3+X2^2+X3)

一、APP 界面设计展示注:在自变量框输入自变量,点击计算按钮,结果就会显示在因变量输出框。二、APP设计界面运行结果展示该APP界面设计包括表达式运算显示框,自变量输入框,计算按钮,因变量输出框。注&#…

正大数据抢先看 祝各位情人节快乐

美国1月消费者物价指数 (CPI)周二 21:30,估6.2%,前值 6.5%。 周三12:00达拉斯FED总裁、03:00纽约FED总裁发表演说、和欧洲 央行 (ECB)总裁拉加德22:00演说。 日本政府预定周二向国会提出日本银行 (央行,BOJ) 总裁黑田东彦的继任人选。 市场高…

【服务器数据恢复】Hyper-V虚拟机数据恢复案例

服务器数据恢复环境: WinServer操作系统服务器,部署Hyper-V虚拟机环境; 虚拟机的硬盘文件和配置文件存储在一台存储设备中; 该存储设备配置:一组4盘raid5阵列存放虚拟机数据单块盘存放虚拟机数据备份。 服务器故障&am…

附录1-pytorch目标检测

源码来自作者Bubbliiiing,我对参考链接的代码略有修改,网盘地址 链接:百度网盘 请输入提取码 提取码:bfvs 目录 1 参考 2 环境 3 数据集准备 3.1 VOCdevkit/VOC2007 3.2 model_data/voc_classes.txt 3.3 voc_annota…

【Java|多线程与高并发】进程与线程的区别与联系

文章目录什么是进程什么是线程上下文切换多线程一定比串行执行快吗进程与线程的区别与联系什么是进程 进程的定义:进程是正在运行的程序实体,并且包括这个运行的程序中占据的所有系统资源,比如说CPU(寄存器),IO,内存&a…

自学前端最容易犯的10个的错误,入门学前端快来看看

在前端学习过程中,有很多常见的误区,包括过度关注框架和库、缺乏实践、忽视算法和数据结构、忽视浏览器兼容性、缺乏团队合作经验、忽视可访问性、重构次数过多、没有关注性能、缺乏设计知识以及没有持续学习等。要避免这些误区,应该注重基础…

Lambda表达式详细操作

一、基础语法 形态一:匿名内部类 Runnable runnable new Runnable() {Overridepublic void run() {System.out.println(Thread.currentThread().getName());} };runnable.run();形态二:完整的Lambda表达式 口诀:复制小括号,写…

消息中间件----内存数据库 Redis7(第1章 Redis 概述)

第1章 Redis 概述1.1 Redis 简介Redis,Remote Dictionary Server,远程字典服务,由意大利人 Salvatore Sanfilippo(又名Antirez)开发,是一个使用 ANSI C 语言编写、支持网络、可基于内存亦可持久化的日志型、…

【路径规划】基于Dijkstra算法及Floyd算法的通信与网络路径规划(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

Dubbo相关问题合集

Dubbo相关问题合集 java.io.StreamCorruptedException: invalid stream header: 77D30000 ; Decode rpc invocation failed 现象 2023-02-14 09:49:32.251 [NettyServerWorker-4-2] [] [WARN] o.a.d.r.exchange.codec.ExchangeCodec-130 [DUBBO] Skip input stream 634, du…

go gin学习记录2

环境 环境:mac m1,go version 1.17.2, goland, mysql 昨天学习了安装和基本的参数,路由使用,今天接着学习一下数据库的操作。 建立数据库 测试数据库操作,需要先准备一个测试用的数据库&…

【自适应软件开发过程思想】自适应软件开发 - 简介 Adaptive Software Development Introduction(中英文)

目录 ASWD 核心思想 什么是敏捷(Agile)? 敏捷宣言(Agile Manifesto) 敏捷的特征

微前端指北

微前端概述 Techniques, strategies and recipes for building a modern web app with multiple teams that can ship features independently. – Micro Frontends 什么是微前端 微前端是一种类似于微服务的架构,它将微服务的理念应用于浏览器端,即将 …

GAN和CycleGAN

文章目录1. GAN 《Generative Adversarial Nets》1.1 相关概念1.2 公式理解1.3 图片理解1.4 熵、交叉熵、KL散度、JS散度1.5 其他相关(正在补充!)2. Cycle GAN 《Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Ne…

Spring事务Spring整合MyBatis

Spring整合MyBatis 在整合之前需要保证mybatis、springframework、mybatis-spring、spring-jdbc的包都已经导入 并且要根据官网提示保证mybatis、springframework、mybatis-spring版本相对应&#xff0c;否则会产生冲突报错 maven依赖如下&#xff1a; <!-- Spring Web…

SAS应用入门学习笔记6

SQL (SAS): Features&#xff1a; 1&#xff09;不需要在每个query中重复调用每个SQL&#xff1b; 2&#xff09;每个statement都是独立去完成的&#xff1b; 3&#xff09;我们是没有proc print和proc sort语句的&#xff1b;&#xff08;order by&#xff09; key synta…

vue3的shallowReactive和shallowRef,readonly和shallowReadonly

shallowReactive&#xff1a;只处理对象最外层属性的响应式&#xff08;浅响应式&#xff09; <template><span>姓名&#xff1a;{{name}}</span><span>年龄&#xff1a;{{age}}</span><span>职业&#xff1a;{{salary.job.num}}</spa…

JAVA SE复习(第5章 面向对象(上))

本文笔记来自硅谷柴林燕老师的笔记 只为自己看笔记方便使用 不做他用5.1 面向对象编程5.1.2 类和对象1、什么是类类是一类具有相同特性的事物的抽象描述&#xff0c;是一组相关属性和行为的集合。属性&#xff1a;就是该事物的状态信息。行为&#xff1a;就是在你这个程序中&am…