BDA初级分析——SQL清洗和整理数据

news2024/11/15 23:37:58

一、数据处理

数据处理之类型转换

字符格式与数值格式存储的数据,同样是进行大小排序, 会有什么区别?

以rev为例,看看字符格式与数值格式存储时,排序会有什么区别?

用cast as转换为字符后进行排序

SELECT CAST(rev AS char(10))AS rev_test 

FROM orders 

ORDER BY rev_test DESC;

99.1>982.1?

字符串比较大小是逐位来比较的

 CAST AS

Cast as 按...分组

作用:对字段格式进行转换

写法:cast(字段名 as 目标数据类型)

常见的格式转换:

转换为日期:Cast(字段 as date)

转换为整数:Cast(字段 as signed)

SUBSTRING

substring 截取子串

作用:提取长串字符中的部分关键词

写法:SUBSTRING(string,start_position,length)

string:要取的目标字段,可以是某个字段,也可以是一个指定的字符

start_position:起始位置

Length:要取的长度

ROUND

round

作用:对数据保留特定的小数点后位数

写法:round(number,n)

number:数据

n:小数点后位数,不提供n时默认为0,即对数据取整

二、对现有表的更改

INSERT INTO

insert into 插入

作用:在现有表中插入新的记录

写法:INSERT INTO 表名(column1,column2,...)VALUES(value1,value2,...)

 怎么把一条漏掉的数据更新到表里?

 INSERT INTO product(category,sku,cat_name,sku_name)

VALUES('2','23','家具','电视柜');

DELETE

delete 删除

作用:删除数据表中的记录

写法:DELETE FROM table_name WHERE condition;

 

 UPDATE

update 更新

作用:直接更新表内字段值

写法:UPDATE table_name SET 字段名=“更新后的内容” WHERE condition;

 

 UPDATE、INSERT INTO、DELETE的执行不可逆

三、创建新的变量和数据表

CASE WHEN

case when

作用:根据是否满足语句中的判断条件,选择不同的取值,对数据进行重新分类整理和命名

写法:CASE WHEN 条件1 THEN 取值1

                     WHEN 条件2 THEN 取值2

           ........

          ELSE 取值n

          END

 

 CREATE TABLE … AS

create table ... as

作用:创建新的表

写法:create table 表名称 as 所需要的表信息

 课后小结

随堂练习

 正确答案: 正确
解析:
cast as的作用是对数据类型做转换

 正确答案: B 
解析:
UPDATE是更新现有数据,CREATETABLE是创建新的表,CASE WHEN是对现有数据分组形成新的字段

 正确答案: 错误 
解析:
我们在这里将units格式转换后的结果命名为了units new,因此这里ORDERBY的依据应该是units new而不是units

 正确答案: ACD
解析:
ROUND可以取小数点后位数,0即为整数,为0时可以省略不写; SIGNED 表示有符号的整数(这里的符号是指正负号) ,CAST(值 AS SIGNED)也可以实现取整

 正确答案: 错误 
解析:在SQL对表格的修改是不可逆的UPDATE,DELETE,INSERT INTO一旦执行后是无法撤销的

 正确答案: 错误 
解析:
日期格式可以改写为date,即cast(日期as date)

 正确答案: 错误
解析:
column2这里,字段名不需column1、要加引号

 正确答案: 错误 
解析:
UPDATE的语何是UPDATE 表名 SET字段=某个值 WHERE 条件,这里漏掉了SET

 正确答案: 错误 
解析:
SUBSTRING的功能是提取长串字符中的部分关键词,SUBSTRING ( string,start position , length )中start position即代表起始位置

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/900271.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Wazuh安装及使用

环境配置 官方网址Quickstart Wazuh documentation 可以选择Elastic Stack安装,也可以选择下载虚拟机(OVA)安装 这里展示虚拟机安装 下载好文档中提供的文件 虚拟机配置要求 在VM左上角 文件->打开->刚刚下载的.ova文件&#xff0c…

力扣974被K整除的子数组

同余定理 使用前缀和哈希表 由于可能是负数所以要进行修正&#xff1a;(sum%kk)%k class Solution { public:int subarraysDivByK(vector<int>& nums, int k) {unordered_map<int,int> hash;hash[0 % k] 1; //0 这个数的余数int sum 0, ret 0;for(auto x…

Swing程序设计(1)概述及常用组件

文章目录 前言一、什么是GUI?二、Swing概述 1.Swing包2.Swing常用组件总结 前言 该文介绍了Java中Swing组件的概述&#xff0c;以及常用组件的介绍。Swing程序是关于开发软件界面的一种轻量级Java组件。那什么是Swing组件&#xff1f;弹出对话框&#xff0c;窗体&#xff0c;设…

Java创建对象的几种方式

在Java中&#xff0c;对象是程序中的一种基本元素&#xff0c;它通过类定义和创建。本篇教程旨在介绍Java中创建对象的几种方式&#xff0c;包括使用new关键字、反射、clone、反序列化等方式。 使用new关键字创建对象 在Java中&#xff0c;最常用的创建对象方式是使用new关键…

Linux笔试题(4)

67、在局域网络内的某台主机用ping命令测试网络连接时发现网络内部的主机都可以连同,而不能与公网连通,问题可能是__C_ A.主机ip设置有误 B.没有设置连接局域网的网关 C.局域网的网关或主机的网关设置有误 D.局域网DNS服务器设置有误 解析&#xff1a;在局域网络内的某台主…

ACE内存池管理器积累

源起 近来由于研究ACE内存分配的组件&#xff0c;想做一个应用程序级的内存管理&#xff0c;有人还想自己写一个&#xff0c;我觉得可以直接用ACE自己提供的内存管理器&#xff0c;避免重复发明轮子。 结合以前认识&#xff0c;和前辈们的积累&#xff0c;觉得可以记下来一些…

【AutoLayout案例3 Objective-C语言】

一、咱们接下来,再把这个案例实现一下 1.要求, 1)在控制器的顶部,有两个UIView,一个是蓝色View,一个是红色View 2)这两个UIView的高度,永远是相等的,蓝色和红色的高度是相等的,都是50 3)红色View和蓝色View,是右对齐的 4)蓝色View,距离父控件的左边、上边、右…

双指针算法实例1(移动零)

常⻅的双指针有两种形式&#xff1a; 1 对撞指针&#xff08;左右指针&#xff09;&#xff1a; a 对撞指针从两端向中间移动。⼀个指针从最左端开始&#xff0c;另⼀个从最右端开始&#xff0c;然后逐渐往中间逼 近 b 终止条件一般是两指针相遇or错过&#xff08;也可能在循…

VMWare Workstation 网络设置 桥接模式 网络地址转换(NAT)模式 仅主机模式

文章目录 网络模式配网要求CentOSDHCP虚拟网络桥接模式默认配置测试手动配置测试 网络地址转发模式 (NAT) 网络模式 桥接模式: 主机与虚拟机对等, 虚拟机注册到主机所在的局域网, 会占用该网络的IP该局域网内的所有机器, 包括主机和其他机器和所有虚拟机, 均可互相访问 网络地…

ElasticSearch索引库、文档、RestClient操作

文章目录 一、索引库1、mapping属性2、索引库的crud 二、文档的crud三、RestClient 一、索引库 es中的索引是指相同类型的文档集合&#xff0c;即mysql中表的概念 映射&#xff1a;索引中文档字段的约束&#xff0c;比如名称、类型 1、mapping属性 mapping映射是对索引库中文…

ORA-600 ksuloget2 恢复----惜分飞

客户在win 32位的操作系统上调至sga超过2G,数据库运行过程中报ORA-600 ksuloget2错误 Thread 1 cannot allocate new log, sequence 43586 Checkpoint not complete Current log# 1 seq# 43585 mem# 0: D:\ORACLE\ORADATA\ORCL\REDO01.LOG Fri Aug 04 14:57:02 2023 Errors i…

正则表达式:贪婪与非贪婪模式

正则中的三种模式&#xff0c;贪婪匹配、非贪婪匹配和独占模式。 在这 6 种元字符中&#xff0c;我们可以用 {m,n} 来表示 &#xff08;*&#xff09;&#xff08;&#xff09;&#xff08;?&#xff09; 这 3 种元字符&#xff1a; 贪婪模式&#xff0c;简单说就是尽可能进行…

激活函数总结(十三):Tanh系列激活函数补充(LeCun Tanh、TanhExp)

激活函数总结&#xff08;十三&#xff09;&#xff1a;Tanh系列激活函数补充 1 引言2 激活函数2.1 LeCun Tanh激活函数2.2 TanhExp激活函数 3. 总结 1 引言 在前面的文章中已经介绍了介绍了一系列激活函数 (Sigmoid、Tanh、ReLU、Leaky ReLU、PReLU、Swish、ELU、SELU、GELU、…

pytorch 42 C#使用onnxruntime部署内置nms的yolov8模型

在进行目标检测部署时,通常需要自行编码实现对模型预测结果的解码及与预测结果的nms操作。所幸现在的各种部署框架对算子的支持更为灵活,可以在模型内实现预测结果的解码,但仍然需要自行编码实现对预测结果的nms操作。其实在onnx opset===11版本以后,其已支持将nms操作嵌入…

2.基于SpringBoot3集成SpringDoc Swagger3

1. 引入依赖 我们在build.gradle中引入依赖 implementation org.springdoc:springdoc-openapi-starter-webmvc-ui:2.1.0 implementation org.springdoc:springdoc-openapi-starter-webmvc-api:2.1.02. 新增SpringDocConfig.java文件 Configuration public class SpringDocCo…

ElasticSearch 数据聚合、自动补全(自定义分词器)、数据同步

文章目录 数据聚合一、聚合的种类二、DSL实现聚合1、Bucket&#xff08;桶&#xff09;聚合2、Metrics&#xff08;度量&#xff09;聚合 三、RestAPI实现聚合 自动补全一、拼音分词器二、自定义分词器三、自动补全查询四、实现搜索款自动补全&#xff08;例酒店信息&#xff0…

【图论】最短路的传送问题

一.分层图问题&#xff08;单源传送&#xff09; &#xff08;1&#xff09;题目 P4568 [JLOI2011] 飞行路线 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) &#xff08;2&#xff09;思路 可知背景就是求最短路问题&#xff0c;但难点是可以使一条路距离缩短至0&#xf…

excel逻辑函数篇2

1、IF(logical_test,[value_if_true],[value_if_false])&#xff1a;判断是否满足某个条件&#xff0c;如果满足返回一个值&#xff0c;如果不满足则返回另一个值 if(条件,条件成立返回的值,条件不成立返回的值) 2、IFS(logical_test1,value_if_true1,…)&#xff1a;检查是否…

虚拟机问题

虚拟机无法识别USB设备 经排查为VMware USB Arbitration Service 没有启动,但是VMware USB Arbitration Service依赖于VMware Workstation Server启动 VMware USB Arbitration Service(VMUSBArbService)是由 VMware 虚拟化软件提供的一个服务,用于协调和管理主机系统上的…

每日一题——接雨水(单调栈)

接雨水——单调栈 题目链接 单调递增的栈还是单调递减的栈 我们常说的**”积水成洼“**&#xff0c;指的就是说&#xff1a;当两边地势高于中间的地势时&#xff0c;中间的区域就成了洼地&#xff0c;也就可以积水了。 这一题就是如此&#xff0c;我们需要通过一个栈来记录数…