一、认识SQL
SQL作为实用技能,热度高、应用广泛
在对数据分析人员的调查中SQL长期作为热度排名第-一的编程语言超过Python和R
SQL:易学易用,高效强大的语言
SQL:Structured Query Language 结构化查询语言
SQL:易学易用,类似英文语法类的语言结构
SQL:标准语句,写法成熟,应用广泛
SQL的核心语句已经有三十多年成熟的行业标准 能在多个平台“跨界“使用
二、用SQL认识和理解数据
三个初始数据集
DESCRIBE
Describe,描述
作用:“描述”指定表或视图中的所有列
写法:describe table_name,也可以简写为desc
DESCRIBE 订单表
DESCRIBE 用户表
DESCRIBE 产品表
读懂DESCRIBE的结果
数据类型
主键
主键:意味着他们是各自表中唯一不重复的字段,这些字段被称为“主键
- 主键一定是唯一不重复的
- 一张表的主键,在另一张表中可能不是主键
- 表格里也可以允许没有主键
会员表,user_id唯一不重复
订单表,user_id会重复出现,代表一个用户多次购买
建立数据字典,快速了解一张表的含义
三、SQL查询数据
SELECT语句
Select,选取
作用:查询表中的数据
写法: SELECT 字段名 FROM 数据表注意:可以代表数据表中包含的所有列变量
DISTINCT
Distinct,不同的,分开的
作用:去除重复的取值或记录
写法: DISTINCT 字段名
哪些SKU发生了交易?
SELECT DISTINCT sku FROM orders;
四、SQL描述数据
COUNT
Count,计数
作用:查询满足条件的记录总数,也就是行数
写法: COUNT()
COUNT对比
MIN/MAX/SUM/AVG
Min:极小值
Max :极大值
Sum:求和
Avg:平均数
注意!!
分号:语句结尾的分号,这是表示一个SQL语句结束的标记
一旦运行多段语句,如果不用分号隔开,就会发生代码的报错
中英文输入法:必须使用英文标点
读懂报错
语法错误,错误出现在第二行,出现在SELECT前
五、随堂练习
正确答案: 错误
解析:
SQL无法识别中文标点,会报错
正确答案:主键
解析:
主键唯一不重复且无缺失,才能实现三个运行结果相同
正确答案:错误
解析:
没有给出表格的实际业务含义时,无法判断一个字段是否是主键。同样的字段在不同表中的情况可能是不同的
正确答案: 正确
解析:
SQL对大小写是不敏感的
正确答案: 正确
解析:
SQL,就是Structured Query Language,也就是[结构化查询语言]的简称
正确答案: 错误
解析:
double是数值类数据格式
正确答案: 正确
解析:表中唯一不重复的字段被称为“主键
正确答案:
describe; desc;
DESCRIBE语句的功能是“描述”指定表或视图中的所有列,可以帮助我们了解数据表中包含了哪些列以及这一列数据的类型
正确答案
COUNT; count
解析:
COUNT函数是SQL语句中用来统计个数的函数
正确答案
distinct;DISTINCT
解析:
distinct可以用于去重
正确答案: 错误
解析:
表格里也可以允许没有主键
正确答案:错误
解析:null这里代表的是改列是否可以存储空值,而不是当前是否存在空值
正确答案: B
解析:
分号代表语句的结束