一、高级SQL语句(进阶查询)
先准备2个表
一个location表:
use kgc;
create table location (Region char(20),Store_Name char(20));
insert into location values('East','Boston');
insert into location values('East','New York');
insert into location values('West','Los Angeles');
insert into location values('West','Houston');
一个store_info表:
create table store_info (Store_Name char(20),Sales int(10),Date char(10));
insert into store_info values('Los Angeles','1500','2020-12-05');
insert into store_info values('Houston','250','2020-12-07');
insert into store_info values('Los Angeles','300','2020-12-08');
insert into store_info values('Boston','700','2020-12-08');
1.1 select
select,显示表格中一个或数个字段的所有数据记录。
语法: SELECT "字段" FROM "表名";
示例:
select store_name from store_info;
select store_name,sales from store_info;
1.2 distinct
distinct,不显示重复的数据记录。
注意:关系型数据库,单次只能对一个字段去重
SELECT DISTINCT "字段" FROM "表名";
示例:
select distinct store_name from store_info; #对商店名称进行去重
select distinct date from store_info; #对日期字段进行去重
1.3 where
where,有条件查询。
SELECT "字段" FROM 表名" WHERE "条件";
示例:
select * from store_info where sales > 1000; #查找销售额大于1000的数据记录
select store_name from store_info where sales > 1000; #查找销售额大于1000的商店名称
1.4 and 和 or (且和或)
SELECT "字段" FROM "表名" WHERE "条件1" AND "条件2";
SELECT "字段" FROM "表名" WHERE "条件1" OR "条件2";
#查询销售额大于500且小于1000的数据记录。
select * from store_info where sales > 500 and sales < 1000 ;
#查询销售额大于200且小于500的记录,或者销售额大于1000的记录。
select * from store_info where sales > 1000 or (Sales < 500 and Sales > 200);
#查询销售额大于200且小于500的商店名,或者销售额大于1000的商店名。
select store_name from store_info where sales > 1000 or (Sales < 500 and Sales > 200);
1.5 in
in,显示已知的值的数据记录。
SELECT "字段" FROM "表名" WHERE "字段" IN ('值1', '值2', ...); #in,遍历一个取值列表
SELECT "字段" FROM "表名" WHERE "字段" NOT IN ('值1', '值2', ...); #not in取反,查询不在这个范围内的值
#查询商店名为“Los Angeles”,以及商店名为“Houston”的记录。
select * from store_info where store_name in ('Los Angeles','Houston');
#查询商店名称不是“Los Angeles”、不是“Houston”的记录。
select * from store_info WHERE store_name not in ('Los Angeles','Houston');
1.6 between
between,显示两个值范围内的数据记录
SELECT "字段" FROM "表名" WHERE "字段" BETWEEN '值1' AND '值2';
#查询销售额在500~1500之间的数据记录(包含500和1500)
select * from store_info where sales between 500 and 1500;
#查询店铺开业日期在2020-12-06到2020-12-10之间的记录(包含这两个日期)
select * from store_info where date between '2020-12-06' and '2020-12-10';
1.7 通配符
通配符一般都是跟 like 一起使用的。
%:百分号表示零个、一一个或多个字符
_:划线表示单个字符
'A_Z':所有以'A'起头,另一个任何值的字符,且以'Z'为结尾的字符串。
例如,'ABZ'和'A2Z' 都符合这一一个模式,而'AKKZ'并不符合(因为在A和z之间有两个字符,而不是一个字符)。
'ABC%':所有以'ABC'起头的字符串。例如,'ABCD' 和'ABCABC' 都符合这个模式。
'%XYZ':所有以'XYZ' 结尾的字符串。例如,'WXYZ' 和'ZZXYZ' 都符合这个模式。
'%AN%':所有含有'AN'这 个模式的字符串。例如,'LOS ANGELES'和'SAN FRANCISCO' 都符合这个模式。
'_AN%': 所有第二个字母为'A' 和第三个字母为'N' 的字符串。
例如,'SAN FRANCISCO' 符合这个模式,而'Los ANGELES'则不符合这个模式。
1.8 like
like,匹配一个模式来找出我们要的数据记录
SELECT "字段" FROM "表名" WHERE "字段" LIKE {模式} ;
#查询商店名称包含字符串"os"的记录
select * from store_info where store_name like '%os%';
#查询商店名称以字符串"on"结尾的记录
select * from store_info where store_name like '%on';
#查询商店名称的第二、第三个字符为"os"的记录
select * from store_info where store_name like '_os%';
1.9 order by
order by,按关键字排序。
注意:
- 一般对数值字段进行排序。
- 如果对字符类型的字段进行排序,则会按首字母排序。
SELECT "字段" FROM "表名" [WHERE "条件"] ORDER BY "字段" [ASC|DESC] ;
#ASC是按照升序进行排序的,是默认的排序方式。
#DESC是按降序方式进行排序。
#查看store_info表中的所有记录,按销售额进行升序排列。
select * from store_info order by sales ASC; #ASC可以不加,默认升序
#查看store_info表中的所有记录,按销售额进行倒序排列。
select * from store_info order by sales desc;
#获取销售额最大的那行数据记录。即先按销售额进行倒序排列,之后取第一行记录。
select * from store_info order by sales desc limit 1;
二、函数
SELECT abs(-1),rand(), mod(5,3) ,power(2,3);
#返回:1, 0-1之间的随机数,2,8
SELECT round(1.89),sqrt(2);
#返回:2,1.414
SELECT round(1.8937,3),truncate (1.235,2);
#返回:1.894,1.23
SELECT ceil(5.2) ,floor(2.1) ,least(1.89,3,6.1,2.1);
#返回:6,2,1.89
2.2 聚合函数
注意:
- count(列名):只包括列名那一列的行数,在统计结果的时候,会忽略列值为 NULL 的行。
- count(*) :包括了所有的列的行数,在统计结果的时候,不会忽略列值为 NULL。
select avg(sales) from store_info; #求表中销售额字段的平均值
select sum(sales) from store_info; #求表中销售额字段所有值的和
select max(sales) from store_info; #显示表中销售额字段的最大值
select min(sales) from store_info; #显示表中销售额字段的最小值
#统计表中store_name字段有多少个非空值
select count(store_name) from store_info;
#统计表中store_name字段有多少个不重复的非空值
select count(distinct store_name) from store_info;
例4:比较 count(列名) 和 count(*)
- count(列名):会忽略null值的行。
- count(*) :会统计所有行。
#先准备一个数据表city
create table city(name char(20));
insert into city values('beijing');
insert into city values('nanjing');
insert into city values('hangzhou');
insert into city values();
insert into city values();
#统计name字段有多少个非空值,会忽略字段值为null的行
select count(name) from city;
#统计所有行,不会忽略字段值为null的行。全表扫描。
select count(*) from city;
2.3 字符串函数
2.3.1 拼接的两种方法
方法一:concat(x,y)
select concat('zhang','san'); #将字符串"zhang"和"san"拼接在一起
select concat('zhang','san','san'); #将3个字符串拼接在一起
select concat('zhang',' ','san'); #将字符串"zhang"、空格、"san"拼接在一起
#将location表中,region字段值和store_name字段值拼接在一起。
select concat(region,store_name) from location;
#将location表中,region字段值和store_name字段值拼接在一起,且中间加空格。
select concat(region,' ',store_name) from location;
方法二:使用 || 符号(5.7之后的版本才支持)
如果sql_mode开启了PIPES_AS_CONCAT(可查看配置文件进行确认),"||"视为字符串的连接操作符而非”或“运算符,和字符串的拼接函数Concat相类似,这和Oracle数据库使用方法一样的。
#将location表中,region字段值和store_name字段值拼接在一起。
select Region || store_name from location;
#将location表中,region字段值和store_name字段值拼接在一起,且中间加空格。
select Region || ' ' || store_name from location;
2.3.2 截取
substr(x,y)和 substr(x,y,z)
#从商店名称的第3个字符开始截取直到最后一个字符。
select substr(Store_Name,3) from location;
#从商店名称的第2个字符开始截取长度为4的字符串。
select substr(Store_Name,2,4) from location;
#当商店名为"Los Angeles"时,从商店名称的第3个字符开始截取直到最后一个字符。
select substr(Store_Name,3) from location where Store_Name='Los Angeles';
#当商店名为"New York"时,从商店名称的第2个字符开始截取长度为4的字符串。
select substr(Store_Name,2,4) from location where Store_Name='New York';
2.3.3 去除格式 trim()
SELECT TRIM ([ [位置] [要移除的字符串] FROM ] 字符串);
#[位置]:值可以为 LEADING (起头), TRAILING (结尾), BOTH (起头及结尾)。
#[要移除的字符串]:从字串的起头、结尾,或起头及结尾移除的字符串。缺省时为空格。
select trim(leading 'Ne' from 'New York'); #移除"New York"开头的"Ne"
select trim(trailing 'k' from 'New York'); #移除"New York"结尾的"k"
2.3.4 返回字符长度 length
select store_name,length(store_name) from location; #统计store_name字段值的字符长度
2.3.5 替换 replace
select replace(region,'st','stern') from location;
#将region字段值中的字符串"st"替换为字符串"stern"
三、进阶查询(二)
3.1 GROUP BY(用于分组和汇总)
对GROUPBY后面的字段的查询结果进行汇总分组,通常是结合聚合函数一起使用的
-
"GROUP BY"有一个原则,凡是在"GROUP BY"后面出现的字段,必须在SELECT 后面出现;
-
凡是在SELECT 后面出现的、且未在聚合函数中出现的字段,必须出现在"GROUP BY"后面。
SELECT 字段1,SUM(字段2) FROM 表名 GROUP BY 字段1;
select store_name from store_info group by store_name;
#对store_name字段值进行分组汇总。
select store_name,count(store_name) from store_info group by store_name;
#对store_name字段值进行分组汇总,并统计组内每个非空值的数量。
select store_name,sum(sales) from store_info group by store_name;
#对store_name字段值进行分组汇总,并计算每组的销售额。即分组后求和。
select store_name,sum(sales) from store_info group by store_name order by sum(sales) desc;
#对store_name字段值进行分组汇总,并计算每组的销售额,之后对组销售额降序排序。
3.2 HAVING(和 group by配合使用)
-
用来过滤由"GROUP BY"语句返回的记录集,通常与"GROUP BY"语句联合使用。
-
HAVING语句的存在弥补了WHERE 关键字不能与聚合函数联合使用的不足。
-
where只能对原表中的字段进行筛选,不能对group by后的结果进行筛选。
SELECT 字段1,SUM(字段2) FROM "表格名" GROUP BY 字段1 HAVING(函数条件) ;
select store_name,sum(sales) from store_info group by store_name having sum(sales)>1500;
#对store_name字段值进行分组汇总,计算每组的销售额,之后显示组销售额大于1500的记录。
3.3 别名——字段别名、表別名
SELECT 字段1,字段2 AS 字段2的别名 from 表名; #AS可以省略不写
示例:
select store_name,sum(sales) as A from store_info group by store_name having A > 1000;
#设置sum(sales)字段的别名为A。
#对store_name字段进行分组汇总,并计算组内销售额之和,之后查询出组销售额大于1000的记录。
SELECT 表格别名.字段1 [AS] 字段别名 FROM 表格名 [AS] 表格别名; #AS可以省略不写
例:
select A.store_name store, sum(A.sales) total_sales from store_info A group by A.store_Name;
#设置store_info表的别名为A,A.store_name字段的别名为store,sum(A.sales)字段的别名为total_sales。
#对A表的store_Name字段进行分组汇总,并计算组销售额。即分组后求组内之和。
3.4 表的自我连接
例如:对销售额字段进行排名,并显示名次
#count统计的是A表中销售额的每个值小于等于B表中每个值的次数。(A和B都是store_info的别名,即表的自我连接,自己跟自己对比。)
select A.store_name,A.sales,count(A.sales) rank from store_info as A,store_info as B where A.sales <= B.sales group by A.store_name,A.sales order by rank asc;
如果表中有相同数值的销售额,使用如下语句:
select A.store_name,A.sales,count(A.sales) rank from store_info as A,store_info as B where A.sales<B.sales or (A.sales=B.sales and A.store_name=B.store_name) group by A.store_name,A.sales order by rank asc;
3.5 子查询
子查询:连接表格,在WHERE 子句或HAVING 子句中插入另一个SQL语句。
SELECT "字段1" FROM "表格1" WHERE "字段2" [比较运算符] #外查询
(SELECT "字段1" FROM "表格2" WHERE "条件") ; #内查询
#可以是符号的运算符,例如=、>、<、>=、<= ;也可以是文字的运算符,例如LIKE、 IN、BETWEEN
#先执行内查询,再执行外查询。内查询的查询结果,作为外查询的条件
#两张表连接在一起
select * from store_info A, location B where A.store_name=B.store_name;
select sales from store_info where store_name in #外查询
(select store_name from location where region = 'West'); #内查询。查询西部区域的商店名
#内查询先查询出西部区域的商店名,之后外查询遍历这个商店名列表,查询出每个商店名对应的销售额。
select sum(sales) from store_info where store_name in #外查询
(select store_name from location where region = 'West'); #内查询。查询西部区域的商店名
#内查询先查询出西部区域的商店名,之后外查询遍历这个商店名列表,求出列表中所有商店的销售额之和。
select sum(sales) from store_info A where A.store_name in
(select store_name from location B where B.store_name=A.store_name);
#内查询先查询出B表中和A表相同的商店名,之后外查询遍历这个商店名列表,求出列表中所有商店的销售额之和。
3.6 EXISTS
- 用来测试内查询有没有产生任何结果,类似布尔值是否为真。
- 如果内查询有结果的话,系统就会执行外查询中的SQL语句。若是没有结果的话,那整个SQL语句就不会产生任何结果
SELECT "字段1" FROM "表格1" WHERE EXISTS (SELECT * FROM "表格2" WHERE "条件");
#内查询有结果的话,系统就会执行外查询中的SQL语句
select sum(sales) from store_info where exists (select * from location where region = 'west');
#内查询没有产生结果,会返回NULL值
select sum(sales) from store_info where exists (select * from location where region = 'north');