一、高级SQL语句（进阶查询）

先准备2个表

一个location表：

use kgc;
create table location (Region char(20),Store_Name char(20));
insert into location values('East','Boston');
insert into location values('East','New York');
insert into location values('West','Los Angeles');
insert into location values('West','Houston');

一个store_info表：

create table store_info (Store_Name char(20),Sales int(10),Date char(10));
insert into store_info values('Los Angeles','1500','2020-12-05');
insert into store_info values('Houston','250','2020-12-07');
insert into store_info values('Los Angeles','300','2020-12-08');
insert into store_info values('Boston','700','2020-12-08');

1.1 select

select，显示表格中一个或数个字段的所有数据记录。

 语法: SELECT "字段" FROM "表名";
 
 示例：
 select store_name from store_info;
 select store_name,sales from store_info;

1.2 distinct

distinct，不显示重复的数据记录。

注意：关系型数据库，单次只能对一个字段去重

 SELECT DISTINCT "字段" FROM "表名";
 
 示例：
 select distinct store_name from store_info;    #对商店名称进行去重
 select distinct date from store_info;        #对日期字段进行去重

1.3 where

where，有条件查询。

 SELECT "字段" FROM 表名" WHERE "条件";
 
 
 示例：
 select * from store_info where sales > 1000; #查找销售额大于1000的数据记录
 select store_name from store_info where sales > 1000;  #查找销售额大于1000的商店名称

1.4 and 和 or (且和或)

 SELECT "字段" FROM "表名" WHERE "条件1"  AND "条件2";
 SELECT "字段" FROM "表名" WHERE "条件1"  OR "条件2";

#查询销售额大于500且小于1000的数据记录。
 select * from store_info where sales > 500 and sales < 1000 ; 
 
 #查询销售额大于200且小于500的记录，或者销售额大于1000的记录。
 select * from store_info where sales > 1000 or (Sales < 500 and Sales > 200); 
 
 #查询销售额大于200且小于500的商店名，或者销售额大于1000的商店名。
 select store_name from store_info where sales > 1000 or (Sales < 500 and Sales > 200);

1.5 in

in，显示已知的值的数据记录。

SELECT "字段" FROM "表名" WHERE "字段" IN ('值1'， '值2'， ...);   #in,遍历一个取值列表
SELECT "字段" FROM "表名" WHERE "字段" NOT IN ('值1'， '值2'， ...);  #not in取反，查询不在这个范围内的值

#查询商店名为“Los Angeles”，以及商店名为“Houston”的记录。
 select * from store_info where store_name in ('Los Angeles','Houston');    
 
#查询商店名称不是“Los Angeles”、不是“Houston”的记录。
 select * from store_info WHERE store_name not in ('Los Angeles','Houston');

1.6 between

between，显示两个值范围内的数据记录

SELECT "字段" FROM "表名" WHERE "字段" BETWEEN '值1' AND '值2';

#查询销售额在500~1500之间的数据记录（包含500和1500）
select * from store_info where sales between 500 and 1500;
 
#查询店铺开业日期在2020-12-06到2020-12-10之间的记录（包含这两个日期）
select * from store_info where date between '2020-12-06' and '2020-12-10';

1.7 通配符

通配符一般都是跟 like 一起使用的。

 %：百分号表示零个、一一个或多个字符
 _：划线表示单个字符

'A_Z'：所有以'A'起头，另一个任何值的字符，且以'Z'为结尾的字符串。
 例如，'ABZ'和'A2Z' 都符合这一一个模式，而'AKKZ'并不符合(因为在A和z之间有两个字符，而不是一个字符)。
 
 'ABC%'：所有以'ABC'起头的字符串。例如，'ABCD' 和'ABCABC' 都符合这个模式。
 
 '%XYZ'：所有以'XYZ' 结尾的字符串。例如，'WXYZ' 和'ZZXYZ' 都符合这个模式。
 
 '%AN%'：所有含有'AN'这 个模式的字符串。例如，'LOS ANGELES'和'SAN FRANCISCO' 都符合这个模式。
 
 '_AN%': 所有第二个字母为'A' 和第三个字母为'N' 的字符串。
 例如，'SAN FRANCISCO' 符合这个模式，而'Los ANGELES'则不符合这个模式。

1.8 like

like，匹配一个模式来找出我们要的数据记录

SELECT "字段" FROM "表名" WHERE "字段" LIKE {模式} ;

 #查询商店名称包含字符串"os"的记录
 select * from store_info where store_name like '%os%';
 
 #查询商店名称以字符串"on"结尾的记录
 select * from store_info where store_name like '%on';
 
 #查询商店名称的第二、第三个字符为"os"的记录
 select * from store_info where store_name like '_os%';

1.9 order by

order by，按关键字排序。

注意：

一般对数值字段进行排序。
如果对字符类型的字段进行排序，则会按首字母排序。

 SELECT "字段" FROM "表名" [WHERE "条件"] ORDER BY "字段" [ASC|DESC] ;
 #ASC是按照升序进行排序的，是默认的排序方式。
 #DESC是按降序方式进行排序。

 #查看store_info表中的所有记录，按销售额进行升序排列。
 select * from store_info order by sales ASC；    #ASC可以不加，默认升序
 
 #查看store_info表中的所有记录，按销售额进行倒序排列。
 select * from store_info order by sales desc;
 
 #获取销售额最大的那行数据记录。即先按销售额进行倒序排列，之后取第一行记录。
 select * from store_info order by sales desc limit 1;

二、函数

 SELECT abs(-1),rand(), mod(5,3) ,power(2,3);
 #返回：1， 0-1之间的随机数，2，8
 
 SELECT round(1.89),sqrt(2);
 #返回：2，1.414
 
 SELECT round(1.8937,3),truncate (1.235,2);
 #返回：1.894，1.23
 
 SELECT ceil(5.2) ,floor(2.1) ,least(1.89,3,6.1,2.1);
 #返回：6，2，1.89

2.2 聚合函数

注意：

count(列名)：只包括列名那一列的行数，在统计结果的时候，会忽略列值为 NULL 的行。
count(*) ：包括了所有的列的行数，在统计结果的时候，不会忽略列值为 NULL。

 select avg(sales) from store_info;   #求表中销售额字段的平均值
 
 select sum(sales) from store_info;   #求表中销售额字段所有值的和

 select max(sales) from store_info;    #显示表中销售额字段的最大值
 
 select min(sales) from store_info;    #显示表中销售额字段的最小值

 #统计表中store_name字段有多少个非空值
 select count(store_name) from store_info;
 
 #统计表中store_name字段有多少个不重复的非空值
 select count(distinct store_name) from store_info;

例4：比较 count(列名) 和 count(*)

count(列名)：会忽略null值的行。
count(*) ：会统计所有行。

 #先准备一个数据表city
 create table city(name char(20));
 insert into city values('beijing');
 insert into city values('nanjing');
 insert into city values('hangzhou');
 insert into city values();
 insert into city values();
 
 #统计name字段有多少个非空值，会忽略字段值为null的行
 select count(name) from city;
 
 #统计所有行，不会忽略字段值为null的行。全表扫描。
 select count(*) from city;

2.3 字符串函数

2.3.1 拼接的两种方法

方法一：concat(x,y)

 select concat('zhang','san');  #将字符串"zhang"和"san"拼接在一起
 
 select concat('zhang','san','san');   #将3个字符串拼接在一起
 
 select concat('zhang',' ','san');   #将字符串"zhang"、空格、"san"拼接在一起

 #将location表中，region字段值和store_name字段值拼接在一起。
 select concat(region,store_name) from location;
 
 #将location表中，region字段值和store_name字段值拼接在一起，且中间加空格。
 select concat(region,' ',store_name) from location;

方法二：使用 || 符号（5.7之后的版本才支持）

如果sql_mode开启了PIPES_AS_CONCAT（可查看配置文件进行确认），"||"视为字符串的连接操作符而非”或“运算符，和字符串的拼接函数Concat相类似，这和Oracle数据库使用方法一样的。

 #将location表中，region字段值和store_name字段值拼接在一起。
 select Region || store_name from location;
 
 #将location表中，region字段值和store_name字段值拼接在一起，且中间加空格。
 select Region || ' ' || store_name from location;

2.3.2 截取

substr(x,y)和 substr(x,y,z)

 #从商店名称的第3个字符开始截取直到最后一个字符。
 select substr(Store_Name,3) from location;
 
 #从商店名称的第2个字符开始截取长度为4的字符串。
 select substr(Store_Name,2,4) from location;
 
 #当商店名为"Los Angeles"时，从商店名称的第3个字符开始截取直到最后一个字符。
 select substr(Store_Name,3) from location where Store_Name='Los Angeles';
 
 #当商店名为"New York"时，从商店名称的第2个字符开始截取长度为4的字符串。
 select substr(Store_Name,2,4) from location where Store_Name='New York';

2.3.3 去除格式 trim()

 SELECT TRIM ([ [位置] [要移除的字符串] FROM ] 字符串);
 
 #[位置]：值可以为 LEADING (起头), TRAILING (结尾), BOTH (起头及结尾)。 
 #[要移除的字符串]：从字串的起头、结尾，或起头及结尾移除的字符串。缺省时为空格。

 select trim(leading 'Ne' from 'New York');    #移除"New York"开头的"Ne"
 
 select trim(trailing 'k' from 'New York');    #移除"New York"结尾的"k"

2.3.4 返回字符长度 length

select store_name,length(store_name) from location;   #统计store_name字段值的字符长度

2.3.5 替换 replace

 select replace(region,'st','stern') from location;   
 #将region字段值中的字符串"st"替换为字符串"stern"

三、进阶查询（二）

3.1 GROUP BY（用于分组和汇总）

对GROUPBY后面的字段的查询结果进行汇总分组，通常是结合聚合函数一起使用的

"GROUP BY"有一个原则，凡是在"GROUP BY"后面出现的字段，必须在SELECT 后面出现；
凡是在SELECT 后面出现的、且未在聚合函数中出现的字段，必须出现在"GROUP BY"后面。

SELECT 字段1,SUM(字段2) FROM 表名 GROUP BY 字段1;

 select store_name from store_info group by store_name;
 #对store_name字段值进行分组汇总。
 
 select store_name,count(store_name) from store_info group by store_name;
 #对store_name字段值进行分组汇总，并统计组内每个非空值的数量。
 
 select store_name,sum(sales) from store_info group by store_name;
 #对store_name字段值进行分组汇总，并计算每组的销售额。即分组后求和。
 
 select store_name,sum(sales) from store_info group by store_name order by sum(sales) desc;
 #对store_name字段值进行分组汇总，并计算每组的销售额，之后对组销售额降序排序。

3.2 HAVING（和 group by配合使用）

用来过滤由"GROUP BY"语句返回的记录集，通常与"GROUP BY"语句联合使用。
HAVING语句的存在弥补了WHERE 关键字不能与聚合函数联合使用的不足。
where只能对原表中的字段进行筛选，不能对group by后的结果进行筛选。

SELECT 字段1,SUM(字段2) FROM "表格名" GROUP BY 字段1 HAVING(函数条件) ;

select store_name,sum(sales) from store_info group by store_name having sum(sales)>1500;
 #对store_name字段值进行分组汇总，计算每组的销售额，之后显示组销售额大于1500的记录。

3.3 别名——字段别名、表別名

SELECT 字段1,字段2 AS 字段2的别名 from 表名;   #AS可以省略不写
 
 示例：
select store_name,sum(sales) as A from store_info group by store_name having A > 1000;
 #设置sum(sales)字段的别名为A。
 #对store_name字段进行分组汇总，并计算组内销售额之和，之后查询出组销售额大于1000的记录。

SELECT 表格别名.字段1 [AS] 字段别名  FROM 表格名 [AS] 表格别名; #AS可以省略不写
 
例：
select A.store_name store, sum(A.sales) total_sales from store_info A group by A.store_Name;
 #设置store_info表的别名为A，A.store_name字段的别名为store，sum(A.sales)字段的别名为total_sales。
 #对A表的store_Name字段进行分组汇总，并计算组销售额。即分组后求组内之和。

3.4 表的自我连接

例如：对销售额字段进行排名，并显示名次

#count统计的是A表中销售额的每个值小于等于B表中每个值的次数。（A和B都是store_info的别名，即表的自我连接，自己跟自己对比。）
select A.store_name,A.sales,count(A.sales) rank from store_info as A,store_info as B where A.sales <= B.sales group by A.store_name,A.sales order by rank asc;

如果表中有相同数值的销售额，使用如下语句：

select A.store_name,A.sales,count(A.sales) rank from store_info as A,store_info as B where A.sales<B.sales or (A.sales=B.sales and A.store_name=B.store_name) group by A.store_name,A.sales order by rank asc;

3.5 子查询

子查询：连接表格，在WHERE 子句或HAVING 子句中插入另一个SQL语句。

 SELECT "字段1" FROM "表格1" WHERE "字段2" [比较运算符]     #外查询
 (SELECT "字段1" FROM "表格2" WHERE "条件") ;             #内查询
 
 #可以是符号的运算符，例如=、>、<、>=、<= ;也可以是文字的运算符，例如LIKE、 IN、BETWEEN
 
 #先执行内查询，再执行外查询。内查询的查询结果，作为外查询的条件

#两张表连接在一起
select * from store_info A, location B where A.store_name=B.store_name;

select sales from store_info where store_name in           #外查询
(select store_name from location where region = 'West');   #内查询。查询西部区域的商店名
 
#内查询先查询出西部区域的商店名，之后外查询遍历这个商店名列表，查询出每个商店名对应的销售额。

 select sum(sales) from store_info where store_name in      #外查询
 (select store_name from location where region = 'West');   #内查询。查询西部区域的商店名
 
 #内查询先查询出西部区域的商店名，之后外查询遍历这个商店名列表，求出列表中所有商店的销售额之和。

select sum(sales) from store_info A where A.store_name in
(select store_name from location B where B.store_name=A.store_name);
 
 #内查询先查询出B表中和A表相同的商店名，之后外查询遍历这个商店名列表，求出列表中所有商店的销售额之和。

3.6 EXISTS

用来测试内查询有没有产生任何结果，类似布尔值是否为真。
如果内查询有结果的话，系统就会执行外查询中的SQL语句。若是没有结果的话，那整个SQL语句就不会产生任何结果

SELECT "字段1" FROM "表格1" WHERE EXISTS (SELECT * FROM "表格2" WHERE "条件");

#内查询有结果的话，系统就会执行外查询中的SQL语句
 select sum(sales) from store_info where exists (select * from location where region = 'west');
 
 #内查询没有产生结果，会返回NULL值
 select sum(sales) from store_info where exists (select * from location where region = 'north');