1.本文前言
数据库是用来存储数据,更新,查询数据的工具,而查询数据是一个数据库最为核心的功能,数据库是用来承载信息,而信息是用来分析和查看的。所以掌握更为精细化的查询方式是很有必要的。本文将围绕数据的高级查询语句展开。
为了下面查询语句的运用,事先准备了两张表,后续也会根据查询功能的运用会对表进行一些变动,或则创建新表:
CREATE TABLE info (
id int(4) ,
name char(4),
height double
) ;
CREATE TABLE info2 (
name char(4)
hobby char(10)
date char(10)
) ;
2. 高效查询方式
2.1 指定指字段进行查看
select 字段1,字段2 from 表名;
2.2 对字段进行去重查看
SELECT DISTINCT "字段" FROM "表名";
2.3 where条件查询
SELECT "字段" FROM 表名" WHERE "条件";
2.4 and 和 or 进行逻辑关系的增加
SE SELECT "字段" FROM "表名" WHERE "条件1" AND "条件2";
LECT "字段" FROM "表名" WHERE "条件1" OR "条件2";
2.5 查询取值列表中的数据
SELECT "字段" FROM "表名" WHERE "字段" IN ('值1', '值2', ...); #in,遍历一个取值列表
2.6 between的引用
SELECT "字段" FROM "表名" WHERE "字段" BETWEEN '值1' AND '值2';
2.7 like的查询 方式
like查询通常会与通配符配合使用
%:百分号表示零个、一一个或多个字符
_:划线表示单个字符
select * from info2 where hobby like '%ing';
select * from info2 where name like '小_';
2.8 排序方式进行查询
order by,按关键字排序。
注意:
- 一般对数值字段进行排序。
- 如果对字符类型的字段进行排序,则会按首字母排序。
SELECT "字段" FROM "表名" [WHERE "条件"] ORDER BY "字段" [ASC|DESC] ;
#ASC是按照升序进行排序的,是默认的排序方式。
#DESC是按降序方式进行排序。
select * from info order by height;
select * from info order by height asc;
select * from info order by height desc;
3.运用函数查询
3.1 数据库中常用数学的函数
数学函数 | 作用 |
abs(x) | 返回x的绝对值 |
rand() | 返回0到1的随机数 |
mod(x, y) | 返回x除以y以后的余数 |
power(x, y) | 返回x的y次方 |
round(x) | 返回离x最近的整数 |
round(x, y) | 保留x的y位小数四舍五入后的值 |
sqrt(x) | 返回x的平方根 |
truncate(x, y) | 返回数字x截断为y位小数的值 #不四舍五入 |
ceil(x) | 返回大于或等于x的最小整数 |
floor(x) | 返回小于或等于x的最大整数 |
greatest(x1,x2,...) | 返回集合中最大的值 |
least(x1,x2,...) | 返回集合中最小的值 |
SELECT abs(-1),rand(), mod(5,3) ,power(2,3);
SELECT truncate(1.89,2);
SELECT truncate(1.89,1);
truncate 和 round区别
select ceil(1.76);
select floor(1.76);
select greatest(1,2,3,55,12,55,61);
select least(1,2,3,55,12,55,61);
3.2 聚合函数
聚合函数 | 含义 |
avg() | 返回指定列的平均值 |
count() | 返回指定列中非 NULL 值的个数 |
min() | 返回指定列的最小值 |
max() | 返回指定列的最大值 |
sum(字段) | 返回指定列的所有值之和 |
例:
select avg(height) from info;
select max(height) from info;
select min(height) from info;
select sum(height) from info;
3.3 字符串函数
(1)去除字符 trim
SELECT TRIM ([ [位置] [要移除的字符串] FROM ] 字符串);
#trim后面括号前不能有空格
#[位置]:值可以为 LEADING (起头), TRAILING (结尾), BOTH (起头及结尾)。
#[要移除的字符串]:从字串的起头、结尾,或起头及结尾移除的字符串。缺省时为空格。
select trim(leading 's' from 'swmming' );
select trim(trailing 'g' from 'swmming' );
select trim(both 'l' from 'lol' );
(2) 截取 substr
substr(x,y) #截取x字符串 从第y个开始,截取到末尾
substr(x,y,z) #截取x字符串 从第y个开始截取 ,截取长度为z
select substr(hobby,2) from info2;
select substr(hobby,3) from info2;
(3)字段拼接
方法一:
select concat(name,height) from info;
方法二:
#将info表中,name字段值和height字段值拼接在一起。
select name || height from info;
(4) 返回字符长度 length
select length(hobby) from info2;
(5)替换 replace
select replace(name,'小','大') from info2;
4.高级查询语句
4.1 GROUP BY(用于分组和汇总)
对GROUPBY后面的字段的查询结果进行汇总分组,通常是结合聚合函数一起使用的
"GROUP BY"有一个原则,凡是在"GROUP BY"后面出现的字段,必须在SELECT 后面出现;
凡是在SELECT 后面出现的、且未在聚合函数中出现的字段,必须出现在"GROUP BY"后面。
(1)汇总统计
select name, count(name) from info group by name;
(2)汇总并对其指定字段(数字类)进行累加
select name,sum(saving) from info3 group by name;
(3)汇总并对其指定字段(数字类)进行累加,再进行降序
select name,sum(saving) from info3 group by name order by sum(saving) desc;
4.2 HAVING 过滤
-
用来过滤由"GROUP BY"语句返回的记录集,通常与"GROUP BY"语句联合使用。
-
HAVING语句的存在弥补了WHERE 关键字不能与聚合函数联合使用的不足。
-
where只能对原表中的字段进行筛选,不能对group by后的结果进行筛选。
SELECT 字段1,SUM(字段2) FROM "表格名" GROUP BY 字段1 HAVING(函数条件) ;
select name,sum(saving) from info3 group by name having sum(saving)>1500;
4.3 别名设置查询
SELECT 字段1,字段2 AS 字段2的别名 from 表名; #AS可以省略不写
(1)字段别名
select name,sum(saving) as total_saving from info3 group by name having sum(saving)>1000;
select name,sum(saving) as total_saving from info3 group by name having total_saving>1000;
(2)表别名
SELECT 表格别名.字段1 [AS] 字段别名 FROM 表格名 [AS] 表格别名; #AS可以省略不写
4.4 表的自我连接
(1)无重复数值排名
对下面的表进行saving比较并且进行排名通过表的自我连接进行实现
表的自我连接达到排名的原理分析及操作思路:
1.以上面的数据表为例,假设共有四个人,他们手中的金额各不相同。我们已经进行表的自我连接。
2. 使用count计数,只计数大于等于自身手上金额的人数,比如2000的小明,大于等于他的人数只有1个,就计数值也可以当作他的排名
3.再比如800的小红,大于等于她的有4个人,就该计数值为4,同理可以证明她排名第四。
select A.name,A.saving,count(A.saving) as rank from info3 as A,info3 as B where A.saving <=B.saving group by A.name,A.saving order by rank asc;
(2)有重复数值排名
4.5 子查询语句
子查询:连接表格,在WHERE 子句或HAVING 子句中插入另一个SQL语句。
SELECT "字段1" FROM "表格1" WHERE "字段2" [比较运算符] #外查询
(SELECT "字段1" FROM "表格2" WHERE "条件") ; #内查询
普通的表数据连接:
select * from info as A, info3 as B where A.name=B.name;
子查询加入表连接 :
select * from info where name in(select name from info3 where saving > 1000);
子查询运用升级
求“北京地区”的所有saving值之和
select sum(saving) from info3 where name in (select name from info where address='北京');
select sum(saving) from info3 where name in
(select name from info where address='北京');
4.6 EXISTS
- 用来测试内查询有没有产生任何结果,类似布尔值是否为真。
- 如果内查询有结果的话,系统就会执行外查询中的SQL语句。若是没有结果的话,那整个SQL语句就不会产生任何结果。
格式:
SELECT "字段1" FROM "表格1" WHERE EXISTS (SELECT * FROM "表格2" WHERE "条件");
5. 表连接查询
MYSQL数据库中常用的表连接有三种:
- inner join(内连接):只返回两个表中联结字段相等的行(有交集的值)
- left join(左连接):返回包括左表中的所有记录和右表中联结字段相等的记录
- A left join B : A为左表,B为右表
- right join(右连接):返回包括右表中的所有记录和左表中联结字段相等的记录
- A right join B: A为左表 ,B为右表
(1) 内连接 inner join
select * from info A inner join info3 B on A.name = B.name;
其他实现内连接的方式:
select * from info A, info3 B where A.name=B.name;
select * from info A inner join info3 B using(name);
(2)左连接 left join
select * from info A LEFT JOIN info3 B on A.name=B.name;
(3)右连接 right join
select * from info3 A right join info B on A.name=B.name ;
6. view 视图的运用
视图:可以被当作是虚拟表或存储查询。
视图跟表格的不同是,表格中有实际储存数据记录,而视图是建立在表格之上的一个架构,它本身并不实际储存数据记录。
临时表在用户退出或同数据库的连接断开后就自动消失了,而视图不会消失。
视图不含有数据,只存储它的定义,它的用途一般可以简化复杂的查询。 比如你要对几个表进行连接查询,而且还要进行统计排序等操作,写SQL语句会很麻烦的,用视图将几个表联结起来,然后对这个视图进行查询操作,就和对一个表查询一样,很方便。
格式
CREATE VIEW "视图表名" AS "SELECT 语句"; #创建视图表
DROP VIEW "视图表名"; #删除视图表
(1)视图的创建
创建需求:独立创建一个视图,用来统计info和info3 两张表之间,先对name进行address的汇总,再计算地区的saving之和 。要求体现出address 和sum(sving) 两个字段
create view v_address_saving as select A.address,sum(B.saving) total_saving from info A inner join info3 B on A.name=B.name group by address;
(2) 视图提供的后续便捷操作
视图的好处:创建视图的过程虽然和高级查询语句(通过两个select语句进行组合条件划分生成派生表)一样,过程是复杂的,但是如果该查询操作是需要经常使用的,创建视图就很有必要,不仅能简化查询过程,还能对该查询进行进一步操作,而且十分简便。
进一步需求: 需要计算出苏州和上海两个地区的saving之和
select sum(total_saving) as suzhou_shanghai_saving from v_address_saving where address='苏州'or address='上海';
(3)经典定义问题:视图能否插入数据
视图能否插入数据,要看情况而定:
1)如果视图表是两个表的连接查询(比如视图的A字段来自A表,B字段来自B表,数据是无法插入的)。因为表结构和原表不一致。视图中的字段是根据原表中某个字段,通过函数运算,产生的新字段,而没有真正能够存储的字段,所以该数据是无法插入的
2)如果视图表结构与原表保持一致,数据是可以插入的,插入的数据是存储在原表中,视图所更新出的数据,其实是映射原表的数据。
7.UNION 联级
UNION联集:将两个SQL语句的结果合并起来,两个SQL语句所产生的字段需要是同样的数据记录种类。
7.1 UNION(合并后去重)
生成结果的数据记录值将没有重复,且按照字段的顺序进行排序。#合并后去重
格式:[select 语句1] UNION [select 语句2];
7.2 UNION ALL(合并后不去重)
select name from info union all select name from info3;
8. 多种方式求表与表的交集值
8.1 联级视图求交集值
create view v_info as select distinct name from info union all select distinct name from info3;
select name,count(*) from v_info group by name;
select name from v_info group by name having count(*) >1;
8.2 内连接求交集值
(1)不去重求交集
select A.name from info A inner join info3 B on A.name=B.name;
select A.name from info A inner join info3 B using(name);
(2)去重求交集
select distinct A.name from info A inner join info3 B using(name);
8.3 使用左连接求交集值
select * from info A left join info3 B using(name);
select distinct A.name from info A left join info3 B using(name) where B.name is not null;
8.4 使用右连接求交集
#使用右连接查出store_name字段的交集值,之后去重
select * from info A right join info3 B using(name);
select distinct A.name from info A right join info3 B using(name) where A.name is not null;
或
select distinct A.name from info A right join info3 B on A.name=B.name where A.name is not null;
8.5 使用子查询的方式求交集值
select distinct name from info where name in (select name from info3);
8.6 取非交集值
(1)联级方法中 count(*)<=1
(2)左右内连接 将is not null 改为 is null
(3)子查询 外连接查询 not in (内连接查询)
9. case 条件选择查询语句
SELECT CASE ("字段名")
WHEN "条件1" THEN "结果1"
WHEN "条件2" THEN "结果2"
[ELSE "结果N"]
END
FROM "表名";
# "条件"可以是一个数值或是公式。ELSE子句则并不是必须的。
mysql> select address,case address
-> when '上海' then height-10
-> when '北京' then height+5
-> else height+10
-> end
-> "new_height",name
-> from info;
10. 正则表达式的运用
10.1 sql正则表达式的常见种类
正则符号 作用
^ 匹配文本的开始字符
$ 匹配文本的结束字符
. 匹配任何单个字符
* 匹配零个或多个在它前面的字符
+ 匹配前面的字符 1 次或多次
字符串 匹配包含指定的字符串
l 或,“|”前面的不成立时,就匹配后面的字符串
[...] 匹配字符集合中的任意一个字符
[^...] 匹配不在括号中的任何字符
{n} 匹配前面的字符串 n 次
{n,m} 匹配前面的字符串至少 n 次,至多m 次
10.2 sql正则运用
格式
select "字段" from "表名" where "字段" regexp '正则表达式';
探究:空值(NULL)和无值(' ')的区别
无值的长度为0,不占用空间;而NULL值的长度是NULL,是占用空间的。
IS NULL
或者IS NOT NULL
,是用来判断字段是不是为NULL或者不是NULL,不能查出是不是无值的。
无值的判断使用=' '
或者< >' '
来处理。<>代表不等于。
在通过 count ()
指定字段统计有多少行数时,如果遇到NULL值会自动忽略掉,遇到无值会加入到记录中进行计算。