第03章 基本的SELECT语句
1.SQL概述
1.1 SQL背景知识
- 1946年,世界上第一台电脑诞生,如今,借由这台电脑发展起来的互联网已经自成江湖。在这几十年里,无数的技术、产业在这片江湖里沉浮,有的方兴未艾,有的已经几幕兴衰。但在这片浩荡的波动里,有一门技术从未消失,甚至“老当益壮”,那就是SQL。
45 年前,也就是 1974 年,IBM研究员发布了一篇揭开数据库技术的论文《SEQUEL:一门结构化的英语查询语言》,直到今天这门结构化的查询语言并没有太大的变化,相比于其他语言,SQL 的半衰期可以说是非常长了。 - 不论是前端工程师,还是后端算法工程师,都一定会和数据打交道,都需要了解如何又快又准确地提取自己想要的数据。更别提数据分析师了,他们的工作就是和数据打交道,整理不同的报告,以便指导业务决策。
- SQL(Structured Query Language,结构化查询语言)是使用关系模型的数据库应用语言, 与数据直接打交道 ,由IBM 上世纪70年代开发出来。后由美国国家标准局(ANSI)开始着手制定SQL标准,先后有 SQL-86 , SQL-89 ,SQL-92 , SQL-99 等标准。
SQL 有两个重要的标准,分别是 SQL92 和 SQL99,它们分别代表了 92 年和 99 年颁布的 SQL 标准,我们今天使用的SQL 语言依然遵循这些标准。 - 不同的数据库生产厂商都支持SQL语句,但都有特有内容。
1.2SQL语言排行榜
1.3 SQL 分类
SQL语言在功能上主要分为如下3大类:
DDL(Data Definition Languages、数据定义语言),这些语句定义了不同的数据库、表、视图、索引等数据库对象,还可以用来创建、删除、修改数据库和数据表的结构。
主要的语句关键字包括 CREATE 、 DROP 、 ALTER 等。
- CREATE DATABASE - 创建新数据库
- CREATE TABLE - 创建新表
- CREATE INDEX - 创建索引(搜索键
- DROP TABLE - 删除表
- DROP INDEX - 删除索引
- ALTER DATABASE - 修改数据库
- ALTER TABLE - 变更(改变)数据库表
DML(Data Manipulation Language、数据操作语言),用于添加、删除、更新和查询数据库记录,并检查数据完整性。主要的语句关键字包括 INSERT 、 DELETE 、 UPDATE 、 SELECT 等。SELECT是SQL语言的基础,最为重要。增删改查
- INSERT INTO - 向数据库表中插入数据
- DELETE - 从数据库表中删除数据
- UPDATE - 更新数据库表中的数据
- SELECT - 从数据库表中获取数据
DCL(Data Control Language、数据控制语言),用于定义数据库、表、字段、用户的访问权限和安全级别。主要的语句关键字包括 GRANT 、 REVOKE 、 COMMIT、ROLLBACK 、 SAVEPOINT 等。
因为查询语句使用的非常的频繁,所以很多人把查询语句单拎出来一类:DQL(数据查询语言)。还有单独将 COMMIT 、 ROLLBACK 取出来称为TCL (Transaction Control Language,事务控制语言)。
SQL 语句的分类:
- DDL 数据定义语言
- DML 数据操作语言
- DQL 数据查询语言
- DCL 数据控制语言
2.SQL语言的规则与规范
2.1SQL语言的规则(必须遵守)
- SQL 可以写在一行或者多行。为了提高可读性,各子句分行写,必要时使用缩进
- 每条命令以 ; 或 \g 或 \G 结束
- 关键字不能被缩写也不能分行
- 关于标点符号
1.必须保证所有的()、单引号、双引号是成对结束的
2.必须使用英文状态下的半角输入方式
3.字符串型和日期时间类型的数据可以使用 单引号(‘ ’) 表示
4.列的别名,尽量使用双引号(" "),而且不建议省略as
2.2 SQL大小写规范 (建议遵守)
- MySQL 在 Windows 环境下是大小写不敏感的
- MySQL 在 Linux 环境下是大小写敏感的
1.数据库名、表名、表的别名、变量名是严格区分大小写的
2.关键字、函数名、列名(或字段名)、列的别名(字段的别名) 是忽略大小写的。 - 推荐采用统一的书写规范:
1.数据库名、表名、表别名、字段名、字段别名等都小写
2.SQL 关键字、函数名、绑定变量等都大写
2.3 注 释
可以使用如下格式的注释结构
单行注释:#注释文字(MySQL特有的方式)
单行注释:-- 注释文字(–后面必须包含一个空格。)
多行注释:/* 注释文字 */
2.4 命名规则(暂时了解)
- 数据库、表名不得超过30个字符,变量名限制为29个
- 必须只能包含 A–Z, a–z, 0–9, _共63个字符
- 数据库名、表名、字段名等对象名中间不要包含空格
- 同一个MySQL软件中,数据库不能同名;同一个库中,表不能重名;同一个表中,字段不能重名
- 必须保证你的字段没有和保留字、数据库系统或常用方法冲突。如果坚持使用,请在SQL语句中使用`(着重号)引起来
- 保持字段名和类型的一致性,在命名字段并为其指定数据类型的时候一定要保证一致性。假如数据类型在一个表里是整数,那在另一个表里可就别变成字符型了
2.5 数据导入指令
在命令行客户端登录mysql,使用source指令导入现有的数据表
方式1:source 文件的全路径名
命令行语句 mysql> source c:\Users\17315\Desktop\数据库学习资料\atguigudb.sql
方式2:基于具体的图形化界面的工具导入数据
比如:SQLyog中选择“工具”–“执行SQL脚本” 选择xxx.sql就行
3.基本的SELECT语句
3.0 SELECT…
SELECT 1,9/2,3*2;#没有任何子句
SELECT 1,3*2
FROM DUAL;#dual是伪表
3.1 SELECT … FROM
语法:
最基本的SELECT语句:SELECT字段1,字段2...FROM表名
SELECT 标识选择哪些列
FROM 标识从哪个表中选择
3.2 列的别名
- 重命名一个列
- 便于计算
- 紧跟列名,也可以在列名和别名之间加入关键字AS,别名使用双引号,以便在别名中包含空格或特殊的字符并区分大小写。
- AS 可以省略
- 建议别名简短,见名知意
- 举例
SELECT employee_id emp_id,last_name AS lname,department_id "部门id",salary*12 "annual sal"
FROM employees;
3.3 去除重复行
默认情况下,查询会返回全部行,包括重复行。
在SELECT语句中使用关键字DISTINCT去除重复行
SELECT DISTINCT department_id
FROM employees;
/*输出
+---------------+
| department_id |
+---------------+
| NULL |
| 10 |
| 20 |
| 30 |
| 40 |
| 50 |
| 60 |
| 70 |
| 80 |
| 90 |
| 100 |
| 110 |
+---------------+
*/
针对于:
SELECT DISTINCT department_id,salary
FROM employees;
#输出
+---------------+----------+
| department_id | salary |
+---------------+----------+
| 90 | 24000.00 |
| 90 | 17000.00 |
| 60 | 9000.00 |
| 60 | 6000.00 |
| 60 | 4800.00 |
| 60 | 4200.00 |
| 100 | 12000.00 |
| 100 | 9000.00 |
| 100 | 8200.00 |
| 100 | 7700.00 |
| 100 | 7800.00 |
| 100 | 6900.00 |
| 30 | 11000.00 |
| 30 | 3100.00 |
| 30 | 2900.00 |
| 30 | 2800.00 |
| 30 | 2600.00 |
| 30 | 2500.00 |
| 50 | 8000.00 |
| 50 | 8200.00 |
| 50 | 7900.00 |
| 50 | 6500.00 |
| 50 | 5800.00 |
| 50 | 3200.00 |
| 50 | 2700.00 |
| 50 | 2400.00 |
| 50 | 2200.00 |
| 50 | 3300.00 |
| 50 | 2800.00 |
| 50 | 2500.00 |
| 50 | 2100.00 |
| 50 | 2900.00 |
| 50 | 3600.00 |
| 50 | 3500.00 |
| 50 | 3100.00 |
| 50 | 2600.00 |
| 80 | 14000.00 |
| 80 | 13500.00 |
| 80 | 12000.00 |
| 80 | 11000.00 |
| 80 | 10500.00 |
| 80 | 10000.00 |
| 80 | 9500.00 |
| 80 | 9000.00 |
| 80 | 8000.00 |
| 80 | 7500.00 |
| 80 | 7000.00 |
| 80 | 7200.00 |
| 80 | 6800.00 |
| 80 | 6400.00 |
| 80 | 6200.00 |
| 80 | 11500.00 |
| 80 | 9600.00 |
| 80 | 7400.00 |
| 80 | 7300.00 |
| 80 | 6100.00 |
| 80 | 8800.00 |
| 80 | 8600.00 |
| 80 | 8400.00 |
| NULL | 7000.00 |
| 50 | 4200.00 |
| 50 | 4100.00 |
| 50 | 3400.00 |
| 50 | 3000.00 |
| 50 | 3800.00 |
| 50 | 4000.00 |
| 50 | 3900.00 |
| 10 | 4400.00 |
| 20 | 13000.00 |
| 20 | 6000.00 |
| 40 | 6500.00 |
| 70 | 10000.00 |
| 110 | 12000.00 |
| 110 | 8300.00 |
+---------------+----------+
74 rows in set (0.00 sec)
这里有两点需要注意:
- DISTINCT 需要放到所有列名的前面,如果写成
SELECT salary, DISTINCT department_id FROM employees;
会报错。
- DISTINCT 其实是对后面所有列名的组合进行去重,你能看到最后的结果是 74 条,因为这 74 个部门id不同,都有 salary 这个属性值。如果你想要看都有哪些不同的部门(department_id),只需要写 DISTINCT department_id 即可,后面不需要再加其他的列名了。
3.4 空值参与运算
所有运算符或列值遇到null值,运算的结果都为null
3.5 着重号
错误的:
mysql> SELECT * FROM ORDER;
/*报错
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that
corresponds to your MySQL server version for the right syntax to use near 'ORDER' at line 1
正确的:
SELECT * FROM `ORDER`;
3.6 查询常数
SELECT 查询还可以对常数进行查询。就是在 SELECT 查询结果中增加一列固定的常数列。这列的取值是我们指定的,而不是从数据表中动态取出的。
你可能会问为什么我们还要对常数进行查询呢?
SQL 中的 SELECT 语法的确提供了这个功能,一般来说我们只从一个表中查询数据,通常不需要增加一个固定的常数列,但如果我们想整合不同的数据源,用常数列作为这个表的标记,就需要查询常数。比如说,我们想对 employees 数据表中的员工姓名进行查询,同时增加一列字段 corporation ,这个字段固定值为“尚硅谷”,可以这样写:
SELECT '尚硅谷' as corporation, last_name FROM employees;
4. 显示表结构
使用DESCRIBE 或 DESC 命令,表示表结构。
DESCRIBE employees;
或
DESC employees;