SQL连接与筛选:解析left join on和where的区别及典型案例分析

news2024/12/24 11:43:35

文章目录

  • 前言
  • 一、left join on和where条件的定义和作用
    • left join on条件
    • where条件
  • 二、left join on和where条件的区别
    • 原理不同
      • left join原理:
      • where原理:
    • 应用场景不同
    • 执行顺序不同(作用阶段不同)
    • 结果集不同
  • 三、实际案例理解left join on和where条件
    • 建表
    • 案例实操
      • 使用left join on的查询语句:
        • 常规案例-on主外键
        • 变形1-on其他列
        • 变形2-on多个条件
        • ~变态变形3-on无关联字段
      • 使用where条件的查询语句:
    • 总结:
  • TODO后续

在这里插入图片描述

前言

作为一名Java(CRUD)开发工程师,与数据库打交道的时间可不少,我们在编写SQL语句时,经常会用到left join on和where条件来过滤数据,对于初学者来说,都会遇到一个经典问题:left join on后面的条件和where条件的区别到底是什么?

还记得在刚工作那会,我就写过2篇针对left join on相关的文章,最近又看了下之前的文章,发现又有了新的体会,

注意区分left join on 后面的条件 和where 后面的条件------这篇有点low了
测试一下你真的理解数据库左连接了吗?--------这篇说实话可以结合我写的例子看看你自己是否掌握了数据库的left join on左连接

本篇文章我将深入探讨left join on后面条件和where条件的异同,并通过实际SQL案例进行详细解析,帮助大家理解和应用这两个关键的查询语句。

一、left join on和where条件的定义和作用

left join on条件

在SQL语句中,left join on条件是用来指定两个表之间相关字段的连接方式。它用于联结两个表,返回左表中所有的记录以及符合连接条件的右表记录。 left join on条件通常结合on子句使用,格式如下:

SELECT 列名
FROM 表名1
LEFT JOIN 表名2
ON 表名1.列名 = 表名2.列名

where条件

where条件则是用于过滤记录的条件语句。它用于对查询结果进行进一步筛选,只选择满足条件的记录。where条件可以组合多个条件,使用逻辑运算符(如AND、OR)来连接。格式如下:

SELECT 列名
FROM 表名
WHERE 条件1 AND 条件2 ...

二、left join on和where条件的区别

原理不同

  • on条件是在生成临时表时使用的条件,它不管on中的条件是否为真,都会返回左边表中的记录。

  • where条件是在临时表生成好后,再对临时表进行过滤的条件。这时已经没有left join的含义(必须返回左边表的记录)了,条件不为真的就全部过滤掉。

具体一步步分析一下:

left join原理:

  1. 遍历左表中的每一条记录。
  2. 对于左表中的每一条记录,尝试在右表中找到匹配的记录(注意如果右边找到多条,左表重复展示,右边分别展示对应的数据),匹配条件由ON子句指定。
  3. 如果找到匹配的记录,则将这两条记录合并成一条新记录,并添加到结果集中。
  4. 如果未找到匹配的记录,则将左表的记录与NULL值合并成一条新记录,并添加到结果集中。

特别需要注意上面第2点,遍历过程中如果右边找到多条,左表重复展示,右边分别展示对应的数据,下面会有例子帮助理解

where原理:

  1. 从表中检索出所有记录。
  2. 对每一条记录应用WHERE子句中的条件表达式。
  3. 如果记录满足条件表达式,则将其包含在结果集中。
  4. 如果记录不满足条件表达式,则将其排除在结果集之外。
  • 这里也可以注意第2点,对于每一条记录都应用WHERE子句中的条件进行过滤,也就是如果不符合就是左边和右边都不会显示,
  • 而上面left join on是对于不符合的会将左表记录与NULL值合并成一条记录添加到结果集,也就是左表记录数据一定会展示出来!

应用场景不同

  • left join on常用于连接两个或多个表,并显示左表中所有记录以及匹配的右表记录。它适用于需要获取连接表间所有数据的场景。

  • 而where条件则是用于在查询结果上进行进一步的筛选和限定,通常是基于某些列的具体值或范围进行选择。

执行顺序不同(作用阶段不同)

  • left join on是在连接过程中确定两个表之间的连接条件,并将满足条件的记录组合在一起。也就是LEFT JOIN 发生在数据连接阶段!

  • 而where条件是在连接完成后对结果集进行筛选和过滤。也就是WHERE 条件发生在数据筛选阶段!

结果集不同

  • left join on会返回左表的所有记录以及符合连接条件的右表记录,即使条件不满足也会返回左表的数据。

  • 而where条件只会返回满足条件的记录。

三、实际案例理解left join on和where条件

为了更深入地理解left join on和where条件的区别,让我们来看一个实际案例。

建表

注意这里的建表语句跟我之前文章的测试一下你真的理解数据库左连接了吗?一模一样,可以两篇一起理解看看!

假设我们有两张表:大学学生大学选修班级来模拟大学生选修课程,。其中选修班级包括选修班级名称cname ,是否删除is_delete学生表包括学生的姓名name、班级class_id、以及选修班级的课程(这里采用hobby字段标识),

选修班级表t_class如下:

  • 注意这里Java课程有2条记录,其中一条是is_delete=1已经逻辑删除了,其中一条是正常启用的
DROP TABLE IF EXISTS `t_class`;
CREATE TABLE `t_class`
(
    `cid`       int(11)       NOT NULL AUTO_INCREMENT,
    `cname`     varchar(255)           DEFAULT NULL comment '选修班级名称',
    `is_delete` smallint(255) NOT NULL DEFAULT 0 comment '是否逻辑删除',
    PRIMARY KEY (`cid`) USING BTREE
);

-- ----------------------------
-- Records of t_class
-- ----------------------------
INSERT INTO `t_class` VALUES (1, 'Java', 0);
INSERT INTO `t_class` VALUES (2, 'Python', 0);
INSERT INTO `t_class` VALUES (3, 'C语言', 0);
INSERT INTO `t_class` VALUES (4, 'Java', 1);
cidcnameis_delete
1Java0
2Python0
3C语言0
4Java1

学生信息t_student如下:

  • 注意这里采用hobby字段代表学生选修班级的名称,正常这里用选修班级id关联就可以了,有时候我们为了查询方便会多冗余一下别的字段
DROP TABLE IF EXISTS `t_student`;
CREATE TABLE `t_student`
(
    `id`       int(11) NOT NULL AUTO_INCREMENT,
    `name`     varchar(255) DEFAULT NULL comment '学生姓名',
    `class_id` int(11) NULL DEFAULT NULL comment '选修班级id',
    `hobby`    varchar(255) DEFAULT NULL comment '选修班级名称',
    PRIMARY KEY (`id`) USING BTREE
);
-- ----------------------------
-- Records of t_student
-- ----------------------------
INSERT INTO `t_student` VALUES (1, '小王', 1, 'Python');
INSERT INTO `t_student` VALUES (2, '小红', 2, 'Java');
INSERT INTO `t_student` VALUES (3, '小明', 3, 'C语言');
INSERT INTO `t_student` VALUES (4, '小李', 4, 'Java');
idnameclass_idhobby
1小王1Python
2小红2Java
3小明3C语言
4小李4Java

案例实操

现在我们想查询每个学生以及他们的选修课程,即使没有选修课程记录,也要显示学生信息。

使用left join on的查询语句:

常规案例-on主外键

正常的我们用学生表的class_id关联课程表的cid即可

select * from t_student s left join t_class c on  s.class_id=c.cid
idnameclass_idhobbycidcnameis_delete
1小王1Python1Java0
2小红2Java2Python0
3小明3C语言3C语言0
4小李4Java4Java1

这种是我们最常见的例子,接下来我们看看另外一种变形

变形1-on其他列

如果我们想用想学生表的选修班级名字去关联班级名称呢?SQL也很简单,但是对应的结果大家可以好好也猜一下

select * from t_student s left join t_class c on  s.hobby=c.cname
idnameclass_idhobbycidcnameis_delete
1小王1Python2Python0
2小红2Java1Java0
2小红2Java4Java1
3小明3C语言3C语言0
4小李4Java1Java0
4小李4Java4Java1

我们可以发现关联出来的小红和小李他们的记录会有2行,这是为什么?有注意到我们刚刚上面提到的left join on的原理执行步骤吗:

  1. 遍历左表中的每一条记录。
  2. 对于左表中的每一条记录,尝试在右表中找到匹配的记录(注意如果右边找到多条,左表重复展示,右边分别展示对应的数据),匹配条件由ON子句指定。
  3. 如果找到匹配的记录,则将这两条记录合并成一条新记录,并添加到结果集中。
  4. 如果未找到匹配的记录,则将左表的记录与NULL值合并成一条新记录,并添加到结果集中。

注意到上面第2点,遍历过程中如果右边找到多条,左表重复展示,右边分别展示对应的数据,对应这个例子就是小红选修的课程有2条记录,其中一条是正常启用的,一条是废弃删除的

变形2-on多个条件

假如现在我们想查询每个学生以及他们选修了Java课程的,即使没有选修Java课程记录,也要显示学生信息。

select * from t_student s left join t_class c on  s.hobby=c.cname and s.hobby='Python'
idnameclass_idhobbycidcnameis_delete
1小王1Python2Python0
2小红2Java
3小明3C语言
4小李4Java

我们先把条件拆解,然后按着上面这个步骤一步步来
第1步执行完select * from t_student s left join t_class c on s.hobby=c.cname 就是上面的结果

idnameclass_idhobbycidcnameis_delete
1小王1Python2Python0
2小红2Java1Java0
2小红2Java4Java1
3小明3C语言3C语言0
4小李4Java1Java0
4小李4Java4Java1

接着我们再看on的另外一条件 s.hobby='Python',同时结合这两个步骤

  • 如果找到匹配的记录,则将这两条记录合并成一条新记录,并添加到结果集中。
  • 如果未找到匹配的记录,则将左表的记录与NULL值合并成一条新记录,并添加到结果集中。

所以我们就是在上面的表格上进行过滤,只保留cname='Python’的班级,对于找不到的班级,就用NULL与左表合并显示,所以我们的左边的记录一定是完整的!

最终得到的结果就应该班级表只有Python信息,但是左表学生全部都会查询展示信息

idnameclass_idhobbycidcnameis_delete
1小王1Python2Python0
2小红2Java
3小明3C语言
4小李4Java

同理,如果改成select * from t_student s left join t_class c on s.hobby=c.cname and s.hobby='Python'呢?如果真的理解了应该很容易想出答案!

idnameclass_idhobbycidcnameis_delete
1小王1Python
2小红2Java1Java0
2小红2Java4Java1
3小明3C语言
4小李4Java1Java0
4小李4Java4Java1
~变态变形3-on无关联字段

前面的3个案例都是t_class和t_student有关联字段将两者关联在一起了,那么如果我没关联字段,阁下又当如何应对?

这个案例是我在文章测试一下你真的理解数据库左连接了吗?的最后一个例子,结果比较奇葩,正常也不会有这样关联的,大家可以蛮看理解一下!

select * from t_student s left join t_class c on s.hobby='Python'

结果如下:

idnameclass_idhobbycidcnameis_delete
1小王1Python1Java0
1小王1Python2Python0
1小王1Python3C语言0
1小王1Python4Java1
2小红2Java
3小明3C语言
4小李4Java

关键在于 left join 的条件 s.hobby = 'Python'。由于这个条件与 t_class 表无关,它实际上会导致一个笛卡尔积,然后根据这个条件来进行筛选

这个查询实际上会对 t_student 表中的每一行进行左连接,但 left join 的条件是 s.hobby = 'Python'。因为这个条件与 t_class 表无关,所有的行都会被保留,t_class 表的列会根据条件 s.hobby = 'Python' 来填充。

  • 对于 id=1 这一行,hobby'Python',所以会与 t_class 表的所有行进行左连接,因为 hobby = 'Python' 的条件总是成立。
  • 对于 id=2, id=3, 和 id=4 的行,hobby 分别是 'Java''C语言',所以 t_class 表的所有列都是 NULL

总结一下就是:查询的结果是对于每一个 t_student 表的行,如果 hobby == 'Python',则会与 t_class 表的所有行进行连接,否则 t_class 表的所有列都是 NULL。结果中包含了所有 t_student 表的行,并且根据 hobby 是否为 'Python' 来决定 t_class 表的列是否填充。

使用where条件的查询语句:

我们看看将上面变形2的on的另外一个条件放在where是怎样的?

select * from t_student s left join t_class c on  s.hobby=c.cname where s.hobby='Python'

先再看下上面的where原理执行步骤:

  1. 从表中检索出所有记录。
  2. 对每一条记录应用WHERE子句中的条件表达式。
  3. 如果记录满足条件表达式,则将其包含在结果集中。
  4. 如果记录不满足条件表达式,则将其排除在结果集之外。
  • 这里特别注意第2点,对于每一条记录都应用WHERE子句中的条件进行过滤,也就是如果不符合就是左边和右边都不会显示,
  • 而上面LEFT JOIN ON是对于不符合的会将左表记录与NULL值合并成一条记录添加到结果集,也就是左表记录数据一定会展示出来!

执行结果如下:也很好理解对于where里面符合的条件s.hobby='Python'会正常展示一行,而不符合的就直接整行不展示,而不是保留左边值,右边显示NULL

idnameclass_idhobbycidcnameis_delete
1小王1Python2Python0

而对于把条件过滤改成Java,执行结果应该也能很好理解了

select * from t_student s left join t_class c on  s.hobby=c.cname where s.hobby='Java'
idnameclass_idhobbycidcnameis_delete
2小红2Java1Java0
4小李4Java1Java0
2小红2Java4Java1
4小李4Java4Java1

总结:

  • 通过对比上述left join on 和where两个查询语句,我们可以发现在使用left join on时,即使没有选修课程记录,学生的信息也会显示出来,而在使用where条件时,要是选修课程的条件不满足,就直接整行不显示了,区别还是很大的!
  • left join on主要用于连接表和显示所有记录,而where条件则用于对结果进行进一步筛选。平常工作中我们一定要理解这两者的区别和原理,才能正确地用好这两个关键的查询语句!

TODO后续

日常工作中写SQL,我们会经常left join一堆表,我最多见过的有20多张的。。。(在一家外企,然后还用了一堆存储过程有几千行的,吐了。。。)那么对于left join on和前面表关联条件的时候,有的时候是紧挨着的表,有的是隔开的,有啥区别呢?具体看看这个

a 表主键是aid,b表是bid,c表是cid,以下两个语句有什么区别?如何理解?
篇幅有限。详见下文~

select * from  a left join b on a.aid=b.aid  left join c on b.bid=c.bid

select * from  a left join b on a.aid=b.aid  left join c on a.aid=c.aid

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1861781.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深入JVM:详解JIT即时编译器

文章目录 深入JVM:详解JIT即时编译器一、序言二、基础概念1、何为JIT即时编译2、热点代码 三、HotSpot内置的即时编译器1、C1编译器2、C2编译器3、分层编译3.1 协作流程 四、常见JIT优化技术1、方法内联2、逃逸分析(1)同步锁消除(…

高考填报志愿,找准自己的真兴趣来选择专业

又是一年一度的高考填报志愿的时间了,毕业生们要根据自己的分数,在很短的时间内确定自己的专业。专业千万条,兴趣第一条。专业的选择很大程度上决定着大学的学习生活是否顺利,甚至决定着以后的职业生涯。在纷繁复杂的专业中&#…

全球首个数字人开源了

DUIX(Dialogue User Interface System)是硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力,实现数字…

【AI落地应用实战】如何高效检索与阅读论文——302.AI学术论文工具评测

一、引言 作为一名学术领域的探索者,我们都知道,检索和阅读论文是我们获取知识、启发思考、验证假设的基石,也是日常学习中必不可少的基本功之一。然而在浩瀚的学术海洋中,如何快速、准确地找到我们需要的论文,就像是…

git提交新仓库代码,提示无权限,但用户名已修改

目录 1 用户名无权限 2 删除用户凭据 2.1 打开控制面板 2.2 找到“凭据管理器” 2.3 删除git历史 3 npm工具库添加git仓库指引 1 用户名无权限 之前因为时间的原因,js-tool-big-box工具库没有提交到github上去,今天想着往上提交一下,但…

python03——文件操作(new)

“变量”open(‘文件路径’,‘模式’) //注意加引号 “变量”.write( ) //write函数是写的是字符串,如果你写的东西不是字符串,要写成write(str(。。)) “变量”.read…

【Containerd】Containerd接入Harbor仓库

说明 在日常使用容器时,安全方便起见一般都会使用到私有仓库,一般都是采用 harbor 作为私有仓库,docker 对接 harbor 仓库非常简单,那么 containerd 如何对接 harbor 呢? 在内网使用 harbor 根据个人习惯&#xff0c…

快速上手golang(持续更新)

由于项目需要,我不得不快速掌握go语言来帮助我进行项目的开发。时间紧迫到我来不及去了解语言的特性就直接项目上手了。我决定就先熟悉一个主流的go框架和go语言的一些日常用法,之后就得滑着这只破船摇摇晃晃上路了。 1 基础命令 就说几个用的多的&…

QT拖放事件之八:通过全局剪切板中的接口QClipboard::mimeData()来获取MIME类型数据

1、演示效果 首先向剪切板写入数据,然后点击paste按钮进行从全局剪切板中 获取 MIME数据。。。 2、核心代码 void Widget::on_pasteBtn_clicked() {const QClipboard* clipBoard = QGuiApplication::clipboard()

理解和处理不同类型的上下文的新型的语言模型ReALM

在人类的日常交流中,模糊的代词如“他们”或“那个”常常出现,它们的意义通常依赖于上下文才能明确。这种上下文的理解对于对话助手来说至关重要,因为它们旨在提供一种自然的交流体验。然而,现有的对话助手在处理这类模糊引用时往…

Java HashMap 简介

HashMap 简介 HashMap 主要用来存放键值对,它基于哈希表的 Map 接口实现,是常用的 Java 集合之一,是线程不安全的。 HashMap;可以存储 null 的 key 和 value ,但 null 作为 key 只能有一个,null 作为值可以…

非强化学习的对齐方法

在文章《LLM对齐“3H原则”》和《深入理解RLHF技术》中,我们介绍了大语言模型与人类对齐的“3H原则”,以及基于人类反馈的强化学习方法(RLHF),本文将继续介绍另外一种非强化学习的对齐方法:直接偏好优化&am…

深度学习语义分割算法之基础知识

文章目录 前言一、图像分割介绍1.语义分割2.实例分割3.全景分割 二、常见数据集格式1.PASCAL VOC2.MS COCO 三、语义分割结果四、语义分割常见评价指标1.Pixel Accuracy2.mean Accuracy3.mean IoU 五、语义分割标注工具结束语 💂 个人主页:风间琉璃🤟 版…

FireFox 编译指南2024 Windows10篇-环境准备(一)

1. 引言 在开源浏览器项目中,Firefox因其高性能和灵活性而备受开发者青睐。为了在本地环境中编译和定制Firefox,开发者需要做好充分的环境准备工作。这不仅是编译成功的基础,也是后续调试、优化和二次开发的关键步骤。 编译Firefox是一个复…

硬核实力再亮,玩出梦想科技发布全球首款安卓系统空间计算机

6月25日,玩出梦想科技在新加坡召开全球新品发布会,正式发布全球首款安卓系统空间计算机——玩出梦想MR,填补了空间计算机在安卓生态的空白。 作为品牌沉淀两年的破晓之作,玩出梦想MR以业内领先软硬件配置,强大自研算法…

kafka--发布-订阅消息系统

1. Kafka概述 1. kafka是什么 kafka是分布式的、高并发的、基于发布/订阅模式的消息队列软件系统。 kafka中的重要组件 Producer:消息生产者,发布消息到Kafka集群的终端或服务Consume:消费者,从Kafka集群中消费消息的终端或服…

CAN报文的发送类型-OnChange、OnWrite、IfActive、Repetition

CAN报文的发送类型分为基本发送类型和混合发送类型两大类 CAN基本发送类型包括Cyclic周期发送、OnChange变化时发送、OnWrite写入时发送和IfActive有效时发送。基本发送类型中的Cyclic称为周期型,而其他3个类型称为事件型(Event)。发送次数是通过定义Repetition重复次数来实…

AI 编程探索- iOS动态标签控件

需求分析: 标签根据文字长度,自适应标签居中显示扩展 超过内容显示范围,需要换行显示,且保持居中显示 AI实现过程 提问: 回答: import UIKit import SnapKitclass DynamicLabelsContainerView: UIView…

python基础篇(5):None类型

1 None类型 Python中有一个特殊的字面量&#xff1a;None&#xff0c;其类型是&#xff1a;<class NoneType> 无返回值的函数&#xff0c;实际上就是返回了&#xff1a;None这个字面量 None表示&#xff1a;空的、无实际意义的意思 函数返回的None&#xff0c;就表示…

[MYSQL] MYSQL库的操作

前言 本文主要介绍MYSQL里 库 的操作 请注意 : 在MYSQL中,命令行是不区分大小写的 1.创建库 create database [if not exists] database_name [charsetutf8 collateutf8_general_ci] ...] create database 是命名语法,不可省略[if not exists] 如果不存在创建,如果存在跳过…