前言:
某天用exists语句时发现跟我的理解有出入,我以前理解的exists是子查询的结果不会影响最终返回的结果,只要子查询查到有结果,则返回true,没有则返回false。即下面图中的sql,只要house_appraisal不是空表,那么两条sql都应该等价于
SELECT h.* FROM house h WHERE 1=1
但结果却是有所不同,第二条语句像是被筛选了一样
我怀疑是我以前理解有误,但问了gpt确实是这样理解没错
1.exists的本质
exists是一个用于判断子查询结果是否为空的逻辑操作符。它用于检查exists括号内是否返回了至少一行结果。如果子查询返回了至少一行结果,则返回true,否则返回false。
由于这种特性使用exists子查询时,数据库引擎会在找到满足条件的第一行后立即停止查询,大大提升了查询效率
2.现象解释
问了大佬之后,发现原来exists括号内没有跟主表联系的话确实是按原先理解的方式执行,但是有了跟主表的关联之后就会执行相当于对结果集筛选的操作。
比如下面这条语句,在括号内你无论对house_appraisal表怎么筛选(比如where后面加个and id=‘114514’ and create_time >xxx…等等)只要括号内但凡有一条数据,那么就会返回house全表的列
SELECT h.* FROM house h
WHERE EXISTS
(SELECT 1 FROM
house_appraisal ha
WHERE ha.house_id > 5)
但是如果加了主表相关联的东西,如下面这条语句,要保证括号内是true的情况下,不仅SELECT 1 FROM house_appraisal ha WHERE ha.house_id > 5
必须有至少一条结果,还要相当于保证 AND h.
house_id = ha.
house_id 为true,这就导致最终结果会以h.house_id
= ha.`house_id为筛选条件
SELECT h.* FROM house h
WHERE EXISTS
(SELECT 1 FROM
house_appraisal ha
WHERE ha.house_id > 5
AND h.`house_id` = ha.`house_id`)
即等价于
SELECT h.* FROM house h
WHERE EXISTS
(SELECT 1 FROM
house_appraisal ha
WHERE ha.house_id > 5 ) AND h.`house_id` = ha.`house_id`
用GPT用in改写上面的sql拿去数据库执行得到相同结果,说明这种理解方式是对的
今日收获:
SELECT * FROM stu,class,grade WHERE stu.id='001' AND class.name='web'
这条sql相当于stu、class、grade三个表做笛卡尔积然后进行筛选,其结果集等价于
SELECT * FROM stu
INNER JOIN class ON stu.class_id = class.id
INNER JOIN grade ON stu.grade_id = grade.id
WHERE stu.id = '001' AND class.name = 'web';
但inner join 操作会先根据连接条件筛选出需要关联的行进行合并,而不是生成所有可能的组合。这大大节省了存储和处理的开销,数据量大的话必须用inner join,不要给后来人挖坑。
自从GPT推广以来,越发觉得深度学习的重要性,有些广度的东西完全不知道不懂,可以问问GPT,但一些深度的东西根本问不了,只能自己根据原理去悟或者通过经验老道的大佬指点