Oracle 中什么情况下 可以使用 EXISTS 替代 IN 提高查询效率

news2024/12/21 10:58:11

为什么 EXISTS 更高效?

EXISTS 提前终止:

     EXISTS 一旦在子查询中找到第一个匹配项,就会立即返回 TRUE,不再继续扫描子查询中的其他记录。
     IN 必须扫描整个子查询的结果集,将所有结果与主查询的每一行进行对比。

大数据集性能差异大:

     当子查询的数据集很大(如几万到几百万行)时,EXISTS 的提前终止特性会显著减少不必要的扫描。
     IN 在子查询中会生成临时结果集,这会导致更多的内存占用和性能开销。

🚀 EXISTS 替换 IN 的写法

IN 的原始写法:

SELECT * 
FROM employees e 
WHERE e.department_id IN ( 
    SELECT d.department_id 
    FROM departments d 
    WHERE d.department_name = 'SALES'
);

这段 SQL 查询的逻辑是,查询部门名为 ‘SALES’ 的所有员工。
这里的 IN 先生成一个临时结果集(d.department_id),并与 e.department_id 进行对比。

🔄 使用 EXISTS 替换 IN

SELECT * 
FROM employees e 
WHERE EXISTS ( 
    SELECT 1 
    FROM departments d 
    WHERE d.department_name = 'SALES' 
      AND d.department_id = e.department_id
);

这段 SQL 查询的逻辑是等价的。
不同点在于:

EXISTS 只要找到一个匹配项(d.department_id = e.department_id)就返回 TRUE,这时主查询中的这条 e 记录就被返回。
子查询中的 SELECT 1,实际上只要返回一行数据就能满足 EXISTS 条件,不需要返回字段值。

⚙️ EXISTS 和 IN 的区别

区别点INEXISTS
子查询结果生成子查询的完整结果集只要找到一个匹配的值就立即返回
子查询数据量适用于小数据集适用于大数据集
效率扫描整个子查询的结果集提前终止,效率高
关联条件主表的每一行与子查询的结果集比较子查询的条件与主表的每一行比较
内存使用子查询的结果集可能存储在临时表中不生成临时表,减少内存开销
索引利用索引不一定有效,可能全表扫描更容易利用索引

🔥 何时使用 EXISTS 替换 IN?

场景推荐使用方式原因
子查询返回大数据量EXISTS子查询中数据大,EXISTS 可以提前终止
子查询返回小数据量IN子查询小数据集,IN 性能也很好
子查询包含 NULL 值EXISTSIN 会因为 NULL 导致结果不匹配
主表数据多EXISTS主表数据多,EXISTS 在行对比上更高效
子查询不依赖主表IN如果子查询不依赖主表,IN 更清晰
子查询依赖主表EXISTS描子查询依赖主表的字段,EXISTS 更高效

🔍 示例 1:替代 IN 的常用场景

原始 SQL (使用 IN):

SELECT e.employee_name 
FROM employees e 
WHERE e.department_id IN (
    SELECT d.department_id 
    FROM departments d 
    WHERE d.department_name LIKE 'SALES%'
);

替换为 EXISTS:

SELECT e.employee_name 
FROM employees e 
WHERE EXISTS (
    SELECT 1 
    FROM departments d 
    WHERE d.department_name LIKE 'SALES%' 
      AND d.department_id = e.department_id
);

🔍 示例 2:避免 NULL 值的坑

原始 SQL (使用 IN):

SELECT * 
FROM employees e 
WHERE e.department_id IN (
    SELECT d.department_id 
    FROM departments d 
    WHERE d.department_name = 'SALES'
);

替换为 EXISTS:

SELECT * 
FROM employees e 
WHERE EXISTS (
    SELECT 1 
    FROM departments d 
    WHERE d.department_name = 'SALES' 
      AND d.department_id = e.department_id
);

🔍 示例 3:子查询依赖主表的场景

原始 SQL (使用 IN):

SELECT * 
FROM orders o 
WHERE o.customer_id IN (
    SELECT c.customer_id 
    FROM customers c 
    WHERE c.customer_type = o.customer_type
);

替换为 EXISTS:

SELECT * 
FROM orders o 
WHERE EXISTS (
    SELECT 1 
    FROM customers c 
    WHERE c.customer_type = o.customer_type 
      AND c.customer_id = o.customer_id
);

💡 总结

场景推荐使用
子查询返回大结果集EXISTS
子查询不依赖主表字段IN
子查询可能返回 NULLEXISTS
子查询依赖主表字段EXISTS
子查询小、主表大EXISTS
主表小、子查询大EXISTS

🚀 小结

  • EXISTS 在数据集较大时性能更高,尤其是子查询的返回数据量较大或包含 NULL 时。
  • EXISTS 避免了 IN 的“NULL 陷阱”,更安全。
  • 当子查询依赖主表的字段时,EXISTS 比 IN 更高效,因为不需要生成中间结果集。
  • EXISTS 可以提前终止子查询,在数据量较大时,性能优势更明显。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2263208.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

代码随想录day24 | leetcode 93.复原IP地址 90.子集 90.子集II

93.复原IP地址 Java class Solution {List<String> result new ArrayList<String>();StringBuilder stringBuilder new StringBuilder();public List<String> restoreIpAddresses(String s) {backtracking(s, 0, 0);return result;}// number表示stringb…

Hive是什么,Hive介绍

官方网站&#xff1a;Apache Hive Hive是一个基于Hadoop的数据仓库工具&#xff0c;主要用于处理和查询存储在HDSF上的大规模数据‌。Hive通过将结构化的数据文件映射为数据库表&#xff0c;并提供类SQL的查询功能&#xff0c;使得用户可以使用SQL语句来执行复杂的​MapReduce任…

AI智能决策赋能服装零售 实现精准商品计划与供需平衡

在服装这个典型的散对散供需模型中&#xff0c;库存问题一直是零售商面临的重大挑战。如何精准预测市场需求&#xff0c;实现供需平衡&#xff0c;成为摆在零售商面前的一道难题。然而&#xff0c;随着智能决策系统的应用&#xff0c;这一切正在悄然改变。 在这个信息爆炸的时代…

RadiAnt DICOM - 基本主题 :从 PACS 服务器打开研究

正版序列号获取&#xff1a;https://r-g.io/42ZopE RadiAnt DICOM Viewer PACS 客户端功能允许您从 PACS 主机&#xff08;图片存档和通信系统&#xff09;搜索和下载研究。 在开始之前&#xff0c;您需要确保您的 PACS 服务器和 RadiAnt 已正确配置。有关配置说明&#xff0c…

VR虚拟展馆如何平衡用户隐私保护与数据收集?

在虚拟现实&#xff08;VR&#xff09;虚拟展馆的设计和运营中&#xff0c;用户隐私保护与数据收集之间的平衡是一个至关重要的议题。 接下来&#xff0c;由专业从事VR虚拟展馆制作的圆桌3D云展厅平台为大家介绍一些策略&#xff0c;可以帮助VR虚拟展馆在收集有用数据的同时&a…

46.全排列 python

全排列 题目题目描述示例 1&#xff1a;示例 2&#xff1a;示例 3&#xff1a;提示&#xff1a; 题解解决方案&#xff1a;回溯算法思路&#xff1a;Python 实现&#xff1a;复杂度分析&#xff1a; 提交结果 题目 题目描述 给定一个不含重复数字的数组 nums &#xff0c;返回…

在Win11系统上安装Android Studio

诸神缄默不语-个人CSDN博文目录 下载地址&#xff1a;https://developer.android.google.cn/studio?hlzh-cn 官方安装教程&#xff1a;https://developer.android.google.cn/studio/install?hlzh-cn 点击Next&#xff0c;默认会同时安装Android Studio和Android虚拟机&#…

基于字节大模型的论文翻译(含免费源码)

基于字节大模型的论文翻译 源代码&#xff1a; &#x1f44f; star ✨ https://github.com/boots-coder/LLM-application 展示 项目简介 本项目是一个基于大语言模型&#xff08;Large Language Model, LLM&#xff09;的论文阅读与翻译辅助工具。它通过用户界面&#xff08…

密钥.id文件连接SSH

不用设置密码&#xff0c;直接连接

run postinstall error, please remove node_modules before retry!

下载 node_modules 报错&#xff1a;run postinstall error, please remove node_modules before retry! 原因&#xff1a;node 版本出现错误&#xff0c;我的项目之前是在 12 下运行的。解决方法&#xff1a; 先卸载node_modules清除缓存将node版本切换到12重新下载即可

【ETCD】【实操篇(二)】如何从源码编译并在window上搭建etcd集群?

要在 Windows 上编译 etcd 及 etcdctl 工具&#xff0c;并使用 bat 脚本启动 etcd 集群&#xff0c;首先需要准备好开发环境并确保依赖项正确安装。下面是从 etcd 3.5 源码开始编译和启动 etcd 集群的详细步骤&#xff1a; 目录 1. 安装 Go 环境2. 获取 etcd 源码3. 编译 etcd…

双指针---和为s的两个数字

这里写自定义目录标题 题目链接问题分析代码解决执行用时 题目链接 购物车内的商品价格按照升序记录于数组 price。请在购物车中找到两个商品的价格总和刚好是 target。若存在多种情况&#xff0c;返回任一结果即可。 问题分析 暴⼒解法&#xff0c;会超时 &#xff08;两层…

处理 Audio PCM 数据24位偏移问题

在音频处理过程中&#xff0c;我们有时会遇到特殊的问题&#xff0c;例如某些WAV文件的PCM数据发生了位移&#xff0c;导致声音播放异常。最近&#xff0c;我遇到了一个具体的问题&#xff0c;48000&#xff0c;32bit&#xff0c;8ch的PCM数据每32位&#xff08;4字节&#xff…

【大模型】GraphRAG技术原理

核心概念 GraphRAG 的核心在于用大模型构建知识图谱知识图谱聚类社区化RAG RAG就是输入&#xff08;问题知识&#xff09;到大模型 1-大模型自动从海量数据中构建知识图谱&#xff08;提取合并实体关系&#xff09; 2-聚类算法从知识图谱中聚类社区并生成社区摘要 3-输入问题…

Vue与React:前端框架的巅峰对决

文章目录 一、引言&#xff08;一&#xff09;前端框架发展现状简述 二、Vue 与 React 框架概述&#xff08;一&#xff09;Vue.js 简介&#xff08;二&#xff09;React.js 简介 三、开发效率对比&#xff08;一&#xff09;Vue 开发效率分析&#xff08;二&#xff09;React …

Ubuntu下C语言操作kafka示例

目录 安装kafka&#xff1a; 安装librdkafka consumer Producer 测试运行 安装kafka&#xff1a; Ubuntu下Kafka安装及使用_ubuntu安装kafka-CSDN博客 安装librdkafka github地址&#xff1a;GitHub - confluentinc/librdkafka: The Apache Kafka C/C library $ apt in…

线程池ForkJoinPool详解

由一道算法题引发的思考 算法题&#xff1a;如何充分利用多核CPU的性能&#xff0c;快速对一个2千万大小的数组进行排序&#xff1f; 这道算法题可以拆解来看&#xff1a; 1&#xff09;首先这是一道排序的算法题&#xff0c;而且是需要使用高效的排序算法对2千万大小的数组…

基于多尺度动态卷积的图像分类

✨✨ 欢迎大家来访Srlua的博文&#xff08;づ&#xffe3;3&#xffe3;&#xff09;づ╭❤&#xff5e;✨✨ &#x1f31f;&#x1f31f; 欢迎各位亲爱的读者&#xff0c;感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢&#xff0c;在这里我会分享我的知识和经验。&am…

[Linux] 信号保存与处理

&#x1fa90;&#x1fa90;&#x1fa90;欢迎来到程序员餐厅&#x1f4ab;&#x1f4ab;&#x1f4ab; 主厨&#xff1a;邪王真眼 主厨的主页&#xff1a;Chef‘s blog 所属专栏&#xff1a;青果大战linux 总有光环在陨落&#xff0c;总有新星在闪烁 信号的保存 下面的概…

计算机网络-GRE Over IPSec实验

一、概述 前情回顾&#xff1a;上次基于IPsec VPN的主模式进行了基础实验&#xff0c;但是很多高级特性没有涉及&#xff0c;如ike v2、不同传输模式、DPD检测、路由方式引入路由、野蛮模式等等&#xff0c;以后继续学习吧。 前面我们已经学习了GRE可以基于隧道口实现分支互联&…