数据库索引深度解析:原理、类型与高效使用实践

news2025/4/16 16:59:08

🧠 一句话理解索引是什么?

索引就是数据库中的“目录”或“书签”,它能帮助我们快速找到数据的位置,而不是一页页地翻整本书。
在这里插入图片描述


🧩 一、为什么需要索引?(用生活化例子秒懂)

想象你在图书馆找一本书中的一个关键词:

  • 没有索引的情况:你只能从第一页一页一页地翻,直到找到关键词(全表扫描)。
  • 有索引的情况:你直接去目录查到页码,快速翻过去(通过索引快速定位)。

所以索引的作用很明确:

  • 加快查询速度
  • 加速 WHERE / JOIN / ORDER BY 等操作
  • 在大数据量下提升性能至关重要

📦 二、索引的分类(面试考察重点)

分类类型说明
按结构划分B+ Tree 索引(最常见)平衡多叉树,查询效率高(MySQL 默认使用)
Hash 索引基于哈希表,等值查询快,不支持范围查找
按字段数划分单列索引针对一个字段创建的索引
复合索引包含多个字段,顺序非常重要(最左前缀原则
按用途划分主键索引主键默认建立的唯一索引
唯一索引保证字段唯一性,如用户名、身份证号等
普通索引仅加速查询,不限制重复
全文索引支持模糊匹配,如搜索引擎关键字匹配(MySQL 5.6+ 支持 InnoDB 全文索引)
空间索引专门用于地理信息查询(GIS 数据)

🚀 三、实际业务中索引的典型应用场景

✅ 场景 1:用户登录

SELECT * FROM user WHERE username = 'zhangsan';

如果 username 上没有索引,数据库会全表扫描,非常慢。添加普通索引即可加速。

✅ 场景 2:订单查询(范围查找)

SELECT * FROM orders WHERE create_time BETWEEN '2023-01-01' AND '2023-01-31';

此类范围查询适合建立 B+ 树索引,因为 B+ 树结构天然支持区间查找。

✅ 场景 3:多字段搜索

SELECT * FROM user WHERE age = 25 AND gender = 'male';

可以考虑建立复合索引 (age, gender),提升多条件过滤的效率。


📐 四、索引的底层原理 —— 为什么是 B+ 树?

B+ Tree 是一种 多路平衡搜索树,它比二叉树更“胖”,查询次数更少。

结构特点:

  • 所有值都存储在叶子节点
  • 所有叶子节点形成链表,方便范围查找
  • 非叶子节点只存储索引键,不存储具体数据

为什么不是 Hash?

特性B+ TreeHash
支持范围查找
有序
支持排序
适合范围、排序、LIKE 前缀查询
适合单值精确匹配一般

所以数据库默认使用 B+ Tree,除非你明确需要 Hash 特性。


🎯 五、最左前缀原则(复合索引的核心)

复合索引只能使用“最左边开始的连续字段”进行查询。

比如创建索引 (a, b, c),下面哪些查询能用上这个索引?

查询条件是否命中索引
WHERE a = 1
WHERE a = 1 AND b = 2
WHERE a = 1 AND b = 2 AND c = 3
WHERE b = 2
WHERE b = 2 AND c = 3
WHERE a = 1 AND c = 3❌(中间断了)

⚠️ 六、常见面试陷阱 + 实战优化建议

❌ 1. where 后用了函数

WHERE DATE(create_time) = '2023-04-10';

这会让索引失效,应该改为:

WHERE create_time BETWEEN '2023-04-10 00:00:00' AND '2023-04-10 23:59:59';

❌ 2. 使用 %like% 造成索引失效

WHERE name LIKE '%张%'

会导致全表扫描,建议改为全文索引或前缀匹配:

WHERE name LIKE '张%'

✅ 3. 尽量避免在查询中使用 OR

WHERE a = 1 OR b = 2

可能导致两个字段的索引都失效,建议拆成 UNION 查询。


📈 七、索引优化建议总结

建议说明
只给高频查询字段加索引避免冗余索引
使用复合索引替代多个单列索引能大幅提升查询效率
保持索引字段的选择性高选择性高 = 唯一值多,过滤效果好
定期分析慢查询日志判断是否需要建立新索引
删除不再使用或重复的索引减少写入负担

📊 额外加餐:索引与事务的关系(关联知识)

  • 索引可以加速事务中的查询与更新
  • 过多索引会增加事务写入时的锁开销
  • 在使用 RR(可重复读)隔离级别时,InnoDB 会使用 间隙锁(gap lock),而索引设计会直接影响锁粒度和性能

✅ 总结一句话:

索引设计,是数据库性能优化的第一战线。用好了像火箭,用错了像拖拉机。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2335132.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

React 记账本项目实战:多页面路由、Context 全局

在本文中,我们将分享一个使用 React 开发的「记账本」项目的实战经验。该项目通过 VS Code 完成,包含首页、添加记录页、编辑页等多个功能页面,采用了 React Router 实现路由导航,使用 Context API 管理全局的交易记录状态,并引入数据可视化组件呈现不同月份的支出情况。项…

易路iBuilder智能体平台:人力资源领域AI落地,给“数据权限管控”一个最优解

近日,加拿大电子商务巨头Shopify的CEO Tobias Ltke分享了一份内部备忘录,明确表示有效使用AI已成为公司对每位员工的基本期望,并指出:各团队在招募新员工前,必须先确定是否能够利用AI完成工作。 而在全球范围内&#…

mybatis--多对一处理/一对多处理

多对一处理(association) 多个学生对一个老师 对于学生这边,关联:多个学生,关联一个老师[多对一] 对于老师而言,集合,一个老师有多个学生【一对多】 SQL: 测试环境搭建 1.导入依…

计算机视觉——图像金字塔与目标图像边缘检测原理与实践

一、两个图像块之间的相似性或距离度量 1.1 平方差和(SSD) 平方差和(SSD) 是一种常用的图像相似性度量方法。它通过计算两个图像在每个对应位置的像素值差的平方和来衡量两个图像之间的整体差异。如果两个图像在每个位置的像素值…

VRoid-Blender-Unity个人工作流笔记

流程 VRoid 选配模型>减面、减材质>导出vrm Blender(先有CATS、vrm插件) 导入vrm>Fix model>修骨骼>导出fbx Unity 找回贴图、改着色器、调着色器参数…… VRoid 减面 以模型不出现明显棱角为准。脸好像减面100也问题不大。 下…

Domain Adaptation领域自适应

背景与问题定义 传统监督学习假设:训练集与测试集数据分布一致。 Domain Shift:测试数据分布与训练数据不同,模型泛化性能骤降 。 例如在黑白图像上训练数字分类器,测试时用彩色图像,准确率骤降。 Domain Adaptatio…

从自动测量、8D响应到供应链协同的全链路质量管理数字化方案——全星QMS如何破解汽车行业质量困局

全星QMS如何破解汽车行业质量困局:从自动测量、8D响应到供应链协同的全链路数字化方案 在当今竞争激烈的市场环境中,企业要想脱颖而出,必须确保产品质量的稳定性和可靠性。 全星质量QMS软件系统凭借其强大的功能和灵活的架构,为企…

联想电脑开机出现Defalut Boot Device Missing or Boot Failed怎么办

目录 一、恢复bios默认设置 二、关机重启 三、“物理”方法 在图书馆敲代码时,去吃了午饭回来发现刚开机就出现了下图的问题(崩溃),想起之前也发生过一次 这样的问题,现在把我用到的方法写在下面,可能对…

SQL学习笔记-聚合查询

非聚合查询和聚合查询的概念及差别 1. 非聚合查询 非聚合查询(Non-Aggregate Query)是指不使用聚合函数的查询。这类查询通常用于从表中检索具体的行和列数据,返回的结果是表中的原始数据。 示例 假设有一个名为 employees 的表&#xff…

【Vue 3 + Element Plus 实现产品标签的动态添加、删除与回显】

🚀Vue 3 Element Plus 实现产品标签的动态添加、删除与回显 在后台管理系统中,我们经常需要对表单数据进行动态处理,尤其是类似“产品标签”这样的字段,它需要用户能够灵活添加、删除,并在编辑时自动回显。今天我们就…

IntelliJ 配置(二)配置相关类库(2)LineMarkerProvider

一、介绍 LineMarkerProvider 是 IntelliJ 平台插件开发中的一个接口,它的作用是在编辑器左侧的“行标记区域”(就是代码行号左边那一栏)添加各种图标、标记或导航链接。比如Java 类中看到的: 小绿色三角形(可以点击运…

从零开始学java--线性表

数据结构基础 目录 数据结构基础 线性表 顺序表 链表 顺序表和链表的区别: 栈 队列 线性表 线性表(linear list)是n个具有相同特性的数据元素的有限序列。 线性表中的元素个数就是线性表的长度,表的起始位置称为表头&am…

AD917X系列JESD204B MODE7使用

MODE7特殊在F8,M4使用2个复数通道 CH0_NCO10MHz CH1_NCO30MHZ DP_NCO50MHz DDS1偏移20MHz DDS2偏移40MHz

Spring Cloud之远程调用OpenFeign最佳实践

目录 OpenFeign最佳实践 问题引入 Feign 继承方式 创建Module 引入依赖 编写接口 打Jar包 服务提供方 服务消费方 启动服务并访问 Feign 抽取方式 创建Module 引入依赖 编写接口 打Jar包 服务消费方 启动服务并访问 服务部署 修改pom.xml文件 观察Nacos控制…

【Python爬虫】详细入门指南

目录 一、简单介绍 二、详细工作流程以及组成部分 三、 简单案例实现 一、简单介绍 在当今数字化信息飞速发展的时代,数据的获取与分析变得愈发重要,而网络爬虫技术作为一种能够从互联网海量信息中自动抓取所需数据的有效手段,正逐渐走入…

Win11系统 VMware虚拟机 安装教程

Win11系统 VMware虚拟机 安装教程 一、介绍 Windows 11是由微软公司(Microsoft)开发的操作系统,应用于计算机和平板电脑等设备 。于2021年6月24日发布 ,2021年10月5日发行 。 Windows 11提供了许多创新功能,增加了新…

打造AI应用基础设施:Milvus向量数据库部署与运维

目录 打造AI应用基础设施:Milvus向量数据库部署与运维1. Milvus介绍1.1 什么是向量数据库?1.2 Milvus主要特点 2. Milvus部署方案对比2.1 Milvus Lite2.2 Milvus Standalone2.3 Milvus Distributed2.4 部署方案对比表 3. Milvus部署操作命令实战3.1 Milv…

【深度学习与大模型基础】第11章-Bernoulli分布,Multinoulli分布

一、Bernoulli分布 1. 基本概念 想象你抛一枚硬币: 正面朝上(记为 1)概率是 p(比如 0.6)。 反面朝上(记为 0)概率是 1-p(比如 0.4)。 这就是一个Bernoulli分布&…

基于Windows通过nginx代理访问Oracle数据库

基于Windows通过nginx代理访问Oracle数据库 环境说明: 生产环境是一套一主一备的ADG架构服务器,用户需要访问生产数据,基于安全考虑,生产IP地址不能直接对外服务,所以需要在DMZ部署一个前置机,并在该前置机…

北斗和GPS信号频率重叠-兼容与互操作

越来越多的同学们发现北斗三代信号的B1C,B2a信号居然和美国GPS L1,L5处在同样频率上? 为什么美国会允许这样的事情发生?同频率难道不干扰彼此的信号吗? 思博伦卫星导航技术支持文章TED 这事得从2006年联合国成立全球卫星导航系统…