深入理解Mysql底层数据结构

news2024/9/25 7:16:26

一. 索引的本质

索引是帮助MySQL高效获取数据的排好序的数据结构。

二. 索引的数据结构

  • 二叉树
  • 红黑树
  • Hash表
  • BTree
  • B+Tree

mysql的索引采用的是B+树的结构

mysql为什么不用二叉树,因为对于单边增长的数据列,二叉树和全表扫描差不多,效率没有什么提升。
mysql为什么不用红黑树,因为使用红黑树,树的高度会比较高,如果要查找的元素在叶子节点比如在20层,就会查询20层,所以对于数据量大的不可控,树的高度越小,效率越高;
mysql为什么不用hash表,因为hash表不支持范围查询

2.1 B-Tree
  • 叶节点具有相同的深度,叶节点的指针为空
  • 所有索引元素不重复
  • 节点中的数据索引从左到右递增排列
    在这里插入图片描述
2.2 B+Tree
  • 非叶子节点不存储data,只存储索引(冗余),可以放更多的索引
  • 叶子节点包含所有索引字段
  • 叶子节点用指针连接,提高区间访问的性能

在这里插入图片描述

使用B+树结构 :一页数据大概16k,第一层大概16k/(8+6)=1170,第二层1170,第三层16k/1k=16,三层1170117016~2千多万;
使用B树结构:一页数据大概16k,第一层大概16k/1k=16,第二层也是16…相同数据量如果使用B-tree则层数会很多,层数越少,遍历越少,I/O操作越少,效率越高,所以使用B+树效率更高

2.3 Hash结构
  • 对索引的key进行一次hash计算就可以定位出数据存储的位置
  • 很多时候Hash索引要比B+ 树索引更高效
  • 仅能满足 “=”,“IN”,不支持范围查询
  • hash冲突问题
    在这里插入图片描述

三.存储引擎

3.1 MylSAM存储引擎索引实现

MyISAM索引文件和数据文件是分离的(非聚集), 数据在MYD文件,索引在MYI文件

在这里插入图片描述

3.2 InnoDB存储引擎索引实现
  • InnoDB索引实现(聚集) 索引和数据在一起存储在IBD文件
  • 表数据文件本身就是按B+Tree组织的一个索引结构文件
  • 聚集索引-叶节点包含了完整的数据记录
    在这里插入图片描述
    二级索引里数据存放的是主键索引中的聚集索引(有主键就是主键id,没主键就是rowId)

四.联合索引

在这里插入图片描述
联合索引是按照索引字段排序的,先根据第一个元素查找,再根据第二个元素查找… 最左匹配原则,只有从左到右索引都匹配时才会执行右边的索引。
加入index(a,b,c)

where语句索引是否被使用
where a=3Y,使用到a
where a=3 and b=5Y,使用到a,b
where a=3 and b=5 and c=4Y,使用到a,b,c
where b=3 或者 b=3 and c=4 或者c=4N
where a=3 and c=4 或者c=4Y,使用到a,不可以使用c
where a=3 and b>4 and c=5Y,使用到a和b,不可以使用c,因为b断了,c不可使用在范围后
where a=3 and b like ‘kk%’ and c=4Y,使用到a,b,c
where a=3 and b like ‘%kk’ and c=4Y,使用到a
where a=3 and b like ‘%kk%’ and c=4Y,使用到a
where a=3 and b like ‘k%kk%’ and c=4Y,使用到a,b,c

五.相关问题

5.1 为什么建议InnoDB表必须建主键?
如果不建主键,innodb就没有聚簇索引去组织数据,数据怎么存放没办法管理,如果没有建主键,mysql会主动去查找一个所有值都是唯一的列字段作为唯一索引。如果遍历完没有找到可以适合做主键的列,mysql就会创建隐藏的列rowId,作为唯一索引来维护整个表。如果你自己创建了主键索引,mysql就不用去查找唯一列,mysql资源比较紧张。
5.2 推荐使用整型的自增主键?

  • 查找效率高。查询数据时会逐位比对,如果是顺序递增的话,速度比较快;
  • 节省空间。整型要比字符串省空间;
  • 非自增主键,如果插入中间的数据 就可能会导致分裂,分裂之后再重新平衡树,如果是自增主键,就会一直只在后面插入就行。

5.3 为什么非主键索引结构叶子节点存储的是主键值?
主要是为了节省存储空间,不用把整条数据都存储起来。
5.4 MylSAM存储引擎和innodb存储引擎是形容数据库还是形容数据库表呢?
是形容数据库表的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/176013.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

pytorch 神经网络笔记-RNN和LSTM

文章目录时间序列表示方法一般过程RNNRNN原理1RNN原理2RNN layer使用pytorch实现nn.RNN__init__forwardSingle layer RNN2 layer RNNpytorch实现nn.RNNCell时间序列波形预测例子LSTMnn.LSTMnn.LSTMCellSingle layerTwo Layersb站课程链接课时自己找一下 时间序列表示方法 卷积神…

自注意力(Self-Attention)机制浅析

一、自注意力机制概述循环神经网络由于信息传递的容量以及梯度消失问题,实际上也只能建立短距离依赖关系。为了建立长距离的依赖关系,可以增加网络的层数或者使用全连接网络。但是全连接网络无法处理变长的输入序列,另外,不同的输…

字节青训前端笔记 | Web安全

在网络时代下,Web 安全随处可见并且危害极大,Web 安全问题也越来越受到重视。本节课将讲述Web中的攻击和防御 XSS 利用开发者盲目信任客户提交的内容来实现的工具,恶意攻击者往 Web 页面里插入恶意 Script 代码,当用户浏览该页面…

机器视觉(十二):二维条码识别

目录: 机器视觉(一):概述 机器视觉(二):机器视觉硬件技术 机器视觉(三):摄像机标定技术 机器视觉(四):空域图像增强 …

【16】C语言 | 初识函数递归 | 几个练习

目录 什么是递归? 练习1: 练习2: 练习3、 练习4 什么是递归? 程序调用自身的编程技巧称为递归( recursion )。递归做为一种算法在程序设计语言中广泛应用。一个过程或函数在其定义或说明中有直接或间接调用自身的一种方法,它通常把一个大型复杂的问题层层转化…

生物化学 电阻抗成像OpenEIT,Dbar算法,数据集等(暂记)

Electrical Impedance Tomography,EIT 电阻抗成像(Electrical Impedance Tomography,EIT)是一种无创的以人体内部的电阻率分布为目标的重建体内组织图像的技术。人体是一个大的生物电导体,各组织、器官均有一定的阻抗,当人体的局部…

SLF4J基本使用

文章目录1. 日志门面2. SLF4J的使用2.1 SLF4J入门2.2 为什么要使用SLF4J作为日志门面?2.3 绑定日志的实现(Binding)2.4 logback 整合 slf4j2.5 log4j 整合 slf4j2.6 jul 整合 slf4j3. 桥接旧的日志框架(Bridging)3.1 S…

完全二叉树的权值

题目描述 给定一棵包含 N 个节点的完全二叉树,树上每个节点都有一个权值,按从 上到下、从左到右的顺序依次是 A1​,A2​,⋅⋅⋅AN​,如下图所示: 现在小明要把相同深度的节点的权值加在一起,他想知道哪个深度的节点 权值之和最大?如果有多个深度的权值和同为最大,请你输…

react用高阶组件优化文件结构 帮助建立高阶组件应用思路

其实高阶组件是一个将组件写的更灵活的方式,他的应用场景在业务开发中会非常多样 这里 我们演示一种 主要还是解决问题的思想最重要 或者是 这个不叫解决问题 而是设计组件结构的思路 我们来模拟一个场景 在src下有一个 components 文件夹目录 在 components 下有…

3.开发社区首页

数据库设计如下: 任务:开发社区首页,显示前十个帖子;开发分页组件,分页显示所有帖子。 开发流程:entity->dao->mapper.xml->service->controller 由于关注后端,所以未使用前后分离…

【Potplayer】如何用Potplayer实现对视频的局部缩放播放?如何用potplayer更舒心地播放竖屏视频?

一、问题背景 有时候我们从互联网上下载得到一个竖屏视频,用电脑播放时,左右两边都是黑的,电脑屏幕的高宽度没有得到良好应用。而如果恰好这个竖屏视频其实只有一小部分才是有效区域/重点内容,比如中央区域,上下区域都…

win10怎么玩经典扫雷?繁星软件园推荐大家试试Windows7Games吧,亲测好用的扫雷Win10电脑版下载!!!

扫雷Win10电脑版(Windows7Games)是专门为微软最新版本的Windows 10/11操作系统打造的一款非常不错的消除类PC休闲小游戏安装包, Windows7Games游戏安装包为中文版,包含经典扫雷、空当接龙、红心大战、国际象棋等微软低版本操作系统Windows自带的多款超级…

我的硕士前半生

本篇文章属于随笔类,它可能无法对你起到直接帮助,它只是我这个普通学生一年半以来的一些足迹与思考。本文首发于我的个人博客 Forever Young 我的本科像硕士,有实验室有工位,桌子超级大,有老师带有学长可以问。 我的硕…

分享122个ASP源码,总有一款适合您

ASP源码 分享122个ASP源码,总有一款适合您 下面是文件的名字,我放了一些图片,文章里不是所有的图主要是放不下..., 122个ASP源码下载链接:https://pan.baidu.com/s/1-hwBdIxuv1NvpapRJsGAcQ?pwdgs1l 提取码&#x…

设计模式_行为型模式 -《迭代器模式》

设计模式_行为型模式 -《迭代器模式》 笔记整理自 黑马程序员Java设计模式详解, 23种Java设计模式(图解框架源码分析实战) 概述 定义 提供一个对象来顺序访问聚合对象中的一系列数据,而不暴露聚合对象的内部表示。 结构 迭代器…

手撕Pytorch源码#3.Dataset类 part3

写在前面手撕Pytorch源码系列目的:通过手撕源码复习了解高级python语法熟悉对pytorch框架的掌握在每一类完成源码分析后,会与常规深度学习训练脚本进行对照本系列预计先手撕python层源码,再进一步手撕c源码版本信息python:3.6.13p…

Couplet | 用Python写一副对联送给诸位科研汪!~

1写在前面 小伙伴们大家新年好啊!!!🥰 又是一年新春到,玉兔祝福要记牢:蹦蹦跳跳身体棒,平平淡淡精神爽,红红火火财运旺,和和气气朋友广,简简单单幸福长。&…

Windows SDK编程 初学笔记

#include "windows.h"int WINAPI WinMain(HINSTANCE hinstance, HINSTANCE hPreInstance, PSTR szCmdLine, int iCmdShow) {MessageBox(NULL, TEXT("来见见世面"), TEXT("Say Hi"), MB_OK);return 0; } MessageBox第一个参数为句柄,第…

Socket通信

什么是Socket?

Java基础——运算符与表达式

目录 Eclipse下载 安装 使用 运算符 键盘录入 Eclipse下载 安装 使用 Eclipse的概述(磨刀不误砍柴工)——是一个IDE(集成开发环境)Eclipse的特点描述(1)免费 (2)纯Java语言编写 (3)免安装 &#xff08…