【MySQL】索引的作用及知识储备

news2025/1/10 23:29:13

为什么要有索引

索引可以提高数据库的性能。不用加内存,不用改程序,不用调sql,只要执行正确的create indix,查询的速度就可能提高成百上千倍。但相应的代价是,插入,更新,删除的速度有所减弱。
所以索引的作用在于提高一个海量数据的检索速度

常见索引分为:

  • 主键索引(primary key)
  • 唯一键索引(unique)
  • 普通索引(indix)
  • 全文索引(fulltext) - 解决子文索引问题

认识磁盘

我们知道了索引的作用是提高数据检索的速度,那么海量数据的检索为什么慢呢?我们需要通过认识数据的存储来了解

MySQL与存储

MySQL给用户提供存储服务,而存储的都是数据,数据在磁盘这个外设当中。磁盘是计算机中的一个机械设备,相比于其他电子元件,磁盘的效率是比较低的,在加上IO本身的特征,所以存取数据是一个比较慢的操作


磁盘的物理结构和数据存取可以参看磁盘文件系统的第一部分

总结来说

数据的存取在磁盘中需要经历以下步骤:

  1. 定位读取的盘面,进而确定哪一个磁头读取数据
  2. 定位读取哪一个磁道
  3. 定位读取哪一个扇区
    整个过程称为CHS定位法 磁头:head ;磁道(柱面):cylinder;扇区:sector
    这些步骤都是机械运动,所以速度相比于电子元件,会慢上很多

另外

数据在扇区里大多是以512字节存储
操作系统读取数据的单位是数据块(4kb),也就是8个扇区
数据库文件,本质就是保存在磁盘的盘片当中,当数据库文件很大时,一定需要占据多个扇区


磁盘随机访问与连续访问
  • 随机访问:本次IO所给出的扇区地址和上次IO给出的扇区地址不连续,此时磁头在两次IO操作之间需要作较大移动才能重新开始读/写数据
  • 连续访问:如果本次IO给出的扇区地址与上次IO结束的扇区地址是连续的,那么磁头就能很快的开始这次IO操作,这样的多个IO操作称为连续访问

如果相邻的两次IO操作是在同一时刻发出的,但它们请求的扇区地址相差很大的话,也只能称为随机访问,而非连续访问

磁盘是通过机械运动进行寻址的,连续访问不需要过多的定位,故效率比较高

MySQL与磁盘交互的基本单位

MySQL是一款应用软件,其与磁盘的交互需要依靠操作系统从中构建桥梁,我们可以将其想象为一种特殊的文件系统,它有着更高的IO场景。
所以为了提高基本的IO效率,MySQL进行IO的基本单位是16KB(InnoDB存储引擎)

mysql> show global status like 'innodb_page_size';
+------------------+-------+
| Variable_name    | Value |
+------------------+-------+
| Innodb_page_size | 16384 | -- 16*1024
+------------------+-------+

也就是磁盘的基本单位是扇区512字节操作系统基本单位是数据块4KBMySQL基本单位是page(页)16KB
三者数据交互如下:

在这里插入图片描述

  • MySQL中的数据文件,是以page为单位保存在磁盘当中的
  • MySQL的CURD操作(create update read delete),都是需要计算,找到相应的插入位置,或者找到对应要修改或者查询的数据
  • 涉及计算,就需要CPU参与,而为了便于CPU参与,一定要能够先将数据移动到内存当中
  • 所以在特定时间内,数据一定是在磁盘和内存中都存在的。后续完成内存数据的操作后,以特定的舒心策略,刷新到磁盘。此时会涉及磁盘和内存的数据交互,也就是IO。而此时IO的基本单位是page
  • 为了更好的进行上述操作,MySQL服务器在内存运行时,在服务器内部,会申请被称为buffer bool的内存空间,来进行各种缓存。使用这个内存空间和磁盘数据进行IO交互
  • 所以为提高效率,一定要尽可能的减少系统和磁盘的IO次数

局部性原理

局部性原理分为时间局部性空间局部性

局部性原理出现的原因,大部分人认为是:程序的指令大部分时间是顺序执行,而且程序的集合,如数组等各种数据结构都是连续存放

  1. 时间局部性:如果程序中的某条指令一旦执行,则不久之后该指令可能再次被执行;如果某数据被访问,则不久之后该数据可能再次被访问
  2. 空间局部性:一旦程序访问了某个存储单元,则不久之后,其附近的存储单元也很大可能被访问

参考:局部性原理


MySQL的IO交互为什么要用page

为什么MySQL和磁盘进行IO交互要使用page呢?而不是用多少加载多少呢?

倘若,我们有十个数据,其中id从1到10,如果用多少加载多少,每次都只加载一个数据,查找id=10就需要十次IO

但如果使用page存储,那么十个数据都是存储在一个page中,一次IO读取整个page,放入buffer bool。无论是id=3,4,8,都是在内存中查找。大大减少了IO的次数

但是我们无法保证,用户下次查找的数据一定在这个page中,但是因为局部性原理,大概率在这个page中
往往IO效率低下的最主要矛盾不是IO单次数据量的大小,而是IO的次数

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1093014.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【重新定义matlab强大系列十六】求解混合整数线性问题

🔗 运行环境:Matlab 🚩 撰写作者:左手の明天 🥇 精选专栏:《python》 🔥 推荐专栏:《算法研究》 #### 防伪水印——左手の明天 #### 💗 大家好🤗&#x1f91…

【算法|动态规划No.18】leetcode718. 最长重复子数组

个人主页:兜里有颗棉花糖 欢迎 点赞👍 收藏✨ 留言✉ 加关注💓本文由 兜里有颗棉花糖 原创 收录于专栏【手撕算法系列专栏】【LeetCode】 🍔本专栏旨在提高自己算法能力的同时,记录一下自己的学习过程,希望…

数据结构与算法-单链表小练习

🎈类定义 typedef int ElemType; typedef struct LNode {ElemType data;LNode* next; }LNode; class LinkList { private:LNode* head;public:LinkList();~LinkList();int deletelist(int x);void CreatList_h(int n);void print_evennode();void divide_LinkList(…

『GitHub Actions』部署静态博客指南

前言 之前博主是使用的 Jenkins 实现 vuepress 博客的自动部署与持续交付,但是因为现在迁移服务器到海外,并且服务器配置降低。现在经常出现服务器的 Jenkins 构建过程中 CPU 占用率过高,导致服务器卡死 然后我想的话既然只是部署静态博客&…

基于Java的博客管理系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding)有保障的售后福利 代码参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作…

Puppeteer实现上下滚动、打开新Tab、用户数据保存(三)

Puppeteer实现上下滚动、打开新Tab、用户数据保存(三) Puppeteer实现上下滚动、打开新Tab、用户数据保存(三)一、实现上下滚动二、打开新Tab三、用户数据保存四、效果演示 一、实现上下滚动 在自动化测试中,我们需要能…

计算机毕业设计选题推荐-springboot 蛋糕甜品店管理系统

✍✍计算机编程指导师 ⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡ Java实战 |…

YOLO目标检测——跌倒摔倒数据集【含对应voc、coco和yolo三种格式标签】

实际项目应用:公共安全监控、智能家居、工业安全等活动区域无监管情况下的人员摔倒事故数据集说明:YOLO目标检测数据集,真实场景的高质量图片数据,数据场景丰富。使用lableimg标注软件标注,标注框质量高,含…

SpringBoot面试题1:什么是SpringBoot?为什么要用SpringBoot?

该文章专注于面试,面试只要回答关键点即可,不需要对框架有非常深入的回答,如果你想应付面试,是足够了,抓住关键点 面试官:什么是SpringBoot? Spring Boot 是一个用于快速开发独立的、基于 Spring 框架的应用程序的开源框架。它简化了 Spring 应用的配置和部署过程,使…

稚晖君项目复刻:L-ink门禁卡(1)——环境搭建与第一个项目创建

行文目录 前言其他文章正文开始STM32CubeMX安装STM32CubeMX安装L0的固件支持包Clion安装OpenOCD安装MinGw安装arm-none-eabi-gcc安装Clion配置 创建STM32工程创建STM32CubeMX工程更改芯片型号 参考文献 前言 其实关于稚晖君的L-ink门禁卡在我本科阶段就已经刷过好几次了&#x…

前端页面布局之【响应式布局】

目录 🌟前言🌟优点🌟缺点🌟media兼容性🌟利用CSS3-Media Query实现响应式布局🌟常见的媒体类型🌟常见的操作符🌟属性值🌟设备检测🌟响应式阈值选取&#x1f3…

使用vue3+element-ui plus 快速构建后台管理模板

一、安装 vue3 脚手架 npm create vuelatestcd vue-ui-template #切换到刚刚创建好的vue项目根目录中 npm install #下载项目所需要的依赖包 npm run dev #启动运行项目服务项目启动后,默认页面显示如下: 二、安装element-ui plus 官网链接:…

CDN到底有什么魅力,值得网站接入

当谈到提高网站性能和用户体验时,内容分发网络(Content Delivery Network,CDN)是一项不可忽视的技术。CDN加速已经成为许多在线企业的首选,用以减少加载时间、提高安全性和全球可访问性。本文将深入探讨CDN的原理、工作…

2023-10-14 LeetCode每日一题(只出现一次的数字)

2023-10-14每日一题 一、题目编号 136. 只出现一次的数字二、题目链接 点击跳转到题目位置 三、题目描述 给你一个 非空 整数数组 nums ,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。 你必须设计并实现线性时…

基于Java的大学生实习管理系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding)有保障的售后福利 代码参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作…

【LVGL】SquareLine Studio入门基础操作

1.SquareLine Studio基础 在这篇文章中将介绍SquareLine Studio的基础操作、解释如何加载一个项目、布局结构。    启动软件后,可以加载之前的项目、创建项目、加载一个示例。    这里以打开示例audio_mixer为例,可以双击该项目打开或者选中该项目点击右下角的【创建】按…

从基础到卷积神经网络(第13天)

1. PyTorch 神经网络基础 1.1 模型构造 1. 块和层 首先,回顾一下多层感知机 import torch from torch import nn from torch.nn import functional as Fnet = nn.Sequential(nn.Linear(20, 256), nn.ReLU(), nn.Linear(256, 10))X = torch.rand(2, 20) # 生成随机输入(批…

Java电子病历编辑器项目源码 采用B/S(Browser/Server)架构

电子病历(EMR,Electronic Medical Record)是用电子技术保存、管理、传输和重现的数字化的病人的医疗记录,取代手写纸张病历,将医务人员在医疗活动过程中,使用医疗机构管理系统生成的文字、符号、图表、图形、数据、影像等数字化内…

27 mysql 组合索引 的存储以及使用

前言 这里来看一下 mysql 中索引的 增删改查 查询在前面的系列文章中都有使用到 这里 来看一下 增删改 的相关实现 索引记录 和 数据记录 的处理方式是一致的 这里来看一下 组合索引 的相关, 以及 特性 组合索引的存储以及使用 创建数据表如下, 除了主键之外, 创建了…