Mysql高级部分学习笔记(一)——底层及索引

news2025/1/13 2:34:03

0. 概述

我们的数据库一般都会并发执行多个事务,多个事务可能会并发的对相同的一批数据进行增删改查操作,可能

就会导致我们说的脏写、脏读、不可重复读、幻读这些问题。

这些问题的本质都是数据库的多事务并发问题,为了解决多事务并发问题,数据库设计了事务隔离机制、锁机

制、MVCC多版本并发控制隔离机制,用一整套机制来解决多事务并发问题。接下来,我们会深入讲解这些机

制,让大家彻底理解数据库内部的执行原理。

1. 事务处理

  1. ACID:DBMS保证事务的ACID性质

    • Atomicity(原子性):要么完全执行,要么完全没有执行
    • Consistency(一致性):从一个正确状态转换到另一个正确状态
    • Isolation(隔离性):每个事务与其它并发事务互不影响
    • Durability(持久性):Transaction commit后,结果持久有效,crash也不消失
  2. Read uncommitted data (读脏数据) (写读):在T2 commit之前,T1读了T2已经修改了的数据

  3. Unrepeatable reads(不可重复读) (读写):在T2 commit之前,T1写了T2已经读的数据;如果T2再次读同一个数据,那么将发现不同的值

  4. Overwrite uncommitted data (更新丢失) (写写):在T2 commit之前,T1重写了T2已经修改了的数据

  5. 韩顺平版本:

    在这里插入图片描述

    在这里插入图片描述

  6. 隔离级别:

    在这里插入图片描述

2. 数据仓库

  1. 数据仓库:少量的数据分析操作;每个操作访问大量的数据;分析操作以读为主

  2. 事务处理:大量的并发transactions;每个transaction访问很少的数据;读写

3. 数据库索引

索引是帮助MySQL高效获取数据的排好序的数据结构

索引的数据结构:二叉树、红黑树、B树、哈希表…

3.1 B+树

Mysql的底层实现就是B+树,只存储索引,每个叶子节点是排序好的,便于区间查询;Mysql默认每个节点的大小为16kb;
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

加入索引后,其实查询主要的开销还是在IO(从磁盘加载子树节点到RAM),高一点的mysql版本会直接将整个B+树初始化的时候就加入RAM,这样只需要最开始的一次IO,即可。

4. 存储引擎(面试重点)

mysql有多种存储引擎,但是常用的主要是这两种,分别为myisam和innodb,这两种数据结构都是用的b+树

B+树的非叶子节点不存储数据,只有叶子节点才存储数据
而B树的非叶子和叶子节点都会存储数据,会导致非叶子节点存储的索引值会更少,树的高度相对会比B+树高,平均的I/O效率会比较低

所以使用B+树作为索引的数据结构,再加上B+树的叶子节点之间会有指针相连,也方便进行范围查找

4.1. MyISAM(非聚集索引)

  • 不支持事务,但是操作是有原子性的

  • 不支持外键,支持表锁,每次操作的时候都是锁住整张表

  • update会有表锁,所以并发量小,因为会进行阻塞。所以如果执行大量的SELECT,MyISAM是更好的选择

  • 采用非聚集索引,索引文件的数据域存储指向数据文件的指针。辅索引与主索引基本一致,但是辅索引不用保证唯一

  • MyISAM的索引和数据是分开的,并且索引是有压缩的,内存使用率就对应提高了不少。能加载更多索引

  • 主键索引和辅助索引

在这里插入图片描述
在这里插入图片描述

MyISAM存储引擎在使用索引查询数据时,会先根据索引查找到数据地址,再根据地址查询到具体的数据。并且主键索引和辅助索引没有太多区别。

两个表都是差不多,查找的思路也都是根据索引找到数据地址,在通过数据地址找到数据

4.2. InnoDB(聚集索引)

与MyISAM相比,InnoDB的最大特色就是支持了ACID兼容的事务(Transaction)功能。

  • 支持外键

  • 支持行锁,采用MVCC来支持高并发,有可能死锁

  • 对于AUTO_INCREMENT类型的字段,InnoDB中必须包含只有该字段的索引

  • InnoDB用于事务处理,具有ACID事务支持等特性如果在应用中执行大量insert和update操作,可选择

  • 不支持全文搜索

  • 主键索引和辅助索引

在这里插入图片描述
在这里插入图片描述

InnoDB中主键索引的叶子节点的数据区域存储的是数据记录,辅助索引存储的是主键值
主键索引采用聚集索引(索引的数据域存储数据文件本身),辅索引的数据域存储主键的值;

因此从辅索引查找数据,需要先通过辅索引找到主键值,再访问主键索引;

(面试题)为什么建议InnoDB表必须建主键,并且推荐使用整型的自增主键?

最好使用自增主键,防止插入数据时,为维持B+树结构,文件的大调整。

Innodb中的主键索引和实际数据时绑定在一起的,也就是说Innodb的一个表一定要有主键索引,如果一个表没有手动建立主键索引,Innodb会查看有没有唯一索引,如果有则选用唯一索引作为主键索引,如果连唯一索引也没有,则会默认建立一个隐藏的主键索引(用户不可见)。(用户没有指定的话会自己找生产一个隐藏列Row_id来充当默认主键)

另外**,Innodb的主键索引要比MyISAM的主键索引查询效率要高(少一次磁盘IO),并且比辅助索引也要高很多**。

所以,我们在使用Innodb作为存储引擎时,我们最好︰

  • 手动建立主键索引
  • 尽量利用主键索引查询

自增ID可以保证每次插入时B+索引是从右边扩展的,可以避免B+树和频繁合并和分裂(对比使用UUID)

(面试题)为什么非主键索弓|结构叶子节点存储的是主键值? (一致性和节省存储空间)

4.3 总结(重点)

在这里插入图片描述

MyISAM

  • 优点:查询数据相对较快,适合大量的select,可以全文索引。
  • 缺点:不支持事务,不支持外键,并发量较小,不适合大量update

InnoDB

  • 优点:支持事务,支持外键,并发量较大,适合大量update
  • 缺点:查询数据相对较快,不适合大量的select

聚集索引和非聚集索引

  • 聚集索引(聚簇索引):表中的数据都会有一个主键,即使不创建主键,系统也会帮你创建一个隐式的主键。这是因为innodb是把数据存放在B+树中的,而B+树的键值就是主键,在B+树的叶子节点中,存储了表中所有的数据。这种以主键作为B+树索引的键值而构建的B+树索引,我们称之为聚集索引。在B+树中,叶子节点存储整条记录的数据,这样的索引为聚集索引。
  • 非聚集索引(非聚簇索引):以主键以外的列值作为键值构建的B+树索引,我们称之为非聚集索引。叶子节点不存储表中的数据,而是存储该列对应的主键,想要查找数据我们还需要根据主键再去聚集索引中进行查找,这个再根据聚集索引查找数据的过程,我们称为回表。

使用index(索引)

  • Tree based:有序,支持点查询和范围查询

  • Hash based:无序,只支持点查询

5.联合索引

在平时开发中,我们最常见的是聚集索引,但在我们需要多条件查询的时候,就不得不建立联合索引,来提高我们的查询效率

  • 联合索引:也称复合索引,就是建立在多个字段上的索引。联合索引的数据结构依然是 B+ Tree
  • 一颗 B+ Tree 只能根据一个值来构建,所以联合索引使用最左的字段来构建 B+ Tree

5.1 最左前缀匹配原则(重要)

最左优先,以最左边的为起点任何 连续 的索引都能匹配上,但遇到范围查询 (>、<、between、like) 就会停止匹配。之所以会有 最左前缀匹配原则和联合索引的索引构建方式及存储结构 是有关系的

  • 联合索引是使用多列索引的第一列(最左)构建的 B+ Tree
  • 用上面 (A,B) 的例子就是使用 A 列构建的 B+ Tree ,当 A 列值相等时再以 B 列进行排序(相对有序)

具体见:https://blog.csdn.net/weixin_38192427/article/details/120244367

(面试题)java开发中为什么不建议连表查询

web架构水平扩展很方便,方式mysql水平扩展是很困难的

一:单表查询更有利于后续维护;

二:代码可复用性高;

三:效率问题

  • a:数据量小的情况下,连表查询的效率还是可以的,但是如果连表比较多,数据量上去,查询是笛卡尔积方式,查询的数据量是成几何倍上升的,这种情况下连表查询也必然会建立索引,这样的话索引的建立方式就要进行设计,需要一些索引功底的,如果索引建立不合适,是有可能会拖垮数据库的。
  • b: 相比较而言,单表查询+代码上组装,逻辑比较清楚,维护方便,构建索引也相对很简单了,用多访问几次数据库,多几行代码换取效率上的提升,也是很可行的。

四:缓存利用率高

比如不常变动的数据,缓存下来,每次查询的时候就没必要再去查了,直接拿取,进行下面操作就可以了。

解决方法:分成很多小表,将一个大的sql语句拆分成很多小的sql语句,多次查询,多次使用java代码调用sql,多几行代码换取效率上的提升,也是很可行的
索引也相对很简单了,用多访问几次数据库,多几行代码换取效率上的提升,也是很可行的。

四:缓存利用率高

比如不常变动的数据,缓存下来,每次查询的时候就没必要再去查了,直接拿取,进行下面操作就可以了。

解决方法:分成很多小表,将一个大的sql语句拆分成很多小的sql语句,多次查询,多次使用java代码调用sql,多几行代码换取效率上的提升,也是很可行的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/191742.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用windows电脑SSH客户端链接Iphone手机的sshd服务(免越狱)

最近有需求使用电脑导出手机中特定app的文件。 当然可以直接连上数据线将手机中的文件下载下来。 为了能做到代码自动化导出&#xff0c;将手机作为一台电脑使用&#xff0c;将手机中的文件导出来。 关键问题是如何将手机作为电脑使用&#xff0c;这里有几个步骤(我使用的是…

关于接口测试自动化的总结与思考

关于接口测试自动化的总结与思考 目录&#xff1a;导读 什么是服务端? 什么是接口? 什么是接口测试? 为什么要做接口测试? 如何做接口测试&#xff1f; 什么是接口测试自动化? 为什么要做接口测试自动化? 接口测试自动化的规范 文档准备 明确接口测试自动化需…

CRI 与 ShimV2:一种 Kubernetes 集成容器运行时的新思路

作者|张磊 CRI 与 ShimV2&#xff1a;一种 Kubernetes 集成容器运行时的新思路-阿里云开发者社区 Kubernetes 项目目前的重点发展方向&#xff0c;是为开发者和使用者暴露更多的接口和可扩展机制&#xff0c;将更多的用户需求下放到社区来完成。其中&#xff0c;发展最为成熟…

再探前端低代码的“野路子”

之前码过很多低代码的文章&#xff0c;发现大家口中的低代码挺不一样的&#xff0c;这次心血来潮想探探低代码的野路子。 只需要拖拽操作或者几行基础代码&#xff0c;就能完成以往需要程序员才能搭建的各类应用系统&#xff0c;对效率要求较高的企业而言&#xff0c;是不是很有…

命令执行简介、命令执行函数

数据来源 命令执行简介 01 命令执行漏洞产生原因 02 命令执行漏洞的危害 03 远程代码执行 1&#xff09;远程代码执行- eval函数 2&#xff09;远程代码执行 - assert函数 3&#xff09;远程代码执行 - preg_replace函数 使用方法和一句话木马一样 示例&#xff1a; 在ph…

9 多分类问题

文章目录问题引入网络设计改进网络方法softmax层lossMINIST引入代码实现课程内容来源&#xff1a; 链接课程文本借鉴&#xff1a; 链接以及Birandaの突然发现的也挺好&#xff1a;链接 问题引入 前篇中&#xff0c;对糖尿病数据集的问题是一个二分类问题&#xff0c;但实际问…

vue-node解决 rollbackFailedOptional: verb npm-session fd23ceb3f5797b77进度条卡住的问题

一、文章引导 #mermaid-svg-qv5tmCFBaoUwQojc {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-qv5tmCFBaoUwQojc .error-icon{fill:#552222;}#mermaid-svg-qv5tmCFBaoUwQojc .error-text{fill:#552222;stroke:#55222…

RabbitMQ常见场景问题

RabbitMQ常见场景问题 文章目录RabbitMQ常见场景问题6种工作模式1.直连模式2.发布订阅模式3.Routing路由模式4.Topic通配符模式5.Header模式6.RPC消息不丢失消息发送到交换机失败1.配置文件开启发布确认2.配置回调函数3.测试4.如何处理失败消息RabbitMQ服务器故障持久化消息发送…

存量房贷利率,一种简单估算其自然年利率调整的方法。

1.摘要2022年过去了&#xff0c;总所周知LPR被多次下调&#xff0c;目前有存量房贷的朋友&#xff0c;如果&#xff08;普遍&#xff09;设置的是根据自然年LPR动态调整利率&#xff0c;到2023年2月应该注意到了比较明显的房贷金额变动。这里主要给出一种根据这个变动&#xff…

Plecs电力电子仿真专业教程-第一季 第一节 Plecs简介

Plecs电力电子仿真专业教程-第一季 第一章 Plecs是什么&#xff1f; 第一节 Plecs简介 Plecs是瑞士Plexim GmbH公司开发的系统级电力电子仿真软件PLECS。PLECS是一个用于电路和控制结合的多功能仿真软件&#xff0c;尤其适用于电力电子和传动系统。不管您是工业领域中的开发…

[架构之路-96]:《软件架构设计:程序员向架构师转型必备》-6-需求与用户用例User Case/Senario建模

第6章 需求与用户用例User Case建模备注&#xff1a;严格意义上讲&#xff0c;用户用例属于需求分析领域&#xff0c;不属于架构设计。用户用例是架构设计最重要的输入参考之一。User Case和User Senario是非常重要的描述需求的重要手段6.1 常用的4种用例技术6.1.1 用例图6.1.2…

学习Java开发按此路线规划,从10K到40K全都有了,我就是这样过来的

如果有一天我醒来时&#xff0c;发现自己的几年Java开发经验被抹掉&#xff0c;重新回到了一个小白的状态。我想要重新自学Java&#xff0c;然后找到一份自己满意的Java工作&#xff0c;我想大概只需要6个月的时间就够了&#xff0c;如果顺利的话&#xff0c;4个月也差不多。如…

用光盘怎样重装电脑系统

用光盘怎样重装电脑系统&#xff1f;重装系统&#xff0c;听起来好像很难的样子。其实没那么难&#xff0c;用光盘装还是比较容易的。下面一起看看如何用光盘重装系统吧。 工具/原料&#xff1a; 系统版本&#xff1a;win7 品牌型号&#xff1a;联想yoga13 方法/步骤&#xf…

Vue使用axios发送get请求并携带参数

前言 其实关于Vue使用axios发送get请求并携带参数&#xff0c;我之前写过一篇&#xff0c;但是昨天又发现了另外一种方式&#xff0c;所以就单独写一篇进行总结。 之前写的那篇使用get请求并携带参数都是使用的字符串拼接的方式 感兴趣可以参考&#xff1a; Vue使用axios进行g…

基于Android的校园资产管理系统

需求信息&#xff1a; 管理员用户&#xff1a; 1&#xff1a;用户注册登录&#xff1a;通过手机号码、用户名称以及密码完成用户的注册和登录 2&#xff1a;添加资产&#xff1a;添加资产的编号、名称、归属部门之后生成资产二维码&#xff0c;以及查看添加过的资产信息 3&…

amCharts Javascript Web 5.3.0 Crack

添加新的 JSON 插件&#xff0c;允许您将序列化 (JSON) 配置解析为图表。 2023 年 1 月 31 日 - 16:00新版本 特征 添加了新JSON插件&#xff0c;允许将序列化 (JSON) 配置序列化和解析为图表。 crisp&#xff08;默认&#xff1a;&#xff09;false设置已添加到Sprite。如果设…

已经拿到IB成绩的学生,应该怎么为申请大学做准备呢?

2023年将会是过渡的一年&#xff0c;前几年的高分可能一去不复返了&#xff0c;大家心里也是要做好准备。对于今年已经拿到IB成绩的孩子们&#xff0c;应该怎么为申请大学做准备呢&#xff1f;老师也给了大家一些建议。1.如何递交IB成绩给申请的大学&#xff1f;今年1月出成绩的…

Shell + Datax 动态传递时间参数模式

Datax 数据同步模式Shell 脚本实现Datax 数据同步四种模式Datax 数据全量同步模式此脚本省略...Datax 数据实时增量&#xff08;T1&#xff09;模式功能&#xff1a;实现前一天日期 00:00:00 至前一天日期 23:59:59 数据同步#&#xff01;/bin/bash # 切换至增量脚本文件存储目…

[NOI Online #3 入门组] 最急救助

题目描述: 救助中心每天都要收到很多求救信号。收到求救信号后&#xff0c;救助中心会分析求救信号&#xff0c;找出最紧急的求救者给予救助。 求救信号是一个由小写英文字母组成的字符串&#xff0c;字符串中连续三个字符依次组成sos的情况越多&#xff08;即包含子串sos的数…

【蓝桥杯单片机】工厂灯光控制系统案例解析(小蜜蜂老师基础综合实训)

工厂灯光控制系统案例解析题目流程图关键点复盘参考代码&#xff08;IO模式&#xff09;题目 流程图 关键点复盘 设备检测——移位 L1~L8在板子上是从左至右&#xff0c;但是在对P0口赋值时是16进制从高位(L8)—>低位(L0) 根据原理图&#xff0c;LED赋值0亮1灭 为了方便赋值…