【MySQL数据库】 六

news2025/1/20 1:04:07

本文主要介绍了数据库原理中数据库索引和事务相关概念. 

一.索引

在查询表的时候,最基本的方式就是遍历表,一条一条筛选 .

因此,就可以给这个表建立索引,来提高查找的速度 

比如,按照id建立索引

在数据库上额外搞一个空间维护一些id 相关的信息,

id:1  表的某个位置

id:2  表的某个位置

后续再按照id来查询,就不必直接遍历了,而是从索引中进行查询,根据索引就能够 , 初步判断锁定数据所在位置

索引,是用来提高查询效率的

1.缺陷

1.消耗额外空间

2.有可能拖慢增/删/改的速度

对于新增来说,不光要往表里写数据,同时还要修改索引

删除/修改,如果删除修改的条件,正好是和索引匹配还可以快点;如果涉及到索引列的删除/修改,这个时候也要需要维护索引

(好在大多数的业务场景中,是查询操作为主,增删改少很多,这种情况下,使用索引,就非常合适了 .

2.sql中使用索引

1.查看索引

show index from 表名;

  • 对于class表,由于classid是主键,自动生成了一个索引

  • 对于classes表,由于classid是unique,自动生成了一个索引

  • 对于student表,由于classid是外键,也自动生成了索引

2.创建索引

手动创建索引

create index 索引名 on 表名 (字段名) ;

查看创建的索引

注意:

这个创建索引操作,可能会非常危险 !!

如果表是空的,或者表里的数据本身不多,创建索引,没关系;

如果表非空,并且包含了非常多的数据,创建索引,会引起非常大规模的硬盘IO操作,进一步就会导致数据库被卡死 !

3.删除索引

指定要删除的索引名和表名

drop index 索引名 on 表名;

删除索引,只能针对手动创建的索引 ; 自动生成的索引,是不能删除的;

如果需要给一个已经有很多数据的表创建/删除索引,并且这个数据库还是生产环境的数据库 ,怎么做 ?

冗余 !

数据库服务器往往不是单台服务器,为了整个系统的可靠性,通常会搞多个mysql服务器节点,这些节点的数据是一样的,能够提供相同的服务

因此可以先准备好一个新的mysql服务器,把表和索引都创建好,然后把数据都导入到新的服务器,再把要替换的mysql服务器关闭,把新的mysql服务器提上就行

其实sql除了增删改查之外,也支持一些其他的语法 (定义变量/条件/循环/函数)

但是并不建议使用复杂的sql

1.语法比较老了

2.不方便调试/优化

3.索引底层的数据结构

非常重要!!!!

mysql的索引的数据结构是什么样的数据结构?

不是一定的,取决于mysql使用哪个存储引擎

存储引擎

mysql里面包含很多模块

负责解析sql的

负责网络通信的

负责存储数据的 -- > 存储引擎 ,本质就是代码中的一个模块(包含了若干个代码文件)

具体如何存储数据,mysql支持多种存储方案

innodb当下最主流的一种方式

数据库组织数据使用的数据结构,是在硬盘上 !

对于内存上的数据结构,对于访问操作来说,是不敏感的;

但是硬盘上的数据结构,对于访问操作来说,比较敏感;  读写一次硬盘,开销远远大于内存

而索引,主要目的是为了进行快速查找 , 因此硬盘的读写对索引来说非常敏感 ! 太多的硬盘读写势必拖慢索引的速度  ! 

回忆学过的数据结构:

顺序表/链表/栈/队列/堆  都不行

1.哈希表  

工作中最常用的数据结构

O(1)复杂度查询/插入/删除/修改数据

但是不适合数据库的查询场景

因为哈希表只能做精确查询,没法做到模糊查询和范围查询

2.红黑树

O(logN) 插入删除/修改/查询

也不适合数据库的查询场景

元素有序,可以处理范围查询

最大的问题,在于红黑树的高度,会在元素个数比较多的时候,变得比较高,因此会引入较多的硬盘IO

索引存储在硬盘上,每次比较都意味着硬盘IO操作

(1次硬盘IO操作相当于1万次内存IO操作)

上述讨论是针对mysql innodb存储引擎来讨论, 对于其他的存储引擎也可能会用到hash作为索引

3.B树

innodb使用的是B+树 , B+树是为了数据库量身定做的数据结构

要了解B+树,需要先了解B/B-树

B树的本质是是要给N叉搜索树

一个节点,可以保存多个key;

N个key可以延伸出N+1个分叉

(N个key可以划分出N+1)个区间

B树查询元素的流程:

拿着要查询的元素从根节点触发,判定要查找的元素是否在根节点上存在,

如果不存在,看这个元素是落在哪个区间里,就沿着这个区间的路线往下一个节点上找,最后找到叶子节点还不存在,就是真的不存在了.

此时每个节点上,都可以保存多个元素, 当总的元素个数固定,相比于二叉搜索树,涉及到的节点的总数就大大降低了,树的高度也大大降低了(B树的高度远远小于二叉搜索树的高度) , 因此进行查询的时候,硬盘IO的次数也随之减少了


注意:

对于数据库来说,每个节点,都需要把数据从硬盘上读出来才能进行比较 ;

但是一个节点有多个key,和一个节点有一个key,硬盘IO的开销是差不多的;


对于B树来说,进行插入和删除元素的时候,就涉及到拆分和合并的操作

一个节点,可以cun多个key,也不能无限的存,当存储的key数量达到一定程度的时候,

就需要把这个节点拆分,把这个节点的一部分key以书的子节点的方式来进行重新组织

拆分

合并

当key变少了就可以合并成一个节点


4.B+

数据库索引的主角,在B树的基础上,进一步作出了一些改进 (针对数据库查询)

1)B+树也是N叉搜索树

但是N个key分出了N个区间

其中节点上的最后一个key就是最大值了

2)父节点的key会在子节点中重复出现 (而且是以最大值的身份)

看起来重复了很多元素,浪费了空间

实际上能够达成一个重要的效果:叶子节点这一层,包含了整个数据的全集

3)叶子节点,按照链表的方式,首尾相连

此时就可以通过叶子节点之间的连接,快速找到下一个,上一个元素,进一步也方便进行范围查询

比如查询id>=5 and id<=12

只需要确定开头和结尾 , 把中间的这段子链表拎出来就是范围查询的结果

以上是三个B+树的特点

优势

1.特别擅长范围查询

2.所有的查询都会落在叶子节点上,比较次数是均衡的 , 查询时间是稳定的 !

有的时候,稳定比快更重要 .

3.由于叶子节点上的完整的数据全集 .

因此表的每一行数据的其他列,都可以保存在叶子节点上,而非叶子节点,只存储索引的key即可 (只保存id)

其实在物理层面上,不需要表格这样的数据结构,直接使用B+树来存储这个表的数据,只是用户看起来像表格而已

此时,非叶子节点的存储空间,消耗是非常小的 ,可以在内存中缓存一份 ;

因此进行数据查询的时候,就可以通过内存来直接进行比较, 从而更快速的找到叶子节点的记录,又进一步地减少了硬盘IO的次数 .

,

这里的面试题:

介绍一下对数据库索引的认识

这里的回答包含前面索引的这个章节的所有内容

二.事务

事务的本质就是为了把多个操作,打包成一个操作来完成  (让这多个操作,要么全都执行成功 , 要么就一个都不执行 --->原子性 )

注意:

"一个都不执行" 不是真的不执行

执行成不成功,得执行了才知道

假设事务中有三个操作

先执行1 ,再执行2 , 最后执行3

真正执行之前,是不知道123哪一步会失败

如果中间执行到中间出错了 , 就需要自动把之前前面已经成功执行的操作,进行还原,还原会最初没有执行的模样, 本质上,这里的"一个都不执行",指的是 看起来和 没执行一样

还原的这个过程,把它称作回滚 .

实现过程:

把事务中的执行的每个操作都记录下来,如果需要回滚,就直接按照操作的逆操作来执行就可以

事务 -> 原子性 -> 回滚 ->特定的日志

1.使用

1.开启事务

start transaction

输入多个sql语句

2.提交事务

commit

把这些sql按照原子的方式进行执行(带回滚机制)

3.rollback回滚

手动触发回滚

一个事务必须以这两个操作结尾 , 接下来的各种sql操作都会被认为是事务的一部分 .


上述操作,在开发中往往是通过程序代码的方式来操作事务  , 不会用命令来操作事务  , 并且差异很大

2.事务的基本特性

1.原子性

保证多个操作被打包成一个整体 , 要么全部正确执行 ,要不一个都不执行

2.一致性

事务执行之前和事务执行之后,数据都能对上  (约束/回滚机制)

3.持久性

执行的各种操作都是持久生效的(最终写入到磁盘中的)

一旦事务执行成功了,这里的所有操作产生的修改,都会写到硬盘里的

4.隔离性

并发执行事务的时候,隔离性会在执行效率和数据可靠之间做出权衡,

隔离 描述的是同时执行的事务之间相互的影响;

隔离性越高,并发性越低 ; 数据越可靠, 性能就越低 ;

3.并发

简称理解成同时执行 .

在并发执行事务的过程中,可能产生以下问题:

1.脏读

读到了事务提交之前的中间数(脏数据)

解决方法: 引入写加锁 . 提交之前,不能读

2.不可重复读

一个事务之内,多次读取同一个数据,发现数据不一样(读的过程中,另一个事务修改

了数据)

解决方法:引入读加锁. 读的时候,不能修改了

3.幻读

一个事务之内,多次读到的数据,值相同,但是结果集不同

解决方法: 彻底串行化,完全放弃并发执行

逐渐往下,隔离性越高,数据越可靠,并发程度越低,

咱们可以根据实际的需求场景,来决定使用哪个隔离级别,找到一个效率和可靠性都能接受的情况

4.事务的隔离级别

mysql提供了四种事务的隔离级别

1.read uncommitted (RU)

允许读未提交的数据 (存在脏读/不可重复读/幻读问题)

2.read committed (RC)

允许提交已经提交的数据(给写加锁了,解决了脏读,存在不可重复读/幻读 )

 3.repeatable read(RR)

可以重复读取数据(写写操作和读操作都加锁,解决了不可重复读的问题,存在幻读问题)

4.serializable

事务彻底串行执行  (解决了脏读/不可重读读/幻读)

默认的事务级别是RR

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1187041.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第22章_数据库的设计规范

文章目录 范式的概念三范式范式一范式二范式三 反范式总结 范式的概念 为了建立冗余较小、结构合理的数据库&#xff0c;设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库&#xff…

LLM 大模型向量数据库技术架构浅析

▼最近直播超级多&#xff0c;预约保你有收获 近期直播&#xff1a;《LLM 大模型向量数据库技术架构剖析和应用案例实战》 —1— AI 智能时代&#xff0c;开发者需要一个真正的向量数据库吗&#xff1f; 答案很简单&#xff0c;这取决于开发者的应用场景。举个例子&#xff0c;…

【C++】多态(重写)的实现过程及其原理【核心知识点精讲】(22)

前言 大家好吖&#xff0c;欢迎来到 YY 滴C系列 &#xff0c;热烈欢迎&#xff01; 本章主要内容面向接触过C的老铁 主要内容含&#xff1a; 欢迎订阅 YY滴C专栏&#xff01;更多干货持续更新&#xff01;以下是传送门&#xff01; 目录 一.基础知识介绍1&#xff09;虚函数&a…

It Is All About Data: A Survey on the Efects of Data on Adversarial Robustness

It Is All About Data: A Survey on the Effects of Data on Adversarial Robustness----《这一切都关乎数据&#xff1a;关于数据对对抗性鲁棒性影响的调查》 摘要 对抗性示例是攻击者故意设计的机器学习模型的输入&#xff0c;目的是迷惑模型&#xff0c;使其犯错误。这些例…

Java对象的深拷贝

什么是深拷贝 在Java中&#xff0c;对象的深拷贝是指创建一个新的对象&#xff0c;并复制原始对象的所有字段和属性&#xff0c;包括嵌套对象。深拷贝确保原始对象和拷贝对象是完全独立的&#xff0c;对其中一个对象的修改不会影响另一个对象。 深拷贝需要注意的点 在Java中…

震裕科技-300953 三季报分析(20231108)

震裕科技-300953 基本情况 公司名称&#xff1a;宁波震裕科技股份有限公司 A股简称&#xff1a;震裕科技 成立日期&#xff1a;1994-10-18 上市日期&#xff1a;2021-03-18 所属行业&#xff1a;专用设备制造业 周期性&#xff1a;0 主营业务&#xff1a;精密级进冲压模具及下游…

【hcie-cloud】【5】华为云Stack规划设计之华为云Stack标准化配置、缩略语【下】

文章目录 前言、华为云Stack交付综述为云Stack标准组网华为云Stack标准化配置华为云Stack配置概览华为云Stack云服务全视图华为云Stack部署方案节点类型说明华为云Stack云服务组件部署场景管理节点部署原则云平台管理规格华为云Stack IaaS场景&高阶场景起步必选部署组件x86…

Python高级语法----Python多线程与多进程

文章目录 多线程多进程注意事项多线程与多进程是提高程序性能的两种常见方法。在深入代码之前,让我们先用一个简单的比喻来理解它们。 想象你在一家餐厅里工作。如果你是一个服务员,同时负责多个桌子的顾客,这就类似于“多线程”——同一个人(程序)同时进行多项任务(线程…

RflySim | 滤波器设计实验二

本讲是关于无人机滤波器&#xff0c;其中包括无人机滤波器简介、测量原理、线性互补滤波器设计、线性互补滤波器参数分析、卡尔曼滤波器设计等。 滤波器设计实验2 卡尔曼滤波器是一种递推线性最小方差估计算法&#xff0c;它的最优估计需满足以下三个条件&#xff1a; 1&#…

【Spring】静态代理

例子&#xff1a; 租房子 角色&#xff1a; 我 &#xff08;I ) 中介( Proxy ) 房东( host ) Rent 接口 package org.example;public interface Rent {void rent(); }房东 package org.example;public class Host implements Rent{Overridepublic void rent() …

NAT协议

目录 NAT 前言 NAT地址转换表 NAT分类 前言 静态NAT 192.168.1.2访问200.1.1.2执行过程 动态NAT 192.168.1.2访问200.1.1.2执行过程 NAPT 192.168.1.2的5000端口访问200.1.1.2的80端口执行过程 基本命令 配置动态NAPT转换 定义内外网接口 配置NAPT 静态NAPT配置…

NetworkManager 图形化配置 bond

1、在桌面右下角找到网络连接标识&#xff0c;鼠标右击&#xff0c;选择编辑连接&#xff0c;如下图 注意&#xff1a;此次示例使用 ens37 和 ens38 两张网卡组成 bond。在配置 bond 前为了网 络稳定如果子网卡已有网络连接的建议先删除 bond 子网卡的网络连接。 2、单击按钮&a…

Python高级语法----Python异步编程入门

文章目录 异步编程概念asyncio模块基础event loop和coroutineasync与await关键字代码示例结论在现代软件开发中,异步编程已经成为一个不可或缺的概念,尤其是在处理I/O密集型任务和高并发需求时。Python作为一门多范式编程语言,自3.5版本以来,通过引入asyncio模块和async/aw…

UseGalaxy.cn生信云平台文本文件操作手册

文本文件是生物信息学中应用非常广泛的文本格式&#xff0c;甚至可以说是最重要的文件格式&#xff0c;比如常见的测序下机数据Fastq、参考基因组保存格式Fasta、比对文件SAM&#xff0c;以及突变列表VCF&#xff0c;它们都是文本文件。熟练地进行文本文件的处理&#xff0c;对…

facebook分享-错误记录

无法拉起分享 "code":30000,"msg":"fail:API_ERROR: API_ERROR" 1.确认facebook的app_id是否一致 2.确认是否在app_id应用的白名单里&#xff0c;注册meta开发者&#xff0c;然后把主页的user_id给管理员加 A ContentProvider for this app was…

响应式生活常识新闻博客资讯网站模板源码带后台

模板信息&#xff1a; 模板编号&#xff1a;30483 模板编码&#xff1a;UTF8 模板分类&#xff1a;博客、文章、资讯、其他 适合行业&#xff1a;博客类企业 模板介绍&#xff1a; 本模板自带eyoucms内核&#xff0c;无需再下载eyou系统&#xff0c;原创设计、手工书写DIVCSS&a…

Pandas - 数据转换

数据转换一班包括一列数据转换为多列数据&#xff0c;行列转换&#xff0c;DataFrame转换为字典、DataFrame转换为列表和DataFrame转换为元组等。 1.一列数据转换为多列数据 如原始地址数据为&#xff1a;“广东省 深圳市 罗湖区 xxxx”&#xff0c; 此时如果我们需要按照省来…

解密网易数帆DataOps“三剑客”:从数据开发治理、指标中台到ChatBI

大数据产业创新服务媒体 ——聚焦数据 改变商业 近日&#xff0c;以“数智聚力&#xff0c;共赴新程”为主题的2023网易数字大会在杭州召开。在这次大会上&#xff0c;数据猿采访了网易副总裁、网易数帆总经理汪源&#xff0c;网易数帆大数据产品线总经理余利华&#xff0c;对…

centos7部署Canal与Canal集成使用

1、简介 canal [kə’nl]&#xff0c;译意为水道/管道/沟渠&#xff0c;主要用途是基于 MySQL 数据库增量日志解析&#xff0c;提供增量数据订阅和消费 早期阿里巴巴因为杭州和美国双机房部署&#xff0c;存在跨机房同步的业务需求&#xff0c;实现方式主要是基于业务 trigge…

项目实战:中央控制器实现(2)-优化Controller,将共性动作抽取到中央控制器

1、FruitController FruitController已经和Web没有关系了&#xff0c;和Web容器解耦&#xff0c;可以脱离Web容器做单元测试 package com.csdn.fruit.controller; import com.csdn.fruit.dto.PageInfo; import com.csdn.fruit.dto.PageQueryParam; import com.csdn.fruit.dto.R…