1. 数据库的存储结构 : 页
索引结构给我们提供了高效的索引方式,不过索引信息以及数据记录都是保存在文件上的.确切说是存储在页结构中.另一方面,索引是在存储引擎中实现的,MySQL服务器上的存储引擎负责对表中数据的读取和写入操作.不同的存储引擎中存放的格式一般不同.甚至有个存储引擎比如Memory都不用磁盘来存储数据,而是存储在内存中.重启MySQL服务器直接GG.
(1). 磁盘与内存交互基本单位:页
InnoDB将数据划分为若干个页,InnoDB中页的大小默认为16kb.以页作为磁盘和内存之间的交互的基本单位,也就是一次最少从磁盘中读取16kb的内容到内存中,一次最少把内存中的16kb的内容刷新到磁盘中.也就是说,在数据库中,不论读取一行,还是读取多行,都将这些行所在的页都加载到内存中.即,数据库管理存储空间的基本单位是页.数据库I/O操作的最小单位是页.一般情况下一个页可以存储多个行记录.
记录是按照行来存储的,但数据库的读取并不以行为单位,否则一次I/O操作只处理一行数据,效率会非常低.
(2). 页结构的概述
页a,页b,...这些页可以不在物理结构上相连,只需要通过双向链表在逻辑上相邻即可.每个数据页中的记录按照主键值从小到大的顺序组成一个单向链表,每个数据页都会为存储在其中的记录生成一个页目录,在通过主键查找某条记录的时候可以在页目录中通过二分法快速定位到对应的槽,然后再遍历槽对应分组中的记录即可快速找到指定的记录.
(3). 页的大小
不同数据库管理系统的页的大小是不同的.比如在MySQL的InnoDB存储引擎中,默认页的大小为16kb.
(4). 页的上层结构
另外在数据库中,还存在着区,段,和表空间的概念.行,页,区,段,表空间的关系如图.
- 区是比页大一级的存储结构,在InnoDB存储结构中,一个区会分配64个连续的页.因为在InnoDB中页的大小默认是16kb的.所以一个区的大小是16*64kb=1mb.
- 段是由一个或多个区组成.区在文件系统是一个连续分配的空间(在InnoDB中是连续的64个页),不过在段中不要求区与区之间是相邻的.段是数据库中的分配单位,不同类型的数据库对象以不同的段形式存在.当我们创建数据库表,索引的时候,就会创建相对应的段,比如创建一张表的时候创建表段,创建索引的时候创建一个索引段.
- 表空间是一个逻辑容器.表空间存储的对象是段,在一个表空间中可以有一个或多个段,但是一个段只能属于一个表空间.数据库由一个或多个表空间组成,表空间从管理上可以划分为系统表空间和用户表空间,撤销表空间,临时表空间.
(5). 页的内部结构 超级重点
页如果按照类型划分,常见的有数据页(保存b+树节点),系统页,Undo页和事务数据页.数据页是我们最常用的页.
数据页的16kb大小的存储空间被划分为7个部分,分别是文件头,页头,最大最小记录,用户记录,空闲空间,页目录和文件尾.
这7个部分的作用.
1). 文件头(File Header)和文件尾(File Trailer)
首先是文件通用部分,也就是文件头和文件尾.
文件头部信息.
- 不同类型的页都会以File Header作为第一个组成部分,它描述了一些针对各种页都通用的一些信息.比方说这个页的编号是多少,它上一个页是谁,下一个页是谁等等.所有的数据页会组成一个双向链表.
文件头的构成.
2). 记录部分
页的主要作用是存储记录,所以最大最小记录和用户记录占了页结构的主要空间.