一个InnoDB表包含两部分:表结构定义和数据。表结构定义占用空间很小,所以主要来看一下表数据。
表数据既可以存放在共享表空间里,也可以是单独的文件。由参数innodb_file_per_table控制,这个参数值为OFF,则表示存放在系统共享表空间里,也就是跟数据字典放在一起,值为ON,则表示每个InnoDB表数据存储在一个以.ibd为后缀的文件中。从MySQL5.6.6开始,它的默认值就是ON了。此时,如果执行drop table命令,系统就会直接删除这个文件。如果是放在共享表空间中,即使表删掉了,空间也不会被回收。
在MySQL中当删除一条数据时,InnoDB引擎只会把R4这个记录标记为删除,如果之后要再插入一个ID在300和600之间的记录时,可能会复用这个位置,但是磁盘文件的大小并不会缩小。如删除下图中R4的时候
InnoDB的数据是按页存储的,当删掉了一个数据页上的所有记录时,整个数据页就可以被复用了。
记录的复用,只限于符合范围条件的数据,数据页的复用则没有此限制,可以复用到任何位置。
如果相邻的两个数据页利用率都很小,系统就会把这两个页上的数据合到其中一个页上,另一个数据页就被标记为可复用了。
如果用delete命令把整个表的数据都删除了,则所有的数据页都会被标记为复用,但是磁盘上的文件不会变小。delete并不能回收表空间。这些可以复用,而没有被使用的空间,称为“空洞”。
插入数据也会造成空洞。如果数据是按照索引递增顺序插入的,则索引是紧凑的,但是如果数据是随机插入的,就可能造成索引的数据页分裂,就会造成空洞。此外,更新索引上的值,可以理解为删除一个旧值,再插入一个新值,这也会造成空洞。
综上,经过大量增删改的表,都是可能存在空洞的。可以通过重建表,达到去掉这些空洞,收缩表空间的目的。如下述语句。
alter table A engine=InnoDB
analyze table其实并不是重建表,只是对表的索引信息做重新统计,没有修改数据,这个过程加了MDL读锁。
optimize table等于recreate + analyze。recreate的过程即执行上述语句的过程。
正文止。
感兴趣的朋友,欢迎关注我的公众号哈,公众号上已经集成了AI大模型,大家可以过来聊天、问问题了