MySQL是一款广泛使用的关系型数据库。在MySQL中,大量数据场景提高查询效率是非常关键的,所以,对数据表进行分区是一个很好的选择。
在创建分区表之前,需要了解一下MySQL分区的基本概念。MySQL分区可以将一个大表分成多个小表,每个小表就是一个分区。常用的分区方式有:按范围分区RANGE、按列表分区LIST和按哈希分区HASH。而按照日期分区,是一种常用的按范围分区方式。
我们来看一下如何按日期创建分区表。首先,创建一个不分区的表
CREATE TABLE `test` (
`id` bigint NOT NULL,
`created_by` varchar(255) DEFAULT NULL,
`created_time` datetime(6) DEFAULT NULL,
`warehouse_code` varchar(255) DEFAULT NULL,
`warehouse_name` varchar(255) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;
添加分区表
ALTER TABLE test PARTITION BY RANGE COLUMNS(created_time) (
PARTITION P202301 VALUES LESS THAN ('2024-01-01 00:00:00'),
PARTITION P202401 VALUES LESS THAN ('2024-07-01 00:00:00'),
PARTITION P202402 VALUES LESS THAN ('2025-01-01 00:00:00'),
PARTITION P202501 VALUES LESS THAN ('2025-07-01 00:00:00'),
PARTITION Pmax VALUES LESS THAN (MAXVALUE)
);
此时,会报错,含义如下
分区的字段必须是要包含在主键当中。这时候分区的字段要么是主键,要么把分区字段加入到主键中,从而形成复合主键。
解决方案为:重建主键
--重建主键
alter table test DROP PRIMARY KEY, ADD PRIMARY key(id, created_time);
再次执行分区sql,
并插入数据,查看分区表结构
INSERT INTO test
(id, created_by, created_time, warehouse_code, warehouse_name)
VALUES(1, 'aaa', now(), 'cccccc', 'ddddd');
INSERT INTO test
(id, created_by, created_time, warehouse_code, warehouse_name)
VALUES(1, 'aaa', '2023-08-15 01:11:16.328551', 'cccccc', 'ddddd');
INSERT INTO test
(id, created_by, created_time, warehouse_code, warehouse_name)
VALUES(1, 'aaa', '2023-05-15 01:11:16.328551', 'cccccc', 'ddddd');
INSERT INTO test
(id, created_by, created_time, warehouse_code, warehouse_name)
VALUES(1, 'aaa', '2024-07-11 01:11:16.328551', 'cccccc', 'ddddd');
最后,查询验证
EXPLAIN SELECT * FROM test as t WHERE created_time = '2024-07-11 01:11:16.328551'
至此,MySQL基于range分区完美结束
总结一下:
RANGE COLUMNS是RANGE分区的一种特殊类型,它与RANGE分区的区别如下:
1. RANGE COLUMNS不接受表达式,只能是列名。而RANGE分区则要求分区的对象是整数。
2. RANGE COLUMNS允许多个列,在底层实现上,它比较的是多个列值组成的列表,而RANGE比较的是数值的大小。
3. RANGE COLUMNS不限于整数对象,date,datetime,string都可作为分区列。