(一)高并发压力测试调优篇——MYSQL数据库的调优

前言

在实际项目开发中，很多业务场景下都需要考虑接口的性能要求，追求高并发、高吞吐量。那么对于此类问题如何入手呢？关注作者，不迷路。本节内容主要介绍在数据库db方面的优化，以mysql数据库为例。

关于db的优化，主要有以下几个方面的优化：

db数据库优化
db优化的层面	db优化说明
查询优化	①使用EXPLAIN: 分析查询执行计划，找出瓶颈。 ②避免直接使用SELECT *: 明确指定需要的列，减少数据传输量。 ③使用JOIN替代子查询: JOIN通常比子查询更高效。 ④减少全表扫描: 尽可能使用索引。 ⑤优化子查询: 使用JOIN或存在子句（EXISTS）替换嵌套子查询。 ⑥避免使用LIKE 'prefix%': 这种形式的LIKE语句会导致全表扫描，除非前缀索引可用。
索引优化	①创建合适的索引: 索引应基于查询中最常使用的列。 ②使用覆盖索引: 索引中包含所有需要查询的列，避免回表查询。 ③避免过多索引: 过多索引会增加写操作的成本。 ④定期分析和优化索引: 使用ANALYZE TABLE和OPTIMIZE TABLE命令。
配置优化	①调整my.cnf/my.ini配置文件: 根据服务器硬件调整参数。 ②InnoDB Buffer Pool: 设置为物理内存的60%-80%。 ③Query Cache: MySQL 8.0已弃用，但在之前的版本中，合理配置可以提高性能。 ④Max Connections: 设置合理的连接数，避免资源浪费。 ⑤Thread Cache Size: 减少线程创建和销毁的开销。
存储引擎选择	①InnoDB: 支持事务，行级锁定，适合写密集型应用。 ②MyISAM: 不支持事务，但读取速度快，适合读密集型应用。 ③MEMORY: 用于临时表和小数据集的快速存储。
硬件优化	①足够的CPU: 处理复杂的查询和并发请求。 ②充足的内存: 特别是用于InnoDB的Buffer Pool。 ③高速存储: SSD比HDD快得多，减少I/O延迟。 ④网络优化: 高速网络接口，减少网络延迟。
架构优化	①读写分离: 主从复制，将读操作分散到从服务器。 ②分区: 将大表分割成更小的部分，提高查询效率。 ③集群: 使用MySQL Cluster或Galera Cluster提供高可用性和负载均衡。
定期维护	①定期检查表: 使用CHECK TABLE命令检测表损坏。 ②定期优化表: 使用OPTIMIZE TABLE命令整理碎片。 ③定期备份: 避免数据丢失
监控与调整	①性能监控: 使用slow query log，performance_schema等工具监控性能。 ②定期调整: 根据监控结果调整配置和策略。
应用层优化	①减少不必要的查询: 缓存结果，避免重复查询。 ②优化应用程序代码: 减少数据库交互次数，使用批处理。
安全与合规	①数据加密: 保护敏感数据。 ②权限管理: 最小权限原则，限制不必要的数据库访问。

本节内容我们主要针对的是单个mysql数据库的优化配置，主要从数据库缓存池的大小设置、数据库最大连接数的设置、数据库表索引的设置着手。以上几个方面的优化配置能够明显提升数据库的性能。通过配合jemeter压测工具来观察优化的结果。本地服务器是14核40G，使用的数据库是mysql8.0。

正文

压测前准备

①创建一个数据库，一张用户表tps_user

CREATE TABLE `tps_user` (
  `id` bigint NOT NULL COMMENT '主键',
  `username` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '用户名',
  `password` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '密码',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci COMMENT='tps-用户表';

②使用springboot工程创建一个压测接口，根据用户名查询用户信息

③数据库的默认参数配置

# 默认缓冲池大小： 128M
SHOW VARIABLES LIKE 'innodb_buffer_pool_size';
# 默认最大线程连接数： 200
SHOW VARIABLES LIKE 'max_connections';
# 活跃的连接数
SHOW STATUS LIKE 'Threads_connected';
# 查看所有的线程
SHOW PROCESSLIST;

压测默认缓冲池大小128M，默认数据库连接数200，用户数据一条，应用的数据库连接池最小10，最大设置为50。并发数500、1000、5000、10000

- 500并发

- 1000并发

- 2000并发

- 5000并发

结论：单条数据压测，吞吐量4000左右，不具有参考价值，因为一条数据，默认查询的是缓冲池的数据，查询会走数据库缓存，吞吐量会很高。同时我们也可以看到，随着并发数据的上升，吞吐量基本差别不大，但是响应时间明显会增大。

压力测试结果
并发数	吞吐率QPS	平均响应时间
500	4756.1/sec	103ms
1000	4374.9/sec	224ms
2000	4512.6/sec	429ms
5000	3925.9/sec	1237ms

压测默认缓冲池大小128M，默认数据库连接数200，用户数据100万，应用的数据库连接池最小10，最大设置为50。并发数500、1000、5000、10000

- 生成100万用户测试数据

- 500并发：随着压测时间的增长，吞吐量基本稳定在11.4左右，响应时间逐渐变大

- 1000并发：随着压测时间的增长，吞吐量基本稳定在11.4左右，响应时间逐渐变大

- 2000并发：随着压测时间的增长，吞吐量基本稳定在11.4左右，响应时间逐渐变大

- 5000并发：随着压测时间的增长，吞吐量基本稳定在11.2左右，响应时间逐渐变大

结论：100万用户数据压测，吞吐量只有11左右，可以明显的看到吞吐量急剧下降，而且随着压测时间持续时间的增长，响应时间也在逐渐变大。随着并发数的增大，吞吐率和平均响应时间差别不大，数据基本不会走缓冲，基本都要经过数据库的IO读写操作。数据库此时遇到了瓶颈。

压力测试结果
并发数	吞吐率QPS	平均响应时间
500	11.4/sec	28157ms
1000	11.4/sec	36718ms
2000	11.4/sec	31768ms
5000	11.4/sec	33850ms

优化一：将用户的查询字段增加索引，压测的默认配置保持不变。压测默认缓冲池大小128M，默认数据库连接数200，用户数据100万，应用的数据库连接池最小10，最大设置为50。并发数500、1000、5000、10000

- 增加查询字段的索引

- 500并发：吞吐量4416，平均响应时间111ms

-1000并发：吞吐量4671，平均响应时间210ms

-2000并发：吞吐量4615，平均响应时间401ms

-5000并发：吞吐量4204，平均响应时间1145ms

结论：100万用户数据压测，增加索引后，吞吐量达到4500左右，与不创建索引天差地别，平均响应时间也变为毫秒级，且随着并发访问增大而平均响应时间也增大。为什么吞吐量会变大是因为创建索引后，数据不用全表逐行扫描，能够很快的定位数据的位置，减少数据库IO操作。如果缓存中存在索引数据，则可以完全不用IO操作，直接内存中查询；如果缓存中不存在，且是覆盖索引，则需要一次IO操作；如果缓存中不存在，且不是覆盖索引，则需要俩次IO,一次索引查询，一次用于回表读取数据行；如果是范围查询，则可能需要多次IO操作。由此可见，对于查询操作而言，对于合理的索引创建能够大幅度提高数据库的访问性能。

压力测试结果
并发数	吞吐率QPS	平均响应时间
500	4416/sec	111ms
1000	4671/sec	210ms
2000	4615/sec	401ms
5000	4204/sec	1145ms

优化二：增加数据库最大连接数以及应用的数据库连接池个数。将用户的查询字段索引去掉（尽量排除缓存干扰），压测的默认配置保持不变。压测默认缓冲池大小128M，默认数据库连接数改为1000，用户数据100万，应用的数据库连接池最小10，最大设置改为200。并发数500、1000、5000、10000

- 准备工作1，设置数据库最大连接个数为1000
SET GLOBAL max_connections=1000;
- 准备工作1，配置应用的数据库连接池个数最大为200

- 500并发：吞吐量14.8，平均响应时间25159ms

- 1000并发：吞吐量17.4，平均响应时间28160ms

- 2000并发：吞吐量17.6，平均响应时间32575ms

- 5000并发：吞吐量43.2，平均响应时间7423,开始出现报错

结论：100万用户数据压测，不加索引，只通过增加数据库连接数，从结果来看增大数据库连接数，以及数据库连接池的个数，并不能提升数据库的吞吐能力，而且随着并发的提高，出现了错误。

压力测试结果
并发数	吞吐率QPS	平均响应时间
500	14.8/sec	25159ms
1000	17.4/sec	28160ms
2000	17.6/sec	32575ms
5000	43.2/sec	7423ms

优化三：在优化二的基础上增加数据库缓冲池的大小为10G。将用户的查询字段索引去掉（尽量排除缓存干扰），压测的默认配置保持不变。数据库连接数改为1000，用户数据100万，应用的数据库连接池最小10，最大设置改为200。并发数500、1000、5000、10000

- 准备工作1，设置数据库的缓冲池大小为10G

- 500并发：吞吐量13.9，平均响应时间23497ms

- 1000并发：吞吐量17.3，，平均响应时间22212ms

- 2000并发：吞吐量17.3，，平均响应时间20856ms

- 5000并发：吞吐量230，，平均响应时间1196ms，开始报错

结论：100万用户数据压测，不加索引，只通过增加数据库连接数和缓冲池的大小。从结果来看增大数据库连接数、缓冲池大小以及数据库连接池的个数，并不能提升数据库的吞吐能力，而且随着并发的提高，出现了错误。这是因为数据库的查询操作还是会走大量的IO操作，导致吞吐量基本没什么变化。

压力测试结果
并发数	吞吐率QPS	平均响应时间
500	13.9/sec	23497ms
1000	17.3/sec	22212ms
2000	17.3/sec	20856ms
5000	230/sec	1196ms

终极优化：数据库查询字段添加索引，缓冲池大小设置为10G,数据库连接数设置为1000，应用连接池个数设置为200，并发数500、1000、5000、10000压测

- 500并发：吞吐量4455,平均响应时间109

- 1000并发：吞吐量4524,平均响应时间222

- 2000并发：吞吐量4463,平均响应时间421

- 5000并发：吞吐量4397,平均响应时间1170

结论：100万用户数据压测，吞吐量能达到4000左右，响应时间基本1秒以内，随着并发请求增大，响应时间也变慢。

压力测试结果
并发数	吞吐率QPS	平均响应时间
500	4455/sec	109ms
1000	4524/sec	222ms
2000	4463/sec	421ms
5000	4397/sec	1170ms

结语

通过压测实验，我们可以明确的一点是，数据库的性能瓶颈主要来源于数据库的IO操作，有效的减少数据库的IO操作次数是优化数据库访问性能的关键，有效的创建索引、增加缓冲池大小、以及设置一定比例的数据库连接，能够有效的减少数据库的IO操作，从而提高数据库的访问性能。一般的建议，数据库的缓冲池大小innodb_buffer_pool_size设置为总内存的0.75，数据库最大连接数据设置为内存/12582080个。