今天我们来看一个真实的案例。事情是这样的,之前有人在微信上问我一个问题,这个问题的现象很典型:典型的 TPS 上不去,响应时间增加,资源用不上。
大概的情况是这样的:有两台 4C8G 的服务器,一台服务器上有 2 个 Tomcat,一台服务器上是 DB。压测的混合场景有 4 个功能模块,其中 3 个访问一个 Tomcat,另外一个访问一个 Tomcat。
Tomcat 的监控页面如下:
应用服务器系统资源监控页面如下:
数据库服务器系统资源监控如下:
JMeter 结果如下:
综上现象就是,单业务场景执行起来并不慢,但是一混合起来就很慢,应用服务器和数据库服务器的系统资源使用率并不高。请问慢在哪?
这是非常典型的询问性能问题的方式,虽然多给了系统资源信息,但是这些信息也不足以说明瓶颈在哪。
为什么呢?在现在多如牛毛的监控工具中,除非我们在系统中提前做好分析