客户端请求耗时严重,初步从几个方面进行排查
1.检查网络连接,是否实现丢包,网络波动,网络拥堵等问题。
2.检查客户端请求耗时和project api 接口耗时差异,判断是nginx问题还是接口问题
如果是nginx耗时导致,
可以检查nginx配置 worker_processes 是否改为auto
观察网关1和网关2 request_time 和upstream_response_time 差异⽐较⼤
upstream_response_time ⽐较⼤,证明 【⽹关1】和【机器】之间⽹络传输时间延迟很⾼
修改【⽹关1】的 nginx worker_processes配置
发现调整nginx配置后,并没有改善 且 存在恶化趋势
决定对差异较⼤的IP进⾏分析,观察是否有共性
nginx日志全天耗时汇总监控IP耗时排行,发现存在共性IP,判断为跨机房网络传输导致