本文介绍VMware® vSphere对虚拟服务器进行网卡限速的案例
一、案例背景
目前有一套生产环境的虚拟化平台基于VMware® vSphere构建。宿主机外连网卡均为主、备各10Gb,核心交换机出口至外部网络带宽也是10Gb。某业务系统使用nginx搭建了两台固件升级服务器对外提供下载服务。
二、问题、分析及定位
某日平台出现大面积承载的虚拟服务器对外提供的外部服务时断时续,业务受到影响的情况。怀疑出口网络存在问题。
1、检查防火墙,问题时段南向入方向带宽占用峰值9.85Gps
2、检查核心交换机与防火墙间的接口,问题时段出方向带宽占用峰值9.98Gps
3、检查nginx1号机流量,问题时段出方向带宽占用峰值8.99Gbps:
4、 检查nginx2号机流量,问题时段出方向带宽占用峰值9.68Gbps:
5、两台nginx主机问题时段合计发送流量达19Gbps,超过出口的10Gb带宽,超带宽部分在交换机的汇聚上报接口上形成了入方向数据包丢弃:
可以确定本次问题的原因即是固件升级服务器对外提供了大流量下载服务占满平台整体出口带宽,致平台上所有的业务访问异常。
三、处理措施
在vCenter上对nginx1号机网卡配置限流,限制单台带宽为3Mb:
对nginx12号机网卡配置进行相同配置,两台合计6Mb。
四、实测效果
完成优化后实测结果如下:
1、nginx1号机流量:
2、nginx2号机流量:
3、防火墙南向入方向流量:
可见限流优化配置以后,整体出口带宽峰值流量6.49Gbps,在下发固件行动正常进行的同时,其它业务也有充足的带宽,平台不再受下发行为的影响。