负载均衡的实现方式一般来说有以下三种:
基于DNS负载均衡:直接通过DNS来实现负载均衡。优点是非常简单,缺点是调整后不知道啥时生效(当然正常情况下几十分钟,长的也可能更长)
基于硬件负载均衡:购买硬件,也就是我们常常说的F5(F5 Network Big-IP),不过F5就贵一般来说单台硬件也得几十万块,要是搞个双机,多机就更贵了
基于软件负载均衡:基于软件的方式也非常多,类似几个主流LVS、Nginx、HAproxy(当然IBM也有个HIS),接下来就针对以下几种具体说明:
三大主流软件负载均衡器对比(LVS、Nginx、HAproxy)
LVS:
-
- 抗负载能力强,性能高,能达到F5的60%,对内存和CPU资源消耗比较低
-
- 工作在网络4层,通过VRRP协议(仅作代理之用),具体的流量是由linux内核来处理,因此没有流量的产生。
-
- 稳定,可靠性高,自身有完美的热备方案(Keepalived+lvs)
-
- 不支持正则处理,不能做动静分离。
-
- 支持多种负载均衡算法:rr(轮询),wrr(带权轮询)、lc(最小连接)、wlc(带权最小连接)
-
- 配置相对复杂,对网络依赖比较大,稳定性很高。
-
- LVS工作模式有4种:
(1) nat 地址转换
(2) dr 直接路由
(3) tun 隧道
(4) full-nat
- LVS工作模式有4种:
- 工作在网络4层,相对性能上较高 (网络的七层模式:物理层、数据链路层、网络层、传输层、会话层、表示层、应用层)
Nginx:
-
- 工作在网络7层,可以针对http应用做一些分流的策略,比如针对域名,目录结构
-
- Nginx对网络的依赖较小,理论上能ping通就能进行负载功能
-
- Nginx安装配置比较简单,测试起来很方便
-
- 也可以承担较高的负载压力且稳定,nginx是为解决c10k问题而诞生的
-
- 对后端服务器的健康检查,只支持通过端口来检测,不支持通过url来检测
-
- Nginx对请求的异步处理可以帮助节点服务器减轻负载压力
-
- Nginx仅能支持http、https和Email协议,这样就在适用范围较小。
-
- 不支持Session的直接保持,但能通过ip_hash来解决。对Big request header的支持不是很好。
-
- Nginx还能做Web服务器即Cache功能。
HAProxy:
-
- 支持两种代理模式:TCP(四层)和HTTP(七层),支持虚拟主机;
-
- 能够补充Nginx的一些缺点比如Session的保持,Cookie的引导等工作
-
- 支持url检测后端的服务器出问题的检测会有很好的帮助。
-
- 更多的负载均衡策略比如:动态加权轮循(Dynamic Round Robin),加权源地址哈希(Weighted Source -Hash),加权URL哈希和加权参数哈希(Weighted Parameter Hash)已经实现
-
- 单纯从效率上来讲HAProxy更会比Nginx有更出色的负载均衡速度。
-
- HAProxy可以对Mysql进行负载均衡,对后端的DB节点进行检测和负载均衡。
-
- 支持负载均衡算法:Round-robin(轮循)、Weight-round-robin(带权轮循)、source(原地址保持)、RI(请求URL)、rdp-cookie(根据cookie)
- 不能做Web服务器即Cache。
三大主流软件负载均衡器适用业务场景:
- 网站建设初期,可以选用Nginx、HAProxy作为反向代理负载均衡(流量不大时,可以不选用负载均衡),因为其配置简单,性能也能满足一般业务场景。如果考虑到负载均衡器是有单点问题,可以采用Nginx+Keepalived/HAproxy+Keepalived避免负载均衡器自身的单点问题。
- 网站并发到达一定程度后,为了提高稳定性和转发效率,可以使用lvs,毕竟lvs比Nginx/HAProxy要更稳定,转发效率也更高。
注:nginx与HAProxy比较:nginx只支持七层,用户量最大,稳定性比较可靠。Haproxy支持四层和七层,支持更多的负载均衡算法,支持session等。
衡量负载均衡器好坏的几个重要的因素:
-
- 会话率 :单位时间内的处理的请求数
-
- 会话并发能力:并发处理能力
-
- 数据率:处理数据能力
负载均衡的策略
- 轮询策略
- 负载度策略
- 响应策略
- 哈希策略