案例概述
Haproxy 是目前比较流行的一种群集调度工具,同类群集调度工具有很多,如 LVS 和Nginx。相比较而言,LVS 性能最好,但是搭建相对复杂;Nginx 的upstream模块支持群集功能,但是对群集节点健康检查功能不强,高并发性能没有Haproxy好。Haproxy 官方网站是http://www.haproxy.org/.
本案例介绍使用 Haproxy 及 Nginx 搭建一套 Web 群集。
一、案例前置知识点
1. HTTP 请求
通过 URL 访问网站使用的协议是 HTTP 协议,此类请求一般称为 HTTP 请求。HTTP 请求的方式分为 GET方式和 POST方式。当使用浏览器访问某一个 URL,会根据请求 URL 返回状态码,通常正常的状态码为 2xx、3xx(如 200、301),如果出现异常会返回 4xx、5xx(如 400、500)。
例如,访问 http://www.test.com/a.php?Id=123,就是一个 GET请求,如果访问正常,会从服务器的日志中获取 200 状态码。假如此请求使用 POST 方式,那么传递给 a.php 的 Id参数依旧是 123,但是浏览器的 URL,将不会显示后面的 Id=123 字样,因此表单类或者有用户名、密码等内容提交时建议使用 POST 方式。不管使用哪种方式,最终 a.php 获取的值是一样的。
2.负载均衡常用调度算法
LVS、Haproxy、Nginx 最常用的调度算法有三种,如下所述。
(1)RR(Round Robin)。RR算法是最简单最常用的一种算法,即轮询调度。例如,有三个节点 A、B、C,第一个用户访问会被指派到节点 A,第二个用户访问会被指派到节点 B,第三个用户访问会被指派到节点C,第四个用户访问继续指派到节点A,轮询分配访问请求实现负载均衡效果。此算法还有一种加权轮询,即根据每个节点的权重轮询分配访问请求。
(2)LC(Least Connections)。LC算法即最小连接数算法,根据后端的节点连接数大小动态分配前端请求。例如,有三个节点 A、B、C,各节点的连接数分别为A:4、B:5、C:6,此时如果有第一个用户连接请求,会被指派到A上,连接数变为 A:5、B:5、C:6;第二个用户请求会继续分配到A上,连接数变为A:6、B:5、C:6:再有新的请求会分配给B,每次将新的请求指派给连接数最小的客户端。由于实际情况下A、B、C的连接数会动态释放,很难会出现一样连接数的情况,因此此算法相比较rr 算法有很大改进,是目前用到比较多的一种算法。
(3)SH(Source Hashing)。SH即基于来源访问调度算法,此算法用于一些有 Session会话记录在服务器端的场景,可以基于来源的 IP、Cookie 等做群集调度。例如,使用基于源 IP 的群集调度算法,有三个节点 A、B、C,第一个用户第一次访问被指派到了 A,第二个用户第一次访问被指派到了 B,当第一个用户第二次访问时会被继续指派到 A,第二个用户第二次访问时依旧会被指派到 B,只要负载均衡调度器不重启,第一个用户访问都会被指派到 A,第二个用户访问都会被指派到 B,实现群集的调度。此调度算法好处是实现会话保持,但某些 IP访问量非常大时会引起负载不均衡,部分节点访问量超大,影响业务使用。
3.常见的 Web 群集调度器
目前,常见的 Web 群集调度器分为软件和硬件。软件通常使用开源的LVS、Haproxy、Nginx,硬件一般使用比较多的是F5。也有很多人使用国内的一些产品,如梭子鱼、绿盟等。
二、案例环境
1.本案例环境
本案例使用三台服务器模拟搭建一套 Web 群集,具体的拓扑如图 4.1所示。案例环境如下。
2.案例需求
测试安装 nginx、haproxy;Haproxy、nginx 配置。
三、案例实施
1.编译安装 Nginx服务器
(1)搭建 Nginx-node-1,使用 nginx-1.12.0.tar.gz 安装包进行编译安装。
为了方便实验,网站没有配置域名,直接使用IP地址。在客户端访问http://192.168.1.61/test.html 测试,如下图所示。
(2)搭建 Nginx-node-2.
编译安装的步骤与 Nginx-node-1 相同,不同之处在于建立测试页面。
安装完成后,在客户端访问 http://192.168.1.62/test.html 测试,如下图所示。
2.编译安装 Haproxy
在 Haproxy 服务器使用 haproxy-1.5.19.tar.gz 安装包进行编译安装。
3.Haproxy服务器配置
(1)建立 Haproxy的配置文件。
Haproxy 配置项介绍:
Haproxy配置文件通常分为三个部分,即 global、defaults 和 listen。global 为全局配置,defaults 为默认配置,listen 为应用组件配置。global 配置项通常有下面配置参数,以示例参数说明如下。
defaults配置项配置默认参数,一般会被应用组件继承,如果在应用组件中没有特别声明,将按照默认配置参数设置。
listen 配置项一般配置应用模块参数。
(2)修改 haproxy.cfg配置文件
根据目前的群集设计,将haproxy.cfg配置文件的内容修改如下
4.创建自启动脚本
自启动脚本命令如下:
5.测试 Web 群集
通过上面的步骤,已经搭建完成 Haproxy 的 Web 群集,接下来需要验证群集是否工作正常。一个群集一般需要具备两个特性,第一个是高性能,第二个是高可用。
(1)测试高性能
在客户端使用浏览器打开 http://192.168.1.60/test.html,浏览器显示信息如图一所示。
再次打开一个新的浏览器页面访问 http://192.168.1.60/test.html,浏览器显示信息如图所二示。
可以看到群集的负载均衡调度已经生效,已经满足了群集的高性能需求。
(2)测试高可用
现在将192.168.1.62的Nginx服务停用,在客户端使用浏览器打开http://192.168.1.60/test.html,浏览器显示信息仍然如图一所示。
从中可以看出,当一台节点故障,不会影响群集的使用,这样就满足了群集的高可用性。也可以将 192.168.1.62的 Nginx 服务恢复,再将 192.168.1.61的 Nginx 服务停用,测试高可用性。
6.Haproxy 的日志
Haproxy 的日志默认输出到系统的 syslog 中,查看起来不是非常方便,为了更好地管理 Haproxy 的日志,在生产环境中一般单独定义出来,定义的方法如下所述。
(1)修改 syslog 配置文件,将原有的配置更改为以下配置:
重启 rsyslog,完成rsyslog 配置。
(2)测试日志信息。
在客户端访问 http://192.168.1.60/test.html后,可以使用 tail/var/log/haproxy.log 即时査看 Haproxy 的访问请求日志信息。
7.Haproxy的参数优化
关于 Haproxy 的参数优化,以下列举了几个关键的参数,并对各参数的生产环境的优化建议做了说明,如表所示。