Haproxy 高可用代理原理配置(Haproxy High Availability Proxy Principle Configuration)

Haproxy 高可用代理原理

简介

Haproxy是一个开源的高可用性负载均衡解决方案，提供基于TCP和HTTP的应用代理服务。它支持高并发连接，能够处理大量的请求，特别适合高负载站点和需要会话保持的应用场景。

主要特点

‌高可用性‌：HAProxy能够检测后端服务器的健康状况，如果某台服务器出现故障，HAProxy会自动将其从负载均衡池中移除，直到恢复正常后再重新加入，确保系统的持续稳定运行‌。
‌负载均衡‌：支持多种负载均衡算法，如轮询、最少连接等，能够根据服务器性能和请求特性合理分配负载‌。
‌性能卓越‌：HAProxy在网络层进行高效的数据转发，减少处理开销，适用于高流量的网站或应用‌1。
‌支持多种协议‌：支持TCP和HTTP协议层的负载均衡，功能丰富‌。
‌会话保持‌：通过客户端IP、Cookie或Session ID等方式保持会话，确保同一客户端的请求始终被转发到同一服务器‌。
‌监控和管理‌：拥有功能强大的监控页面，实时了解系统状态，支持基于ACL的规则配置‌。

应用场景

HAProxy适用于以下场景：

‌大型网站‌：通过负载均衡和会话保持功能，提高网站的可用性和响应速度。
‌Web应用集群‌：在多个服务器之间分配负载，提高整体处理能力。
‌微服务架构‌：在微服务之间实现负载均衡和故障转移，确保服务的稳定性和可用性。

一、HAProxy 简介

官网：http://www.haproxy.com
HAProxy提供高可用性、负载均衡以及基于TCP和HTTP的应用代理，支持虚拟主机，它是免费、快速并且可靠的一种负载均衡解决方案。适合处理高负载站点的七层数据请求。类似的代理服务可以屏蔽内部真实服务器，防止内部服务器遭受攻击。

1、HAProxy 特点和优点

支持原生SSL,同时支持客户端和服务器的SSL. https
支持IPv6和UNIX套字节（sockets）
支持HTTP Keep-Alive
支持HTTP/1.1压缩，节省宽带
支持优化健康检测机制（SSL、scripted TCP、check agent...）
支持7层负载均衡。
可靠性和稳定性非常好。
并发连接40000-50000个，单位时间处理最大请求20000个，最大数据处理10Gbps.
支持8种负载均衡算法，同时支持session保持。
支持虚拟主机。
支持连接拒绝、全透明代理。
拥有服务器状态监控页面。
支持ACL.

2、HAProxy 保持会话

HAProxy为了让同一客户端访问服务器可以保持会话。有三种解决方法：客户端IP、Cookie以及Session 客户端的id
- HAProxy通过客户端IP进行Hash计算并保存，以此确保当相同IP访问代理服务器可以转发给固定的真实服务器。
- HAProxy依靠真实服务器发送客户端的Cookie信息进行会话保持。
- HAProxy将保存真实服务器的Session以及服务器标识，实现会话保持。（HAProxy只要求后端服务器能够在网络联通，也没有像LVS那样繁琐的ARP配置）

3、HAProxy 负载均衡算法

HAProxy的balance8种负载均衡算法：
- roundrobin : 基于权重轮循。
- static-rr : 基于权重轮循。静态算法，运行时改变无法生效
- source : 基于请求源IP的算法。对请求的源IP进行hash运算，然后将结果与后端服务器的权重总数想除后转发至某台匹配服务器。使同一IP客户端请求始终被转发到某特定的后端服务器。
- leastconn : 最小连接。（适合数据库负载均衡，不适合会话短的环境）
- uri : 对部分或整体URI进行hash运算，再与服务器的总权重想除，最后转发到匹配后端。 http://www.qf.com/aa/bb/a.html
- uri_param : 根据URL路径中参数进行转发，保证在后端服务器数量不变的情况下，同一用户请求分发到同一机器。 /web /new
- hdr() : 根据http头转发，如果不存在http头。则使用简单轮循。

4、HAProxy主要工作模式

tcp模式:该模式下，在客户端和服务器之间将建立一个全双工的连接，且不会对7层的报文做任何处理的简单模式。此模式默认，通常用于SSL、SSH、SMTP应用。
http模式（一般使用）：该模式下，客户端请求在转发给后端服务器之前会被深度分析，所有不与RFC格式兼容的请求都会被拒绝。

二、HAProxy 安装及配置文件参数

1、HAProxy 安装

[root@edenluo.com ~]# yum -y install haproxy

2、HAProxy 环境

haproxy 的配置文件通常分为三部分:
- global（全局配置部分）
- defaults（默认配置部分）
- listen (应用组件部分)

1、 HAProxy 配置文件详解

[root@edenluo.com ~]# vim /etc/haproxy/haproxy.cfg

       ####################全局配置####################### 
       #######参数是进程级的，通常和操作系统（OS）相关######### 
global 
       maxconn 20480                   # 默认最大连接数 
       log 127.0.0.1 local0            # 日志输出配置，所有日志都记录在本机系统日志，通过local0输出
       log 127.0.0.1 local1 notice     # notice 为日志级别，通常有24个级别（error warring info debug）
       chroot /var/haproxy             # chroot运行的路径 
       uid 99                          # 所属运行的用户uid 
       gid 99                          # 所属运行的用户组 
       daemon                          # 以后台形式运行haproxy 
       nbproc 1                        # 进程数量(可以设置多个进程提高性能) 
       pidfile /var/run/haproxy.pid    # haproxy的pid存放路径,启动进程的用户必须有权限访问此文件 
       ulimit -n 65535                  # ulimit的数量限制 
       #####################默认设置###################### 
       ##这些参数可以被利用配置到frontend，backend，listen组件## 
defaults 
       log global 
       mode http                       # 所处理的类别 (#7层 http;4层tcp  ) 
       maxconn 20480                   # 最大连接数 
       option httplog                  # 日志类别http日志格式 
       option httpclose                # 每次请求完毕后主动关闭http通道 
       option dontlognull              # 不记录健康检查的日志信息 
       option forwardfor               # 如果后端服务器需要获得客户端真实ip需要配置的参数，可以从Http Header中获得客户端ip  
       option redispatch               # serverId对应的服务器挂掉后,强制定向到其他健康的服务器  
       option abortonclose             # 当服务器负载很高的时候，自动结束掉当前队列处理比较久的连接 
       stats refresh 30                # 统计页面刷新间隔 
       retries 3                       # 3次连接失败就认为服务不可用，也可以通过后面设置 
       balance roundrobin              # 默认的负载均衡的方式,轮询方式 
      #balance source                  # 默认的负载均衡的方式,类似nginx的ip_hash 
      #balance leastconn               # 默认的负载均衡的方式,最小连接 
       contimeout 5000                 # 连接超时 
       clitimeout 50000                # 客户端超时 
       srvtimeout 50000                # 服务器超时 
       timeout check 2000              # 心跳检测超时 
       ####################监控页面的设置####################### 
listen admin_status                    # Frontend和Backend的组合体,监控组的名称，按需自定义名称 
        bind 0.0.0.0:65532             # 监听端口 
        mode http                      # http的7层模式 
        log 127.0.0.1 local3 err       # 错误日志记录 
        stats refresh 5s               # 每隔5秒自动刷新监控页面 
        stats uri /admin?stats         # 监控页面的url 
        stats realm itnihao\ itnihao   # 监控页面的提示信息 
        stats auth admin:admin         # 监控页面的用户和密码admin,可以设置多个用户名 
        stats auth admin1:admin1       # 监控页面的用户和密码admin1 
        stats hide-version             # 隐藏统计页面上的HAproxy版本信息  
        stats admin if TRUE            # 手工启用/禁用,后端服务器(haproxy-1.4.9以后版本) 只要登录就能获得管理权限
       errorfile 403 /etc/haproxy/errorfiles/403.http 
       errorfile 500 /etc/haproxy/errorfiles/500.http 
       errorfile 502 /etc/haproxy/errorfiles/502.http 
       errorfile 503 /etc/haproxy/errorfiles/503.http 
       errorfile 504 /etc/haproxy/errorfiles/504.http 
       #################HAProxy的日志记录内容设置################### 
       capture request  header Host           len 40 
       capture request  header Content-Length len 10 
       capture request  header Referer        len 200 
       capture response header Server         len 40 
       capture response header Cache-Control  len 8 
       #######################网站监测listen配置##################### 
       ###########此用法主要是监控haproxy后端服务器的监控状态############ 
listen site_status 
       bind 0.0.0.0:1081                    # 监听端口 
       mode http                            # http的7层模式 
       log 127.0.0.1 local3 err             # [err warning info debug] 
       monitor-uri /site_status             # 网站健康检测URL，用来检测HAProxy管理的网站是否可以用，正常返回200，不正常返回503 
       acl site_dead nbsrv(server_web) lt 2 # 定义网站down时的策略当挂在负载均衡上的指定backend的中有效机器数小于1台时返回true 
       acl site_dead nbsrv(server_blog) lt 2 
       acl site_dead nbsrv(server_bbs)  lt 2  
       monitor fail if site_dead            # 当满足策略的时候返回503，网上文档说的是500，实际测试为503 
       monitor-net 192.168.16.2/32          # 来自192.168.16.2的日志信息不会被记录和转发 
       monitor-net 192.168.16.3/32 
       ######################frontend配置######################### 
       #####注意，frontend配置里面可以定义多个acl进行匹配操作########### 
frontend http_80_in 
       bind 0.0.0.0:80      # 监听端口，即haproxy提供web服务的端口，和lvs的vip端口类似 
       mode http            # http的7层模式 
       log global           # 应用全局的日志配置 
       option httplog       # 启用http的log 
       option httpclose     # 每次请求完毕后主动关闭http通道，HA-Proxy不支持keep-alive模式 
       option forwardfor    # 如果后端服务器需要获得客户端的真实IP需要配置次参数，将可以从Http Header中获得客户端IP 
       ########################acl策略配置######################## 
       acl itnihao_web hdr_reg(host) -i ^(www.itnihao.cn|ww1.itnihao.cn)$    
       # 如果请求的域名满足正则表达式中的2个域名返回true -i是忽略大小写 
       acl itnihao_blog hdr_dom(host) -i blog.itnihao.cn 
       # 如果请求的域名满足www.itnihao.cn返回true -i是忽略大小写 
       # acl itnihao    hdr(host) -i itnihao.cn 
       # 如果请求的域名满足itnihao.cn返回true -i是忽略大小写 
       # acl file_req url_sub -i  killall= 
       # 在请求url中包含killall=，则此控制策略返回true,否则为false 
       # acl dir_req url_dir -i allow 
       # 在请求url中存在allow作为部分地址路径，则此控制策略返回true,否则返回false 
       # acl missing_cl hdr_cnt(Content-length) eq 0 
       # 当请求的header中Content-length等于0时返回true 
       ##########################acl策略匹配相应################## 
       # block if missing_cl 
       # 当请求中header中Content-length等于0阻止请求返回403 
       # block if !file_req || dir_req 
       # block表示阻止请求，返回403错误，当前表示如果不满足策略file_req，或者满足策略dir_req，则阻止请求 
       use_backend  server_web  if itnihao_web 
       # 当满足itnihao_web的策略时使用server_web的backend 
       use_backend  server_blog if itnihao_blog 
       # 当满足itnihao_blog的策略时使用server_blog的backend 
       # redirect prefix http://blog.itniaho.cn code 301 if itnihao 
       # 当访问itnihao.cn的时候，用http的301挑转到http://192.168.16.3 
       default_backend server_bbs 
       # 以上都不满足的时候使用默认server_bbs的backend 
       ########################backend的设置#################### 
       #下面我将设置三组服务器 server_web，server_blog，server_bbs
###########################backend server_web############################# 
backend server_web 
       mode http            # http的7层模式 
       balance roundrobin   # 负载均衡的方式，roundrobin平均方式 
       cookie SERVERID      # 允许插入serverid到cookie中，serverid后面可以定义 
       option httpchk GET /index.html # 心跳检测的文件 
       server web1 192.168.16.2:80 cookie web1 check inter 1500 rise 3 fall 3 weight 1  
       # 服务器定义，cookie 1表示serverid为web1，check inter 1500是检测心跳频率rise 3是3次正确认为服务器可用， 
       # fall 3是3次失败认为服务器不可用，weight代表权重 
       server web2 192.168.16.3:80 cookie web2 check inter 1500 rise 3 fall 3 weight 2 
       # 服务器定义，cookie 1表示serverid为web2，check inter 1500是检测心跳频率rise 3是3次正确认为服务器可用， 
       # fall 3是3次失败认为服务器不可用，weight代表权重 
###################################backend server_blog############################################### 
backend server_blog 
       mode http            # http的7层模式 
       balance roundrobin   # 负载均衡的方式，roundrobin平均方式 
       cookie SERVERID      # 允许插入serverid到cookie中，serverid后面可以定义 
       option httpchk GET /index.html # 心跳检测的文件 
       server blog1 192.168.16.2:80 cookie blog1 check inter 1500 rise 3 fall 3 weight 1  
       # 服务器定义，cookie 1表示serverid为web1，check inter 1500是检测心跳频率rise 3是3次正确认为服务器可用，fall 3是3次失败认为服务器不可用，weight代表权重 
       server blog2 192.168.16.3:80 cookie blog2 check inter 1500 rise 3 fall 3 weight 2 
        # 服务器定义，cookie 1表示serverid为web2，check inter 1500是检测心跳频率rise 3是3次正确认为服务器可用，fall 3是3次失败认为服务器不可用，weight代表权重 
###################################backend server_bbs############################################### 
backend server_bbs 
       mode http            # http的7层模式 
       balance roundrobin   # 负载均衡的方式，roundrobin平均方式 
       cookie SERVERID      # 允许插入serverid到cookie中，serverid后面可以定义 
       option httpchk GET /index.html # 心跳检测的文件 
       server bbs1 192.168.16.2:80 cookie bbs1 check inter 1500 rise 3 fall 3 weight 1  
       # 服务器定义，cookie 1表示serverid为web1，check inter 1500是检测心跳频率rise 3是3次正确认为服务器可用，fall 3是3次失败认为服务器不可用，weight代表权重 
       server bbs2 192.168.16.3:80 cookie bbs2 check inter 1500 rise 3 fall 3 weight 2 
       # 服务器定义，cookie 1表示serverid为web2，check inter 1500是检测心跳频率rise 3是3次正确认为服务器可用，fall 3是3次失败认为服务器不可用，weight代表权重

三、Haproxy 实现七层负载

1、拓扑结构

2、调度器配置 Haproxy

[root@haproxy-lb1 ~]# /etc/haproxy/haproxy.cfg
global
    log                     127.0.0.1 local2
    chroot                  /var/lib/haproxy
    pidfile                 /var/run/haproxy.pid
    maxconn                 4000
    user                    haproxy
    group                   haproxy
    daemon

defaults
    mode                     http
    log                      global
    option                   dontlognull
    retries                  3
    maxconn                  3000
    timeout connect          50000
    timeout client           50000
    timeout server           50000

listen stats 
    bind                    *:1314
    stats                   enable
    stats                   hide-version
    stats uri               /haproxystats
    stats realm             Haproxy\ stats
    stats auth              admin:admin
    stats admin             if TRUE

frontend web
    option                   httplog
    option                   http-server-close
    option forwardfor        except 127.0.0.0/8
    #option                  redispatch
    mode                     http
    bind                     *:80
    default_backend          httpservers

backend httpservers
    balance roundrobin
    server http1 192.168.152.156:80 check maxconn 2000
    server http2 192.168.152.157:80 check maxconn 2000

3、登录 web 监控页面查看状态

4、HAProxy 监控页面参数解释

1、服务状态说明

pid = 3698 (process #2, nbproc = 2, nbthread = 2) # pid为当前pid号，process为当前进程号，nbproc和nbthread为一共多少进程和每个进程多少个线程
uptime = 0d 0h00m08s # 启动了多长时间
system limits: memmax = unlimited; ulimit-n = 131124 # 系统资源限制：内存/最大打开文件数/
maxsock = 131124; maxconn = 65536; maxpipes = 0 # 最大socket连接数/单进程最大连接数/最大管道数maxpipes
current conns = 1; current pipes = 0/0; conn rate = 1/sec # 当前连接数/当前管道数/当前连接速率
Running tasks: 1/9; idle = 100 % # 运行的任务/当前空闲率
active UP： # 在线服务器 backup UP： # 标记为backup的服务器
active UP, going down： # 监测未通过正在进入down过程 backup UP, going down： # 备份服务器正在进入down过程
active DOWN, going up： # down的服务器正在进入up过程 backup DOWN, going up：# 备份服务器正在进入up过程
active or backup DOWN： # 在线的服务器或者是backup的服务器已经转换成了down状态 not checked：# 标记为不监测的服务器
active or backup DOWN for maintenance (MAINT) #active或者backup服务器认为下线的
active or backup SOFT STOPPED for maintenance #active或者backup被认为软下线(人为将weight改成0)

2、前后端状态说明

1、Queue（队列信息）

Cur: current queued requests # 当前的队列请求数量
Max：max queued requests # 最大的队列请求数量
Limit：sessions limit # 队列限制数量

2、Session rate(每秒的连接会信息)

scur: current sessions # 每秒的当前回话的限制数量
smax: max sessions # 每秒的新的最大的会话量
slim: sessions limit # 每秒的新会话的限制数量

2、Sessions（会话信息）

Total: # 总共会话量
Cur: # 当前的会话
Max: # 最大会话
Limit: # 会话限制
Lbtot: total number of times a server was selected # 选中一台服务器所用的总时间

3、Bytes（流量统计信息）

In： # 网络的字节数输入总量
Out： # 网络的字节数输出总量

4、Denied（拒绝统计信息）

Req: denied requests # 拒绝请求量
Resp：denied responses # 拒绝回应

5、Errors （错误统计信息）

Req：request errors # 错误请求
Conn：connection errors # 错误的连接
Resp: response errors (among which srv_abrt) # 错误的回应

6、Warnings （警告统计信息）

Retr: retries (warning) # 重新尝试
Redis：redispatches (warning) # 再次发送

7、Server （real server信息）

Status: 后端机器状态，包括up(后端机活动)和down(后端机挂掉)两种状态
LastChk: 持续检查后端服务器的时间
Wght: (weight) : 权重
Act: server is active (server), number of active servers (backend) # 活动链接数量
Bck: server is backup (server), number of backup servers (backend) # 备份的服务器数量
Chk: 心跳检测时间
Down：后端服务器连接后都是down的数量
Downtime: downtime: total downtime (in seconds) # 总的downtime 时间
Throttle: warm up status # server 的状态