Haproxy的配置详解与使用

news2024/12/24 9:35:35

一、haproxy简介

HAProxy是一个使用C语言编写的自由及开放源代码软件,其提供高可用性、负载均衡,以及基于TCP和HTTP的应用程序代理。

HAProxy特别适用于那些负载特大的web站点,这些站点通常又需要会话保持或七层处理。HAProxy运行在当前的硬件上,完全可以支持数以万计的并发连接。并且它的运行模式使得它可以很简单安全地整合进用户当前的架构中, 同时可以保护用户的web服务器不被暴露到网络上。

四层负载均衡和七层负载均衡主要有以下区别:

工作层次: 四层负载均衡工作在 OSI 模型的第四层(传输层),主要基于 IP 地址和端口号进行流量分配。 七层负载均衡工作在第七层(应用层),能理解应用层协议(如 HTTP、HTTPS、FTP 等),根据请求的内容进行更精细的流量分发。

处理内容: 四层负载均衡仅根据数据包的源 IP 地址、目标 IP 地址、源端口和目标端口等信息做出决策。 七层负载均衡可以深入分析数据包中的应用层数据,例如 HTTP 请求的 URL、Cookie、请求方法等。

调度策略: 四层负载均衡的调度策略相对简单,常见的有轮询、加权轮询、最少连接等。 七层负载均衡的调度策略更加丰富和灵活,可以基于 URL 路径、文件类型、浏览器类型、语言等进行调度。

性能和开销: 四层负载均衡处理速度较快,性能较高,但功能相对简单。 七层负载均衡由于需要解析应用层数据,处理开销较大,性能相对较低,但能提供更智能的流量分配。

应用场景: 四层负载均衡适用于对性能要求较高、流量较大且协议相对简单的场景,如 TCP 或 UDP 业务。 七层负载均衡适用于对内容识别和处理要求较高的复杂应用场景,如 Web 服务器集群、反向代理等。 例如,在一个大型的文件下载服务中,如果主要关注的是快速分配连接,四层负载均衡可能是较好的选择。而对于一个复杂的电商网站,需要根据用户请求的不同页面或功能来分配流量,七层负载均衡则能更好地满足需求。

二、haproxy实验环境部署及负载均衡实现

1、基于RHEL9的实验环境搭建:

haproxy:172.25.254.100

webserver1:172.25.254.10

webserver2:172.25.254.20

软件安装:

[root@haproxy ~]# dnf install haproxy -y

[root@webserver1 ~]# dnf install nginx -y
[root@webserver1 ~]# echo webserver1-172.25.254.10  > /usr/share/nginx/html/index.html 
[root@webserver1 ~]# systemctl enable --now nginx


[root@webserver2 ~]# dnf install nginx -y
[root@webserver2 ~]# echo webserver2-172.25.254.20  > /usr/share/nginx/html/index.html
[root@webserver2 ~]# systemctl enable --now nginx

#测试
[root@haproxy ~]# curl  172.25.254.20
webserver2-172.25.254.20
[root@haproxy ~]# curl  172.25.254.10
webserver1-172.25.254.10

2、proxies:代理配置段

defaults:为frontend, backend, listen提供默认配置

frontend:前端,相当于nginx中的server {}

backend:后端,相当于nginx中的upstream {}

listen:同时拥有前端和后端配置,配置简单,生产推荐使用

[root@haproxy ~]# vim /etc/haproxy/haproxy.cfg 
frontend webcluster #名字唯一,避免混淆和冲突
    bind *:80 #这台主机所有80端口均打开
    mode  http #http七层,tcp四层
    use_backend webcluster-host #使用的后端

backend webcluster-host
    balance roundrobin #调度规则
    server web1 172.25.254.10:80 
    server web2 172.25.254.20:80

[root@haproxy ~]# systemctl start haproxy.service 
[root@haproxy ~]# systemctl status haproxy.service

3、global:全局配置段

·进程及安全配置相关的参数

·性能调整相关参数

.Debug参数

4、haproxy全局配置参数及日志分离

默认只有一个进程

设定多线程:

设定多进程:

对比:

[root@mlh ~]# pstree  -p | grep haproxy
           |-haproxy(36860)-+-haproxy(36862)
           |                `-haproxy(36863)
[root@mlh ~]# cat /proc/36863/status | grep -i  thread
Threads:        1
Speculation_Store_Bypass:       thread vulnerable


多线程
[root@mlh ~]# pstree  -p | grep haproxy
           |-haproxy(38654)---haproxy(38657)---{haproxy}(38658)
[root@mlh ~]# cat /proc/38657/status | grep -i  thread
Threads:        2
Speculation_Store_Bypass:       thread vulnerable

不能同时设定多进程和多线程,参数互斥

线程与CPU进行绑定:

查看进程数
[root@mlh ~]# cat /proc/36863/status | grep -i  thread
Threads:        1
Speculation_Store_Bypass:       thread vulnerable

自定义日志文件:

[root@haproxy ~]# vim /etc/rsyslog.conf

local2.*                                                /var/log/haproxy.log

定义全局的syslog服务器;日志服务器需要开启UDP协议,最多可以定义两个

开启UDP协议
module(load="imtcp") # needs to be done just once
input(type="imtcp" port="514")

三、haproxy代理配置参数

sorryserver:172.25.254.30

[root@sorryserver ~]# dnf install httpd -y
[root@sorryserver ~]# systemctl enable --now httpd
[root@sorryserver ~]# echo 对不起,下班了! > /var/www/html/index.html

效果实现:

先把两台后端服务器down
[root@webserver1 ~]# systemctl stop nginx.service
[root@webserver2 ~]# systemctl stop nginx.service
添加172.25.254.30主机为备份主机

[root@haproxy log]# vim /etc/haproxy/haproxy.cfg
backend webcluster-host
    balance roundrobin
    server web1 172.25.254.10:80 check inter 2 fall 3 rise 5 weight 2
    server web2 172.25.254.20:80 check inter 2 fall 3 rise 5 weight 1
    server sorry_server 172.25.254.30:80 backup

当两台后端服务器都down时:

开启其中一台:

disabled维护状态:

[root@haproxy log]# vim /etc/haproxy/haproxy.cfg
  
  server web1 172.25.254.10:80 check inter 2 fall 3 rise 5 weight 2 disabled

临时重定向:

[root@haproxy log]# vim /etc/haproxy/haproxy.cfg
listen webcluster
    bind *:80
    mode http
    balance roundrobin
    redirect prefix http://www.baidu.com/
    #server web1 172.25.254.10:80 check inter 2 fall 3 rise 5 weight 2
    #server web2 172.25.254.20:80 check inter 2 fall 3 rise 5 weight 1
    #server sorry_server 172.25.254.30 backup

四、haproxy热更新方法

提权
[root@haproxy log]# vim /etc/haproxy/haproxy.cfg
stats socket /var/lib/haproxy/stats  mode 600 level admin
[root@haproxy log]# ll /var/lib/haproxy/stats
srw-------. 1 root root 0  8月 11 00:11 /var/lib/haproxy/stats

对服务器动态权重和其它状态可以利用 socat工具进行调整,Socat 是 Linux 下的一个多功能的网络工 具,名字来由是Socket CAT,相当于netCAT的增强版.Socat 的主要特点就是在两个数据流之间建立双向 通道,且支持众多协议和链接方式。如 IP、TCP、 UDP、IPv6、Socket文件等

[root@haproxy log]# dnf install socat -y
查看帮助
 [root@haproxy log]#  echo "help" | socat stdio /var/lib/haproxy/stats
查看haproxy状态
[root@haproxy log]# echo "show info" | socat stdio /var/lib/haproxy/stats
查看集群状态
[root@haproxy log]# echo "show servers state" | socat stdio /var/lib/haproxy/stats
1
查看集群权重
[root@haproxy log]# echo get weight webcluster/web1 | socat stdio /var/lib/haproxy/stats
2 (initial 2)#当前权重/配置权重
更改权重
[root@haproxy log]# echo "set weight webcluster/web1 1 " | socat stdio /var/lib/haproxy/stats

[root@haproxy log]# echo get weight webcluster/web1 1  | socat stdio /var/lib/haproxy/stats
1 (initial 2)

[root@haproxy log]# echo "disable server webcluster/web1 " | socat stdio  /var/lib/haproxy/stats
下线web1服务器

[root@haproxy log]# echo "enable server webcluster/web1 " | socat stdio /var/lib/haproxy/stats
上线web2服务器

haproxy多进程热处理:

保证每个进程就会有单独的sock文件来进行单独管理

[root@haproxy log]# systemctl restart haproxy.service
[root@haproxy log]# ll /var/lib/haproxy/
总用量 0
srw-------. 1 root root 0  8月 11 00:31 stats
srw-------. 1 root root 0  8月 11 01:02 stats1
srw-------. 1 root root 0  8月 11 01:02 stats2

五、haproxy算法

1、静态算法

static-rr

不支持运行时利用socat进行权重的动态调整(只支持0和1,不支持其它值)

不支持端服务器慢启动

其后端主机数量没有限制,相当于LVS中的 wrr

first

根据服务器在列表中的位置,自上而下进行调度

其只会当第一台服务器的连接数达到上限,新请求才会分配给下一台服务

其会忽略服务器的权重设置

不支持用socat进行动态修改权重,可以设置0和1,可以设置其它值但无效

2、动态算法

基于后端服务器状态进行调度适当调整

新请求将优先调度至当前负载较低的服务器

权重可以在haproxy运行时动态调整无需重启

roundrobin

  1. 基于权重的轮询动态调度算法

  2. 支持权重的运行时调整,不同于lvs中的rr轮训模式

  3. HAProxy中的roundrobin支持慢启动(新加的服务器会逐渐增加转发数)

  4. 其每个后端backend中最多支持4095个real server

  5. 支持对real server权重动态调整

  6. roundrobin为默认调度算法,此算法使用广泛

leastconn

leastconn加权的最少连接的动态

支持权重的运行时调整和慢启动,即:根据当前连接最少的后端服务器而非权重进行优先调度(新客户 端连接)

比较适合长连接的场景使用,比如:MySQL等场景。

3、其他算法

source

源地址hash,基于用户源地址hash并将请求转发到后端服务器,后续同一个源地址请求将被转发至同一 个后端web服务器。此方式当后端服务器数据量发生变化时,会导致很多用户的请求转发至新的后端服 务器,默认为静态方式,但是可以通过hash-type支持的选项更改这个算法一般是在不插入Cookie的TCP 模式下使用,也可给拒绝会话cookie的客户提供最好的会话粘性,适用于session会话保持但不支持 cookie和缓存的场景源地址有两种转发客户端请求到后端服务器的服务器选取计算方式,分别是取模法和一致性hash

map-base取模法

map-based:取模法,对source地址进行hash计算,再基于服务器总权重的取模,最终结果决定将此请 求转发至对应的后端服务器。 此方法是静态的,即不支持在线调整权重,不支持慢启动,可实现对后端服务器均衡调度 缺点是当服务器的总权重发生变化时,即有服务器上线或下线,都会因总权重发生变化而导致调度结果 整体改变

一致性hash

一致性哈希,当服务器的总权重发生变化时,对调度结果影响是局部的,不会引起大的变动hash(o) mod n 该hash算法是动态的,支持使用 socat等工具进行在线权重调整,支持慢启动

1、后端服务器哈希环点keyA=hash(后端服务器虚拟ip)%(2^32)

2、客户机哈希环点key1=hash(client_ip)%(2^32) 得到的值在[0---4294967295]之间

3、将keyA和key1都放在hash环上,将用户请求调度到离key1最近的keyA对应的后端服务器

uri

基于对用户请求的URI的左半部分或整个uri做hash,再将hash结果对总权重进行取模后 根据最终结果将请求转发到后端指定服务器 适用于后端是缓存服务器场景 默认是静态算法,也可以通过hash-type指定map-based和consistent,来定义使用取模法还是一致性 hash

访问不同的uri,确认可以将用户同样的请求转发至相同的服务器

[root@webserver1 ~]# echo 172.25.254.10-index1.html > /usr/share/nginx/html/index1.html
[root@webserver1 ~]# echo 172.25.254.10-index2.html > /usr/share/nginx/html/index2.html
[root@webserver1 ~]# echo 172.25.254.10-index3.html > /usr/share/nginx/html/index3.html
[root@mlh ~]# echo 172.25.254.20-index1.html > /usr/share/nginx/html/index1.html
[root@mlh ~]# echo 172.25.254.20-index2.html > /usr/share/nginx/html/index2.html
[root@mlh ~]# echo 172.25.254.20-index3.html > /usr/share/nginx/html/index3.html

url_param

url_param对用户请求的url中的 params 部分中的一个参数key对应的value值作hash计算,并由服务器 总权重相除以后派发至某挑出的服务器,后端搜索同一个数据会被调度到同一个服务器,多用与电商 通常用于追踪用户,以确保来自同一个用户的请求始终发往同一个real server

hdr

针对用户每个http头部(header)请求中的指定信息做hash, 此处由 name 指定的http首部将会被取出并做hash计算, 然后由服务器总权重取模以后派发至某挑出的服务器,如果无有效值,则会使用默认的轮询调度。

六、haproxy状态页面监控

stats enable #基于默认的参数启用

stats page stats hide-version #将状态页中haproxy版本隐藏

stats refresh #设定自动刷新时间间隔,默认不自动刷新

stats uri #自定义stats page uri,默认值:/haproxy?

stats stats auth : #认证时的账号和密码,可定义多个用户,每行指定一个用户 #默认:no authentication

stats admin { if | unless } #启用stats page中的管理功能

状态页配置:

七、haproxy-基于cookie的会话保持

HAProxy 基于 Cookie 值的会话保持是一种在负载均衡环境中确保用户会话持续性的有效方法。 当用户首次访问服务时,后端服务器会在响应中设置一个特定的 Cookie。HAProxy 会检测并提取这个 Cookie 值,并在后续的请求中,根据这个 Cookie 值将用户的请求始终路由到同一台后端服务器,从而保持会话的一致性。

cookie name [ rewrite | insert | prefix ][ indirect ] [ nocache ][ postonly ] [ 
preserve ][ httponly ] [ secure ][ domain ]* [ maxidle <idle> ][ maxlife ]
name: #cookie 的 key名称,用于实现持久连接
insert: #插入新的cookie,默认不插入cookie
indirect: #如果客户端已经有cookie,则不会再发送cookie信息
nocache: #当client和hapoxy之间有缓存服务器(如:CDN)时,不允许中间缓存器缓存cookie,
     #因为这会导致很多经过同一个CDN的请求都发送到同一台后端服务器

curl -b WEBCOOKIE=111 172.25.254.100

八、haproxy状态页

修改 HAproxy 配置文件

stats enable	----基于默认的参数启用stats page
stats hide-version	----将状态页中haproxy版本隐藏
stats refresh <delay>	----设定自动刷新时间间隔,默认不自动刷新
stats uri <prefix>	----自定义stats page uri,默认值:/haproxy?stats
stats auth <user>:<passwd>	----认证时的账号和密码,可定义多个用户,每行指定一个用户;默认:no authentication
stats admin{if|unless}<cond>	----启用stats page中的管理功能

效果演示

九、ip透传

1、四层ip透传

修改 HAproxy 配置文件

 

2、七层ip透传

十、ACL

访问控制列表ACL(Access Control Lists)
是一种基于包过滤的访问控制技术,它可以根据设定的条件对经过服务器传输的数据包进行过滤(条件匹配)即对接收到的报文进行匹配和过滤,基于请求报文头部中的源地址、源端口、目标地址、目标端口、请求方法、UL、文件后缀等信息,对内容进行匹配并执行进一步操作,比如允许其通过或丢弃。

ACL配置选项:

acl    <aclname>(名称) <criterion>(匹配规范) [flags](匹配模式) [operator](具体操作符) [<value>](操作对象类型)
ACL命名规则:

acl image_service hdr_dom(host) -i img.magedu.com

ACL名称,可以使用大字母(A-Z)、小写字母(a-z)、数字(0-9)、冒号(:)、点(.)、中横线(-)和下划线(_),并且严格区分大小写,比如:my_acl和My_Acl就是两个完全不同的acl

ACL 匹配
域名解析地址:

匹配条件:输入www.ty.org则访问server1,其他访问至server2

域名内的某一段匹配

正则匹配:

条件匹配:

错误页提示
errorfile

指定错误页路径和内容

重定向 IP 地址

当网页访问错误时,自动跳转至指定的地址

HAproxy 四层负载-数据库

数据库监听字段:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2036437.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

uniapp实现自定义弹窗组件,支持富文本传入内容

1.首先安装vuex 通过此命令安装 ​​npm install vuex --save​​ 创建initModal.js import Vuex from vuex // 自定义弹窗 export default function initModal (v) {// 挂在store到全局Vue原型上v.prototype.$modalStore new Vuex.Store({state: {show: false,title: 标题,c…

【人工智能】深入理解自监督学习中的表征学习与对比学习

我的主页&#xff1a;2的n次方_ 1. 自监督学习 1.1 自监督学习的概念 自监督学习是一种无需大规模标注数据的学习方法&#xff0c;通过构造代理任务&#xff0c;模型可以从数据本身获取监督信号&#xff0c;从而学习有用的特征表征。 1.2 自监督学习的背景与重要性 在当今大…

【C++进阶学习】第十三弹——C++智能指针的深入解析

前言&#xff1a; 在C编程中&#xff0c;内存管理是至关重要的一个环节。传统的手动内存管理方式容易导致内存泄漏、悬挂指针等问题。为了解决这些问题&#xff0c;C引入了智能指针。本文将详细讲解C中智能指针的概念、种类、使用方法以及注意事项。 目录 一、引言 二、智能指…

链表---数据结构-黑马

链表 定义 链表是数据元素的线性集合&#xff0c;其每个元素都指向下一个元素&#xff0c;元素存储上是不连续的。 分类 单向链表&#xff0c;每个元素只知道自己的下一个元素是谁。 双向链表&#xff0c;每个元素知道自己的上一个元素和下一个元素。 循环链表&#xff0c;…

分布式锁:Mysql实现,Redis实现,Zookeeper实现

目录 前置知识 Mysql实现分布式锁 1.get_lock函数 Java代码实现&#xff1a; 2.for update尾缀 Java代码实现&#xff1a; 3.自己定义锁表 Java代码实现&#xff1a; 4.时间戳列实现乐观锁 Java代码实现&#xff1a; Redis实现分布式锁 Zookeeper实现分布式锁&#…

Oracle搭建一主两备dataguard环境的详细步骤

​ 上一篇文章介绍了Oracle一主两备的DG环境&#xff0c;如何进行switchover切换&#xff0c;也许你会问Oracle一主两备dataguard环境要怎么搭建&#xff0c;本篇文章将为你讲述一主两备dataguard详细搭建步骤。 环境说明 主机名IP地址db_unique_name数据库角色ora11g10.10.1…

驱动数智化升级,AI大模型准备好了吗?

大数据产业创新服务媒体 ——聚焦数据 改变商业 AI大模型的快速崛起&#xff0c;为企业带来了前所未有的变革机遇。从自然语言处理到图像识别&#xff0c;从精准营销到智能制造&#xff0c;AI大模型正逐步渗透到各行各业的核心业务中。然而&#xff0c;随着技术的不断演进&…

力扣刷题-循环队列

&#x1f308;个人主页&#xff1a;羽晨同学 &#x1f4ab;个人格言:“成为自己未来的主人~” 思路&#xff1a; 我们在这里采用的是用数组的形式实现循环链表&#xff0c;我认为这个用数组是更为简单的&#xff0c;我们只需要控制下标就可以实现循环链表的效果。具体实现代…

Python数据可视化案例——折线图

目录 json介绍&#xff1a; Pyecharts介绍 安装pyecharts包 构建一个基础的折线图 配置全局配置项 综合案例&#xff1a; 使用工具对数据进行查看 &#xff1a; 数据处理 json介绍&#xff1a; json是一种轻量级的数据交互格式&#xff0c;采用完全独立于编程语言的文…

2024 该学前端还是学后端?

2024 该学前端还是学后端&#xff1f; 现状分析pragmatic-drag-and-drop后端开发 现状分析 对于这个问题&#xff0c;个人作为Java后端开发者&#xff0c;那么当然是比较熟悉Java后端开发&#xff0c;从这么久的工作体验来说&#xff0c;因为个人也是比较熟悉Java后端&#xf…

【第19章】Spring Cloud之Gateway自定义Logback配置

文章目录 前言一、内置配置1. 关联依赖2. 内置配置 二、自定义配置1. 日志级别2. 彩色日志3. 自定义配置4. 增加打印语句5. 效果展示 总结 前言 网关层作为我们程序的主入口&#xff0c;有着至关重要的作用&#xff0c;下面我们通过自定义Logback配置增强网关层的日志输出&…

【实用工具】Stirling-PDF入门安装教程: 优质开源的PDF处理工具/编辑工具

文章目录 项目简介功能展示Page Operations 页面操作Conversion Operations 转换操作Security & Permissions 安全与权限Other Operations 其他业务 如何安装并使用Docker RunDocker Compose 项目简介 这是一款使用 Docker 的基于本地托管网络的强大 PDF 操作工具。它能让…

2024年翻译工具新风尚:实时翻译与精准度并进

语言交流的障碍随着全球化的不断深入日益成为连接不同文化和国家的挑战。然而&#xff0c;在科技日新月异的今天&#xff0c;类似谷歌翻译这样的工具正在高速发展这。这次我们来一起探讨深受用户喜欢的翻译工具有哪些。 1.福昕在线翻译 链接直达&#xff1a;https://fanyi.pd…

贷齐乐系统最新版SQL注入(绕过WAF可union select跨表查询)

目录 标题&#xff1a;贷齐乐系统最新版SQL注入&#xff08;绕过WAF可union select跨表查询&#xff09; 内容&#xff1a; 一&#xff0c;环境部署 二&#xff0c;源码分析 三&#xff0c;sql注入 总结&#xff1a; [回到顶部]&#xff08;#article_top&#xff09; 一&am…

Linux使用学习笔记1到2 命令行与shell 基础运维命令

在学习使用ubuntu等各种喜他构建服务器的过程中遇到很多问题&#xff0c;意识到只是跟着网络的教程没办法管理好一个完整的应用部署和运行。遂开始学习linux基本知识&#xff0c;以应对服务器常见问题和软件的使用和维护。 shell 望文生义&#xff0c;大概意思是一个外壳&…

交错字符串[中等]

优质博文&#xff1a;IT-BLOG-CN 一、题目 给定三个字符串s1、s2、s3&#xff0c;请你帮忙验证s3是否是由s1 和s2交错 组成的。 两个字符串s和t交错 的定义与过程如下&#xff0c;其中每个字符串都会被分割成若干 非空 子字符串&#xff1a; s s1 s2 ... sn t t1 t2 …

数据结构---单链表实现

单链表是什么 我的理解是“特殊的数组”&#xff0c;通过访问地址来连接起来 1怎么创建链表 ----通过结构体&#xff08;成员有存入数据的data和指向下一个节点的地址的指针&#xff08;结构体指针&#xff09;next 初始架构---DataType 对应存入数据类型&#xff0c;此处的N…

一款基于Java外卖配送系统,专为多商户入驻设计,包含用户端、商家端、配送端以及总管理后台(附源码)

前言 在当前的外卖配送市场中&#xff0c;软件系统的状态常常面临一些挑战&#xff0c;例如多商户管理复杂性、用户体验不一致、后端服务的稳定性和安全性等。这些痛点不仅影响了商户和用户的满意度&#xff0c;也限制了平台的扩展性和发展潜力。 为了解决这些现状&#xff0…

B站搜索建库架构优化实践

前言 搜索是B站的重要基础功能&#xff0c;需要对包括视频、评论、图文等海量的站内优质资源建立索引&#xff0c;处理来自用户每日数亿的检索请求。离线索引数据的正确、高效产出是搜索业务的基础。我们在这里分享搜索离线架构整体的改造实践&#xff1a;从周期长&#xff0c;…

【论文阅读】BoT-SORT: Robust Associations Multi-Pedestrian Tracking

题目&#xff1a;BoT-SORT: Robust Associations Multi-Pedestrian Tracking 作者&#xff1a;Nir Aharon* Roy Orfaig Ben-Zion Bobrovsky motivation: 作者来得很直接&#xff0c;就说他们用相机运动模型和优化卡尔曼做了个可以解决具有挑战的跟踪问题的算法:BOT-SORT;说他们…