搭建一个简单的负载均衡

news2024/11/16 8:29:06

前言:

负载均衡是互联网系统架构中必不可少的一个技术,通过负载均衡,可以将高并发的用户请求分发到多台应用服务器组成的一个服务器集群上,利用更多的服务器资源处理高并发下的计算压力。

早期负载均衡的实现,使用专门的负载均衡硬件设备,这些硬件通常比较昂贵,随着互联网的普及,越来越多的企业需要部署自己的互联网应用系统,而这些专业的负载均衡硬件,对于成本的要求比较高,于是出现了各种通过软件实现负载均衡的技术方案。

HTTP重定向负载均衡:

HTTP重定向负载均衡是一种比较简单的负载均衡技术实现。来自用户的HTTP请求到达负载均衡服务器以后,负载均衡服务器根据某种负载均衡算法计算得到一个应用服务器的地址,通过HTTP状态码302重定向响应,将新的IP地址发送给用户浏览器,用户浏览器重定向响应以后,重新发送请求到真正的应用服务器,来达到负载均衡的目的。

这种负载均衡实现方法比较简单,如果是用Java开发的话,只需要在Servlet代码中调用响应重定向方法就可以了,在简化的情况下,只需要不到十行代码就可以实现一个HTTP重定向的负载均衡服务器了。

HTTP重定向负载均衡的优点是设计比较简单,但是它的缺点也比较明显,一方面用户完成了一次访问,就需要请求两次数据中心,一次请求负载均衡服务器,一次是请求应用服务器,请求处理性能就会受很大的影响。

另一个问题是因为响应要重定向到真正的应用服务器,所以需要把应用服务器的IP地址暴露给外部用户,这样可能会带来安全性的问题,负载均衡服务器通常不部署应用代码,也会关闭不必要的访问端口,设置比较严格的防火墙权限,通常安全性更好一点,因此,一个互联网通常只将负载均衡服务器的IP地址外暴露,供用户访问,而应用服务器则只是用内网的IP,外部访问者无法直接连接应用服务器,但是使用HTTP重定向负载均衡,应用服务器不得不使用公网IP,外部访问者可以直接连接到应用服务器,系统的安全性会降低。因此HTTP重定向负载均衡在实战中很少使用。

DNS负载均衡:


另一种实现负载均衡的技术方案是DNS负载均衡,我们知道浏览器或者APP应用访问数据中心的时候,通常是用域名进行访问,HTTP协议则必须知道IP地址才能建立通信连接,那么域名是如何转换成IP地址的,就是通过DNS服务器来完成,当用户从浏览器发起HTTP请求的时候,首先要到DNS域名服务器进行域名分析,解析得到IP地址以后,用户才能根据IP地址建立HTTP连接,访问真正的数据中心的应用服务器,这个时候就可以在DNS域名解析的时候进行负载均衡,也就是说,不同的用户进行域名解析的时候,返回不同的IP地址,从而实现负载均衡。

从上面的架构图可以看出来,DNS负载均衡和HTTP重定向负载均衡很像。

DNS与HTTP重定向的分析:


首先和HTTP重定向不同,用户不需要每次请求都进行DNS域名的结息,第一次解析以后,域名缓存在本机,后面较长一部分时间,不会再进行域名的解析了,因此性能方面不会是问题。

其次,域名解析直接得到应用服务器的IP地址,确实会存在安全性问题,但是大型互联网应用通常并不直接通过DNS解析得到应用服务器IP地址,而是结息得到负载均衡服务器的IP,也就是说,大型互联网应用需要两次负载均衡,一次通过DNS负载均衡,用户请求访问数据中心负载均衡服务器集群的某台机器,然后这台负载均衡服务器再进行一次负载均衡,将用户请求分别分发到应用服务器集群的某台服务器上,通过这种方式,应用服务器不需要用公网IP将自己暴露给外部的访问者,避免了安全性的问题。

DNS域名解析是域名服务商提供的一项基本服务,几乎所有的域名服务商都支持域名解析负载均衡,只需要在域名服务商的服务控制台进行一下配置,不需要开发代码进行部署,就可以拥有DNS负载均衡了,目前大型互联网应用,都是使用的DNS负载均衡。比如说不同的电脑,比如说北京的电脑与苏州的电脑ping www.baidu.com的时候,可以看到不同的IP地址。

反向代理负载均衡

缓存架构中得到用户请求到达数据中心以后,最先到达就是反向代理服务器,反向代理服务器查找本机是否有请求的资源,如果有的话就直接返回资源数据,如果没有,就将该请求发送给后面的应用服务器继续处理,事实上,发送请求给应用服务器的时候,就可以进行负载均衡,将不同的用户请求分发到不同的服务器上面。Nginx这样的HTTP服务器就会同时提高反向代理与负载均衡功能。

反向代理服务器是工作在HTTP协议层之上的,所以它代理的也是HTTP的请求和响应,作为互联网应用层的一个协议,HTTP协议相对来说比较重,效率比较低,所以反向代理负载均衡通常用在小规模的互联网系统上,只有几台或者几十台服务器的规模。

IP负载均衡:

反向代理负载均衡是工作在应用层网络协议上的负载均衡,因此也叫应用层的负载均衡,应用层的负载均衡之下的负载均衡方法是在TCP、IP协议的IP层进行负载均衡,IP层是网络通信协议的网络层,所以有时候叫做网络层负载均衡。它的主要工作原理是当用户的请求到达负载均衡服务器以后,负载均衡服务器会对网络层的数据包的IP地址进行转换,修改IP地址,将其修改问英语服务器的IP地址,然后把数据包重新发送出去,请求数据就会到达应用服务器。

IP负载均衡不需要在HTTP协议层工作,可以在操作系统内核直接修改IP数据包的地址,因此,效率比应用层的反向代理负载均衡高的多,但是它依然有一个缺陷,不管是否请求还是响应的数据包,都要通过负载均衡服务器进行IP地址转换,才能正确的把请求数据分发到应用服务器,或者正确地将响应数据包发送到用户端程序,请求的数据通常比较小,一个URL或者是一个简单的表单,但是响应的数据不管是HTML还是图片,或者JS、CSS这样的资源文件通常都会比较大,因此负载均衡服务器会成为响应数据的流量瓶颈。

数据链路层负载均衡:

数据链路层负载均衡可以解决响应数据量大而导致的负载均衡服务器输出带宽不足的问题,也就是说,负载均衡服务器并不修改数据包的IP地址,而是修改数据链路层的网卡mac地址,在数据链路层实现负载均衡。而应用服务器和负载均衡服务器都使用相同的虚拟IP地址,这样IP路由就不会受到影响,但是网卡会根据自己的mac地址,选择负载均衡服务器发送到自己网卡的数据包,交给对应的应用程序取处理,处理结束以后,当把响应的数据包发送到网络上的时候,因为IP地址没有修改过,所以这个响应会直接到达用户的浏览器,而不会经过负载均衡服务器。

链路层负载均衡避免响应数据再经过负载均衡服务器,因而可以承受较大的数据传输压力,所以,目前大型互联网应用基本都是有链路层负载均衡。

Linux上实现IP负载均衡和链路层负载均衡的技术是LVS,目前LVS的功能已经集成到Linux中了,通过Linux可以直接配置实现这两种负载均衡了。

小结:

负载均衡技术在早期刚出现的时候,设备昂贵,使用复杂,只有大型企业也才用,但是到了今天,随着互联网技术的发展与普及,负载均衡已经是最常用的分布式技术之一,使用也非常简单,如果使用云计算平台,只需要在控制台点击几下,就可以配置实现一个负载均衡了,即使是自己部署一个负载均衡服务器,不管是直接使用Linux还是用Nginx,也不是很复杂了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/150260.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[Linux]Linux调试器-gdb

🥁作者: 华丞臧. 📕​​​​专栏:【LINUX】 各位读者老爷如果觉得博主写的不错,请诸位多多支持(点赞收藏关注)。如果有错误的地方,欢迎在评论区指出。 推荐一款刷题网站 👉 LeetCode刷题网站 文…

HCIA实验(作业)

静态路由综合实验报告 实验目的 建立下图拓扑结构并满足下列要求: 除R5的环回地址固定以外,整个其他所有网段基于192.168.1.0/24进行合理的IP地址划分 R1–R4每个路由器存在两个环回接口,用于模拟连接PC网段,地址也在192.168.1.0…

使用服务网格提升应用和网络安全

当今的企业在正常进行经营的同时,也在不断地与潜在的黑客和不良行为者进行斗争。安全边界逐渐消失,攻击面不断扩大,新的攻击向量不断出现。再加上持续的疫情、全球冲突,难怪每天新闻里都有漏洞、黑客和攻击等内容。 云原生和微服…

低代码平台的七大误解(下)

接上一篇文章“低代码平台的三大误解(上)”,我们继续看看,人们对于低代码平台还有哪些误解。 误解四:低代码应用程序只能解决我的部分问题 无论您构建什么应用程序,它都必须是可以随着业务增长而扩展的可…

Linux应用编程---2.fork()函数

Linux应用编程—2.fork()函数 ​ fork()函数用来创建子进程,函数具体功能与使用方法一起看编程手册。Linux终端命令下输入:man fork,敲击回车键即可打开fork函数详情页。 2.1 fork()函数详情 图1 fork函数详情首先看SYNOPSIS: 图2 fork函数…

一分钟带你上手JS对象的基本用法

前言 相信大家对 JavaScript 中的对象都不陌生,而且我们几乎每天都在使用它,那你对对象的认识有多少呢?本章就带大家一起出浅入深的了解 JavaScript 中的对象。 一、什么是对象? 到底什么是对象呢?大多数人可能都会脱…

生物信息学——基础篇——一至三代测序技术

生物信息学 生物信息学——基础篇——一至三代测序技术 文章目录生物信息学一、一代测序二、二代测序三、三代测序四、总结一、一代测序 概述:一代测序(又称Sanger测序)。 原理:Sanger测序利用一类特殊的核昔酸,即dd…

imx6ull内核添加exfat,并自动开机加载

下载地址:https://github.com/dorimanx/exfat-nofuse.git 方式一,移植到内核,通过内核开启 1、下载exfat源码(将源码目录设置成exfat方便修改),将其放到内核的fs目录下 2、修改fs目录下的Kconfig文件 3、…

Go语言设计与实现 -- GC的简要介绍

GC实现原理 什么是GC? 垃圾回收也称为GC(Garbage Collection),是一种自动内存管理机制 现代高级编程语言管理内存的方式分为两种:自动和手动,像C、C 等编程语言使用手动管理内存的方式,工程师…

OpenHarmony 标准系统 HDF 框架音视频驱动开发

OpenHarmony 标准系统 HDF 框架音视频驱动开发引言OpenHarmony 音频概述HDF 音频驱动框架概述HDF 音频驱动框架分析 —— 音频设备驱动HDF 音频驱动框架分析 —— supportlibs 实现HDF 音频驱动框架分析 —— hdi-passthrough 实现HDF 音频驱动框架分析 —— hdi-binder 实现HD…

从零开始计算机网络——计算机网络课程的了解初步认识计算机网络

目录 🍘计算机网络学科到底学什么? 🧇两个参考模型的介绍 🥪OSI参考模型&TPC参考模型&五层参考模型 🍱 计算机网络学科的重难点——网络协议 🥘如何学好计算机网络课程? 🍣相…

Java使用BigDecimal(公式精确计算)+(精度丢失问题)

一、Java使用BigDecimal公式计算(精确计算) 介绍: 使用BigDecimal加减乘除方法运算,可以使用BigDecimal类提供的add、subtract、multiply、divide方法函数实现。 公式加法计算~add public static void main(String[] args){BigDecimal a BigDecimal.valueOf(5.6);…

动态规划合集

62 斐波那契数列 public class Solution {public int Fibonacci(int n) { return f(n);}public int f(int n){if(n1||n2){return 1;}return f(n-1)f(n-2);} }这种做法时间复杂度O(2^N),空间复杂度是用递归栈,O(n) 改进:用动态规划,可以…

Pytorch优化器全总结(三)牛顿法、BFGS、L-BFGS 含代码

目录 写在前面 一、牛顿法 1.看图理解牛顿法 2.公式推导-三角函数 3.公式推导-二阶泰勒展开 二、BFGS公式推导 三、L-BFGS 四、算法迭代过程 五、代码实现 1.torch.optim.LBFGS说明 2.使用LBFGS优化模型 优化器系列文章列表 Pytorch优化器全总结(一&…

C 程序设计教程(09)—— 数据输出函数(printf)用法详解

C 程序设计教程(09)—— 数据输出函数(printf)用法详解 该专栏主要介绍 C 语言的基本语法,作为《程序设计语言》课程的课件与参考资料,用于《程序设计语言》课程的教学,供入门级用户阅读。 目录…

Python小案例

1、简单的打印输出 age =18 print("我的名字是%s,我的国籍是%s"%("小张","中国")) print("我的年纪是:%d岁"%age) print("www","baidu","com",sep=".") #sep是使用.分割的意思,这个输出是百…

微信小程序开发——小程序的宿主环境API,协同工作和发布

一.小程序API概述 小程序中的 API 是由宿主环境提供的,通过这些丰富的小程序 API ,开发者可以方便的调用微信提供的能力,例如:获取用户信息、本地存储、支付功能等。 二.小程序API的3大分类 a.事件监听AP1 特点:以…

【服务器数据恢复】服务器硬盘掉线的数据库数据恢复案例

服务器数据恢复环境&故障: 某公司服务器,配备24块FC硬盘,两块硬盘出现故障掉线,导致服务器上层的卷无法挂载。 服务器数据恢复过程: 1、查看服务器硬盘状态发现有两块硬盘离线,将服务器内的所有硬盘做好…

【数据结构-JAVA】栈(Stack)和队列(Queue)

栈1.1 栈的概念栈:一种特殊的线性表,其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除操作的一端称为栈 顶,另一端称为栈底。栈中的数据元素遵守先进后出,后进先出的原则(LIFO——Last In First Out&a…

【从零开始学习深度学习】41. 算法优化之RMSProp算法【基于AdaGrad算法的改进】介绍及其Pytorch实现

上一篇文章AdaGrad算法中提到,因为调整学习率时分母上的变量st\boldsymbol{s}_tst​一直在累加按元素平方的小批量随机梯度,所以目标函数自变量每个元素的学习率在迭代过程中一直在降低(或不变)。因此,当学习率在迭代早…