负载均衡
负载均衡是分布式可靠性中非常关键的一个问题,它在一定程度上反映了分布式系统对业务处理的能力。
什么是负载均衡?
负载均衡可以分为两种:
- 请求负载均衡,即将用户的请求均衡的分发到不同的服务器进行处理。
- 数据负载均衡,即将用户更新的数据分发到不同的存储服务器。
分布式系统中,服务请求的负载均衡是指当处理大量用户请求时,请求应该尽量均衡地分配到多台服务器上进行处理,每台服务器处理其中一部分而不是全部请求,这样才能完成高并发的请求处理,避免因为单机处理能力有限,导致系统崩溃而无法提供服务的问题。
服务请求负载均衡算法
我们主要讨论三种负载均衡算法:
- 轮询策略
- 随机策略
- 哈希和一致性哈希策略
轮询策略
轮询策略是一种实现简单、但却很常用的负载均衡策略,核心思想是让服务器轮流处理用户请求,以尽可能使得每个服务器处理的请求数相同。
轮询策略主要包括顺序轮询和加权轮询两种方式。
轮询策略的优点是实现简单,且对于请求所需开销差不多时,负载均衡效果比较明显,同时加权轮询策略还考虑了服务器节点的异构性,可以像性能更好的服务器有更高的优先级,处理更多的请求,这样请求分发更加合理。
轮询策略的缺点是每次请求到的目的节点不确定,不适用于有状态请求的场景,并且,轮询策略主要强调请求数的均衡性,不适用于处理请求所需开销不同的场景。
轮询策略适用于用户请求所需资源比较接近的场景。
随机策略
随机策略是指当用户请求到来时,会随机分发到某个服务节点进行处理,可以采用随机函数来实现节点选取的操作,它的作用是让请求尽可能的分散到不同节点,防止所有请求放到同一节点或者少量几个节点上。
这种方式的优点是实现简单,缺点是每次请求到达的目的节点不确定,不适合有状态的场景,而且没有考虑到处理请求所需要的开销。另外,随机策略没有考虑到服务器节点的异构性。
随机策略适用于集群中服务器节点处理能力相差不大,用户请求所需资源比较接近的场景。
哈希和一致性哈希策略
哈希和一致性哈希是数据负载均衡中常用的算法,数据分布算法的均匀性,一方面指数据的存储均匀,另一方面也指数据请求均匀。
哈希与一致性哈希的优点是哈希函数设置合理时,负载会比较均衡,而且相同key的请求会落在同一个服务节点上,适用于有状态请求的场景,另外,带虚拟接地啊的一致性哈希策略还可以解决服务器节点异构的问题。
哈希与一致性哈希的缺点在于当某个节点出现故障时,采用哈希策略会出现数据大规模迁移的情况,采用一致性哈希策略可能会造成一定的数据倾斜问题,同时,这种策略也没有考虑请求开销不同造成的不均衡问题。
下面是针对三种不同的负载均衡策略的详细比较。