一致性哈希算法【图解理论 + 代码实现】

news2025/1/18 11:46:28

一致性哈希算法

    • 📖1. 普通哈希算法存在的问题
    • 📖2. 一致性哈希算法概念
    • 📖3. 代码实现

📖1. 普通哈希算法存在的问题

在介绍一致性哈希算法前,我们先来看两个场景:

场景一:

image-20221120203120667

现在,假如有三个用户的请求,即三个ip地址,需要被负载均衡到这三台服务器上去,并且,我们使用这样的哈希算法,能够保证同一个客户端永远被映射到一台指定的server上,这样可以有效解决会话共享问题.

简单来说,就是比如现在我们来了一个用户请求,假如它叫张三,并被负载均衡到2号服务器上,那么2号服务器就保存了他的登录状态信息,但是如果下一次张三发出请求,他又被映射到了一号服务器上,但一号服务器上没有保存有关张三的会话信息,那么1号服务器怎么知道张三的登录状态呢?又怎么正确的对张三的请求做出处理呢?

所以,我们是需要让同一客户端每次被映射到一台指定的server上.

假如,现在有张三、李四、王五三个客户端,他们每次都被映射到一台指定的server上,现在,如果3号服务器突然挂掉

image-20221120210741525

场景二:

例如,服务端需要增删查看数据,如果服务端直接去数据库中查找,效率太低,所以我们需要将一些热点数据先缓存起来,以便下次查找时提高效率,假设现在我们以用户id作为key,用户信息作为value如果第一次去查找时没找到,那就去数据库中查找,然后再将此次的查找结果保存在缓存中,以便以后再次查找时快速读取,如果找到,那么服务端直接从缓存中拿到数据并处理,并最终返回给客户端.

image-20221120211834909

image-20221120213521051

所以,综合上述的两个场景可以看出,普通的哈希算法是存在许多问题的,所以我们需要引入一致性哈希算法.

📖2. 一致性哈希算法概念

一致性哈希算法是分布式系统负载均衡的首选算法.

服务器负载均衡环境下,可以配置的负载均衡算法有很多种,比如:轮询算法,哈希算法,权重比算法,最少连接算法.

一个良好的分布式哈希方案应该具有良好的单调性,即服务器节点的增减不会造成大量哈希的重定位.

什么是一致性哈希算法?

image-20221120230329336

image-20221120230813877

image-20221120231144519

image-20221121110906421

image-20221121111244869

那么还有一个问题:服务器经过一致性哈希处理之后,在哈希环上应该分散一些好,还是集中在一起好?

image-20221121111713747

这种问题也叫哈希环的倾斜.

所以,在一致性哈希算法中,就采用了虚拟节点来解决这个问题:

即对每一台服务器节点计算多个哈希,每个计算结果位置都放置一个此服务节点,称作虚拟节点. 一个实际的物理节点可以对应多个虚拟节点,虚拟节点越多,哈希环上的节点就越多,缓存/客户端被均匀分布的概率就越大,哈希环倾斜所带来的影响就越小,同时数据定位算法不变,只是多了一步虚拟节点到实际节点的映射.

image-20221121112805133

落在A1,A2,A3,A4上的节点,均负载到A服务器上,落在B1,B2,B3,B4上的节点,均负载到B服务器上.

📖3. 代码实现

#include<iostream>
#include<string>
#include<list>
#include<set>
#include<map>
#include"md5.h"

using namespace std;

using uint = unsigned int;

class PhysicalHost;

//虚拟节点
class VirtualHost
{
public:
	VirtualHost(string ip, PhysicalHost* p)
		: ip_(ip)
		, physicalHost_(p)
	{
		//md5算法,用来将ip地址离散到哈希环上
		// 把32位的md5串,处理成unsigned int返回
		//unsigned int getMD5(const char* buf);

		md5_ = getMD5(ip_.c_str());
	}

	bool operator<(const VirtualHost& vhost) const
	{
		return md5_ < vhost.md5_;
	}

	bool operator==(const VirtualHost& vhost) const
	{
		return vhost.ip_ == ip_;
	}

	const PhysicalHost* getPhysicalHost() const
	{
		return physicalHost_;
	}

	uint getmd5() const
	{
		return md5_;
	}
private:
	string ip_; //虚拟节点的ip信息
	uint md5_;  //虚拟节点在哈希环上的位置
	PhysicalHost* physicalHost_;  //该虚拟节点所对应的物理节点
};

//物理节点
class PhysicalHost
{
public:
	PhysicalHost(string ip, int vnumber)
		:ip_(ip)
	{
		//添加虚拟节点
		for (int i = 0; i < vnumber; ++i)
		{
			virtualHosts_.emplace_back(ip_ + "#" + to_string(i), this);
		}
	}

	string getIP() const
	{
		return ip_;
	}

	const list<VirtualHost>& getVirtualHosts() const
	{
		return virtualHosts_;
	}
private:
	string ip_;  //物理机器的ip地址
	list<VirtualHost> virtualHosts_; // 存储物理节点对应的虚拟节点列表
};

//一致性哈希算法实现
class ConsistentHash
{
public:
	//在一致性哈希环上添加物理主机的虚拟节点
	void addHost(const PhysicalHost& host)
	{
		//获取物理主机的所有虚拟节点列表
		auto list = host.getVirtualHosts();
		for (auto vhost : list)
		{
			hashCircle_.insert(vhost);
		}
	}


	//在一致性哈希环上删除物理主机的虚拟节点
	void delHost(PhysicalHost& host)
	{
		auto list = host.getVirtualHosts();
		for (auto host : list)
		{
			auto it = hashCircle_.find(host);
			if (it != hashCircle_.end())
			{
				hashCircle_.erase(it);
			}
		}
	}

	//返回负载的真实物理主机的ip信息
	string getHost(string clientip) const
	{
		uint md5 = getMD5(clientip.c_str());

		for (auto vhost : hashCircle_)
		{
			if (vhost.getmd5() > md5)
			{
				return vhost.getPhysicalHost()->getIP();
			}
		}

		return hashCircle_.begin()->getPhysicalHost()->getIP();
	}
private:
	set<VirtualHost> hashCircle_;  //一致性哈希环
};

void ShowConsistentHash(ConsistentHash& chash)
{
	list<string> iplists ={
		"192.168.1.123",
		"192.168.1.12",
		"192.168.1.13",
		"192.168.1.23",
		"192.168.1.54",
		"192.168.1.89",
		"192.168.1.21",
		"192.168.1.27",
		"192.168.1.49",
		"192.168.1.145",
		"192.168.2.34",
		"192.168.6.78",
		"192.168.2.90",
		"192.168.4.5"
	};

	map<string, list<string>> logMap;

	for (auto client : iplists)
	{
		string host = chash.getHost(client);
		logMap[host].emplace_back(client);
	}

	for (auto pair : logMap)
	{
		cout << "物理主机:" << pair.first << endl;
		cout << "负载客户端的数量:" << pair.second.size() << endl;

		for (auto ip : pair.second)
		{
			cout << ip << endl;
		}

		cout << "------------------------" << endl;
	}

	cout << endl;
}

int main()
{
	PhysicalHost host1("10.117.124.10", 150);
	PhysicalHost host2("10.117.124.20", 150);
	PhysicalHost host3("10.117.124.30", 150);

	//在一致性哈希环上添加三台物理主机
	ConsistentHash chash;
	chash.addHost(host1);
	chash.addHost(host2);
	chash.addHost(host3);

	ShowConsistentHash(chash);

	//host1挂掉
	chash.delHost(host1);

	ShowConsistentHash(chash);

	return 0;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/23702.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

liunx 磁盘分区格式报错问题及挂载步骤

磁盘分区 1.lsblk查看未分区空间 2.执行fdisk /dev/vda进行分区 3.n(小写n开始分区)-&#xff08;顺序&#xff0c;可以默认顺序&#xff09;-&#xff08;分区的多少&#xff0c;默认是剩下所有&#xff09;-&#xff08;分区大小&#xff0c;默认是G&#xff09;-w&#xf…

WebRTC系列 -- iOS 音频采集之 ADM、APM和AudioState

文章目录 1. adm和apm1.1 adm类关系简介1.2 adm及apm的创建2. AudoState在WebRTC的音频模块有三个比较重要的模块,ADM、APM和AudioState,其中ADM是audio device model 也就是负责处理音频采集和播放数据的模块,APM是Audio Processing model ,AudioState主要是为了处理多个c…

十六、Lua 文件 I/O的学习

Lua 文件 I/O Lua I/O 库用于读取和处理文件。分为简单模式&#xff08;和C一样&#xff09;、完全模式。 简单模式&#xff08;simple model&#xff09;拥有一个当前输入文件和一个当前输出文件&#xff0c;并且提供针对这些文件相关的操作。完全模式&#xff08;complete …

公众号免费查题接口调用

公众号免费查题接口调用 本平台优点&#xff1a; 多题库查题、独立后台、响应速度快、全网平台可查、功能最全&#xff01; 1.想要给自己的公众号获得查题接口&#xff0c;只需要两步&#xff01; 2.题库&#xff1a; 查题校园题库&#xff1a;查题校园题库后台&#xff08;…

行业安全解决方案|腾讯游戏安全一站式防护,助力对抗外挂和DDoS攻击

近年来&#xff0c;在技术革新、监管加强、用户需求提升的三重作用下&#xff0c;游戏行业进入发展转型期&#xff0c;并涌现出游戏精品化、产业跨界升级、游戏出海三大趋势。随着游戏行业的繁荣&#xff0c;游戏厂商面临越来越多的黑灰产攻击、内容违规等游戏安全难题&#xf…

使用python画柱状图(matplotlib.pyplot)-- 你想要的设置这张图基本都包括

本人写论文时画的图&#xff0c;总结一下方法&#xff1a; 安心看下去&#xff0c;你应该就可以画出一个好看的柱状图&#xff0c;基本上需要的设置都有哦&#xff01;&#xff01;&#xff01; 目录 1 首先引入画图所需要的包Matplotlib 2 Matplotlib Pyplot 3 画柱状图 …

宿舍管理系统的设计与实现/学生宿舍管理系统

摘 要 随着信息技术和网络技术的飞速发展&#xff0c;人类已进入全新信息化时代&#xff0c;传统管理技术已无法高效&#xff0c;便捷地管理信息。为了迎合时代需求&#xff0c;优化管理效率&#xff0c;各种各样的管理系统应运而生&#xff0c;各行各业相继进入信息管理时代&a…

反向散射耦合RFID系统的原理及特点,带你更深入的了解

一.反向散射耦合RFID系统 1.反向散射 雷达技术为RFID的反向散射耦合方式提供了理论和应用基础。当电磁波遇到空间目标时&#xff0c;其能量的一部分被目标吸收&#xff0c;另一部分以不同的强度散射到各个方向。在散射的能量中&#xff0c;一小部分反射回发射天线&#xff0c;并…

Cadence orcad 原理图导出带书签目录的办法

Cadence orcad 导出pdf&#xff0c;方便软件工程师或者其他人员查看&#xff0c;但是Cadence自带的导出pdf的办法不能同时导出书签目录&#xff0c;不利于查看&#xff0c;这片文章就是介绍怎么使用Cadence orcad 原理图导出带书签目录的pdf&#xff0c;这里以cadence16.6举例。…

G1 垃圾回收器

引用&#xff1a; G1垃圾收集器详解_fyygree的博客-CSDN博客 深入解析G1垃圾收集器与性能优化_铁锚的博客-CSDN博客 垃圾回收器之 G1 垃圾回收器_嘿&#xff0c;鱼骨头^O^的博客-CSDN博客 G1是一款增量式的分代垃圾收集器 G1 物理上不分代&#xff0c;默认会将整个内存区域…

React - Jsx 概述

React - Jsx 概述 JSX 概述 目标&#xff1a; 了解 JSX 是什么、与 React.createElement 之间的关系 JSX 语法是另一种在 React 中创建元素的方式 使用他创建元素更加的简单 直接。 JSX 是 javaScript XML 简写 可以理解为在 JavaScript 中写 XML 格式的代码 const list (&…

力扣(LeetCode)808. 分汤(C++)

动态规划 如图&#xff0c;本题的状态表示&#xff0c;是二维 dpdpdp f[i,j]f[i,j]f[i,j] &#xff0c; iii 表示剩余的 aaa &#xff0c; jjj 表示剩余的 bbb &#xff0c; f[i,j]f[i,j]f[i,j] 表示 aaa 先取完的概率 。 按照 i/ji/ji/j 的剩余数量做集合划分 ①当 i≤0,j≤0…

代码冲突的产生以及解决方式

Git代码冲突解决 为什么会产生代码冲突&#xff1f; 远程仓库的某个文件内容发生了修改&#xff0c;而本地没有及时进行pull拉取&#xff0c;那么就会导致本地的分支落后。当修改完本地代码再push到远程的时候&#xff0c;就会产生代码冲突。如何避免产生代码冲突&#xff1f;…

GitHub标星75k,阿里15W字的Spring高级文档(全彩版)真的太香了

随着 Spring 使用越来越广泛&#xff0c;Spring 已经成为 Java 程序员面试的必问知识点&#xff0c;很多同学对于Spring理解不是那么的深刻&#xff0c;经常就会被几个连环追问给干趴了&#xff01; 今天小编整理了一下一线架构师的Spring源码高级文档&#xff1a;SpringSprin…

基础:BS(Browser/Server)、CS(Client/Server)架构

一、BS&#xff08;Browser/Server&#xff09; 所有浏览器应用都是BS架构。 BS&#xff08;Browser/Server&#xff09;&#xff1a;浏览器 / 服务器结构。BS是伴随着Internet技术的兴起&#xff0c;对C/S架构的改进&#xff0c;为了区别于传统的C/S 模式&#xff0c;特意称为…

亚马逊、沃尔玛、美客多测评补单是什么?自养号需要解决哪些问题?

​做跨境电商很多卖家会疑惑测评&#xff08;补单&#xff09;是什么&#xff1f;为什么需要测评或者补单&#xff1f; 其实测评或补单都是类似于国内电商&#xff08;某宝&#xff0c;某东&#xff09;的刷单。 测评补单作用&#xff1a;快速提高产品的排名、权重和销量 可…

如何在 VMware Workstation 16.2 中安装 Ubuntu 20.04

安装 Ubuntun 20.04 如今,Linux 操作系统越来越受欢迎。大多数服务器都使用Linux操作系统,个人系统也开始使用各种 Linux 发行版。Ubuntu 是流行的 Linux 操作系统之一。 一、在搜栏中搜索 VMware Workstation 并打开它 二、在主页上点击“创建新的虚拟机”。当你开始准备时…

TensorFlow中的tf.nn.softmax_cross_entropy_with_logits_v2函数详解

一、函数介绍 函数形式&#xff1a;tf.nn.softmax_cross_entropy_with_logits_v2(labelslabels, logitslogits) 需要注意的是&#xff0c;此处是最常见的参数形式&#xff0c;即只有labels和logits参数。为了简单起见&#xff0c;这里不对其他参数进行赘述。其中&#xff0c;…

【AtCoder】离线询问+树状数组

文章目录题目描述题意思路代码D - AtCoder Express 2 题目描述 input#1&#xff1a; 2 3 1 1 1 1 2 2 2 1 2 output#1&#xff1a; 3 input#2&#xff1a; 10 3 2 1 5 2 8 7 10 1 7 3 10 output#2&#xff1a; 1 1 input#3&#xff1a; 10 10 10 1 6 2 9 4 5 4 7 4 7 5 8 6 6 …

【虹科案例】极高的精度水平——虹科数字化仪在大型强子对撞机机器保护系统中的应用

大型强子对撞机机器保护系统 CERN&#xff08;欧洲核子研究中心&#xff09; 的大型强子对撞机 (LHC) 的机器保护系统中使用了140 多张虹科数字化仪卡。这些板卡用于检查粒子束是否已准确偏转。这需要极高的精度&#xff0c;因为在 27 公里 LHC 加速器环中&#xff0c;两束高能…