模拟实现STL中的unordered_map和unordered_set

news2024/9/20 16:44:22

目录

1.unordered_map和unordered_set简介

2.unordered_map和unordered_set设计图

3.迭代器的设计

4.哈希表的设计

5.my_unordered_map和my_unordered_set代码

1.unordered_map和unordered_set简介

unordered_map和unordered_set的使用非常类似于map和set,两者之间的差异在于底层的数据结构不同,unordered_map和unordered_set的底层使用的数据结构是哈希表,map和set底层使用的数据结构是红黑树。哈希表和红黑树都是查找效率非常高的数据结构,红黑树的查找效率是O(logN),哈希表的查找效率是O(1),总体来说哈希表的查找效率略胜一筹,但是红黑树是接近平衡的二叉搜索树,具有隐藏技能 —— 中序遍历,数据有序(升序),map和set的遍历采用的就是中序遍历;也就是说,遍历map和set得到的数据是有序的,而哈希表的遍历是无序的,所以,为了区分功能相同而底层数据结构的不同的关联式容器,以哈希表为底层数据结构的map和set前加上unordered,unordered其实就是无序的意思。

2.unordered_map和unordered_set设计图

unordered_map和unordered_set底层是开散列方式实现的哈希表,要想实现unordered_map和unordered_set,需要在内部封装哈希表;但是,STL中的容器都提供统一的访问方式 —— 迭代器,所以我们还需要实现unordered_map和unordered_set的迭代器。说白了,unordered_map和unordered_set就是通过组合 哈希表 和 迭代器 来实现的。而unordered_map和unordered_set实现上的区别就是内部存储的数据不同(一个存储键值对,一个存储元素本身),但是整体的设计框架是相同的。

unordered_map和unordered_set的设计图如下:

一个问题:unordered_map中存储的是键值对,unordered_set中存储的是一个个的元素,而二者的底层使用的数据结构都是 开散列实现的哈希表,那我们需要将哈希表实现两份吗?这个问题和map和set中数据存储的问题相同,如果实现两份的话,就会造成代码重复和冗余;解决方案也是和map、set中解决该问题的方式相同。请看下图:

可以看出,在使用上,unordered_set传递一个模板参数,unordered_map传递两个模板参数,但是在unordered_map和unordered_set中封装的哈希表都需要传递两个参数;所以unordered_map中将K类型传给底层哈希表的第一个参数,用 K 和 V封装出pair<K,V>类型传给 底层哈希表的第二个参数;unordered_set中传递给底层哈希表的第一个和第二个参数的类型都是K。这样,哈希表中第二个模板参数T就是哈希表中实际存储的数据类型。于是,就实现了复用同一个 哈希表的类模板。

那第一个模板参数是不是没用呢?并不是,因为,unordered_map和unordered_set的使用上是以Key值  (K类型的数据) 为主的,并且有些操作也是根据Key值来进行的,比如:查找操作。所以我们也是需要单独的K类型的数据的。

获取数据中的Key值问题

由于同一个类模板的哈希表中经常涉及数据的比较,unordered_set中数据的比较是按照Key值来比较的,unordered_map中数据的比较也是按照Key值来比较的。但是在同一个类模板的哈希表中不能使用同样的方式获取Key值,所示实现一个获取Key值的仿函数,该仿函数作为参数传递给哈希表。

实现代码如下:

// unordered_map中获取Key值的仿函数
struct MapKeyOfT
{
	const K& operator()(const pair<K, V>& kv)
	{
		return kv.first;
	}
};

// unordered_set中获取Key值的仿函数
struct SetKeyOfT
{
	const K& operator()(const K& key)
	{
		return key;
	}
};

3.迭代器的设计

unordered_map和unordered_set迭代器的设计不同于map和set,map和set的迭代器的操作主要是是在一棵二叉搜索树上进行,所以封装结点的指针即可;但是unordered_map和unordered_set的迭代器的操作是在哈希表上进行的,而哈希表是由 _table _table下挂的一个个的结点组成的,所以 unordered_map 和 unordered_set 的迭代器需要封装 哈希表 和 结点的指针 (对于哈希表的封装,也采用指针的形式) 。

迭代器总体设计图如下:

迭代器的那些操作

operator* 和 operator->操作:迭代器模仿的是指针的操作,指针常用的操作就是 解引用 * 和 箭头访问操作符 ->;operator* 用于取出结点中的数据,operator->用于返回节点中数据的地址。代码如下:

T& operator*()
{
	return _node->_data;
}

T* operator->()
{
	return &(_node->_data);
}

迭代器的++操作:迭代器的++操作用于实现 用迭代器遍历哈希表中的数据,所以我们需要依次遍历桶,如果桶不为空,就遍历桶中的数据,遍历完当前桶中的数据之后,再遍历下一个桶中的数据;如果桶为空,直接遍历下一个桶;迭代器++操作代码如下:

		Self& operator++()
		{
			if (_node->_next)
			{
				// 当前桶还是节点
				_node = _node->_next;
			}
			else
			{
				// 当前桶走完了,找下一个桶
				KeyOfT kot;
				Hash hs;
				size_t hashi = hs(kot(_node->_data)) % _ht->_tables.size();
				// 找下一个桶
				hashi++;
				while (hashi < _ht->_tables.size())
				{
					if (_ht->_tables[hashi])
					{
						_node = _ht->_tables[hashi];
						break;
					}

					hashi++;
				}

				// 后面没有桶了
				if (hashi == _ht->_tables.size())
				{
					_node = nullptr;
				}
			}

			return *this;
		}

判断相等和不相等操作:迭代器判断相等和不相等,只需要判断迭代器中 结点的指针是否相等。代码如下所示:

        bool operator!=(const Self& s)
		{
			return _node != s._node;
		}

		bool operator==(const Self& s)
		{
			return _node == s._node;
		}

4.哈希表的设计

哈希表的实现有闭散列和开散列两种方式,我们采用开散列的方式实现,哈希表的设计图如下所示:

哈希函数

哈希表主要通过哈希函数来计算出 存储的数据 和 数据存储的位置 之间的映射关系。在该设计中,我们采用 除留余数法 来计算 存储元素 和 存储位置 之间的映射关系;但是,该方法只适用于整形的数据,因为并不是所有类型的数据都能进行取余运算,所以,对于一些不能取余的类型的数据,我们需要提供一个仿函数来计算出其哈希值,方便其进行取余运算,从而计算出数据的存储位置。

哈希函数示例代码如下:

template<class K>
struct HashFunc
{
	size_t operator()(const K& key)
	{
		return (size_t)key;
	}
};
// 特化
template<>
struct HashFunc<string>
{
	size_t operator()(const string& s)
	{
		size_t hash = 0;
		for (auto e : s)
		{
			hash += e;
			hash *= 131;
		}

		return hash;
	}
};

哈希表中的操作

begin()和end()操作:begin()用于返回哈希表中第一个结点的迭代器,end()用于返回最后一个结点的下一个位置的迭代器,其实就是空。

代码实现如下:

    iterator begin()
	{
		for (size_t i = 0; i < _tables.size(); i++)
		{
			// 找到第一个桶的第一个节点
			if (_tables[i])
			{
				return iterator(_tables[i], this);
			}
		}

		return end();
	}

	iterator end()
	{
		return iterator(nullptr, this);
	}

数据的插入:哈希表中插入数据是哈希表的精髓,因为数据的插入位置和数据之间通过哈希函数建立一 一映射的关系,通过数据的值,就可以很快的判断出数据存储的位置;并且通过限制负载因子来防止桶中的数据过多,从而为飞速的查找效率打下基础。

开散列的哈希表中的数据的插入采用头插的方式,代码实现如下:

bool Insert(const T& data)
{
	KeyOfT kot;

	if (Find(kot(data)))
		return false;

	Hash hs;

	// 负载因子到1就扩容
	if (_n == _tables.size())
	{
		vector<Node*> newTables(_tables.size() * 2, nullptr);
		for (size_t i = 0; i < _tables.size(); i++)
		{
			// 取出旧表中节点,重新计算挂到新表桶中
			Node* cur = _tables[i];
			while (cur)
			{
				Node* next = cur->_next;

				// 头插到新表
				size_t hashi = hs(kot(cur->_data)) % newTables.size();
				cur->_next = newTables[hashi];
				newTables[hashi] = cur;

				cur = next;
			}

			_tables[i] = nullptr;
		}

		_tables.swap(newTables);
	}

	size_t hashi = hs(kot(data)) % _tables.size();
	Node* newnode = new Node(data);

	// 头插
	newnode->_next = _tables[hashi];
	_tables[hashi] = newnode;

	++_n;
	return true;
}

数据的查找:在哈希表中查找一个值,首先通过哈希函数计算出该元素在哈希表中的第几个桶,然后遍历该桶下的数据,找到了就返回该结点的地址,没找到就返回空。

代码如下:

Node* Find(const K& key)
{
	KeyOfT kot;
	Hash hs;
	size_t hashi = hs(key) % _tables.size();
	Node* cur = _tables[hashi];
	while (cur)
	{
		if (kot(cur->_data) == key)
		{
			return cur;
		}

		cur = cur->_next;
	}

	return nullptr;
}

数据的删除:删除一个数据的时候,首先要找到该数据所在的结点,找到该结点之后,删除即可。如果不存在该数据,则返回false。

删除代码如下:

bool Erase(const K& key)
{
	KeyOfT kot;
	Hash hs;
	size_t hashi = hs(key) % _tables.size();
	Node* prev = nullptr;
	Node* cur = _tables[hashi];
	while (cur)
	{
		if (kot(cur->_data) == key)
		{
			// 删除
			if (prev)
			{
				prev->_next = cur->_next;
			}
			else
			{
				_tables[hashi] = cur->_next;
			}

			delete cur;

			--_n;
			return true;
		}

		prev = cur;
		cur = cur->_next;
	}

	return false;
}

5.my_unordered_map和my_unordered_set代码

my_unordered_map代码如下:

#include "Open_HashTable.h"

namespace wall
{
	template<class K, class V, class Hash = HashFunc<K>>
	class unordered_map
	{
		struct MapKeyOfT
		{
			const K& operator()(const pair<K, V>& kv)
			{
				return kv.first;
			}
		};

	public:
		typedef typename hash_bucket::HashTable<K, pair<const K, V>, MapKeyOfT, Hash>::iterator iterator;

		iterator begin()
		{
			return _ht.begin();
		}

		iterator end()
		{
			return _ht.end();
		}

		bool insert(const pair<K, V>& kv)
		{
			return _ht.Insert(kv);
		}

		bool erase(const K& key)
		{
			_ht.Erase(key);
		}

		iterator find(const K& key)
		{
			Node* ret = Find(key);
			return iterator(ret);
		}
	private:
		hash_bucket::HashTable<K, pair<const K, V>, MapKeyOfT, Hash> _ht;
	};
}

my_unordered_set代码如下:

#include "Open_HashTable.h"

namespace wall
{
	template<class K, class Hash = HashFunc<K>>
	class unordered_set
	{
		struct SetKeyOfT
		{
			const K& operator()(const K& key)
			{
				return key;
			}
		};
	public:
		typedef typename hash_bucket::HashTable<K, const K, SetKeyOfT, Hash>::iterator iterator;

		iterator begin()
		{
			return _ht.begin();
		}

		iterator end()
		{
			return _ht.end();
		}

		bool insert(const K& key)
		{
			return _ht.Insert(key);
		}
		bool erase(const K& key)
		{
			_ht.Erase(key);
		}

		iterator find(const K& key)
		{
			Node* ret = Find(key);
			return iterator(ret);
		}

	private:
		hash_bucket::HashTable<K, const K, SetKeyOfT, Hash> _ht;
	};
}

总结:可以看出,模拟实现的unordered_map和unordered_set主要是对 哈希表迭代器进行了组合和封装,通过添加一些操作来更加方便的使用底层的数据结构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2077018.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux】日志函数

欢迎来到 破晓的历程的 博客 ⛺️不负时光&#xff0c;不负己✈️ 文章目录 引言日志内容日志等级日志函数的编写函数原型参数说明功能描述使用场景示例代码 引言 日志在程序设计中扮演着至关重要的角色&#xff0c;它不仅是程序运行情况的记录者&#xff0c;还是问题诊断、性…

【机器学习】智驭未来:机器学习如何重塑现代城市管理新生态

&#x1f4dd;个人主页&#x1f339;&#xff1a;Eternity._ &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339; ❀目录 &#x1f50d;1. 引言&#xff1a;迈向智能城市的新时代&#x1f4d2;2. 智驭交通&#xff1a;机器学习在智能交通管理中的应用&#x1…

仿Muduo库实现高并发服务器——LoopThreadPool模块

这个模块需要具备那些基础知识。 线程创建相关操作&#xff0c;锁&#xff0c;条件变量。 设置线程数量&#xff1a; _thread_count 是线程池中&#xff0c;记录线程数量的成员。 创建线程池&#xff1a; 上图就是线程池的创建&#xff0c;将线程与EventLoop对象 通过数组下…

关于嘉立创eda中同一个项目下多个原理图是否独立

嘉立创项目底下&#xff0c;如果你新建了多张原理图&#xff0c;如下 我发现&#xff0c;多张原理图是互相连接的&#xff0c;所以命名是不能重复的 多页原理图 | 嘉立创EDA标准版用户指南https://docs.lceda.cn/cn/Schematic/Multi-Sheet/index.html 上面是嘉立创原文介绍 综…

豆瓣评分7.9!世界级讲师耗时5年整理出的Python学习手册!

Python是一门流行的开源编程语言&#xff0c;广泛用于各个领域的独立程序与脚本化应用中。它不仅免费、可移植、功能强大&#xff0c;同时相对简单&#xff0c;而且使用起来充满乐趣。从软件业界的任意一角到来的程序员&#xff0c;都会发现Python着眼于开发者的生产效率以及软…

编程仙尊——深入理解指针(2)

目录 4.const修饰指针 4.1const修饰变量 5.指针运算 5.1指针-整数 5.2指针-指针 5.3指针的关系运算 6.assert断言 4.const修饰指针 4.1const修饰变量 在编程中&#xff0c;为了防止代码在运行过程中变量的内容意外改变&#xff0c;可以使用const函数&#xff0c;对变量…

介绍python的回归模型原理知识

一.回归 1.什么是回归 回归&#xff08;Regression&#xff09;最早是英国生物统计学家高尔顿和他的学生皮尔逊在研究父母和子女的身高遗传特性时提出的。1855年&#xff0c;他们在《遗传的身高向平均数方向的回归》中这样描述“子女的身高趋向于高于父母的身高的平均值&…

Linux云计算 |【第二阶段】SHELL-DAY2

主要内容&#xff1a; 条件测试&#xff08;字符串比较、整数比较、文件状态&#xff09;、IF选择结构&#xff08;单分支、双分支、多分支&#xff09;、For循环结构、While循环结构 一、表达式比较评估 test 命令是 Unix 和 Linux 系统中用于评估条件表达式的命令。它通常用…

小乌龟运动控制-1 小乌龟划圆圈

目录 第一章 小乌龟划圆圈 第二章 小乌龟走方形 文章目录 目录前言一、准备工作步骤一&#xff1a;创建ROS工作空间步骤二&#xff1a;创建ROS包和节点步骤三&#xff1a;编写Python代码步骤四&#xff1a;运行ROS节点总结 前言 本教程将教会你如何使用Python编写ROS小海龟节…

【SpringCloud】(一文通)优雅实现远程调用-OpenFeign

目 录 一. RestTemplate存在问题二. OpenFeign介绍三. 快速上手3.1 引入依赖3.2 添加注解3.3 编写 OpenFeign 的客户端3.4 远程调用3.5 测试 四. OpenFeign 参数传递4.1 传递单个参数4.2 传递多个参数4.3 传递对象4.4 传递JSON 五. 最佳实践5.1 Feign 继承方式5.1.1 创建⼀个Mo…

马克思发生器有什么用_马克思发生器工作原理

马克思发生器&#xff08;Marx Generator&#xff09;是一种电气装置&#xff0c;用于产生高压脉冲电压。它由多个电容器组成&#xff0c;这些电容器依次连接在一系列开关之后。首先&#xff0c;每个电容器被并联充电至较低的电压。然后&#xff0c;这些电容器被开关依次串联&a…

C++过生日(我给我自己做的生日礼物)

&#x1f680;欢迎互三&#x1f449;&#xff1a;程序猿方梓燚 &#x1f48e;&#x1f48e; &#x1f680;关注博主&#xff0c;后期持续更新系列文章 &#x1f680;如果有错误感谢请大家批评指出&#xff0c;及时修改 &#x1f680;感谢大家点赞&#x1f44d;收藏⭐评论✍ 引言…

电源自动测试系统:测试柜的组成与功能

为了提高电源测试的效率和安全性&#xff0c;电源自动化测试柜是电源ATE自动测试系统的重要设备&#xff0c;不仅对示波器、万用表等测试仪器起保护作用&#xff0c;更是在测试过程中降低了安全风险&#xff0c;方便了电源产品的自动化测试。 电源自动测试系统机柜 电源自动化测…

C++初学(15补充)

15.1、嵌套循环和二维数组 下面讨论如何使用嵌套for循环来处理二维数组。到目前为止&#xff0c;我们一直学的是一维数组&#xff0c;因为每一个数组都可以看作是一行数据。二维数组更像是一个表格——既有数据行也有数据列。C并没有提供二维数组类型&#xff0c;但是用户可以…

电池的入门

目录 化学电池主要参数电池种类常用电池 物理电池太阳能电池 化学电池 主要参数 1.容量 2.标称电压 3.内阻 4.充电终止电压 5.放点终止电压 电池种类 按能否充电分&#xff1a; 原电池&#xff08;Primary Cell&#xff09;&#xff1a;只能放电不能充电的电池&#xff0c…

FastGPT如何增减用户

背景 开源版本的FastGPT默认只有一个超级用户root&#xff0c;为了更好地管理应用和知识库&#xff0c;可以通过操作MongoDB数据库来增加新的用户和团队。 所需环境 已安装并运行的FastGPT实例MongoDB客户端工具&#xff08;如Mongo Shell或Robo 3T等&#xff09; 操作步骤…

一文带你了解React Hooks

目录 一、useState 二、useRef 三、useEffect 四、自定义Hook 五、Hooks使用规则 Hooks原意是“挂钩”&#xff0c;指将类组件中的部分功能直接可以挂钩到函数组件中&#xff0c;例如state、生命周期方法、副作用等功能。 为什么使用Hooks&#xff1f; 封装代码&#xff…

Harmony鸿蒙应用开发:解决Web组件加载本地资源跨域

鸿蒙开发文档中有一节 加载本地页面 提到了可以通过 $rawfile 方法加载本地 HTML 网页&#xff1a; Index.ets 1Web({ src: $rawfile("local.html"), controller: this.webviewController })但是如果在 local.html 中需要引用一些静态资源&#xff0c;例如图片、JS、…

STM32——TIM定时器的输入捕获功能

一、什么是输出比较与输入捕获&#xff1f; 可以看到&#xff1a; 输出比较OC是用于输出一定频率和占空比的PWM波形&#xff0c;可用于电机驱动进行调速等&#xff1b;而输入捕获IC是用于测量PWM波形的频率以及占空比等参数&#xff1b;和他们的名字相反&#xff0c;一个是比…

Datawhale AI夏令营第四期魔搭- AIGC文生图方向 task01笔记

目录 分任务1&#xff1a;跑通baseline 第一步——搭建代码环境 第二步——报名赛事 第三步——在魔搭社区创建PAI实例 分任务2&#xff1a;相关知识学习以及赛题理解 赛题理解&#xff1a; 文生图基本认识&#xff1a; 1. Diffusion Model(扩散模型) 2. LDMs&#x…