unordered系列关联式容器--哈希结构详细讲解及使用示例

news2024/11/19 21:28:25

目录

  • unordered系列关联式容器
    • unordered_map
  • 哈希
    • 哈希概念
    • 哈希函数
      • 直接定址法:
      • 除留余数法:
    • 哈希冲突
    • 解决哈希冲突
      • 闭散列:
      • 开散列:

unordered系列关联式容器

之前讲解在C++98中STL提供了底层为红黑树结构的一系列关联式容器,在查询时效率可达到 l o g 2 N log_2N log2N,即最差情况下需要比较红黑树的高度次,当树中的节点非常多时,查询效率也不理想。最好的查询是,进行很少的比较次数就能够将元素找到,因此在C++11中,STL又提供了4个unordered系列的关联式容器,这四个容器与红黑树结构的关联式容器使用方式基本类似,只是其底层结构不同使用哈希结构。unordered_map、unordered_set、unordered_multimap和unordered_multiset

unordered_map

  1. unordered_map是存储<key, value>键值对的关联式容器,其允许通过keys快速的索引到与其对应的value。
  2. 在unordered_map中,键值通常用于惟一地标识元素,而映射值是一个对象,其内容与此键关联。键和映射值的类型可能不同。
  3. 在内部,unordered_map没有对<kye, value>按照任何特定的顺序排序, 为了能在常数范围内找到key所对应的value,unordered_map将相同哈希值的键值对放在相同的桶中。
  4. unordered_map容器通过key访问单个元素要比map快,但它通常在遍历元素子集的范围迭代方面效率较低。
  5. unordered_maps实现了直接访问操作符(operator[]),它允许使用key作为参数直接访问value。
  6. 它的迭代器只有前向迭代器。

第三方

  • 使用方式和map一样
    但操作性能相比map更高:O(1)的复杂度
	//使用方式和map一样
	unordered_map<int, int> m;
	//操作性能相比map更高:O(1)的复杂度
	m.insert(make_pair(1, 1));
	m[2] = 2;
  • 不同在于map遍历出来的值是有序的而unordered_map遍历出的值是无序的
    unordered_map只有正向迭代器,没有反向迭代器。
	for (int i = 3; i < 100; ++i)
	{
		m[i] = i;
	}
	
	//相对于map/set,unordered_map/set只有正向迭代器
	//迭代器遍历,不是有序的
	unordered_map<int, int>::iterator it = m.begin();
	while (it != m.end())
	{
		cout << it->first << " ";
	}
	cout << endl;
  • equal_range:左闭右开的区间,查询key

由于是map,不允许Key重复,因此只输出了一个值3;如果是multimap可以有多个key值则会输出更多。

	//equal_range:
	auto range = m.equal_range(3);
	it = range.first;
	while (it != range.second)
	{
		cout << it->first << " ";
		++it;
	}
	cout << endl;

哈希

unordered系列的关联式容器之所以效率比较高,是因为其底层使用了哈希结构。

哈希概念

顺序结构以及平衡树中,元素关键码与其存储位置之间没有对应的关系,因此在查找一个元素时,必须要经过关键码的多次比较。顺序查找时间复杂度为O(N),平衡树中为树的高度,即O( l o g 2 N log_2 N log2N),搜索的效率取决于搜索过程中元素的比较次数。
理想的搜索方法:可以不经过任何比较,一次直接从表中得到要搜索的元素。
如果构造一种存储结构,通过某种函数(hashFunc)使元素的存储位置与它的关键码之间能够建立一一映射的关系,那么在查找时通过该函数可以很快找到该元素。
当向该结构中:

  • 插入元素

根据待插入元素的关键码,以此函数计算出该元素的存储位置并按此位置进行存放

  • 搜索元素

对元素的关键码进行同样的计算,把求得的函数值当做元素的存储位置,在结构中按此位置取元素比较,若关键码相等,则搜索成功

该方式即为哈希(散列)方法,哈希方法中使用的转换函数称为哈希(散列)函数,构造出来的结构称为哈希表(Hash Table)(或者称散列表)

哈希函数

直接定址法:

kx+b :适用于小范围数据的位置计算。如果数据范围过大会造成空间浪费。

除留余数法:

x%空间大小:通用
例如:数据集合{1,7,6,4,5,9};
哈希函数设置为:hash(key) = key % capacity; capacity为存储元素底层空间总的大小。
在这里插入图片描述
在这里插入图片描述

哈希冲突

对于两个数据元素的关键字 k i k_i ki k j k_j kj(i != j),有 k i k_i ki != k j k_j kj,但有:Hash( k i k_i ki) ==Hash( k j k_j kj),即:不同关键字通过相同哈希哈数计算出相同的哈希地址,该种现象称为哈希冲突或哈希碰撞。如上图4和14的哈希地址相同。
具有不同关键码而具有相同哈希地址的数据元素称为“同义词”

解决哈希冲突

闭散列:

  • 线性探测
    从计算的哈希位置开始,找第一个空闲的位置,存放数据。
//记录位置状态(哈希表内的数据删除相当于伪删除,因为查询数据如果查找到空余位就会停止查找,比如5,15,25,把15删掉后,查询25时走到15位置发现空余,会停止查找,因此在删除15时不能直接删除)
enum STATE
{
	EXIST,	//存在
	DELETE,	//删除
	EMPTY	//空
};

template <class K, class V>
struct hashNode
{
	pair<k, V> _kv;
	STATE _state = EMPTY;
};

//顺序表实现hash
template <class K, class V>
class HashTable
{
public:
	typedef HashNode<K, V> Node;

	HashTable(size_t n = 10)
		:_hTable(n)
		, _size(0)
	{}

	bool insert(const pair<K, V>& kv)
	{
		//0.检查容量
		checkCapacity();
		//1.计算哈希位置
		int idx = kv.first % _hTable.size();

		//2.判断key是否存在
		while (_hTable[idx]._state != EMPTY)
		{
			//如果当前位置数据有效,且key相同,插入失败
			if (_hTable[idx]._state == EXIST && kv.first == _hTable[idx]._kv.first)
			{
				return false;
			}
			//继续搜索
			++idx;
			if (idx == _hTable.size())
				idx = 0;
		}
		//插入
		_hTable[idx] = kv;
		_hTable[idx]._state = EXIST;
		++_size;
		
		return true;
	}

	void checkCapacity()
	{
		//负载因子:<1 有效元素个数/容量大小
		//负载因子越小可存储的元素就越多,可也浪费的越多,因此权衡取:0.7
		if (_hTable.size() == 0 || _size * 10 / _hTable.size() >= 7)
		{
			//开新表
			int newC = _hTable.size() == 0 ? 10 : 2 * _hTable.size();
			HashTable<K, V> newHt(newC);

			for (int i = 0; i < _hTable.size(); ++i)
			{
				//插入状态为exist的数据
				if (_hTable[i]._state == EXIST)
				{
					newHt.insert(_hTable[i]._kv);
				}
			}
			Swap(newHt);
		}
	}

	void Swap(HashTable<K, V>& Ht)
	{
		swap(_hTable, Ht._hTable);
		swap(_size, Ht._size);
	}

	Node* find(const K& key)
	{
		//计算位置
		int idx = key % _hTable.size();
		while (_hTable[idx]._state != EMPTY)
		{
			if (_hTable[idx]._state == EXIST && key == _hTable[idx]._kv.first)
			{
				return &_hTable[idx];
			}
			++idx;
			if (idx == _hTable.size())
			{
				idx = 0;
			}
		}
		return nullptr;
	}

	bool erase(const K& key)
	{
		Node* node = find(key);
		if (node)
		{
			//假删除
			--_size;
			node->_state = DELETE;
			return true;
		}
		return false;
	}

private:
	vector<Node> _hTable;
	size_t _size;	//有效元素的个数
};

void test()
{
	HashTable<int, int> ht;
	ht.insert(make_pair(1, 1));
	ht.insert(make_pair(14, 14));
	ht.insert(make_pair(16, 16));
	ht.insert(make_pair(11, 11));

	cout << ht.erase(11) << endl;
	cout << ht.erase(100) << endl;
}
  • 二次探测

开散列:

持续更新~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1155048.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于动物迁徙算法的无人机航迹规划-附代码

基于动物迁徙算法的无人机航迹规划 文章目录 基于动物迁徙算法的无人机航迹规划1.动物迁徙搜索算法2.无人机飞行环境建模3.无人机航迹规划建模4.实验结果4.1地图创建4.2 航迹规划 5.参考文献6.Matlab代码 摘要&#xff1a;本文主要介绍利用动物迁徙算法来优化无人机航迹规划。 …

Django实战项目-学习任务系统-用户管理

接着上期代码框架&#xff0c;开发第6个功能&#xff0c;用户管理&#xff0c;查看用户信息和学生用户属性值&#xff0c;尤其是总积分值&#xff0c;还可以查看积分流水明细&#xff0c;完成任务奖励积分&#xff0c;兑换物品消耗积分。 第一步&#xff1a;编写第6个功能-用户…

ChatGPT 3.5只有200亿规模的参数?最新微软的论文暴漏OpenAI的ChatGPT的参数规模远低于1750亿!

本文来自DataLearnerAI官方网站&#xff1a;ChatGPT 3.5只有200亿规模的参数&#xff1f;最新微软的论文暴漏OpenAI的ChatGPT的参数规模远低于1750亿&#xff01; | 数据学习者官方网站(Datalearner)https://www.datalearner.com/blog/1051698672594665 2022年11月底发布的Cha…

Java,面向对象,多态性

多态性是面向对象的第三大重要特征&#xff0c;建立在继承性之上。 多态性一词怎么理解呢&#xff1f;就是一个事物的多种形态的性质。在面向对象中&#xff0c;主要体现为一个父类的属性方法可以继承给多个子类。子类就理解为父类的多种形态。以动物为例&#xff0c;猫和狗都有…

SOAP协议是什么协议,有什么作用

SOAP&#xff08;Simple Object Access Protocol&#xff09;是一种基于XML的协议&#xff0c;用于在网络上进行信息交换。它是一种轻量的协议&#xff0c;旨在进行分布式计算环境中的通信。SOAP可以通过各种下层协议来传输&#xff0c;但最常用的是HTTP。 主要作用&#xff1…

桂林阳朔旅游攻略

桂林上水甲天下&#xff0c;阳朔上水甲桂林&#xff01;阳朔县城看着有点破&#xff0c;但是阳朔的山水真是一绝&#xff0c;适合慢下来&#xff0c;骑个电瓶车来放松心情&#xff01; 适合游玩时间3天左右。 主要景点:十里画廊、兴坪古镇、如易峰、相公山、20元人民币打卡处…

uniapp开发号卡系统

我们先来看一下效果图 商品分享、店铺分享等功能 部分代码 <template><view class""><view class"uy-bg-ffffff uy-p-20 uy-m-t-20 uy-b-r-20 uy-rel" v-for"(item,index) in list" :key"index"><view class&q…

cocosCreator 之 微信小游戏授权设置和调用wxAPI获取用户信息

版本&#xff1a; 3.8.0 语言&#xff1a; TypeScript 环境&#xff1a; Mac 官方文档&#xff1a; 微信官方文档 - 开放能力 微信 API 小游戏环境 在cocosCreator的3.x版本项目开发中&#xff0c;TypeScript最终会被转换为JavaScript语言。 JavaScript的运行时调用的API…

APISpace 全国快递物流地图轨迹查询API接口案例代码

1.全国快递物流地图轨迹查询接口详解 1.1 接口请求 请求方式&#xff1a;POST请求地址&#xff1a;https://eolink.o.apispace.com/wldtgj1/paidtobuy_api/trace_map请求头&#xff1a; 标签必填说明X-APISpace-Token是鉴权私钥&#xff0c;登陆 APISpace 后在管理后台的[访…

竞赛 深度学习手势识别 - yolo python opencv cnn 机器视觉

文章目录 0 前言1 课题背景2 卷积神经网络2.1卷积层2.2 池化层2.3 激活函数2.4 全连接层2.5 使用tensorflow中keras模块实现卷积神经网络 3 YOLOV53.1 网络架构图3.2 输入端3.3 基准网络3.4 Neck网络3.5 Head输出层 4 数据集准备4.1 数据标注简介4.2 数据保存 5 模型训练5.1 修…

高效文件批量重命名:轻松解决文件名中文翻译英文的问题

在日常生活和工作中&#xff0c;我们经常需要处理大量的文件&#xff0c;其中有些文件可能包含中文字符或词汇。当我们需要将这些文件名翻译为英文时&#xff0c;手动修改每个文件名会非常耗时且容易出错。为了解决这个问题&#xff0c;我们可以使用云炫文件管理器高效批量重命…

【Linux】Linux环境配置以及部署项目后端

&#x1f973;&#x1f973;Welcome Huihuis Code World ! !&#x1f973;&#x1f973; 接下来看看由辉辉所写的关于Linux的相关操作吧 目录 &#x1f973;&#x1f973;Welcome Huihuis Code World ! !&#x1f973;&#x1f973; 一.Linux环境配置 1.JDK ①上传安装包到服…

BUUCTF 小明的保险箱 1

BUUCTF:https://buuoj.cn/challenges 题目描述&#xff1a; 小明有一个保险箱&#xff0c;里面珍藏了小明的日记本&#xff0c;他记录了什么秘密呢&#xff1f;。。。告诉你&#xff0c;其实保险箱的密码四位纯数字密码。 密文&#xff1a; 下载附件&#xff0c;得到一张.jpg…

普通unity项目升级URP管线渲染项目教程

普通unity项目升级URP管线渲染 安装URP插件创建URP渲染管线配置渲染管线升级素材的渲染管线方式一方式二 资源链接 安装URP插件 点击Window选择Package Manager在出现的窗口左上角选择Unity Registry搜索关键字Universal在出现的Universal RP插件中下面点击Install 创建URP渲染…

word自带公式,多个公式的左对齐

利用wold自带公式对公式进行编辑。 需要用多个公式表示&#xff0c;通常利用矩阵或大括号的形式&#xff0c;它们实现左对齐的方式一样。网络上主要说了两种方式&#xff1a; 1. shiftf7的方式&#xff0c;自己并没有成功实现。 2. 公式全选后单击右键&#xff0c; 原始数据…

UNIPOSE: DETECTING ANY KEYPOINTS(2023.10.12)

文章目录 AbstractIntroduction现有的方法存在哪些不足基于此&#xff0c;我们提出了哒哒哒取得惊人的成绩Related Work MethodMULTI -MODALITY PROMPTS ENCODING&#xff08;多模态提示编码&#xff09;Textual Prompt Encoder&#xff08;文本提示编码器&#xff09;Visual P…

保姆级安装Jdk,Tomact,Mysql在linux中并且部署项目

&#x1f31f;在这里&#xff0c;我要推荐给大家我的专栏《Linux》。&#x1f3af;&#x1f3af; &#x1f680;无论你是编程小白&#xff0c;还是有一定基础的程序员&#xff0c;这个专栏都能满足你的需求。我会用最简单易懂的语言&#xff0c;带你走进代码的世界&#xff0c;…

搭建高性能分布式存储-minio

文章目录 搭建高性能分布式存储-minioDocker搭建minio&#xff08;单机部署纠删码模式&#xff09;⭐创建minio的bucket&#xff08;桶&#xff09;⭐SpringBootminio项目实战 ⭐1&#xff1a;导入minio的maven依赖2&#xff1a;编写MinioProperties.class3&#xff1a;applica…

浪潮信息G7服务器智能高效的运维秘籍

数据中心的运维压力到底有多大&#xff1f;过去&#xff0c;IT圈里流传着这样一句话&#xff1a;一入运维深似海&#xff0c;从此下班是路人。随着人工智能、大数据、云计算等技术的成熟应用&#xff0c;数据中心走向集约化、规模化的趋势&#xff0c;数据中心的IT设备越来越繁…