哈希表 基础理论

news2024/12/23 5:32:25

什么是哈希表?

哈希表英文名hash table,国内有一些书籍也翻译为散列表。哈希表是根据关键码的值而直接进行访问的数据结构。

直白来讲,其实数组就是一张哈希表,哈希表中关键码就是数组的索引下标,然后通过下标直接访问数组中的元素。

 哈希表用来解决什么问题呢?

一般哈希表都是用来快速判断一个元素是否出现在集合里。

例如要查询一个学生名字是否在这所学校里。

要枚举的话时间复杂度是O(n),但如果使用哈希表的话, 只需要O(1)就可以做到。

我们只需要初始化把这所学校里学生的名字都存在哈希表里,在查询的时候通过索引直接就可以知道这位同学在不在这所学校里了。

将学生姓名映射到哈希表上就涉及到了hash function ,也就是哈希函数

通俗的讲,以上述的查询学生名字问题为例,哈希表就是通过哈希函数将学生名字信息转化为一个索引,然后就可以直接查询索引就可以知道这个名字是否在学校中了。这需要额外的空间来存储哈希表。

哈希函数

哈希函数如下图所示,通过hashcode把名字转化为数值,一般hashcode是通过特殊的编码方式,可以将其他数据格式转化为不同的数值,这样就把学生名字映射为哈希表上的索引数字了。

哈希表的大小为tablesize,如果hashcode得到的数值大于了tablesize了,怎么办呢?

我们会对hashsize取模,保证索引数值都在tablesize中。(如果哈希表大小为100,就会将计算值除100取其余数,保证在100内)

刚才说过,哈希表就是一个数组,如果学生数量大于哈希表的大小怎么办?此时就算将哈希表填满,也总会有几位学生的名字映射到哈希表的同一索引下标的位置。这就是哈希碰撞

 哈希碰撞

如图所示,小李和小王都映射到了索引下标1的位置,这一现象叫做哈希碰撞。

 一般哈希碰撞有两种解决办法,拉链法和探测法。

拉链法

刚刚小李和小王在索引1的位置发生了冲突,发生冲突的元素都被存储在链表中。 这样我们就可以通过索引找到小李和小王了。

其实拉链法就是要选择适当的哈希表的大小,这样既不会因为数组空值而浪费大量内存,也不会因为链表太长而在查找上浪费太多时间。

 线性探测法

使用线性探测法,一定要把保证tablesize(哈希表大小)大于datasize(数据规模)。我们依靠哈希表中的空位来解决碰撞问题。

例如冲突的位置,放了小李,那么就向下找一个空位放置小王的信息。所以要求tableSize一定要大于dataSize ,要不然哈希表上就没有空置的位置来存放 冲突的数据了。

 常见的三种哈希结构

当想使用哈希法来解决问题时,我们一般会选择如下的三种数据结构。

  • 数组
  • set(集合)
  • map(映射)

在C++中,set和map分别有三种数据结构,其底层实现及优劣势如下:

集合底层实现是否有序数值是否可以重复能否更改数值查询效率增删效率
std::set红黑树有序O(log n)O(log n)
std::multiset红黑树有序O(logn)O(logn)
std::unordered_set哈希表无序O(1)O(1)

std::unordered_set底层实现是哈希表,std::set和std::multiset的底层实现是红黑树,红黑树是一种平衡二叉搜索树,所以key值是有序的,但是key值不能修改,修改key值会导致整棵二叉树的错乱,只能删除和增加。

映射底层实现是否有序数值是否可以重复能否更改数值查询效率增删效率
std::map红黑树key有序key不可重复key不可修改O(logn)O(logn)
std::multimap红黑树key有序key可重复key不可修改O(log n)O(log n)
std::unordered_map哈希表key无序key不可重复key不可修改O(1)O(1)

std::unordered_map的底层实现为哈希表,std::map和std::multimap底层实现为红黑树。同理,std::map和std::multimap的key也是有序的(这个问题也经常作为面试题,考察对语言容器底层的理解)。

当我们要使用集合来解决哈希问题时,优先考虑使用unordered_set,因为他的查询和增删效率最有,如果需要集合是有序的,就用set,如果要求不仅有序还要有重复数据,那么就用multiset。

那么再来看一下map ,在map 是一个key value 的数据结构,map中,对key是有限制,对value没有限制的,因为key的存储方式使用红黑树实现的。

虽然std::set、std::multiset 的底层实现是红黑树,不是哈希表,std::set、std::multiset 使用红黑树来索引和存储,不过给我们的使用方式,还是哈希法的使用方式,即key和value。所以使用这些数据结构来解决映射问题的方法,我们依然称之为哈希法。 map也是一样的道理。

总结

总结一下,当我们遇到了要快速判断一个元素是否出现集合里的时候,就要考虑哈希法

但是哈希法也是牺牲了空间换取了时间,因为我们要使用额外的数组,set或者是map来存放数据,才能实现快速的查找。

如果在做面试题目的时候遇到需要判断一个元素是否出现过的场景也应该第一时间想到哈希法!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/727975.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

华为云编译构建CodeArts Build新手操作指南

华为云编译构建(CodeArts Build)基于云端大规模并发加速,为客户提供高速、低成本、配置简单的混合语言构建能力,帮助客户缩短构建时间,提升构建效率。 本文将给各位开发者带来华为云CodeArts Pipeline的手把手初级教学…

亚马逊买家账号被封的原因

亚马逊封号原因有很多种情况,以下是一些可能导致账号被封的常见原因: 1、违反亚马逊的服务条款:亚马逊有一系列的服务条款和规定,如果您违反了这些规定,比如多次提交虚假评价、涉及欺诈行为、滥用退货政策等&#xff…

【深度学习】日常笔记9

泛化误差(generalization error)是指,模型应⽤在同样从原始样本的分布中 抽取的⽆限多数据样本时,模型误差的期望。考虑对掷硬币的结果(类别0:正⾯,类别1:反⾯)进⾏分类的…

AIGC - Stable Diffusion 图像控制插件 ControlNet (OpenPose) 配置与使用

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131591887 论文:Adding Conditional Control to Text-to-Image Diffusion Models ControlNet 是神经网络结构,用于控制预…

CentOS7安装详细安装

CentOS 7镜像下载 官网下载链接:http://isoredirect.centos.org/centos/7/isos/x86_64/ step1: 进入下载页,选择阿里云站点进行下载 Actual Country 国内资源 Nearby Countries 周边国家资源 阿里云站点:http://mirrors.aliyun.com/cento…

开源微服务框架是什么?看完这篇文章就知道了

随着低代码开发平台的快速发展,企业实现流程化管理的愿望指日可待。开源微服务框架是什么?都有哪些特点和优势?作为企业,想要提高办公协作效率,做好数据管理,应用专用的开发平台可以少走弯路,创…

【电子量产工具】6. 业务系统

文章目录 前言一、业务系统分析二、处理配置文件三、生成界面四、根据输入事件找到按钮五、业务系统总流程测试测试效果:总结 前言 最近看了 电子量产工具 这个项目,本专栏是对该项目的一个总结。 一、业务系统分析 前面实现了各个子系统:显…

【Java项目】Vue+ElementUI+Ceph实现多类型文件上传功能并实现文件预览功能

文章目录 效果演示前端后端Java 效果演示 先说一下我们的需求,我们的需求就是文件上传,之前的接口是只支持上传图片的,之后需求是需要支持上传pdf,所以我就得换接口,把原先图片上传的接口换为后端ceph,但是…

MV-Map论文研读

MV-Map MV-Map: Offboard HD-Map Generation with Multi-view Consistency 论文:https://arxiv.org/pdf/2305.08851.pdf code:https://github.com/ZiYang-xie/MV-Map 代码未开源 总体网络结构 简述 论文首次提出以非车载的方式产生高精度地图。可以…

基于QT使用7z压缩与解压总结

1. 概述 本文主要讲述使用7z第三方工具对文件或文件夹进行加密压缩和解密解压相关方法。7z的全称7-Zip,是一款开源软件。(资源主页:https://7-zip.org/)2. 设计原理 本文主要使用7z.exe通过命令行来实现压缩与解压功能&…

数据库之MySQL字符集与数据库操作

目录 字符集 CHRARCTER SET 与COLLATION的关联 CHRARCTER SET 定义 基础操作 查看当前MySQL Server支持的 CHARACTER SET 查看特定字符集信息(主要包含默认的COLLATION 与 MAXLEN) COLLATION 定义 COLLATION后缀 基础操作 查看MySQL Server支持的…

C++教程(一)开发环境visual studio的安装——图文详细

一、visual studio下载地址: 1、百度网盘 链接:https://pan.baidu.com/s/1QJosSoAT7EumuvyjtC_1Iw?pwdwuqz 提取码:wuqz 2、官网下载 Visual Studio: 面向软件开发人员和 Teams 的 IDE 和代码编辑器 (microsoft.com)https://visualstudio.…

【Linux】vi编辑器的使用,要求能新建、编辑、保存一个文本文件。

&#xff08;1&#xff09;点击”应用程序”→ “附件”→“终端”&#xff0c;打开终端&#xff0c;在终端输入命令&#xff1a; [rootlocalhost root]#vi kk.c按 i 键&#xff0c;进入插入状态。 &#xff08;2&#xff09;输入以下C程序 #include<stdio.h>int main( …

【CEEMDAN-WOA-LSTM】完备集合经验模态分解-鲸鱼优化-长短时记忆神经网络研究(Python代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

Java用native修饰的方法

今天看JDK ServerSocket源代码的时候&#xff0c;通过层层调用&#xff0c;到了用native修饰的方法&#xff0c;然后再也跟不下去了。 例如sun.nio.ch.Net类中下面的方法&#xff1a; Java方法如果用native修饰&#xff0c;就表示这个方法的实现不是用java实现的&#xff0c…

Element Ui Tree组件实现增、删、改、查、拖拽节点 的树形结构

介绍&#xff1a;首先组件 | Element官网某些功能都具备了&#xff0c;这里我就把这些功能结合在一起更完美的使用&#xff0c;其次编辑节点官网是没有实例&#xff0c;所以这里搞了一套较完整的功能&#xff0c;其次编辑和添加&#xff0c;这里直接使用了弹窗&#xff08;顾及…

单位列表单列出来,假(封装)组件

效果图&#xff1a; 因为每个页面都用到这个单位&#xff0c;所以把单位列表单列出来&#xff0c;假装是个封装的组件&#xff0c;在其他页面直接用。 源码&#xff1a; <template><div style"height: 48rem;overflow-y: scroll"><h4>单位列表<…

阿里云国际站代理商:阿里云是干什么的?阿里云app和建网站有什么关系?

标题&#xff1a;阿里云是干什么的&#xff1f;阿里云app和建网站有什么关系&#xff1f;   一、解析阿里云的业务范围   阿里云&#xff0c;作为阿里巴巴集团的关键业务板块&#xff0c;主要提供云计算、大数据、人工智能及其他信息化服务。通过其全球网络&#xff0c;阿里…

8 spring-boot访问静态资源

8.1 静态资源存放的位置 在资源目录下分别创建public和resources两个文件夹&#xff0c;static是一开始就存在的&#xff0c;静态资源可以存放在这三个文件夹中。当这三个文件夹同时出现相同的静态资源&#xff0c;如每个文件夹都有一个1.js时&#xff0c;则优先访问resources里…

vue 目录

vue学习资源 vue.js中文官网&#xff1a; http://cn.vuejs.org/ vue.js源码&#xff1a; https://github.com/vuejs/vue vue.js官方工具&#xff1a; https://github.com/vuejs vue.js英文官网&#xff1a; https://vuejs.org/ vue全家桶 介绍 介绍 【 Vue全家桶 Vue&#xff…