[leetcode刷题]面试经典150题之9python哈希表详解(知识点+题合集)

news2024/9/28 11:38:57

为了方便理解哈希表,我们先从python中的字典讲起。

字典 (Dictionary)

字典是 Python 中一种内置的数据结构,它是一种 键值对(key-value pair)存储形式。每个键(key)都有一个对应的值(value)。字典的特点是键是唯一的,而值可以是任何数据类型。字典允许我们通过键快速查找对应的值。

# 定义一个字典
my_dict = {
    'name': 'Alice', 
    'age': 25, 
    'city': 'New York'
}

# 访问字典中的值
print(my_dict['name'])  # 输出 'Alice'
print(my_dict['age'])   # 输出 25

在这个字典 my_dict 中:

  • 'name', 'age', 'city'键(key)
  • 'Alice', 25, 'New York'值(value)

通过键,你可以快速查找对应的值。

字典相关的常用函数

  1. keys():返回字典中所有的键。

print(my_dict.keys())  # 输出 dict_keys(['name', 'age', 'city'])

 2.values():返回字典中所有的值。

print(my_dict.values())  # 输出 dict_values(['Alice', 25, 'New York'])

3.items():返回字典中的所有键值对,形式是 (key, value) 的元组。

print(my_dict.items())  # 输出 dict_items([('name', 'Alice'), ('age', 25), ('city', 'New York')])

4.get():通过键获取值,但如果键不存在,不会报错,而是返回 None 或自定义的默认值。

print(my_dict.get('name'))  # 输出 'Alice'
print(my_dict.get('country', 'USA'))  # 输出 'USA',因为'country'键不存在

字典背后的实现机制是 哈希表。哈希表是一种数据结构,它使用一种称为哈希函数的算法,将键映射到存储数据的位置。这种映射允许字典在平均情况下能够非常快速地查找数据。

哈希表的基本概念

  • 哈希函数(Hash Function):将输入的数据(通常是键)转化为一个整数(称为哈希值),并使用这个整数作为存储位置的索引。
  • 哈希值(Hash Value):由哈希函数生成的整数值,它决定了数据存储在哈希表中的位置。
  • 哈希表(Hash Table):一种通过哈希函数将键映射到值的结构,类似于一个巨大的数组,使用哈希值作为数组的索引。

2. 哈希表的工作原理

2.1 插入数据
  1. 哈希函数:对于每个键 key,通过哈希函数 hash(key) 计算出哈希值(一个整数)。
  2. 映射到索引:这个哈希值决定了数据在哈希表中的存储位置。通常,哈希表的大小是有限的,所以我们会使用 模运算 将哈希值映射到一个较小的索引范围上。
    • 假设哈希表的大小为 N,那么存储位置为 hash(key) % N
  3. 存储键值对:将键和对应的值存储到计算出的索引位置。

2.2 查找数据
  1. 通过哈希函数计算哈希值:首先对要查找的键 key 计算哈希值。
  2. 查找存储位置:根据哈希值查找存储位置,读取存储在该位置的值。

3. 哈希冲突 (Hash Collision)

由于哈希表的大小有限,不同的键通过哈希函数可能会映射到相同的位置,这种现象称为 哈希冲突

3.1 处理哈希冲突的方法
  1. 链地址法(Separate Chaining)

    • 在每个哈希表的索引位置存储一个链表,当多个键映射到同一个位置时,使用链表存储这些键值对。
哈希表:
Index 0: [(key1, value1), (key2, value2)]  # key1 和 key2 发生了冲突
Index 1: [(key3, value3)]

      2.开放地址法(Open Addressing)

  • 如果发生冲突,寻找下一个空闲的位置(通过某种探测方式,如线性探测、二次探测等),将新的键值对存储到下一个空位。

4. 哈希表的优缺点

4.1 优点:
  1. 查找、插入、删除速度快:平均时间复杂度是 O(1)。
  2. 高效性:在数据量较大的情况下,哈希表仍能保持良好的性能。
  3. 简单性:插入和查找操作都非常简单,通过键直接查找到值。
4.2 缺点:
  1. 哈希冲突:虽然哈希表的查找和插入操作在平均情况下是 O(1),但是如果哈希冲突较多,最坏情况下时间复杂度可能上升到 O(n)。
  2. 无序性:哈希表通常不维护元素的顺序,数据是以哈希值的顺序存储的,因此元素的顺序是不可预测的。
  3. 空间浪费:哈希表通常需要分配大量空间来减少冲突,这可能导致一定的空间浪费。

5. 哈希表在 Python 字典中的应用

在 Python 中,字典就是使用哈希表实现的。当你向字典中插入、删除或查找元素时,Python 背后会使用哈希函数计算键的哈希值,并将键值对存储在相应的存储位置。

  • 通过哈希表,Python 字典在绝大多数情况下能够实现 O(1) 的查找和插入操作。
  • Python 字典通过链地址法来处理哈希冲突。

下面我们结合一些题来深入学习哈希表

例1 

字母异位词分组

给你一个字符串数组,请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。

字母异位词 是由重新排列源单词的所有字母得到的一个新单词。

思路

因为字母异位词的特点是它们的字母相同、顺序不同,我们可以通过对每个单词的字母排序,得到一个唯一的“标准形式”作为哈希表的键。例如,"eat" 和 "tea" 都排序为 "aet"。我们把相同键(排序后的字母组合)的单词存放在哈希表对应的值(列表)里。这样,哈希表的每一个键对应的列表就是一组字母异位词,最后返回这些列表即可。

代码

class Solution:
    def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
        # 创建哈希表,默认值为列表
        hash_map = defaultdict(list)

        # 遍历每个字符串
        for word in strs:
            # 将字符串按字母排序,并作为哈希表的键
            sorted_word = ''.join(sorted(word))
            # 将原始字符串加入对应的列表
            hash_map[sorted_word].append(word)

        # 返回哈希表的值,即每个异位词的组合
        return list(hash_map.values())

例2

两数之和

给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target  的那 两个 整数,并返回它们的数组下标。

你可以假设每种输入只会对应一个答案,并且你不能使用两次相同的元素。

你可以按任意顺序返回答案。

思路

这个题是力扣的第一个题,刚开始刷力扣的时候以为很简单,结果想了半天也没想出来,现在学完哈希表再做就容易多了。思路就是形成一个哈希表,将列表中的数作为键值,该数对应的位置作为值,为了避免重复的数,我们使用做差的方式,只返回一个值和一个位置组合。

代码

class Solution:
    def twoSum(self, nums: List[int], target: int) -> List[int]:
        d={}
        for i in range(len(nums)):
            a=target-nums[i]
            if a in d:
                return [d[a],i]
            d[nums[i]]=i

例3

存在重复元素 II

给你一个整数数组 nums 和一个整数 k ,判断数组中是否存在两个 不同的索引 i 和 j ,满足 nums[i] == nums[j] 且 abs(i - j) <= k 。如果存在,返回 true ;否则,返回 false 。

思路

这个题我看解题中说必须要用set函数才能做,其实跟例2一样,用个哈希表就做出来了。

  1. 哈希表记录最近的索引:创建一个哈希表,键是数组的元素,值是该元素最后出现的索引。
  2. 遍历数组
    • 如果当前元素已经在哈希表中,检查它的上一次出现的索引与当前索引之差是否小于等于 k。如果满足条件,返回 true
    • 如果不满足条件,更新该元素的最新索引为当前索引,继续遍历。
  3. 如果遍历结束仍未找到符合条件的索引对,返回 false

代码

class Solution:
    def containsNearbyDuplicate(self, nums: List[int], k: int) -> bool:
        d = {}  # 用于存储数字和对应的索引
        for i in range(len(nums)):
            if nums[i] in d and i - d[nums[i]] <= k:  # 检查是否存在,并且索引差值是否小于等于k
                return True
            d[nums[i]] = i  # 更新索引为当前i
        return False

例4

 最长连续序列

给定一个未排序的整数数组 nums ,找出数字连续的最长序列(不要求序列元素在原数组中连续)的长度。

请你设计并实现时间复杂度为 O(n) 的算法解决此问题。

思路:

  1. 使用哈希表来记录数组中的所有数字:我们可以将所有数字存入哈希表,以便能够快速检查一个数字是否存在。
  2. 寻找序列起点:一个数字是序列的起点当且仅当它的前一个数字不在哈希表中。例如,数字 x 是一个序列的起点当 x - 1 不存在于哈希表中。
  3. 向后查找最长的连续序列:对于每一个序列起点,我们通过不断寻找它的下一个数字,直到找到该序列的末尾。然后计算序列的长度。
  4. 记录最长序列的长度:遍历过程中,记录找到的最长连续序列的长度。

算法步骤:

  1. 将所有的数字存入哈希表,确保查找的时间复杂度为 O(1)。
  2. 对于每个数字,只有当它是序列的起点时(即它的前一个数字不在哈希表中),才开始向后寻找。
  3. 计算从这个起点开始的序列长度,并更新最长的长度。
  4. 返回最长的长度。

代码

class Solution:
    def longestConsecutive(self, nums: List[int]) -> int:
        # 将所有数字存入哈希表中,便于查找
        num_set = set(nums)
        longest_streak = 0

        # 遍历每个数字
        for num in num_set:
            # 只有当 num 是序列的起点时,才开始查找
            if num - 1 not in num_set:
                current_num = num
                current_streak = 1

                # 不断找下一个连续的数字
                while current_num + 1 in num_set:
                    current_num += 1
                    current_streak += 1

                # 更新最长序列的长度
                longest_streak = max(longest_streak, current_streak)

        return longest_streak

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2173353.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

100个Transformer面试题,附答案!收藏这一篇就够了!

前言 Transformer是一种用于自然语言处理&#xff08;NLP&#xff09;和其他序列到序列&#xff08;sequence-to-sequence&#xff09;任务的深度学习模型架构&#xff0c;它在2017年由Vaswani等人首次提出。Transformer架构引入了自注意力机制&#xff08;self-attention mec…

力扣 简单 112.路径总和

文章目录 题目介绍题解 题目介绍 题解 class Solution {public boolean hasPathSum(TreeNode root, int targetSum) {// 只在最开始的时候判断树是否为空if (root null) {return false;}targetSum - root.val;if (root.left null && root.right null) { // root 是…

zookeeper 服务搭建(集群)

准备3台虚拟机&#xff0c;ip分别是&#xff1a; 192.168.10.75 192.168.10.76 192.168.10.77 准备3个节点 mkdir /usr/local/cluster cd /usr/local/cluster git clone https://gitee.com/starplatinum111/apache-zookeeper-3.5.9-bin.git 重命名文件夹 mv apache-zookeeper…

uniapp踩坑 tabbar页面数据刷新了但视图没有更新

问题描述&#xff1a; 有个uni-data-checkbox组件&#xff0c;两个选项&#xff1a;选项1和选项2&#xff08;对应的value值分别为1和2&#xff09;&#xff0c;v-model绑定属性名为value 两个tabbar页面&#xff1a;tab1&#xff0c;tab2。 tab1页面有个逻辑是在onShow中刷新v…

【开源免费】基于SpringBoot+Vue.JS新闻推荐系统(JAVA毕业设计)

本文项目编号 T 056 &#xff0c;文末自助获取源码 \color{red}{T056&#xff0c;文末自助获取源码} T056&#xff0c;文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析 六、核心代码6.1 查…

Docker官网新手入门教程:从零开始玩转容器

大家好&#xff0c;今天咱们来聊聊Docker这个时髦的容器技术。 什么是Docker&#xff1f; Docker就像是一个打包快递的师傅&#xff0c;它能把你的应用程序和它所依赖的一切打包成一个标准的容器。这个容器可以在任何安装了Docker引擎的机器上运行&#xff0c;而且不会受到底…

9.28今日错题解析(软考)

目录 前言面向对象技术——UML软件工程——软件能力成熟度模型&#xff08;CMM&#xff09;程序设计语言——编译 前言 这是用来记录我备考软考设计师的错题的&#xff0c;今天知识点为UML、软件能力成熟度模型&#xff08;CMM&#xff09;和编译&#xff0c;大部分错题摘自希…

Linux基础(三):安装CentOS7

1.分区设置 由于使用 GPT 的关系&#xff0c; 因此根本无须考虑主/延伸/逻辑分区的差异。CentOS 默认使用 LVM 的方式来管理你的文件系统。使用GPT进行分区&#xff1a; 开机管理程序&#xff08; boot loader&#xff09; 使用CentOS 7.x默认的grub2软件。 2.各种分区格式 …

Redis: 特点,优势,与其他产品的区别,版本演进,以及高并发原理

入门Redis概述 1 &#xff09;选择Redis是因为其高性能 因为 Redis 它数据存储的机制是存在内存中的&#xff0c;减少了传统关系数据库的磁盘IO它是单线程的保证了原子性&#xff0c;它还提供了事务&#xff0c;锁等相关的机制 2 &#xff09;Redis 环境安装配置 linux 或 d…

实现语音合成的三种方法:HTML5 Web Speech 、speak-tts、百度语音合成

1. 使用HTML5 Web Speech API 1.1 使用方法 window.speechSynthesis 是HTML5 Web Speech API的一部分&#xff0c;是浏览器原生提供的文本转语音功能。它允许开发者在网页上通过JavaScript调用&#xff0c;将文本转换为语音进行播放。 https://developer.mozilla.org/zh-CN/d…

Cocos Creator 剪裁精灵图片方法记录(7)

Cocos Creator 剪裁精灵图片方法记录 start 最近拿到一些图片资源&#xff0c;但是都需要自己手动切割。类似unity的话有专门点击精灵工具自动帮你切割了&#xff0c;但是目前没有找到cocos中有这种工具。所以记录一下相关方法、 解决方案-Photoshop 最好的方式就是直接用 …

计算机毕业设计 在线项目管理与任务分配系统的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍&#xff1a;✌从事软件开发10年之余&#xff0c;专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精…

[Redis][集群][上]详细讲解

目录 0.前言1.基本概念2.数据分片算法0.前言1.哈希求余2.一致性哈希算法3.哈希槽分区算法(Redis使用) 0.前言 说明&#xff1a;该章节相关操作不需要记忆&#xff0c;理解流程和原理即可&#xff0c;用的时候能自主查到即可 1.基本概念 哨兵模式提高了系统的可用性&#xff0…

数据交易知多少?从零到一的数据交易指南

在数字经济浪潮汹涌的今天&#xff0c;数据已成为推动社会进步和经济发展的关键生产要素。从政府决策到企业运营&#xff0c;从城市管理到个人生活&#xff0c;数据的价值日益凸显。那么数据流通交易机制及公共数据在各个领域的应用你都知道吗&#xff1f; 一、数据要素 数字经…

OFDM通信系统发射端需要做ifftshift的原因分析

对频率为15Hz的正弦波信号进行FFT分析&#xff0c;并且直接画图&#xff0c;matlab代码如下&#xff1a; fs 100; % sampling frequency t 0:(1/fs):(10-1/fs); % time vector S cos(2*pi*15*t); n length(S); X fft(S); f (0:n-1)*(fs/n); %frequenc…

react 常用hooks封装--useReactive

概述 一种具备响应式的useState 我们知道用useState可以定义变量格式为&#xff1a; const [count, setCount] useState(0) 通过 setCount 来进行设置&#xff0c;count 来获取&#xff0c;使用这种方式才能够渲染视图 来看看正常的操作&#xff0c;像这样 let count 0;…

open-resty 服务安装redis插件

从github下载 作者&#xff1a;程序那点事儿 日期&#xff1a;2023/11/16 22:04 lua-resty-redis-cluster cd /usr/local/openresty/modules #进入到modules目录git clone https://github.com/cuiweixie/lua-resty-redis-cluster.git #下载插件mv lua-resty-redis-cluster/ …

数据结构编程实践20讲(Python版)—03栈

本文目录 03 栈 StackS1 说明S2 示例基于列表的实现基于链表的实现 S3 问题&#xff1a;复杂嵌套结构的括号匹配问题求解思路Python3程序 S4 问题&#xff1a;基于栈的阶乘计算VS递归实现求解思路Python3程序 S5 问题&#xff1a;逆波兰表示法(后缀表达式)求值求解思路Python3程…

unix中父进程如何获取子进程的终止状态

一、前言 本文将介绍在unix系统中&#xff0c;父进程如何获取子进程的终止状态。本文主要围绕如下函数展开&#xff1a; 1.wait 2.waitpid 3.waitid 4.wait3、wait4 在讨论这些函数前&#xff0c;先介绍一个进程从创建到释放子进程的过程。 二、子进程的创建以及终止 在unix…

【Java】单元测试【主线学习笔记】

文章目录 前言测试分类JUnit单元测试介绍编写单元测试方法的条件IDEA中简易使用JUnit 前言 Java是一门功能强大且广泛应用的编程语言&#xff0c;具有跨平台性和高效的执行速度&#xff0c;广受开发者喜爱。在接下来的学习过程中&#xff0c;我将记录学习过程中的基础语法、框架…