C#容器源码分析 --- Dictionary<TKey,TValue>

news2025/4/19 2:53:03

Dictionary<TKey, TValue> 是 System.Collections.Generic 命名空间下的高性能键值对集合,其核心实现基于​​哈希表​​和​​链地址法(Separate Chaining)。

.Net4.8 Dictionary<TKey,TValue>源码地址:
dictionary.cs (microsoft.com)https://referencesource.microsoft.com/#mscorlib/system/collections/generic/dictionary.cs,d3599058f8d79be0

原理:

1.初始化:
一个字典会对应一个哈希桶数组,一个键值对数组,如下图所演示的测试图:

2.存储元素:
首先用传入的key值通过比较器计算一个hashcode,再取余得到哈希桶的索引值

这时字典中没有数据,通过上述索引值得到哈希桶中值是-1,

然后在键值对数组的索引为0处存储值,并将当前的取得哈希桶中的数据赋值给键值对当前数据的next指针,再将index赋值给哈希桶当前的数据。


------------------------------------------->

如果得到已经存储的哈希桶的索引值,就会存储到这个数据或者链地址上的数据的next指针为-1的位置。比如在现有的情况下,再次存储元素时,恰好计算出的哈希桶的索引值为0,这时就选择entries中的一个空位置或者是当前count对应的索引位置存储,

按例子的情况是存储在count对应的索引位置也就是1的位置,针对空闲的位置的存放也同理。

也就是将entries中索引为1的位置填充新存储的元素,将其next指针指向entries中索引为0的位置,最后将哈希桶中索引为0的位置设置为1。 

这样就完成了在哈希值取余之后发生冲突的链地址法解决方案。

3.移除元素:
移除元素也分为两部分,一部分是移除不在链地址上的元素,另一部分就是移除在链地址上的元素,按照上面的例子,就是分别移除entries索引0和1的处理方式:

 移除不在链地址上的元素时,也就是移除索引1的元素时

移除在链地址上的元素时,也就是移除索引为0的元素时 

内部结构:

1.主要字段和属性: 

1.buckets:这是一个整型数组,用作哈希桶。每个元素都代表一个桶的索引,而桶是用于存放键值对的链表的头节点(即entries中的元素索引)。
2.entries:这是一个 Entry 结构体数组,Entry 结构体包含键、值、哈希码以及指向下一个 Entry 的索引。
3.count:该字段表示 Dictionary 中当前键值对的数量。
4.version:这是版本号,在对 Dictionary 进行修改操作时,版本号会更新,主要用于在迭代期间检测集合是否被修改。
5.freeList:此为空闲列表的头索引,用于管理已删除的 Entry 槽位,方便后续复用。
6.freeCount:该字段表示空闲列表中 Entry 的数量。
7.comparer:这是一个 IEqualityComparer<TKey> 类型的比较器,用于比较键的相等性。
8.keys:这是一个 KeyCollection 类型的对象,用于表示 Dictionary 中的所有键。
9.values:这是一个 ValueCollection 类型的对象,用于表示 Dictionary 中的所有值。

表示当前字典中含有的键值对数量。
注:因为在字典中移除元素时,字典的count并没有改变,count只在freeCount(字典中空闲的数量)为0时,才进行增加的操作,所以在获取字典中有效的键值对数量时,需要用count - freeCount来计算。

2.构造函数:

1.无参构造函数指定初始容量的构造函数指定比较器的构造函数指定初始容量和比较器的构造函数

最终都调用了指定容量和比较器的构造函数。

1.CoreCLR 平台的特殊处理

HashHelpers.s_UseRandomizedStringHashing​​:
​​作用​​:标志位,指示是否启用​​随机化字符串哈希​​(防御哈希碰撞攻击)。
​​默认值​​:在 .NET Core 中通常为 true。
​​comparer == EqualityComparer<string>.Default​​:
​​条件​​:检测用户是否显式使用了默认的字符串比较器。
​​替换比较器​​:
this.comparer = (IEqualityComparer<TKey>) NonRandomizedStringEqualityComparer.Default;
​​目的​​
在启用随机化哈希的平台上,若用户未指定自定义比较器,强制使用​​非随机化比较器​​。
​​兼容性​​:确保与旧版本 .NET Framework 行为一致,避免因随机化哈希导致的跨版本不一致问题。

2.初始化容量
如果指定了容量就会调用到Initialize函数,如下:

通过HashHelpers.GetPrime得到一个新的值,作为哈希桶和键值对数组的容量,代码如下:
解释
1. min|1:确保 i 初始值为大于等于 min 的最小奇数。min | 1 将 min 的最低二进制位强制设为 1。若 min 是偶数,结果为 min + 1;若 min 是奇数,结果不变。
2.IsPrime(i):验证 i 是否为质数。
3.(i - 1) % Hashtable.HashPrime != 0:确保 i - 1 不能被预定义的质数 HashPrime 整除。

作用
上述代码通常用于哈希表扩容时选择新容量​​,其设计目标包括:
​​减少哈希冲突​​:选择质数作为容量,使哈希分布更均匀。
​​避免特定冲突模式​​:通过 (i - 1) % HashPrime != 0 排除某些可能导致冲突的值。
​​性能优化​​:跳过偶数和快速终止条件提升搜索效率。

 预制的质数表数据如下

2.指定键值对容器参数的构造函数、指定键值对容器和比较器参数的构造函数:

 3. 反序列化构造函数:

​此构造函数是 .NET 序列化机制中​​延迟加载模式​​的经典实现,确保复杂数据结构(如哈希表)在反序列化时的安全性和正确性。通过暂存 SerializationInfo 并在对象图构建完成后恢复数据,有效解决了依赖项初始化和哈希计算的时序问题。

核心原理​​
​​(1) 序列化流程​​
​​序列化时​​:调用 GetObjectData 方法(实现 ISerializable 接口),将字典的键值对、容量、比较器等数据写入 SerializationInfo。
​​反序列化时​​
框架通过反射调用此受保护构造函数,传入 SerializationInfo 和上下文。
​​不立即还原哈希表​​,而是将 SerializationInfo 暂存到 HashHelpers.SerializationInfoTable(一个静态字典),等待后续处理。
​​(2) 延迟加载的原因​​
​​依赖项未就绪​​:反序列化时,字典可能依赖其他尚未反序列化的对象(如自定义比较器)。
​​哈希码计算安全​​:某些键的 GetHashCode() 可能在反序列化时抛出异常(例如,键对象未完全初始化)。
​​(3) 完成反序列化​​
在对象图完全构造后,框架调用 IDeserializationCallback.OnDeserialization 方法,此时从 HashHelpers.SerializationInfoTable 中取出暂存的数据,重建哈希表的 buckets 和 entries 数组。

动态扩容:

在字典中扩容的调用有两处
1.字典中的元素已满:会通过一个函数重新找到一个新的容量值。

ExpandPrime代码如下:



2.字典中的哈希冲突的数量已达到阈值:传入新的容量的是entries当前长度,并强制更新hashcode。

扩容的主要方法如下

主要方法:

1.Add:调用字典中的Insert方法

2.Insert

3.Remove

4.Clear:将字典中的参数重置

5.FindEntry

6.ContainsKey

7.ContainsValue:需要遍历比对value是否相等

8.TryGetValue

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2336809.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

在 Visual Studio Code 中安装通义灵码 - 智能编码助手

高效的编码工具对于提升开发效率和代码质量至关重要。 通义灵码作为一款智能编码助手&#xff0c;为开发者提供了全方位的支持。 本文将详细介绍如何在 Visual Studio Code&#xff08;简称 VSCode&#xff09;中安装通义灵码&#xff0c;以及如何进行相关配置以开启智能编码…

idea报错java: 非法字符: ‘\ufeff‘解决方案

解决方案步骤以及说明 BOM是什么&#xff1f;1. BOM的作用2. 为什么会出现 \ufeff 错误&#xff1f;3. 如何解决 \ufeff 问题&#xff1f; 最后重新编译&#xff0c;即可运行&#xff01;&#xff01;&#xff01; BOM是什么&#xff1f; \ufeff 是 Unicode 中的 BOM&#xff0…

PHY芯片与网络变压器接线设计指南——不同速率与接口的硬件设计原则

一、PHY与网络变压器的核心作用 • PHY芯片&#xff08;物理层芯片&#xff09; • 功能&#xff1a;实现数据编码&#xff08;如Manchester、PAM4&#xff09;、时钟恢复、链路协商&#xff08;Auto-Negotiation&#xff09;。 • 接口类型&#xff1a;MII/RMII/GMII/RGMII/…

【学习笔记】计算机网络(八)—— 音频/视频服务

第8章 互联网上的音频/视频服务 文章目录 第8章 互联网上的音频/视频服务8.1概述8.2 流式存储音频/视频8.2.1 具有元文件的万维网服务器8.2.2 媒体服务器8.2.3 实时流式协议 RTSP 8.3 交互式音频/视频8.3.1 IP 电话概述8.3.2 IP电话所需要的几种应用协议8.3.3 实时运输协议 RTP…

linux: 文件描述符fd

目录 1.C语言文件操作复习 2.底层的系统调用接口 3.文件描述符的分配规则 4.重定向 1.C语言文件操作复习 文件 内容 属性。所有对文件的操作有两部分&#xff1a;a.对内容的操作&#xff1b;b.对属性的操作。内容是数据&#xff0c;属性其实也是数据-存储文件&#xff0c…

记录一次后台项目的打包优化

文章目录 前言分析问题寻找切入点根据切入点逐一尝试cdn引入node包遇到的一些问题记录最终结果 前言 优化&#xff0c;所有开发者到一定的程度上&#xff0c;都绕不开的问题之一 例如&#xff1a; 首页加载优化白屏优化列表无限加载滚动优化&#xff0c;图片加载优化逻辑耦合…

问题记录(四)——拦截器“失效”?null 还是“null“?

拦截器“失效”&#xff1f;null 还是"null"&#xff1f; 问题描述 这个问题本身并不复杂&#xff0c;但是却是一个容易被忽略的问题。 相信大家在项目中一定实现过强制登录的逻辑吧&#xff0c;巧了&#xff0c;所要介绍的问题就出现在测试强制登录接口的过程中&am…

图论整理复习

回溯&#xff1a; 模板&#xff1a; void backtracking(参数) {if (终止条件) {存放结果;return;}for (选择&#xff1a;本层集合中元素&#xff08;树中节点孩子的数量就是集合的大小&#xff09;) {处理节点;backtracking(路径&#xff0c;选择列表); // 递归回溯&#xff…

C++修炼:vector模拟实现

Hello大家好&#xff01;很高兴我们又见面啦&#xff01;给生活添点passion&#xff0c;开始今天的编程之路&#xff01; 我的博客&#xff1a;<但凡. 我的专栏&#xff1a;《编程之路》、《数据结构与算法之美》、《题海拾贝》、《C修炼之路》 欢迎点赞&#xff0c;关注&am…

案例-索引对于并发Insert性能优化测试

前言 最近因业务并发量上升,开发反馈对订单表Insert性能降低。应开发要求对涉及Insert的表进行分析并提供优化方案。   一般对Insert 影响基本都在索引,涉及表已按创建日期做了分区表,索引全部为普通索引未做分区索引。 优化建议: 1、将UNIQUE改为HASH(64) GLOBAL IND…

[区块链lab2] 构建具备加密功能的Web服务端

实验目标&#xff1a; 掌握区块链中密码技术的工作原理。在基于Flask框架的服务端中实现哈希算法的加密功能。 实验内容&#xff1a; 构建Flash Web服务器&#xff0c;实现哈希算法、非对称加密算法的加密功能。 实验步骤&#xff1a; 哈希算法的应用&#xff1a;创建hash…

muduo库源码分析: TcpConnection

一. 主要成员: socket_&#xff1a;用于保存已连接套接字文件描述符。channel_&#xff1a;封装了上面的socket_及其各类事件的处理函数&#xff08;读、写、错误、关闭等事件处理函数&#xff09;。这个Channel中保存的各类事件的处理函数是在TcpConnection对象构造函数中注册…

RuoYi-Vue升级为https访问-后端安装SSL证书(单台Linux服务器部署)

一、前言 当Nginx已经作为反向代理并成功配置了SSL证书时,前端客户端与Nginx的通信已经是加密的。但Nginx和后端服务之间的连接可能仍然存在明文传输的风险。 如果Nginx和后端服务位于同一台物理机器或者通过安全的内部网络(如私有VLAN或防火墙保护的内网)进行通信,则可以…

博客文章文件名该怎么取?

文章目录 &#x1f9fe; 1. 博客文章文件名该怎么取&#xff1f;&#x1f4cc; 2. 为什么文件名重要&#xff1f;✅ 3. 推荐命名规范✅ 3.1 使用 **小写英文 中划线&#xff08;kebab-case&#xff09;**✅ 3.2 简短但具备语义✅ 3.3 如果是系列文章&#xff0c;可加前缀序号或…

【Web API系列】Web Shared Storage API之WorkletSharedStorage深度解析与实践指南

前言 在现代Web开发领域&#xff0c;数据存储与隐私保护的矛盾始终存在。传统存储方案如LocalStorage和Cookies面临着日益严格的安全限制&#xff0c;而跨域数据共享的需求却在持续增长。正是在这样的背景下&#xff0c;Web Shared Storage API应运而生&#xff0c;其核心组件…

UE5 制作方块边缘渐变边框效果

该效果基于之前做的&#xff08;https://blog.csdn.net/grayrail/article/details/144546427&#xff09;进行修改得到&#xff0c;思路也很简单&#xff1a; 1.打开实时预览 1.为了制作时每个细节调整方便&#xff0c;勾选Live Update中的三个选项&#xff0c;开启实时预览。…

2.3 Spark运行架构与流程

Spark运行架构与流程包括几个核心概念&#xff1a;Driver负责提交应用并初始化作业&#xff0c;Executor在工作节点上执行任务&#xff0c;作业是一系列计算任务&#xff0c;任务是作业的基本执行单元&#xff0c;阶段是一组并行任务。Spark支持多种运行模式&#xff0c;包括单…

软件测试——BUG概念

目录 一、软件测试生命周期 二、BUG 2.1BUG概念 2.2BUG要素 2.3BUG级别 2.4 BUG的生命周期 2.5测试人员与开发人员因为BUG发生争执 2.6BUG评审 一、软件测试生命周期 软件测试贯穿于软件的整个生命周期 软件测试的生命周期指测试流程&#xff0c;每个阶段有不同的目标…

二、Android Studio环境安装

一、下载安装 下载 Android Studio 和应用工具 - Android 开发者 | Android DevelopersAndroid Studio 提供了一些应用构建器以及一个已针对 Android 应用进行优化的集成式开发环境 (IDE)。立即下载 Android Studio。https://developer.android.google.cn/studio?hlzh-c…

Hyperlane:重新定义Rust Web开发的未来 [特殊字符][特殊字符]

Hyperlane&#xff1a;重新定义Rust Web开发的未来 &#x1f680;&#x1f525; 大家好&#xff01;&#x1f44b; 今天我要向各位技术爱好者介绍一个令人兴奋的Rust HTTP服务器库——Hyperlane &#x1f31f;。作为一个轻量级、高性能的框架&#xff0c;Hyperlane正在悄然改变…