C语言实现Hash Map(3):Map代码优化

news2024/12/27 11:49:12

在上一节中,我们学习了C语言实现Hash Map(2):Map代码实现详解,通过代码,我们更深入地了解了Map实现的原理,学习了如何通过key找到对应的桶并加入节点。也正如上一节提到的,虽然这是github中star比较多的代码,但是程序还可以进一步地优化:

  • 程序桶的数量是在每次添加节点的时候自动调节的,即使用realloc函数重新分配
    • 可以固定一下默认的桶的大小,而不是每次都从0开始网上分配
    • 假设使用FreeRTOS,并没有realloc函数,所以将其改为动态分配和释放
  • 程序仅支持值为char *类型的映射,且值的数据是拷贝的
    • 支持不同数据类型的键
    • 支持拷贝值和保存值的指针两种方式

文章目录

  • 1 桶的默认大小
  • 2 桶的内存分配
  • 3 支持不同的数据类型
    • 3.1 数据结构修改
    • 3.2 map_init
    • 3.3 map_set
    • 3.4 map_get
  • 4 测试
  • 5 总结

1 桶的默认大小

首先来解决桶内存的问题。由上一节我们知道,在每次增加节点的时候,若当前节点的数量大于等于桶的数量,则会使用realloc重新分配桶内存。但这样的话,最开始从0开始,随着节点的增加,分配1、 2、 4、 8个桶,未免有点太麻烦了,也可能会产生一些内存碎片。所以我们希望在初始化的时候,就初始化固定的桶。

所以解决办法很简单,我们直接在初始化函数中传入一个默认的桶数量的参数,然后调用map_resize即可。

void map_init(unsigned int nbuckets)
{
	...
	assert((nbuckets % 2) == 0);
    map_resize(&base, nbuckets);
}

由上节课可知,map_bucketidx函数中使用的是按位与来获取余数,所以这里的nbuckets的值应为2的倍数,所以这里断言判断一下。

2 桶的内存分配

另外,在map_resize函数中使用的是stdlib.h库中的realloc函数,我们就在分配之前释放上一次分配的,然后使用MAP_MALLOC分配就行了。如下图所示:

在这里插入图片描述

由于我们设置了桶的默认大小,我们可以根据实际情况调整桶的大小,只要不超过这个大小,就不会调用到map_resize函数。

3 支持不同的数据类型

从代码中可以看出:

int map_set_(map_base_t *m, const char *key, void *value, int vsize)
{
	...
	memcpy((*next)->value, value, vsize);
	...
}

value传入的是一个指针,然后函数中使用memcpy拷贝的是指针指向地址里面的值。所以这种情况就导致我们map的值只能使用字符串或定义一个变量并传入地址。假设我们希望值为int类型,然后直接写入数值就不允许了。另外,有的时候我们又希望这个函数不要拷贝函数的内容,比如我们的值传入的就是常量字符串,那我们在函数中还又拷贝一次,这样浪费了内存。所以我们就来更改一下这部分的代码,让它既支持拷贝参数内容,又支持保存参数的地址。

3.1 数据结构修改

首先我们回顾一下之前的数据结构:

typedef map_t(void*) map_void_t;
typedef map_t(char*) map_str_t;
typedef map_t(int) map_int_t;
typedef map_t(char) map_char_t;
typedef map_t(float) map_float_t;
typedef map_t(double) map_double_t;

其中map_t为:

#define map_t(T)\
  struct { map_base_t base; T ref;}

我们知道,map实际的数据结构就是map_base_t,而这个T ref就是标记不同数据类型的唯一地方了。而且ref变量仅在下面用到:

#define map_get(m, key)\
  ( (m)->ref = map_get_(&(m)->base, key) )

也就是获取键值的是保存在这个变量中,但很明显,假设类型为intmap_get_却返回的是一个指针,类型明显不符。另外将结果保存在ref中似乎也没什么意义。所以我们直接删除ref这个变量,和所有的类型的typedef,直接typedef整个结构体就行了。

为了能够区别不同数据类型的长度,我们增加两个变量,typeSize表示数据类型的大小,isCpyAddr表示设置键值的时候是拷贝地址里的值(isCpyAddr=1),还是直接传入值给函数(拷贝参数,isCpyAddr=0)。然后将整个数据结构命名为map_c_t

typedef struct{
    map_base_t base;
    unsigned char typeSize;
    unsigned char isCpyAddr;
}map_c_t;

接下来我们就改下面三个函数:map_initmap_setmap_get,删掉宏定义的map_setmap_get

  • 对于其它几个宏定义和函数,如map_removemap_deinit等,自行更改一下,主要是将函数参数map_base_t修改为map_c_t即可。

3.2 map_init

原来的map_init是一个宏定义,然后用memset将整个map数据结构置0,现在我们将其改为函数。对于不同的数据类型,我们声明一个枚举类型供用户选择传参:

typedef enum{
    MAP_TYPE_VOID_PTR,    //void *
    MAP_TYPE_CHAR_PTR,    //char *
    MAP_TYPE_INT,         //int
    MAP_TYPE_CHAR,        //char
    MAP_TYPE_FLOAT,       //float
    MAP_TYPE_DOUBLE,      //double
}MAP_TYPE;

然后map_init函数如下:

void map_init(map_c_t *instance, MAP_TYPE type, unsigned char isCpyAddr, unsigned int nbuckets)
{
    memset(instance, 0, sizeof(map_c_t));
    switch(type)
    {
    case MAP_TYPE_VOID_PTR:{instance->typeSize = sizeof(void *);break;}
    case MAP_TYPE_CHAR_PTR:{instance->typeSize = sizeof(char *);break;}
    case MAP_TYPE_INT     :{instance->typeSize = sizeof(int);break;}
    case MAP_TYPE_CHAR    :{instance->typeSize = sizeof(char);break;}
    case MAP_TYPE_FLOAT   :{instance->typeSize = sizeof(float);break;}
    case MAP_TYPE_DOUBLE  :{instance->typeSize = sizeof(double);break;}
    default:break;
    }
    instance->isCpyAddr = isCpyAddr; //拷贝地址里的内容
    assert((nbuckets % 2) == 0);
    map_resize(&instance->base, nbuckets);
}
  1. 根据枚举类型保存数据的typeSize,这样比如在用户传入数字的时候,就知道拷贝多大的数据。
  2. isCpyAddr保存是否需要拷贝地址里的内容
  3. 最后根据设置的桶的初始大小来分配内存

3.3 map_set

我们直接来看一下代码前后的对比:

在这里插入图片描述

  1. 首先将原来的map_base_t改为我们定义的map_c_t,然后更改下面所有用到base的地方
  2. 这里vsize为我们传入的参数的大小,如果参数为字符串且我们用的是拷贝方式的话,我们需要传入vsize的大小,这样用户传入字符串的时候,我们就知道拷贝多大的长度。在其它时候,vsize可以传0,vsize就设置为数据类型对应的typeSize
  3. 最后就是根据isCpyAddr来判断是拷贝地址里的值还是拷贝地址,分别在节点已经存在时和创建节点时修改代码。

这里举一个例子,如果我们设置的是MAP_TYPE_INT,然后传入的值是123,那么这个void *类型的value的值就是123,如果直接用memcpy拷贝的话,就拷贝的是123这个地址里的值;所以传入123的时候我们就拷贝value的地址&value就行了。

3.4 map_get

map_get函数不需要做太大的改动,只要把参数改成我们定义的map_c_t,然后把map_getref中的参数改成&m->base就行了。

void *map_get(map_c_t *m, const char *key) {
  map_node_t **next = map_getref(&m->base, key);
  return next ? (*next)->value : NULL;
}

4 测试

这里我把各个类型的使用都写了一个例子,只需要更改TEST_MODE宏定义即可:

#include <stdio.h>
#include <stdlib.h>
#include "map.h"

#define TEST_MODE 1

static map_c_t langMap;
int main()
{
#if (TEST_MODE == 1)       //字符串测试:拷贝字符串地址[常用]
    map_init(&langMap, MAP_TYPE_CHAR_PTR, 0, 8);
    map_set(&langMap, "test", "1234", 0);
    char **ret = map_get(&langMap, "test");
    printf("%x %x = %s\r\n", "1234", *ret, *ret);
#elif (TEST_MODE == 2)     //字符串测试:拷贝字符串的值map_node_t后面的内存中(需要指定长度)
    map_init(&langMap, MAP_TYPE_CHAR_PTR, 1, 8);
    map_set(&langMap, "test", "1234", sizeof("1234"));
    char *ret = map_get(&langMap, "test");
    printf("%x %x = %s\r\n", "1234", ret, ret);
#elif (TEST_MODE == 3)     //int测试:保存数字的值到map_node_t后[常用]
    map_init(&langMap, MAP_TYPE_INT, 0, 8);
    map_set(&langMap, "test", 123, 0);
    int *ret = map_get(&langMap, "test");
    printf("%x = %d\r\n", *ret, *ret);
#elif (TEST_MODE == 4)     //int测试:拷贝int变量的值到map_node_t后
    const int a = 123;
    map_init(&langMap, MAP_TYPE_INT, 1, 8);
    map_set(&langMap, "test", &a, 0);
    int *ret = map_get(&langMap, "test");
    printf("%x %x = %d\r\n", &a, *ret, *ret);
#elif (TEST_MODE == 5)     //int测试:保存int变量的地址
    const int a = 123;
    map_init(&langMap, MAP_TYPE_INT, 0, 8);
    map_set(&langMap, "test", &a, 0);
    int **ret = map_get(&langMap, "test");
    printf("%x %x = %d\r\n", &a, *ret, **ret);
#elif (TEST_MODE == 6)     //char测试:拷贝字符的值到map_node_t后[常用]
    map_init(&langMap, MAP_TYPE_CHAR, 0, 8);
    map_set(&langMap, "test", 'a', 0);
    char *ret = map_get(&langMap, "test");
    printf("%x = %c\r\n", *ret, *ret);
#elif (TEST_MODE == 7)     //double测试:保存double变量地址到map_node_t后
    const double a = 3.14;
    map_init(&langMap, MAP_TYPE_DOUBLE, 0, 8);
    map_set(&langMap, "test", &a, 0);
    double **ret = map_get(&langMap, "test");
    printf("%x %x = %lf\r\n", &a, *ret, **ret);
#elif (TEST_MODE == 8)     //double测试:拷贝double变量的值到map_node_t后
    const double a = 3.14;
    map_init(&langMap, MAP_TYPE_DOUBLE, 1, 8);
    map_set(&langMap, "test", &a, 0);
    double *ret = map_get(&langMap, "test");
    printf("%x %x = %lf\r\n", &a, ret, *ret);
#else
    //1.float类型:代码同double
    //2.void *类型:这种情况一般是保存地址,所以map_init最后一个参数为0
#endif
    return 0;
}

这里来展示一下int作为值类型,传入数值时的演示结果:

在这里插入图片描述

可以看到,输出符合预期,0x7b是创建map_node_t节点时分配的内存地址里value的地址。

5 总结

本文基于Github上给的代码进行了一些小小的优化,使其可以适配不同的数据类型,并能够初始分配一个桶的内存。但正如前面所说,代码并没有完整做完适配,如map_deinit等函数还需要小小修改一下。大家可以自行修改,或者大家还有什么优化的建议都可以在我下面的git仓库中进行提交。

  • 完整代码:https://github.com/Vinolzy/map_fix

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1704732.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android数据缓存框架 - 内存数据载体从LiveData到StateFlow

引言&#xff1a;所有成功者的背后&#xff0c;都有一份艰苦的历程&#xff0c;不要只看到了人前的风光&#xff0c;而低估了他们背后所付出的努力。 随着flow到流行度越来越高&#xff0c;有开发者呼吁我使用flow&#xff0c;于是我就如你们所愿&#xff0c;新增了StateFlow作…

C语言 | Leetcode C语言题解之第115题不同的子序列

题目&#xff1a; 题解&#xff1a; int numDistinct(char* s, char* t) {int m strlen(s), n strlen(t);if (m < n) {return 0;}unsigned long long dp[m 1][n 1];memset(dp, 0, sizeof(dp));for (int i 0; i < m; i) {dp[i][n] 1;}for (int i m - 1; i > 0;…

工控屏(触摸屏)怎么连接电脑

一、使用USB接口连接 连接方法&#xff1a;使用USB线连接触摸屏和电脑&#xff0c;触摸屏会自动识别并连接到电脑上。 二、使用HDMI接口连接 连接方法&#xff1a;1.首先要确认您的触摸屏是否有HDMI接口&#xff1b;2.将一端连接到触摸屏&#xff0c;另一端连接到电脑&#…

台式机安装ubuntu过程

1.单系统参考 20231210-超详细Ubuntu20.04单系统安装_台式机安装ubuntu系统-CSDN博客 2.双系统参考 双系统启动效果_哔哩哔哩_bilibili 安装前一定要先清空电脑的硬盘数据&#xff0c;不然可能会出现以下图片异常 意思估计是分区被占用了&#xff0c;出现这个问题 &#xff0…

GeoJSON数据转shp文件

利用QGis工具,使用GeoJSON数据转换生成shp文件,用于GeoServer发布shp图层服务。 首先准备一份GeoJSON文件,文件格式为“.json”,文件接入如下: 详细操作如下: 1、启动QGis工具 2、从左上角找到按钮“open data source manager”,点击打开数据源 3、选择数据源,显示如…

vue3 uni-app 中小程序实现 底部tabbar 中间凸起部分 或者说自定义底部tabbar [保姆级别教程]

1、先来看一下效果 2、代码实现 我们还是在 pages.json 中正常配置我们底部的tabbar 但是需要 添加一个字段 "custom": true, //开启自定义tabBar 不填每次原来的tabbar在重新加载时都回闪现 3、 在 pages同一级 或者 里面创建一个 子组件 用来放我们的模版 4、 …

用源码建站可能涉及知产侵权,建站的注意!

近日普推知产老杨看到央视报道一家公司用了某建站源码涉及知产侵权&#xff0c;起诉了全国八千多家公司&#xff0c;某梦自从创始人因病转给某公司后&#xff0c;也在大量起诉用其建站代码公司侵权&#xff0c;他们也都是申请了相关的著作权。 有的中小企业在运营中会涉及建站…

Web组态可视化编辑器 快速绘制组态图

演示地址&#xff1a;by组态[web组态插件] 随着工业智能制造的发展&#xff0c;工业企业对设备可视化、远程运维的需求日趋强烈&#xff0c;传统的单机版组态软件已经不能满足越来越复杂的控制需求&#xff0c;那么实现Web组态可视化界面成为了主要的技术路径。 行业痛点 对于…

Akamai 最新版逆向分析 akamai逆向 dhl网址

原创文章&#xff0c;请勿转载&#xff01; 本文内容仅限于安全研究&#xff0c;不公开具体源码。维护网络安全&#xff0c;人人有责。 URL&#xff08;base64加密处理&#xff09;&#xff1a;aHR0cHM6Ly93d3cuZGhsLmNvbS9jbi16aC9ob21lL3RyYWNraW5nL3RyYWNraW5nLWVjb21tZXJ…

小米8SE刷root(面具)

首先准备好一根数据线&#xff0c;一部小米8SE手机&#xff0c;和一台电脑 接下来需要的软件我会给出链接和使用方法&#xff0c;以及分享我遇到的困难和解决方案 下面操作不会的&#xff0c;可以参考这个博主的教程&#xff0c;我也是跟着这个教程刷好的 第一步解锁BL 开启开…

OpenWrt 23.05 安装之后默认空间小 磁盘扩容 教程 软路由实测 系列六

1 安装fdisk opkg update opkg install fdisk #查看磁盘 rootOpenWrt:~# fdisk -l GPT PMBR size mismatch (246303 ! 250069679) will be corrected by write. The backup GPT table is not on the end of the device. Disk /dev/sda: 119.24 GiB, 128035676160 bytes, 25006…

在React中使用Sass实现Css样式管理-10

0. 什么是Sass Sass(Syntactically Awesome Stylesheets)是一个 CSS 预处理器&#xff0c;是 CSS 扩展语言&#xff0c;可以帮助我们减少 CSS 重复的代码&#xff0c;节省开发时间&#xff1a; Sass 引入合理的样式复用机制&#xff0c;可以节约很多时间来重复。支持变量和函…

【前端之ES6语法】

前端之ES6语法 1. ES6简介2. ES6新特性3.ES6不支持&#xff0c;使用babel3.1 参考文献 4.let和const命令5. 模版字符串6.函数之默认值、剩余参数7. 函数之扩展运算符、箭头函数8.箭头函数this指向和注意事项9.解构赋值10.对象扩展11.Symbol类型12.Set集合类型13.Map数据类型14.…

C++ | Leetcode C++题解之第116题填充每个节点的下一个右侧节点指针

题目&#xff1a; 题解&#xff1a; class Solution { public:Node* connect(Node* root) {if (root nullptr) {return root;}// 从根节点开始Node* leftmost root;while (leftmost->left ! nullptr) {// 遍历这一层节点组织成的链表&#xff0c;为下一层的节点更新 next…

第八大奇迹

目录 题目描述 输入描述 输出描述 输入输出样例 示例 输入 输出 运行限制 原题链接 代码思路 题目描述 在一条 R 河流域&#xff0c;繁衍着一个古老的名族 Z。他们世代沿河而居&#xff0c;也在河边发展出了璀璨的文明。 Z 族在 R 河沿岸修建了很多建筑&#xff0c…

Ps 滤镜:消失点

Ps菜单&#xff1a;滤镜/消失点 Filter/Vanishing Point 快捷键&#xff1a;Ctrl Alt V 两条平行的铁轨或两排树木连线相交于很远很远的某一点&#xff0c;这点在透视图中叫做“消失点”&#xff0c;也称为“灭点”。 消失点 Vanishing Point滤镜主要用于在图像中处理具有透视…

鸿蒙ArkTS声明式开发:跨平台支持列表【按键事件】

按键事件 按键事件指组件与键盘、遥控器等按键设备交互时触发的事件&#xff0c;适用于所有可获焦组件&#xff0c;例如Button。对于Text&#xff0c;Image等默认不可获焦的组件&#xff0c;可以设置focusable属性为true后使用按键事件。 说明&#xff1a; 开发前请熟悉鸿蒙开…

电磁仿真--CST综合建模练习1

1. 简介 本文展示一个CST自带的示例&#xff0c;在三维空间中使用带线计算传输线的S参数。基板顶部的带线通过小圆柱连接到底部的短带线&#xff0c;以便绕过可能存在的障碍。 结构生成 该结构完全通过参数输入进行建模&#xff0c;参考波长为10毫米&#xff0c;因此可以轻松…

HTML静态网页成品作业(HTML+CSS)——川西旅游介绍网页(2个页面)

&#x1f389;不定期分享源码&#xff0c;关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 &#x1f3f7;️本套采用HTMLCSS&#xff0c;未使用Javacsript代码&#xff0c;共有2个页面。 二、作品演示 三、代…

java_方法重写(覆盖)

介绍 现在我们来试一下 代码 父类 package b;public class father_ {//father class//4attributepublic void cry() {System.out.println("小动物叫唤");} } package b; 子类 public class graduate extends father_ {public void cry() {//子类方法//非私有的属性和…