STL空间配置器

news2024/11/17 23:50:34

参考《STL源码剖析-侯捷》一书 (SGI版本STL)

前置

六大组件

在这里插入图片描述

空间配置器实现

SGI版本的空间配置器有两个,一个名为allocator,一个名为alloc。前者符合部分标准,但效率不好,只是对operator newoperator delete进行了封装,没有做过多的处理。
而普通的内存申请方式会导致几个问题:

  1. 内存碎片的问题
    首先对于内存碎片的问题,很好理解。use代表已经分配了的内存,free代表空闲空间。此时如果用户要求分配4kb的内存,会发现找不到满足条件的内存块,尽管总体剩下了5kb,但是他们不是连续的
    在这里插入图片描述
  2. 效率问题
    假设用户当前需要1kb,那么OS就给用户1kb,然后待会又想要1kb,OS又得跑去分配1kb的大小空间给用户,这样就很头疼了。主要是因为,每一次系统分配空间是需要从用户态转变为内核态的,因为每一次分配空间都需要触发缺页中断(具体内容见内存管理之虚拟内存)
  3. 直接使用malloc与new进行申请,每块空间前有额外空间浪费,具体看Glibc之malloc实现原理
  4. 如果申请失败没有处理方案等等问题

所以,为了解决上述问题,STL采取了使用alloc来为容器管理空间。

具体实现思想

只贴少量代码,具体代码看侯捷老师的书,结合SGI版本的源码看,这里主要理清楚思想

首先,alloc主要分为两级空间配置器

一级空间配置器(__malloc_alloc_template)

思路非常简单,大于128字节的内存申请,使用一级空间配置器。其内部使用malloc()和free()两个C式接口完成内存开辟与释放。
开辟内存失败,仿写了C++中的set_new_handle(),即自定义自己的out-of-memory handler。这个handle是函数指针,作为回调函数的方式使用,当要求内存配置需求无法被系统满足时,在抛出bad_alloc异常之前,调用一个你指定的函数,也就是该handle指针指向的函数。

在当前SGI的处理中,如果内存申请失败,malloc返回NULL,则会进入OOM_malloc函数,也就是out_of_memory时的处理函数,该函数不断内循环以期成功获取内存,但如果没有自定义的内存获取失败处理函数也就是没有new_handle的话,就直接抛异常。

template <int inst>//该非类型参数没派上用场,所以在代码的最后一行,直接传了0
class __malloc_alloc_template
{
private:
	static void* oom_malloc(size_t);
public:
	// 对malloc的封装
	static void* allocate(size_t n)
	{
		// 申请空间成功,直接返回,失败交由oom_malloc处理
		void* result = malloc(n);
		if (0 == result)
			result = oom_malloc(n);
		return result;
	}
	// 对free的封装
	static void deallocate(void* p, size_t /* n */)
	{
		free(p);
	}
	// 模拟set_new_handle
	// 该函数的参数为函数指针,返回值类型也为函数指针
	// void (* set_malloc_handler( void (*f)() ) )()
	static void (*set_malloc_handler(void (*f)()))()
	{
		void (*old)() = __malloc_alloc_oom_handler;
		__malloc_alloc_oom_handler = f;
		return(old);
	}
};
// malloc申请空间失败时代用该函数
template <int inst>
void* __malloc_alloc_template<inst>::oom_malloc(size_t n)
{
	void (*my_malloc_handler)();
	void* result;
	for (;;)
	{
		// 检测用户是否设置空间不足应对措施,如果没有设置,抛异常,模式new的方式
		my_malloc_handler = __malloc_alloc_oom_handler;
		if (0 == my_malloc_handler)
		{
			__THROW_BAD_ALLOC;
		}
		// 如果设置,执行用户提供的空间不足应对措施
		(*my_malloc_handler)();
		// 继续申请空间,可能就会申请成功
		result = malloc(n);
		if (result)
			return(result);
	}
}
typedef __malloc_alloc_template<0> malloc_alloc;

二级空间配置器(__default_alloc_template)

小额区块带来的不仅是内存碎片,配置时的额外负担也是一个大问题,额外负担永远无法避免,但是区块越小,额外负担所占的比例就越大,愈显得浪费------《STL源码剖析》

二级空间配置器的实现要比一级空间配置器复杂得多。
之所以采用小于等于128字节大小的空间使用二级空间配置器,是因为SGI对于小块内存的定义为小于128字节。为了降低小块内存频繁申请的问题,故采用二级空间配置器。
其内部最主要的实现思路就是内存池。另:alloc默认采用二级空间配置器的模式进行内存分配。
在内存池中,采用哈希桶的方式来提高用户获取空间的速度与高效管理。
在这里插入图片描述
哈希桶:
在这里插入图片描述

当用户所需内存不满足哈希桶内的8的倍数的内存大小时,SGI二级空间配置器将会将内存需求量上调至8的倍数。
其中,每一个区块的节点如下方代码中union obj来维护,第一个字段用来指向下一个相同大小的区块的指针,第二个字段用来指向自己,因此通过使用union的方式来节省维护链表的空间;
分配策略如下:
在这里插入图片描述

enum { __ALIGN = 8 }; // 如果用户所需内存不是8的整数倍,向上对齐到8的整数倍
enum { __MAX_BYTES = 128 }; // 大小内存块的分界线
enum { __NFREELISTS = __MAX_BYTES / __ALIGN }; // 采用哈希桶保存小块内存时所需桶的个数

template <bool threads, int inst>//第一参数是多线程环境下使用的,不做讨论,太复杂,第二参数没排上用场
class __default_alloc_template
{
private:
	// 如果用户所需内存块不是8的整数倍,向上对齐到8的整数倍
	static size_t ROUND_UP(size_t bytes)
	{
		return (((bytes)+__ALIGN - 1) & ~(__ALIGN - 1));
	}
private:
	union obj
	{
		union obj* free_list_link;
		char client_data[1];
	};
private:
	static obj* free_list[__NFREELISTS];
	// 哈希函数,根据用户提供字节数找到对应的桶号
	static size_t FREELIST_INDEX(size_t bytes)
	{
		return (((bytes)+__ALIGN - 1) / __ALIGN - 1);
	}
	static void*refill(size_t n);
	// start_free与end_free用来标记内存池中大块内存的起始与末尾位置
	static char* start_free;
	static char* end_free;
	// 用来记录该空间配置器已经想系统索要了多少的内存块
	static size_t heap_size;
	
public:
	//在下面的代码块中展示,就不放在一起了
	static void* allocate(size_t n);
	static void deallocate(void* p, size_t n);
	static void* reallocate(void* p,size_t old_sz,size_t new_sz);
	
};
// 函数功能:向空间配置器索要空间
// 参数n: 用户所需空间字节数
// 返回值:返回空间的首地址
//该函数是空间配置器的标准接口函数->allocate
static void* allocate(size_t n)
{
	obj* __VOLATILE* my_free_list;
	obj* __RESTRICT result;
	// 检测用户所需空间释放超过128(即是否为小块内存)
	if (n > (size_t)__MAX_BYTES)
	{
		// 不是小块内存交由一级空间配置器处理
		return (malloc_alloc::allocate(n));
	}
	// 根据用户所需字节找到对应的桶号
	my_free_list = free_list + FREELIST_INDEX(n);
	result = *my_free_list;
	// 如果该桶中没有内存块时,向该桶中补充空间
	if (result == 0)
	{
		// 将n向上对齐到8的整数被,保证向桶中补充内存块时,内存块一定是8的整数倍
		void* r = refill(ROUND_UP(n));
		return r;
	}
	// 维护桶中剩余内存块的链式关系
	*my_free_list = result->free_list_link;
	return (result);
};
static void* deallocate(void* p, size_t n);//头插到哈希桶,具体不展示了,不然太长了。可以查看相关源码

allocate发现 free list 中没有可用区块了时
就调用 refill(),准备为 free list 重新填空间。新的空间将由内存池(经chunk alloc()完成)。默认取得20 个新节点(新区块),但万一内存池空间不足,获得的节点数 (区块数)可能小于 20。
refill流程图:
在这里插入图片描述
refill代码:

template <int inst>
char *__default_alloc_template<inst>::chunk_alloc(size_t size, int &
                                                                   nobjs)
{
    // 计算nobjs个size字节内存块的总大小以及内存池中剩余空间总大小
    char *result;
    size_t total_bytes = size * nobjs;
    size_t bytes_left = end_free - start_free;
    // 如果内存池可以提供total_bytes字节,返回
    if (bytes_left >= total_bytes)
    {
        result = start_free;
        start_free += total_bytes;
        return (result);
    }
    else if (bytes_left >= size)
    {
     // nobjs块无法提供,但是至少可以提供1块size字节内存块,提供后返回
        nobjs = bytes_left / size;
        total_bytes = size * nobjs;
        result = start_free;
        start_free += total_bytes;
        return (result);
    }
    else
    {
        // 内存池空间不足,连一块小块内存都不能提供
        // 向系统堆求助,往内存池中补充空间
        // 计算向内存中补充空间大小:本次空间总大小两倍 + 向系统申请总大小/16
        size_t bytes_to_get = 2 * total_bytes + ROUND_UP(heap_size >>
                                                         4);
        // 如果内存池有剩余空间(该空间一定是8的整数倍),将该空间挂到对应哈希桶中
        if (bytes_left > 0)
        {
            // 找对用哈希桶,将剩余空间挂在其上
            obj **my_free_list = free_list +
                                 FREELIST_INDEX(bytes_left);
            ((obj *)start_free)->free_list_link = *my_free_list;
            *my_ree_list = (obj *)start_free;
        }
        // 通过系统堆向内存池补充空间,如果补充成功,递归继续分配
        start_free = (char *)malloc(bytes_to_get);
        if (0 == start_free)
        {
            // 通过系统堆补充空间失败,在哈希桶中找是否有没有使用的较大的内存块
            int i;
            obj **my_free_list, *p;
            for (i = size; i <= __MAX_BYTES; i += __ALIGN)
            {
                my_free_list = free_list + FREELIST_INDEX(i);
                p = *my_free_list;
                // 如果有,将该内存块补充进内存池,递归继续分配
                if (0 != p)
                {
                    *my_free_list = p->free_list_link;
                    start_free = (char *)p;
                    end_free = start_free + i;
                    return (chunk_alloc(size, nobjs));
                }
            }
            // 山穷水尽,只能向一级空间配置器求助
            // 注意:此处一定要将end_free置空,因为一级空间配置器一旦抛异常就会出问题
            end_free = 0;
            start_free = (char *)malloc_alloc::allocate(bytes_to_get);
        }
        // 通过系统堆向内存池补充空间成功,更新信息并继续分配
        heap_size += bytes_to_get;
        end_free = start_free + bytes_to_get;
        return (chunk_alloc(size, nobjs));
    }
}

上述的 chunk_alloc() 函数以 end_free - start_free 来判断内存池的剩余容量。如果剩余容量充足,就直接调出 20 个块返给free list。如果剩余容量不足以提供 20个区块,但还足够供应一个以上的区块,就拨出这不足 20 个区块的空间出去。这时候其 nobjs 参数将被修改为实际能够供应的区块数,如果内存池连1个区块空间都无法供应,此时便利用 malloc()从 heap 中配置内存,为内存池分配更多空间以应付需求。新容量的大小为需求量的两倍,再加上一个随着配置次数增加而愈来愈大的附加量。

  • 举个例子,假设调用 chunk_alloc(32,20)(即需要20个32字节的区块),于是 malloc() 配置 40 个 32 bytes 区块,其中第1个交出,另19 个交给 free_list[3]维护,余20个留给内存池。

  • 调用chunk_alloc(64,20),此时 free list对应桶没有足够对应区块,必须向内存池要求支持。
    内存池只够供应10个64 bytes 区块,就把这10个区块返回,第1个交给用户,余 9个由 free lst[7] 维护。此时内存池全空。接下来再调用

  • 调用chunk_alloc(96,20),此时 free_list对应桶空空如也,必须问内存池要求文持
    而内存池此时也是空的,于是以 malloc()配置40+n (附加量)个96 bytes 区块,其中第1个交出,另19 个交给 free list[11] 维护,余 20+n (附加量)个区块,留给内存池

以上差不多就是SGI空间配置器的基本原理,想看详细分析的参见《STL源码剖析》。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1499275.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Java EE初阶二十九】Linux 系统的学习

当前写的博客系统程序,只是部署在咱们自己的电脑上,其他用户是无法直接访问的.由于 NAT 机制的存在,导致了IP 地址就被分成了 内网 IP 和 外网 IP. 云服务器,包括公司中使用专用服务器,一般都是 Linux 系统&#xff0c;这个系统的使用和 Windows 差异很大.(通过命令行来操作的系…

企业有多套系统需要集成,如何高效率实施项目?

企业有多套系统需要集成&#xff0c;如何解决&#xff1f; 许多企业为了提升业务效率、优化管理流程以及实现数据驱动决策&#xff0c;纷纷引入了多套信息系统。这些系统可能包括ERP&#xff08;企业资源计划&#xff09;、CRM&#xff08;客户关系管理&#xff09;、SCM&#…

时间序列分析技巧(一):根据ACF、PACF进行AR、MA、ARMA模型选择

程序员如何选择职业赛道&#xff1f; &#x1f349;CSDN小墨&晓末:https://blog.csdn.net/jd1813346972 个人介绍: 研一&#xff5c;统计学&#xff5c;干货分享          擅长Python、Matlab、R等主流编程软件          累计十余项国家级比赛奖项&#…

Linux网络内核基础框架

本文了解的具体内容与核心 TCP/IP 协议体系 应用层&#xff1a;为网络用户提供各种服务&#xff0c;例如电子邮件、文件传输等。表示层&#xff1a;为不同主机间的通信提供统一的数据表示形式。会话层&#xff1a;负责信息传输的组织和协调&#xff0c;管理进程会话过程。传输层…

Spark 核心API

核心 API spark core API 指的是 spark 预定义好的算子。无论是 spark streaming 或者 Spark SQL 都是基于这些最基础的 API 构建起来的。理解这些核心 API 也是写出高效 Spark 代码的基础。 Transformation 转化类的算子是最多的&#xff0c;学会使用这些算子就应付多数的数…

惊艳!AI助力,图像放大不再模糊!

文章目录 &#x1f4d6; 介绍 &#x1f4d6;&#x1f3e1; 演示环境 &#x1f3e1;&#x1f4d2; 使用方法/运行效果 &#x1f4d2;&#x1f48b; 效果演示 &#x1f388; 获取方式 &#x1f388;⚓️ 相关链接 ⚓️ &#x1f4d6; 介绍 &#x1f4d6; 在数字时代&#xff0c;图…

【Godot 4.2】Tree控件与TreeItem完全解析

概述 本篇是控件完全解析系列之一&#xff0c;主要总结一下Tree控件与TreeItem的使用。 Tree控件是一个非常强大的控件&#xff0c;尤其是在编写一些相关的程序或编辑器插件时&#xff0c;非常适合展示树形组织的节点型数据。 本篇将从简单的添加根节点&#xff0c;根节点子…

低通滤波器(SMART PLC双线性变换法)

低通滤波器的详细介绍可以参考信号处理专栏,常用链接如下: 1、双线性变换+欧拉后向差分 https://rxxw-control.blog.csdn.net/article/details/128586285https://rxxw-control.blog.csdn.net/article/details/1285862852、博途PLC一阶低通滤波器 https://rxxw-control.blo…

设计模式学习笔记(二):工厂方法模式

一、定义 工厂方法模式&#xff08;Factory Method Pattern&#xff09;是一种创建型设计模式&#xff0c;它提供了一种在不指定具体类的情况下创建对象的方法。工厂方法模式定义了一个用于创建对象的接口&#xff0c;让子类决定实例化哪一个类。工厂方法使一个类的实例化延迟…

大语言模型系列-GPT-3.5(ChatGPT)

文章目录 前言一、GPT-3.5的创新点二、GPT-3.5的训练流程SFT数据集RM数据集PPO数据集 三、ChatGPT的诞生总结 前言 《Training language models to follow instructions with human feedback&#xff0c;2022》 前文提到了GPT-3的缺点&#xff0c;其中最大的问题是&#xff1…

C++ 11 新特性 override和final

一.override和final介绍 在C11中&#xff0c;override和final是两个用于支持继承和多态的重要关键字。它们的具体作用如下&#xff1a; override&#xff1a;这个关键字用于派生类中&#xff0c;以确保虚函数的正确重写。当一个派生类的函数被声明为override时&#xff0c;编译…

【Ubuntu 20.04 / 22.04 LTS】最新 esp-matter SDK 软件编译环境搭建步骤

仓库链接&#xff1a;esp-matter SDK官方软件说明&#xff1a;ESP Matter Programming Guide官方参考文档&#xff1a;使用 Matter-SDK 快速搭建 Matter 环境 (Linux) 环境要求 Ubuntu 20.04 或 Ubuntu22.04网络环境支持访问 Gihub 在安装 esp-matter SDK 软件编译环境之前&a…

基于C++中netCDF库读取.nc数据时的一些坑

本文介绍基于C 语言的netCDF库读取.nc格式的栅格文件时&#xff0c;出现数据无法读取、数据读取错误、无法依据维度提取变量等情况的原因与解决方法。 最近&#xff0c;由于需要读取ERA5气象数据&#xff0c;因此使用C语言中的netCDF库读取.nc格式文件&#xff1b;这其中也是踩…

Docker基础教程 - 7 容器数据卷

更好的阅读体验&#xff1a;点这里 &#xff08; www.doubibiji.com &#xff09; 7 容器数据卷 什么是容器卷&#xff0c;为什么需要容器卷&#xff1f; 我们在运行容器的时候&#xff0c;产生的数据都是保存在容器内部的。如果使用Docker来运行mysql容器&#xff0c;数据…

网络性能优化工具

网络优化是 IT 行业的一个重要方面&#xff0c;网络很复杂&#xff0c;管理员努力保持其平稳运行&#xff0c;然而&#xff0c;网络环境也是不可预测和动态的&#xff0c;任何未受监控的问题都可能像滚雪球一样变成中断。 优化网络性能需要引入&#xff1a; 新设备和应用程序…

Axure RP 10:让原型设计更快、更直观、更智能 mac版

Axure RP 10是一款强大的原型设计工具&#xff0c;它能够帮助设计师快速创建高保真、交互式的原型&#xff0c;从而更好地展示和测试设计方案。这款软件凭借其直观易用的界面和丰富的功能&#xff0c;已经成为了许多设计师的首 选工具。 Axure RP 10 for Mac版软件获取 首先&a…

还在使用 RESTful API ? 试一试 GraphQL

前言 GraphQL 和 RESTful API 是两种不同的网络通信接口设计理念&#xff0c;它们都可以用于客户端和服务器之间的数据交换&#xff0c;但是有着不同的工作方式和特点。 各自的特点以及优缺点 GraphQL&#xff1a; 特点&#xff1a; 查询语言: GraphQL 是一个查询语言&…

【MySQL 系列】MySQL 架构篇

在我们开始了解 MySQL 核心功能之前&#xff0c;首先我们需要站在一个全局的视角&#xff0c;来看 SQL 是如何运作执行的。通过这种方式&#xff0c;我们可以在头脑中构建出一幅 MySQL 各组件之间的协同工作方式&#xff0c;有助于我们加深对 MySQL 服务器的理解。 文章目录 1、…

DEYO: DETR with YOLO for End-to-End Object Detection论文翻译

DEYO&#xff1a;DETR与YOLO用于端到端目标检测 摘要 DETR的训练范式在很大程度上取决于在ImageNet数据集上预训练其骨干。然而&#xff0c;由图像分类任务和一对一匹配策略提供的有限监督信号导致DETR的预训练不充分的颈部。此外&#xff0c;在训练的早期阶段匹配的不稳定性会…

利用Cocos游戏开发中的跑马灯祝女神们节日快乐

点击上方亿元程序员+关注和★星标 引言 Cocos游戏开发中的跑马灯广播效果 大家好,今天是国际劳动妇女节,也就是我们如今熟知的女神节。 今天打算通过游戏开发中的跑马灯广播这最直接的方式祝女神们节日快乐! 跑马灯作为游戏中常见的UI元素,通常被用来展示重要的信息或者…