接前一篇文章:Linux内核有什么之内存管理子系统有什么第一回 —— 引言
一、单刀直入 —— 一切从malloc开始
想必大家都使用过malloc(),malloc的全称是memory allocation,中文叫做动态内存分配。其用于申请一块连续的指定大小的内存块区域以void *类型返回分配的内存区域地址。
一般的工程师尤其是上层应用工程师知道怎么用这个函数就可以了,如果再能知道它是从堆(heap)中分配,并且能够注意通过free()释放内存从而避免内存泄漏,就算是比较优秀的工程师了。但那是对于应用工程师而言的,对于底层内核工程师,要求远不止于此。我们要知道malloc()的底层机制,具体是怎样由上到下、由应用到内核的,在内核中都做了哪些工作,最终又是如何返回给应用的。
先来看一下malloc的定义。在Linux终端下通过man malloc查看其说明,如下所示:
名称
malloc
原型
#include <stdlib.h>
void *malloc(size_t size);
说明
malloc()函数分配size个字节,并返回一个指向已分配内存的指针。此分配到的内存并未初始化。如果大小为0,那么malloc()返回NULL,或者返回一个唯一的指针值,该值稍后可以成功传递给free()。
返回值
malloc()函数返回一个指向已分配内存的指针,该指针适合任何内置类型。出现错误时,这些函数返回NULL。成功调用malloc()且大小为零,也可能返回NULL。
注
默认情况下,Linux遵循乐观的内存分配策略。这意味着当mallo()返回非NULL时,不能保证内存真的可用。如果系统内存不足,一个或多个进程将被OOM杀手杀死。有关更多信息,请参阅proc(5)中/proc/sys/vm/overcommit_memory和/proc/sys/vm/oom_adj的描述,以及Linux内核源文件Documentation/vm/overcommit-accounting.rst。
通常,malloc()从堆中分配内存,并根据需要使用sbrk(2)调整堆的大小;当分配大于MMAP_THRESHOLD字节的内存块时,glibc malloc()实现使用mmap(2)将内存分配为私有匿名映射。MMAP_THRESHOLD默认为128kB,但可以使用mallopt(3)进行调整。
在Linux内核4.7之前,使用mmap(2)执行的分配不受RLIMIT_DATA资源限制的影响;自Linux内核 4.7以来,对于使用mmap(2)执行的分配,也强制执行了此限制。
为了避免多线程应用程序中的损坏,在内部使用互斥锁来保护这些函数所使用的内存管理数据结构。在线程同时分配和释放内存的多线程应用程序中,可能存在对这些互斥对象的争用。为了在多线程应用程序中可伸缩地处理内存分配,如果检测到互斥争用,glibc会创建额外的内存分配区域。每个arena都是一个大的内存区域,由系统内部分配(使用brk(2)或mmap(2)),并使用自己的互斥对象进行管理。
从上边man中对于malloc()的说明可以看到,通过malloc()申请一个堆内的空间,底层要么执行brk,要么执行mmap。
brk是一个系统调用,其入口函数是sys_brk;mmap也是一个系统调用,其入口是sys_mmap。
下一回开始对于这两个系统调用进行深入解析。