heap pwn 入门大全 - 1:glibc heap机制与源码阅读(上)

news2024/12/26 11:36:26

本文为笔者学习heap pwn时,学习阅读glibc ptmalloc2源码时的笔记,与各位分享。可能存在思维跳跃或错误之处,敬请见谅,欢迎在评论中指出。本文也借用了部分外网和其他前辈的素材图片,向各位表示诚挚的感谢!如有侵权,请联系笔者删除。

glibc的堆管理器为ptmalloc2

heap management

堆管理器向kernel申请批量内存,自己管理,堆的内存管理空间称为 arena,堆管理器与用户的内存交易发生在arena中

operations

  • malloc
    • n=0时,返回允许的堆的最小内存块
      • n<0时,size_t 为无符号数,通常无法分配这么大的内存,返回ERRNOMEM
  • free
    • p 为空指针:无操作
    • p 已经释放后,double free
    • 当释放较大内存块后,manager通过系统调用将内存直接还给系统

syscalls

  • (s)brk

  • 堆的内存布局由两个指针控制:start_brk, brk,分别为开始和结尾
    在这里插入图片描述

  • mmap

    • malloc 使用mmap创建独立的匿名映射段,可以申请全0内存,且此内存仅被调用进程所调用

    • void *mmap(void addr[.length], size_t length, int prot, int flags,
                        int fd, off_t offset);
      
    • Flags - MAP_ANONYMOUS: 该区域为匿名映射,不与任何文件关联,内存赋初值为0

    • 当单次申请超过128KB内存,并且arena中没有剩余空间,则直接调用mmap申请内存,而不是brk

多线程支持

与之前实现中多线程共享一个堆不同,ptmalloc2中,所有的线程共享多个堆,在堆申请、释放时,不需要等待其他线程退出临界区 critical area

使用pthread多线程,自线程申请的堆单独建立,

在这里插入图片描述

上图为thread malloc(0x32000)后的vmmap情况,其中:

  • heap: 为main_arena空间,为初始化大小0x21000

  • vmmap堆创建时,总共会申请得到1MB内存(0x7ffff00- ~ 0x7ffff40-),其中仅有132KB(0x7ffff0000000 ~ 0x7ffff0021000 = 0x21000B)内存可以作为堆内存进行读写,这是堆默认初始大小,当malloc大于0x20000,会直接使用mmap而不是在堆中创建

  • 由于申请的size大于initial heap size,于是进行了扩充

  • pwndbg> heap		// in thread 2
    Allocated chunk | PREV_INUSE | NON_MAIN_ARENA
    Addr: 0x7ffff00008c0				// tcache_perthread_struct
    Size: 0x290 (with flag bits: 0x295)
    
    Allocated chunk | PREV_INUSE | NON_MAIN_ARENA
    Addr: 0x7ffff0000b50				// printf in use
    Size: 0x410 (with flag bits: 0x415)
    
    Allocated chunk | PREV_INUSE | NON_MAIN_ARENA
    Addr: 0x7ffff0000f60				// 0x32000 user space allocated
    Size: 0x32010 (with flag bits: 0x32015)
    
    Top chunk | PREV_INUSE
    Addr: 0x7ffff0032f70				// remainder / top chunk
    Size: 0x90 (with flag bits: 0x91)
    

其他多线程支持机制:

  • 单次malloc映射的132KB内存(in main thread)称为arena
  • 当heap空间不足,可以通过扩充arena进行拓展,空间剩余过多时则可以进行shrink
  • thread arena 的数量受限于机器的核数,64bit 系统,最大8*cores

Chunk

chunk是堆管理中的基本结构,无论chunk状态如何,都使用同一个结构体表示:

code in malloc.c

struct malloc_chunk {

  INTERNAL_SIZE_T      prev_size;  /* Size of previous chunk (if free).  */
  INTERNAL_SIZE_T      size;       /* Size in bytes, including overhead. */

  struct malloc_chunk* fd;         /* double links -- used only if free. */
  struct malloc_chunk* bk;

  /* Only used for large blocks: pointer to next larger size.  */
  struct malloc_chunk* fd_nextsize; /* double links -- used only if free. */
  struct malloc_chunk* bk_nextsize;
};
  • INTERNAL_SIZE_T: 用于存储chunk size的数据类型,一般为size_t

  • SIZE_SZ: size of INTERNAL_SIZE_T, 8 in 64-bit system

  • MALLOC_ALIGNMENT: 2 * SIZE_SZ,为chunk size 对齐宽度

  • prev_size, 如果该 chunk 的**物理相邻的前一地址 chunk(两个指针的地址差值为前一 chunk 大小)**是空闲的话,那该字段记录的是前一个 chunk 的大小 (包括 chunk 头)。否则,该字段可以用来存储物理相邻的前一个 chunk 的数据。这里的前一 chunk 指的是较低地址的 chunk

  • size,该 chunk 的大小,大小必须是 2 * SIZE_SZ 的整数倍。如果申请的内存大小不是 2 * SIZE_SZ 的整数倍,会被转换满足大小的最小的 2 * SIZE_SZ 的倍数。32 位系统中,SIZE_SZ 是 4;64 位系统中,SIZE_SZ 是 8。 该字段的低三个比特位对 chunk 的大小没有影响,它们从高到低分别表示

    • NON_MAIN_ARENA,记录当前 chunk 是否不属于主线程,1 表示不属于,0 表示属于。
    • IS_MAPPED,记录当前 chunk 是否是由 mmap 分配的。 若该位被置位,则其他bit被忽略,因为mmap分配的块不属于arena,也不会与其他free chunk物理相邻。
    • PREV_INUSE,记录前一个(物理相邻) chunk 块是否被分配。一般来说,堆中第一个被分配的内存块的 size 字段的 P 位都会被设置为 1,以便于防止访问前面的非法内存。当一个 chunk 的 size 的 P 位为 0 时,我们能通过 prev_size 字段来获取上一个 chunk 的大小以及地址。这也方便进行空闲 chunk 之间的合并。
  • fd, bk: forward, back,只在空闲时使用。当chunk空闲时,会被添加到空闲块管理列表中,为双向链表。fd为下一个,bk为上一个,注意,指针指向非物理相邻的free chunk

  • fd_nextsize, bk_nextsize: 只在空闲时,且大chunk时使用,记录下/上一个块的大小

    • free large chunk一般会由大到小排列,避免挨个遍历

structure of a malloced-chunk:

chunk-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        |             Size of previous chunk, if unallocated (P clear)  |
        +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        |             Size of chunk, in bytes                     |A|M|P|
  mem-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        |             User data starts here...                          .
        .                                                               .
        .             (malloc_usable_size() bytes)                      .
next    .                                                               |
chunk-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        |             (size of chunk, but used for application data)    |
        +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        |             Size of next chunk, in bytes                |A|0|1|
        +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  • 对于下一个chunk,prev_inuse=1
  • malloc返回的指针位于user data的起始处,末尾三位为010
    在这里插入图片描述

structure of a free chunk:

chunk-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        |             Size of previous chunk, if unallocated (P clear)  |
        +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
`head:' |             Size of chunk, in bytes                     |A|0|P|
  mem-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        |             Forward pointer to next chunk in list             |
        +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        |             Back pointer to previous chunk in list            |
        +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        |             Unused space (may be 0 bytes long)                .
        .                                                               .
 next   .                                                               |
chunk-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
`foot:' |             Size of chunk, in bytes                           |
        +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        |             Size of next chunk, in bytes                |A|0|0|
        +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
  • 对于一个free chunk,有两个地方可以保存其大小,一个是该chunk的size,另一个是next_chunkprev_size

注意事项:

  • 一般情况下,物理相邻的两个chunk会自动合并为一个
  • fastbin中的free chunk在堆管理器看来是一个allocated chunk

chunk 相关宏

  • INTERNAL_SIZE_T: 用于存储chunk size的数据类型,一般为size_t

  • SIZE_SZ: size of INTERNAL_SIZE_T, 8 in 64-bit system

  • MALLOC_ALIGNMENT: 2 * SIZE_SZ,为chunk size 对齐宽度

  • chunk与user data空间头部指针的转换:

    /* conversion from malloc headers to user pointers, and back */
    #define chunk2mem(p) ((void *) ((char *) (p) + 2 * SIZE_SZ))
    #define mem2chunk(mem) ((mchunkptr)((char *) (mem) -2 * SIZE_SZ))
    
  • 最小chunk大小

    /* The smallest possible chunk */
    #definMIN_CHUNK_SIZE (offsetof(struct malloc_chunk, fd_nextsize)) //  32 Byte
    
    • offsetof计算结构体中成员的偏置,即该成员前所有成员的大小之和
    • 最小的chunk至少要包含两个指针 (fd,bk),以及前面的两个size,共32B
  • 检查是否对齐

    #define aligned_OK(m) (((unsigned long) (m) & MALLOC_ALIGN_MASK) == 0)
    
  • 请求字节数检查,避免超限

    /*
       Check if a request is so large that it would wrap around zero when
       padded and aligned. To simplify some other code, the bound is made
       low enough so that adding MINSIZE will also not wrap around zero.
     */
    
    #define REQUEST_OUT_OF_RANGE(req)                                              \
        ((unsigned long) (req) >= (unsigned long) (INTERNAL_SIZE_T)(-2 * MINSIZE))
    
  • 将用户请求字节数转化为chunk size

    /* pad request bytes into a usable size -- internal version */
    //MALLOC_ALIGN_MASK = 2 * SIZE_SZ -1
    #define request2size(req)                                                      \
        (((req) + SIZE_SZ + MALLOC_ALIGN_MASK < MINSIZE)                           \
             ? MINSIZE                                                             \
             : ((req) + SIZE_SZ + MALLOC_ALIGN_MASK) & ~MALLOC_ALIGN_MASK)
    
    /*  Same, except also perform argument check */
    
    #define checked_request2size(req, sz)                                          \
        if (REQUEST_OUT_OF_RANGE(req)) {                                           \
            __set_errno(ENOMEM);                                                   \
            return 0;                                                              \
        }                                                                          \
        (sz) = request2size(req);
    
  • chunk_at_offset:将一个ptr+offset处的内存视为一个内存块

当一个 chunk 处于已分配状态时,它的物理相邻的下一个 chunk 的 prev_size 字段必然是无效的,故而这个字段就可以被当前这个 chunk 使用。这就是 ptmalloc 中 chunk 间的复用。

  • request size + chunk header 2 * SIZE_SZ,但复用了prev_size,只需要一个SIZE_SZ即可

chunk 申请流程

  1. 首先,利用 REQUEST_OUT_OF_RANGE 判断是否可以分配用户请求的字节大小的 chunk。
  2. 其次,需要注意的是用户请求的字节是用来存储数据的,即 chunk header 后面的部分。与此同时,由于 chunk 间复用,所以可以使用下一个 chunk 的 prev_size 字段。因此,这里只需要再添加 SIZE_SZ 大小即可以完全存储内容。
  3. 由于系统中所允许的申请的 chunk 最小是 MINSIZE,所以与其进行比较。如果不满足最低要求,那么就需要直接分配 MINSIZE 字节。
  4. 如果大于的话,因为系统中申请的 chunk 需要 2 * SIZE_SZ 对齐,所以这里需要加上 MALLOC_ALIGN_MASK 以便于对齐。
  • 标记位相关宏:

    /* size field is or'ed with PREV_INUSE when previous adjacent chunk in use */
    #define PREV_INUSE 0x1
    
    /* extract inuse bit of previous chunk */
    #define prev_inuse(p) ((p)->mchunk_size & PREV_INUSE)
    
    /* size field is or'ed with IS_MMAPPED if the chunk was obtained with mmap() */
    #define IS_MMAPPED 0x2
    
    /* check for mmap()'ed chunk */
    #define chunk_is_mmapped(p) ((p)->mchunk_size & IS_MMAPPED)
    
    /* size field is or'ed with NON_MAIN_ARENA if the chunk was obtained
       from a non-main arena.  This is only set immediately before handing
       the chunk to the user, if necessary.  */
    #define NON_MAIN_ARENA 0x4
    
    /* Check for chunk from main arena.  */
    #define chunk_main_arena(p) (((p)->mchunk_size & NON_MAIN_ARENA) == 0)
    
    /* Mark a chunk as not being on the main arena.  */
    #define set_non_main_arena(p) ((p)->mchunk_size |= NON_MAIN_ARENA)
    
    /*
       Bits to mask off when extracting size
       Note: IS_MMAPPED is intentionally not masked off from size field in
       macros for which mmapped chunks should never be seen. This should
       cause helpful core dumps to occur if it is tried by accident by
       people extending or adapting this malloc.
     */
    #define SIZE_BITS (PREV_INUSE | IS_MMAPPED | NON_MAIN_ARENA)
    
  • get chunk size

    /* Get size, ignoring use bits */
    #define chunksize(p) (chunksize_nomask(p) & ~(SIZE_BITS))
    
    /* Like chunksize, but do not mask SIZE_BITS.  */
    #define chunksize_nomask(p) ((p)->mchunk_size)
    
  • Get next chunk position which is physical adjacent to the current chunk

    /* Ptr to next physical malloc_chunk. */
    #define next_chunk(p) ((mchunkptr)(((char *) (p)) + chunksize(p)))
    
  • access info about previous chunk

    /* Size of the chunk below P.  Only valid if !prev_inuse (P).  */
    #define prev_size(p) ((p)->mchunk_prev_size)
    
    /* Set the size of the chunk below P.  Only valid if !prev_inuse (P).  */
    #define set_prev_size(p, sz) ((p)->mchunk_prev_size = (sz))
    
    /* Ptr to previous physical malloc_chunk.  Only valid if !prev_inuse (P).  */
    #define prev_chunk(p) ((mchunkptr)(((char *) (p)) - prev_size(p)))
    
  • 操作chunk当前状态

    /* extract p's inuse bit */
    #define inuse(p)                                                               \
        ((((mchunkptr)(((char *) (p)) + chunksize(p)))->mchunk_size) & PREV_INUSE)
    
    /* set/clear chunk as being inuse without otherwise disturbing */
    #define set_inuse(p)                                                           \
        ((mchunkptr)(((char *) (p)) + chunksize(p)))->mchunk_size |= PREV_INUSE
    
    #define clear_inuse(p)                                                         \
        ((mchunkptr)(((char *) (p)) + chunksize(p)))->mchunk_size &= ~(PREV_INUSE)
    
  • 获取指定偏移的chunk

    /* Treat space at ptr + offset as a chunk */
    #define chunk_at_offset(p, s) ((mchunkptr)(((char *) (p)) + (s)))
    

Top chunk

位于arena 顶端的chunk

  • 是内存分配中寻找的最后一个chunk,若前面的各个bin都无法满足要求,则从top chunk中split

  • 如果位置不足,则调用sbrk进行扩容。

  • top chunk 只能split,不能直接被使用

  • PREV_INUSE标志位恒为1,避免前面的chunk合并到top chunk中

    • 前面chunk consolidate时会进行检查,若为top chunk,则直接进行合并
/*
   Top

    The top-most available chunk (i.e., the one bordering the end of
    available memory) is treated specially. It is never included in
    any bin, is used only if no other chunk is available, and is
    released back to the system if it is very large (see
    M_TRIM_THRESHOLD).  Because top initially
    points to its own bin with initial zero size, thus forcing
    extension on the first malloc request, we avoid having any special
    code in malloc to check whether it even exists yet. But we still
    need to do so when getting memory from system, so we make
    initial_top treat the bin as a legal but unusable chunk during the
    interval between initialization and the first call to
    sysmalloc. (This is somewhat delicate, since it relies on
    the 2 preceding words to be zero during this interval as well.)
 */

/* Conveniently, the unsorted bin can be used as dummy top on first call */
#define initial_top(M) (unsorted_chunks(M))

程序第一次进行malloc时,会初始化heap,剩余部分作为 top chunk。初始状态下,将unsorted chunk作为top chunk

Last remainder chunk

是最近一次split产生的chunk。当当前chunk没有合适的大小时,会将一个大的chunk分为两部分,一部分给用户空间使用,另一部分作为last remainder chunk,该部分同样会存入unsorted bin中

bin

用户释放的chunk不会马上归还给系统,ptmalloc会统一管理heap和mmap映射区域中的空闲chunk。

ptmalloc采用分箱方式进行chunk管理。根据chunk大小和使用状态对chunk进行分类:

  • fast bins
  • Large bins
  • small bins
  • unsorted bins

在每个bin中有更多细分,同类bin使用双向链表相连。

除了fast bin,ptmalloc将他们维护在同一个数组中,bin对应的数据结构存放在arrena header数据结构——malloc_state中。

typedef struct malloc_chunk* mchunkptr; 
/* Normal bins packed as described above */
mchunkptr bins[NBINS * 2 - 2];
  • 每个bin使用两个指针描述,第一个记录bin的HEAD,即fd,第二个记录bin的TAIL
  • 整个bin使用malloc_chunk的结构体,也就是说,可以被当作chunk使用,这样就不需要单独处理header chunk。相邻的两个header chunk互相重叠,只使用fd, bk两个指针,offset通过下面宏中所提到的bin_at计算

Fast bin 单独拥有一个维护数组:

typedef struct malloc_chunk *mfastbinptr;
mfastbinptr fastbinsY[]; // Array of pointers to chunks

bins组织如下:(序号为宏计算前的序号,非bins中的offset)

  1. 第 1 个为unsorted bin,chunk未排序,存储较为混乱。注意:没有0号bin

  2. 共有62个small bins, index = 2 ~ 63,每一个small bin链表中chunk长度相同;相邻两个bins 大小相差两个字长 16B in 64-bit OS(即malloc),遵循队列分配(FIFO)

    • small bins 大小依次为:32, 48, …, 1008 共62个
  3. 共有63个large bins,每个bin中的chunk size 为一个范围

    1. 相邻两个bin间隔按照类似指数的规则排列

      64 bins of size      16  [ Small bins]	// 62 bins in deed
      32 bins of size      64  [ Large bins]  // start from 1024
      16 bins of size     512  [ Large bins]
      8 bins of size     4096  [ ..        ]
      4 bins of size    32768
      2 bins of size   262144
      1 bin  of size what's left
      
      • 如上图所示,第一个large bin (index=64) 为: 1024~1087, 第二个是1088~1151
    2. 最小的large bin 大小 MIN_LARGE_SIZE=1024

    3. large bin 内,相同size的chunk按照FIFO规划

  • 原则:任意两个物理相邻的空闲chunk不能在一起,物理相邻的两个chunk都free时会进行合并

bin 相关宏

typedef struct malloc_chunk *mbinptr;

/* addressing -- note that bin_at(0) does not exist */
#define bin_at(m, i)                                                           \
    (mbinptr)(((char *) &((m)->bins[ ((i) -1) * 2 ])) -                        \
              offsetof(struct malloc_chunk, fd))

/* analog of ++bin */
//获取下一个bin的地址
#define next_bin(b) ((mbinptr)((char *) (b) + (sizeof(mchunkptr) << 1)))

/* Reminders about list directionality within bins */
// 这两个宏可以用来遍历bin
// 获取 bin 的位于链表头的 chunk
#define first(b) ((b)->fd)
// 获取 bin 的位于链表尾的 chunk
#define last(b) ((b)->bk)
  • bin_at: 通过index查询到对应的bin,其中减去offset是为了将header chunk作为chunk使用,同时完成空间压缩,一个header chunk,我们只使用两个双向链表指针,其他位置是别的chunk的位置,所以0号位置不能使用,否则继续使用offset将会OOB

bin 的 组织如下:

To simplify use in double-linked lists, each bin header acts as a malloc_chunk. This avoids special-casing for headers. But to conserve space and improve locality, we allocate only the fd/bk pointers of bins, and then use repositioning tricks to treat these as the fields of a malloc_chunk*

  • 一个bin 占用两个bins中的元素,一个代表fd,另一个为bk,为双向链表的两个指针,通过bin_at查询对应索引的bin,从而直接使用两个链表指针参数

fast bin

由于大多数程序经常申请较小chunk,花费在split和merge上的时间过多,使用fast chunk缓解这个问题。使用fastbinsY数组进行储存

/*
   Fastbins

    An array of lists holding recently freed small chunks.  Fastbins
    are not doubly linked.  It is faster to single-link them, and
    since chunks are never removed from the middles of these lists,
    double linking is not necessary. Also, unlike regular bins, they
    are not even processed in FIFO order (they use faster LIFO) since
    ordering doesn't much matter in the transient contexts in which
    fastbins are normally used.

    Chunks in fastbins keep their inuse bit set, so they cannot
    be consolidated with other free chunks. malloc_consolidate
    releases all chunks in fastbins and consolidates them with
    other free chunks.
 */

typedef struct malloc_chunk *mfastbinptr;
#define fastbin(ar_ptr, idx) ((ar_ptr)->fastbinsY[idx])

// ...

/* The maximum fastbin request size we support */
#define MAX_FAST_SIZE     (80 * SIZE_SZ / 4)

#define NFASTBINS  (fastbin_index (request2size (MAX_FAST_SIZE)) + 1)

mfastbinptr fastbinsY[NFASTBINS];
  • fast bin 不进行合并操作

  • 每个fast bin中的chunk size相同

  • 采用单链表存储结构,因为从不会从中间将chunk移除

  • 使用FILO顺序进行管理,所有操作在头部进行

  • fast bins 将IN_USE位始终置1

typedef struct malloc_chunk *mfastbinptr;
#define fastbin(ar_ptr, idx) ((ar_ptr)->fastbinsY[idx])

/* offset 2 to use otherwise unindexable first 2 bins */
#define fastbin_index(sz) \
  ((((unsigned int) (sz)) >> (SIZE_SZ == 8 ? 4 : 3)) - 2)

/* The maximum fastbin request size we support */
#define MAX_FAST_SIZE     (80 * SIZE_SZ / 4)

#define NFASTBINS  (fastbin_index (request2size (MAX_FAST_SIZE)) + 1)
  • 默认支持到128B,最多支持 MAX_FAST_SIZE = 160B in 64-bit OS
    • 通过do_set_mxfast修改最大支持fast bin 大小
    • 初始化时设置为默认支持fast bin 大小
  • 每个fast bin 间隔 16B
    • 共有10个fast bin,依次为32B, 48B…

内存整理:

/*
   FASTBIN_CONSOLIDATION_THRESHOLD is the size of a chunk in free()
   that triggers automatic consolidation of possibly-surrounding
   fastbin chunks. This is a heuristic, so the exact value should not
   matter too much. It is defined at half the default trim threshold as a
   compromise heuristic to only attempt consolidation if it is likely
   to lead to trimming. However, it is not dynamically tunable, since
   consolidation reduces fragmentation surrounding large chunks even
   if trimming is not used.
 */

#define FASTBIN_CONSOLIDATION_THRESHOLD  (65536UL)
  • 当目前需要free的chunk size大于fastbin_consolidation_threshold时,该free chunk周围较多内存碎片,需要调用malloc_consolidate将fast bin中的chunk进行合并
  • malloc_consolidate将所有fastbin释放,并合并为小块

在这里插入图片描述

small bin

small bin 相关宏:

#define NBINS             128
#define NSMALLBINS         64		// is 63 in total, actually
#define SMALLBIN_WIDTH    MALLOC_ALIGNMENT
#define SMALLBIN_CORRECTION (MALLOC_ALIGNMENT > 2 * SIZE_SZ)
#define MIN_LARGE_SIZE    ((NSMALLBINS - SMALLBIN_CORRECTION) * SMALLBIN_WIDTH)

#define in_smallbin_range(sz)  \
  ((unsigned long) (sz) < (unsigned long) MIN_LARGE_SIZE)

#define smallbin_index(sz) \
  ((SMALLBIN_WIDTH == 16 ? (((unsigned) (sz)) >> 4) : (((unsigned) (sz)) >> 3))\
   + SMALLBIN_CORRECTION)
  • smallbin_index 用于计算chunk 位于 smallbin中的序号,当32B(最小chunk)被free时,将得到idx=2,在unsorted bin之后

  • small bin malloc使用队列分配,FIFO

  • small bin的free操作,需要检查物理相邻块,并将相邻free chunk合并,合并后的chunk加入unsorted chunk中

在这里插入图片描述

large bin

  • 大于等于1024B的chunk都为large chunk,在largin bin中管理

  • 同一个bin中的chunk size可以不同

  • large bin支持随机存取

  • 具体的size规范见bin概述

  • bin中chunk降序排列,HEAD上是最大的chunk

  • nextsize查找速度优化

    • 对于large bin,每个bin中的size各不相同,也可能出现多个相同size的chunk

    • 每次在large bin中查找chunk,若遍历所有chunk,可能效率低下

    • nextsize将相邻不同size的chunk组合成链表,如下图所示,会跳过相同size chunk(仍可以通过fd和bk查询到)

      • 独立的chunk,两个nextsize指针为空

      img

malloc 操作:

  • 首先确定用户请求的大小属于哪个bin,再在bin中寻找可用的最小chunk
    • 若大于用户请求量,则拆分后返回给用户,剩余部分加入unsroted bin
  • 若当前bin没有合适chunk,则依次向后寻找bin,否则向top chunk索取
  • 优化:Binmap
    • motivation: 由于不同的bin较多,依次遍历将消耗较多时间特别是在warm-up阶段,绝大多数bin都是空的情况下
    • 用于记录bin是否为空,使用bitmap映射
    • 偏否的蒙特卡洛算法,bit位置1,对应bin不一定非空,但若为0,则一定为空

在这里插入图片描述

unsorted bin

/*
   Unsorted chunks

    All remainders from chunk splits, as well as all returned chunks,
    are first placed in the "unsorted" bin. They are then placed
    in regular bins after malloc gives them ONE chance to be used before
    binning. So, basically, the unsorted_chunks list acts as a queue,
    with chunks being placed on it in free (and malloc_consolidate),
    and taken off (to be either used or placed in bins) in malloc.

    The NON_MAIN_ARENA flag is never set for unsorted chunks, so it
    does not have to be taken into account in size comparisons.
 */

/* The otherwise unindexable 1-bin is used to hold unsorted chunks. */
#define unsorted_chunks(M)          (bin_at (M, 1))

为chunk管理提供缓冲区

  • 若free chunk过大,则放置到缓冲区中

  • split后的chunk也会放到unsroted bin中

  • 循环双链表结构,FIFO管理

  • 任何大小的chunk都可以放到unsroted bin中

  • unsorted bin 中的 non_main_arena一定为0

在这里插入图片描述

bin 初始化

malloc_init_state过程:

static void
malloc_init_state (mstate av)
{
  int i;
  mbinptr bin;

  /* Establish circular links for normal bins */
  for (i = 1; i < NBINS; ++i)
    {
      bin = bin_at (av, i);
      bin->fd = bin->bk = bin;
    }

#if MORECORE_CONTIGUOUS
  if (av != &main_arena)
#endif
  set_noncontiguous (av);
  if (av == &main_arena)
    set_max_fast (DEFAULT_MXFAST);
  atomic_store_relaxed (&av->have_fastchunks, false);

  av->top = initial_top (av);
}
  • 将各个bin中的链表头尾都指向header bin,初始化为空链表
  • 设置noncontiguous
  • 初始化fast bin
  • 初始化当前top chunk为unsorted bin,因为bin为空,所以第一次进行malloc时必然触发brk扩充

arena & heap

  • Arena 是glibc申请一次内存得到的空间,用于管理chunks

  • 每个线程至多有一个arena

  • arena 最多数量为8 * cores + 1 (in 64-bit system)

  • 在2.31中,arena结构体大小为0x898B

  • 主线程的arena称为main_arena,只有它关联到程序的heap段;其余arena通过mmap分配,通过mmap分配的arena通过指针进行串联

    static struct malloc_state main_arena =
    {
      .mutex = _LIBC_LOCK_INITIALIZER,
      .next = &main_arena,
      .attached_threads = 1
    };
    
  • 利用锁机制进行线程间共享,除了访问fastbin是原子性操作外,其他访问都需要获取mutex

  • 首次调用malloc时,在不超过arena上限的情况下,会为其分配并初始化一个arena。否则将选择一个可用的arena提供给线程使用

在这里插入图片描述

上图为一个arena的示意图,多个arena之间通过arena->next链接

heap info

对于非main_arena,其内存由mmap分配,每个mmap块称为heap,每个heap 拥有一个heap_info结构体,其中的ar_ptr均指向同一个arena,arena位于第一个mmap heap中

typedef struct _heap_info
{
  mstate ar_ptr; /* Arena for this heap. */
  struct _heap_info *prev; /* Previous heap. */
  size_t size;   /* Current size in bytes. */
  size_t mprotect_size; /* Size in bytes that has been mprotected
                           PROT_READ|PROT_WRITE.  */
  /* Make sure the following data is properly aligned, particularly
     that sizeof (heap_info) + 2 * SIZE_SZ is a multiple of
     MALLOC_ALIGNMENT. */
  char pad[-6 * SIZE_SZ & MALLOC_ALIGN_MASK];
} heap_info;
  • 其中,pad将heap_info 对齐到MALLOC_ALIGN_MASK

data structure

arena 通过malloc_state结构体实现

struct malloc_state
{
  /* Serialize access.  */
  __libc_lock_define (, mutex);		// 并发锁

  /* Flags (formerly in max_fast).  */
  int flags;		// for example, continuous bit

  /* Set if the fastbin chunks contain recently inserted free blocks.  */
  /* Note this is a bool but not all targets support atomics on booleans.  */
  int have_fastchunks;

  /* Fastbins */
  mfastbinptr fastbinsY[NFASTBINS];

  /* Base of the topmost chunk -- not otherwise kept in a bin */
  mchunkptr top;								// top chunk ptr

  /* The remainder from the most recent split of a small request */
  mchunkptr last_remainder;

  /* Normal bins packed as described above */
  mchunkptr bins[NBINS * 2 - 2];	// bins header chunk (packed)

  /* Bitmap of bins */
  unsigned int binmap[BINMAPSIZE];

  /* Linked list */
  struct malloc_state *next;

  /* Linked list for free arenas.  Access to this field is serialized
     by free_list_lock in arena.c.  */
  struct malloc_state *next_free;

  /* Number of threads attached to this arena.  0 if the arena is on
     the free list.  Access to this field is serialized by
     free_list_lock in arena.c.  */
  INTERNAL_SIZE_T attached_threads;

  /* Memory allocated from the system in this arena.  */
  INTERNAL_SIZE_T system_mem;
  INTERNAL_SIZE_T max_system_mem;
}
  • main_arena的结构体数据保存在glibc的data segment中
  • Main_arena 初始化后的heap size为132KB(0x21000)
  • 非main_arena的malloc_state结构体在heap的第一个块(0x290 size)的0x20偏移处,前0x20 bytes为heap_info

在这里插入图片描述

gdb instructions for debugging heap

  • heap: display heap chunk info all

    • heapbase: display base address of a heap
    • Parse heap: display heap chunk in another way
  • bins: display bins on current thread all

    • specifie bin type to diplay corresponding bin chunks
  • arena: display detailed info on current thread all

    • arenas: list all arenas of current process
    • arenainfo: similar to arena
  • chunk

    • chunkinfo *victim display chunk information
    • chunkptr *user_ptr display chunk information by user pointer
    • Merge info *victim display merge information of a chunk
  • tcache: display tcache info

    • tcache bins: display bins in tcache
  • bmemory self-defined

    • break at malloc and free
    • cannot use “step” to trace those functions, probably because it doesn’t support indirect jump trace?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/873686.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL修改编码

插入中文乱码,我电脑上没有出现&#xff0c;我只是来记录一下 MySQL版本: 8.0.34Windows 查看编码 mysql中输入下面的命令 show variables like ‘character_%’; 乱码的一般是图片中划红线的部分不是utf8 character_set_database是设置数据库的默认编码的 character_set_ser…

面试热题(回文链表)

给定一个链表的 头节点 head &#xff0c;请判断其是否为回文链表。 如果一个链表是回文&#xff0c;那么链表节点序列从前往后看和从后往前看是相同的。 回文链表类似于回文串&#xff0c;正读倒读的顺序是一样的&#xff0c;那么我们怎么去判断一个链表是否是回文链表呢&…

7.2.tensorRT高级(2)-学习深度学习中涉及的线程知识

目录 前言1. 多线程2. 问答环节2.1 线程启动相关问题2.2 线程启动函数参数相关问题 总结 前言 杜老师推出的 tensorRT从零起步高性能部署 课程&#xff0c;之前有看过一遍&#xff0c;但是没有做笔记&#xff0c;很多东西也忘了。这次重新撸一遍&#xff0c;顺便记记笔记。 本次…

7. 延迟队列

延迟队列 7.1. 延迟队列概念 延时队列,队列内部是有序的&#xff0c;最重要的特性就体现在它的延时属性上&#xff0c;延时队列中的元素是希望 在指定时间到了以后或之前取出和处理&#xff0c;简单来说&#xff0c;延时队列就是用来存放需要在指定时间被处理的 元素的队列。 7…

第二章-算法

第二章-算法 数据结构和算法的关系 算法是解决特定问题求解步骤的描述&#xff0c;在计算机中表现为指令的有限序列&#xff0c;并且每条指令表示一个或多个操作。 算法的特性 算法有五个基本特征&#xff1a;输入、输出、有穷性、确定性和可行性。 输入&#xff1a;算法具…

LVS集群和nginx负载均衡

目录 1、基于 CentOS 7 构建 LVS-DR 群集。 2、配置nginx负载均衡。 1、基于 CentOS 7 构建 LVS-DR 群集。 1.部署LVS负载调度器 1>安装配置工具 [rootnode6 ~]# yum install -y ipvsadm 2>配置LVS虚拟IP&#xff08;VIP地址&#xff09; [rootnode6 ~]# ifconfig ens…

Tesseract用OpenCV进行文本检测

我没有混日子&#xff0c;只是辛苦的时候没人看到罢了 一、什么是Tesseract Tesseract是一个开源的OCR&#xff08;Optical Character Recognition&#xff09;引擎&#xff0c;OCR是一种技术&#xff0c;它可以识别和解析图像中的文本内容&#xff0c;使计算机能够理解并处理…

Dalsa线阵相机说明(Linea Color GigESeries 2k and 4K)

文章目录 一. Dalsa相机软件整体架构二. 相机编号说明以及软件要求三. 相机硬件参数三. 相机基本参数四. 软件参数设置列表1. Sensor Control Category2. I/O Control Category3. Counter and Timer Control Category4. Advanced Processing Control Category(1) 平场校正介绍(…

蚂蚁聚合支付系统源码完美版+附安装教程

这是我上个月花重金购买的四fang系统源码&#xff0c;现在分享给大家。 源码内附安装教程&#xff0c;20多项功能及安全方面的更新文档&#xff0c;源码说明等&#xff0c;小白也能轻松搭建。 能够轻松应对高并发&#xff0c;等以前版本无法应对的并发问题&#xff0c;也不会被…

JIRA:项目管理的秘密武器

引言 在当今动态且快速变化的商业环境中&#xff0c;项目管理已经成为任何组织成功的关键因素。能够有效地管理项目&#xff0c;保证项目在设定的时间和预算内按照预期的质量完成&#xff0c;是每个项目经理的目标。为了实现这个目标&#xff0c;项目经理需要依赖强大的工具&a…

由于找不到vcruntime140_1.dll,无法继续执行代码该怎么修复呢?

我最近遇到了一个vcruntime140_1.dll的问题&#xff0c;导致我的某些应用程序无法正常运行。当我第一次遇到这个问题时&#xff0c;我对这个dll文件的作用一无所知。我开始搜索并了解了vcruntime140_1.dll是Microsoft Visual C Redistributable的一部分&#xff0c;并为使用Vis…

FreeRTOS(计数信号量)

资料来源于硬件家园&#xff1a;资料汇总 - FreeRTOS实时操作系统课程(多任务管理) 目录 一、计数信号量的定义与应用 1、计数信号量的定义 2、计数信号量的应用 二、计数信号量的运作机制 1、任务间计数信号量的实现 三、计数信号量常用的API函数 1、计数信号量典型流程…

泛型编程| 模板初阶——懒人福音!

目录 前言介绍 函数模板 函数模板格式 函数模板的原理 函数模板的实例化 隐式实例化 显示实例化 模板参数匹配规则 类模板 总结 前言介绍 之前c语言实现swap函数的时候&#xff0c;我们不仅要修改参数的类型&#xff0c;还要修改函数的名字 而在学完函数重载之后&am…

东南大学齿轮箱故障诊断(Python代码,MSCNN结合LSTM结合注意力机制模型,代码有注释)

运行代码要求&#xff1a; 代码运行环境要求&#xff1a;Keras版本>2.4.0&#xff0c;python版本>3.6.0 1.东南大学采集数据平台&#xff1a; 数据 该数据集包含2个子数据集&#xff0c;包括轴承数据和齿轮数据&#xff0c;这两个子数据集都是在传动系动力学模拟器&am…

Android JNI实现锅炉压力显示系统详解

前些天发现了一个蛮有意思的人工智能学习网站,8个字形容一下"通俗易懂&#xff0c;风趣幽默"&#xff0c;感觉非常有意思,忍不住分享一下给大家。 &#x1f449;点击跳转到教程 第一步创建GuoLu.c文件 // // Created by DELL on 2023/8/13. // #include <stdio.h…

Python 潮流周刊#15:如何分析 FastAPI 异步请求的性能?

你好&#xff0c;我是猫哥。这里每周分享优质的 Python、AI 及通用技术内容&#xff0c;大部分为英文。标题取自其中一则分享&#xff0c;不代表全部内容都是该主题&#xff0c;特此声明。 本周刊精心筛选国内外的 250 信息源&#xff0c;为你挑选最值得分享的文章、教程、开源…

记录一下关于word存放代码出现的问题

如下图所示&#xff0c;从 Word 中复制代码并粘贴到其他地方&#xff0c;例如文本编辑器或代码编辑器中&#xff0c;有时会出现额外的连字符或破折号。这是因为 Word 使用了特定的字符编码和格式&#xff0c;而这些字符在代码中可能不被支持或解析为特殊字符。   可见有时从…

Java线程调度以及算法

线程调度概况 Java的线程调度程序是JVM的一部分&#xff0c;它决定应该运行哪个线程。无法保证线程调度程序将选择运行哪个可运行线程。 一次只能有一个线程在一个进程中运行。线程调度程序主要使用抢占式或时间切片调度来调度线程。 抢占式调度与时间分片的区别 在抢占式调…

边缘计算:下一代计算模式的突破

章节一&#xff1a;引言 随着物联网、人工智能和大数据等技术的不断发展&#xff0c;计算需求变得越来越复杂&#xff0c;传统的云计算模式已经难以满足快速增长的数据处理需求。在这样的背景下&#xff0c;边缘计算作为一种全新的计算模式崭露头角&#xff0c;为我们带来了更加…

Pytorch深度学习-----实现神经网络模型在GPU上进行训练的方法

系列文章目录 PyTorch深度学习——Anaconda和PyTorch安装 Pytorch深度学习-----数据模块Dataset类 Pytorch深度学习------TensorBoard的使用 Pytorch深度学习------Torchvision中Transforms的使用&#xff08;ToTensor&#xff0c;Normalize&#xff0c;Resize &#xff0c;Co…