Linux系列:如何调试 malloc 的底层源码

news2025/4/9 5:53:00

一:背景

1. 讲故事

上一篇我们聊过 C# 调用 C 的 malloc 代码来演示heap的内存泄露问题,但要想深入研究得必须把 malloc 的实现库 libc.so 给调试起来,大家都知道在Linux 上 libc 和 Windows 的 Win32 API 是一个层级的,由于 Linux 重度依赖 libc,比较吐槽的是两者各自为政,如果手工编译 libc,容易搞出很多兼容性问题,这一点真的不如 Windows 的大一统来的痛快,手工编译比较繁琐,用此篇来记录下。

二:手工编译 libc

1. 下载 libc 2.39 源代码

要想知道下载哪个版本的 libc,可以用 ldd 观察现存的 libc 版本,参考如下:


root@ubuntu2404:/data# ldd /bin/bash | grep libc
	libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x0000737556800000)
root@ubuntu2404:/data# /lib/x86_64-linux-gnu/libc.so.6
GNU C Library (Ubuntu GLIBC 2.39-0ubuntu8.4) stable release version 2.39.
Copyright (C) 2024 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.
There is NO warranty; not even for MERCHANTABILITY or FITNESS FOR A
PARTICULAR PURPOSE.
Compiled by GNU CC version 13.3.0.
libc ABIs: UNIQUE IFUNC ABSOLUTE
Minimum supported kernel: 3.2.0
For bug reporting instructions, please see:
<https://bugs.launchpad.net/ubuntu/+source/glibc/+bugs>.

从卦象看,当前 libc 的版本是 Ubuntu GLIBC 2.39-0ubuntu8.4,接下来下载 2.39 版本的源代码进行编译即可。


root@ubuntu2404:/src# wget http://ftp.gnu.org/gnu/libc/glibc-2.39.tar.gz
root@ubuntu2404:/src# tar -xzf glibc-2.39.tar.gz && cd glibc-2.39 && mkdir build && cd build
root@ubuntu2404:/src/glibc-2.39/build# ../configure --prefix=/usr --enable-debug=yes
root@ubuntu2404:/src/glibc-2.39/build# make -j$(nproc)
root@ubuntu2404:/src/glibc-2.39/build# ./libc.so --version
GNU C Library (GNU libc) stable release version 2.39.
Copyright (C) 2024 Free Software Foundation, Inc.
...

稍等片刻后,就可以看到源码编译出来的 libc.so ,截图如下:

2. 配置 C 代码

写了一段简单的 C 代码,参考如下:


#include <stdio.h>
#include <stdlib.h>

int main()
{
    // getchar();    !!! 先注释掉的,后续放开
    void *ptr = malloc(100);
    if (ptr == NULL)
    {
        fprintf(stderr, "malloc failed\n");
        return 1;
    }
    free(ptr);
    printf("malloc and free succeeded\n");
    getchar();
    return 0;
}

为了能够加载我的libc库,使用 `LD_PRELOAD` 环境变量指定,本想用 gdb 启动调试的方式执行 main,无奈编译出来的 __vdso_timeDuring 和 kernel 有兼容性问题导致报错,输出如下:

```C#
root@ubuntu2404:/data# gdb ./main
Reading symbols from ./main...
(gdb) set environment LD_PRELOAD /src/glibc-2.39/build/libc.so
(gdb) run
Starting program: /data/main 
     58340:	__vdso_timeDuring startup program terminated with signal SIGSEGV, Segmentation fault.

一定捣鼓之后,我发现不用 gdb 启动就没有问题,同时内存段也挂上了我的自定义libc,太棒了,输出如下:


root@ubuntu2404:/data# LD_PRELOAD=/src/glibc-2.39/build/libc.so ./main
malloc and free succeeded

root@ubuntu2404:/src/glibc-2.39/build# ps -ef | grep main
root       58361    1251  0 13:55 pts/0    00:00:00 ./main
root       58366    1869  0 13:56 pts/1    00:00:00 grep --color=auto main

root@ubuntu2404:/src/glibc-2.39/build# cat /proc/58361/maps
60fc4cd29000-60fc4cd2a000 r--p 00000000 08:03 1703942                    /data/main
60fc4cd2a000-60fc4cd2b000 r-xp 00001000 08:03 1703942                    /data/main
60fc4cd2b000-60fc4cd2c000 r--p 00002000 08:03 1703942                    /data/main
60fc4cd2c000-60fc4cd2d000 r--p 00002000 08:03 1703942                    /data/main
60fc4cd2d000-60fc4cd2e000 rw-p 00003000 08:03 1703942                    /data/main
60fc8a96c000-60fc8a98d000 rw-p 00000000 00:00 0                          [heap]
7add43aaa000-7add43aad000 rw-p 00000000 00:00 0 
7add43aad000-7add43ad1000 r--p 00000000 08:03 2915675                    /src/glibc-2.39/build/libc.so
7add43ad1000-7add43c21000 r-xp 00024000 08:03 2915675                    /src/glibc-2.39/build/libc.so
7add43c21000-7add43c78000 r--p 00174000 08:03 2915675                    /src/glibc-2.39/build/libc.so
7add43c78000-7add43c7c000 r--p 001ca000 08:03 2915675                    /src/glibc-2.39/build/libc.so
7add43c7c000-7add43c7e000 rw-p 001ce000 08:03 2915675                    /src/glibc-2.39/build/libc.so
...

这就叫在绝望中寻找希望,既然能运行,那就用 gdb 附加调试吧,只要能研究到 malloc 的底层代码才是最终目的。。。

把 main() 函数入口的 getchar() 给注释掉,方便在 malloc 之前通过 attach 附加,为了能够在 vscode 中操作,新增一个对可执行文件可控的 launch.json,内容如下:


{
    "configurations": [
        {
            "name": "C/C++: gcc build and debug active file",
            "type": "cppdbg",
            "request": "attach",
            "program": "${fileDirname}/${fileBasenameNoExtension}",
            "processId": "${command:pickProcess}",      // 选择要附加的进程
            "stopAtEntry": false,
            "setupCommands": [
                {
                    "description": "Enable pretty-printing for gdb",
                    "text": "-enable-pretty-printing",
                    "ignoreFailures": true
                },
                {
                    "description": "Set Disassembly Flavor to Intel",
                    "text": "-gdb-set disassembly-flavor intel",
                    "ignoreFailures": true
                }
            ],
        }
    ],
    "version": "2.0.0"
}

再新增一个 gcc 编译的 task 任务文件 (task.json),内容如下:


{
    "tasks": [
        {
            "type": "cppbuild",
            "label": "C/C++: gcc build active file",
            "command": "/usr/bin/gcc",
            "args": [
                "-fdiagnostics-color=always",
                "-g",
                "${file}",
                "-o",
                "${fileDirname}/${fileBasenameNoExtension}"
            ],
            "options": {
                "cwd": "${fileDirname}"
            },
            "problemMatcher": [
                "$gcc"
            ],
            "group": {
                "kind": "build",
                "isDefault": true
            },
            "detail": "Task generated by Debugger."
        }
    ],
    "version": "2.0.0"
}

稍微解释一下:

  • "processId": "${command:pickProcess}" 表示弹框选择你要附加的进程。
  • "request": "attach" 使用附加进程的模式

在 vscode 中使用 Ctrl+Shift+B 或者 gcc -g main.c -o main 对代码进行构建,接下来执行代码。


root@ubuntu2404:/data# LD_PRELOAD=/src/glibc-2.39/build/libc.so ./main

root@ubuntu2404:/src/glibc-2.39/build# ps -ef | grep main
root       58992    1251  0 14:14 pts/0    00:00:00 ./main
root       58999    1869  0 14:16 pts/1    00:00:00 grep --color=auto main

点击UI中 Run -> Start Debugging 选择要附加的 pid=58992 ,截图如下:

3. 观察效果

vscode 附加成功后,在 UI 上 Enter 回车过掉 getchar(),单步 F11 调试即可进入 malloc 方法实现,挺有意思的,最后给大家截一张大图:

三:总结

对 Win32 级别的 libc 进行源码调试,有助于我们对书籍中那些malloc的底层理论知识有一个很好的眼见为实,也是给Linux上的.NET高级调试打开了一扇窗!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2310075.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深入 PipeWire

简介 随着它的成熟&#xff0c;PipeWire 项目正在慢慢地变得流行。它的文档依然相对稀少&#xff0c;但正在逐渐增长。然而&#xff0c;让项目外部的人尝试用他们自己的语言来理解和解释它总是一个好主意&#xff0c;重申想法&#xff0c;从他们自己的角度来看待它。 在之前的…

20250304笔记-阅读论文

文章目录 前言一、寻找论文1.1寻找有代码的论文方法一&#xff1a;浏览器扩展1.1.1使用流程 方法二&#xff1a;使用Papers with Code 1.2大量搜索代码 二、阅读论文所用软件 三、引用文献格式总结 前言 一、寻找论文 1.1寻找有代码的论文 方法一&#xff1a;浏览器扩展 浏览…

线程POSIX信号量/基于环形队列的⽣产消费模型

一&#xff0c;POSIX线程信号量 信号量的本质就是一个计数器&#xff0c;也是对资源的预定机制&#xff0c;POSIX信号量和SystemV信号量作⽤相同&#xff0c;都是⽤于同步操作&#xff0c;达到⽆冲突的访问共享资源⽬的。但 POSIX可以⽤于线程间同步。 1&#xff0c;初始化信…

C# 类库打包dll文件

目录 前言操作流程注意事项 前言 在C#中&#xff0c;有多种方式可以对代码进行加密&#xff0c;以保护源代码不被轻易查看或修改&#xff0c;这篇文章主要介绍将C# cs类文件加密为dll文件的方式进行保护。 操作流程 在 Visual Studio 中&#xff0c;选择“创建新项目”。 选…

DELL EMC Unity存储如何让控制器进入service mode和退出service mode

近期遇到好几个关于DELL EMC unity &#xff08;VNXe&#xff09;存储系统挂掉的案例&#xff0c;都是很后期才寻找支持到我们这里&#xff0c;然后再看问题&#xff0c;已经变得很复杂&#xff0c;几乎都是从一个相对简单的问题搞成了一锅粥甚至最后丢数据的情况。 为此&…

【微知】如何通过mlxlink查看Mellanox网卡和光模块相关的信息?( mlxlink -d 01:00.0 -m)

背景 通过mlxlink可以查看Mellanox网卡的一些链路信息和硬件信息&#xff0c;也可以查看所插入的光模块的一些信息。 兄弟篇通过ethtool查看的方法&#xff1a;如何查看Mellanox网卡上的光模块的信息&#xff1f; 命令 mlxlink -d 01:00.0 -mman手册介绍&#xff1a; 如果…

Linux系列:如何用 C#调用 C方法造成内存泄露

一个简单的非托管内存泄露 1. 构建 so 文件 在 Windows 平台上我们会通过 MSVC 编译器将 C代码编译出一个成品 .dll&#xff0c;在 Linux 上通常会借助 gcc 将 c 编译成 .so 文件&#xff0c;这个.so 全称 Shared Object&#xff0c;为了方便讲解&#xff0c;先上一段简单的代码…

C# 数据类型相关

分类 按照数据复杂程度 按照数据存储 类型转换 隐式转换 隐式转换无法完成由精度高的数据类型向精度低的数据类型转换 显式转换 又称为强制类型转换&#xff0c;显示转换不一定总是成功&#xff0c;且转换过程中可能出现数据丢失 int num 666;float result (float)num; …

使用Word时无法粘贴,弹出错误提示:运行时错误‘53‘:文件未找到:MathPage.WLL

报错说明 使用Word时无法粘贴&#xff0c;粘贴时弹出提示如下&#xff1a; 一般出现这种情况时&#xff0c;我想你是刚装完MathType不久&#xff0c;博主装的是MathType7版本&#xff0c;出现了这个问题。 出现这个问题的原因是"mathpage.wll"这个文件在Office的插…

玩转python: 深度解析Python高阶函数及推导式

1 高阶函数&#xff1a;工程化编程的基石 1.1 高阶函数基础概念 高阶函数&#xff08;Higher-Order Function&#xff09;是函数式编程范式的核心要素&#xff0c;指能够接受函数作为参数或返回函数作为结果的函数。在Python中&#xff0c;这类函数构成了数据处理的基础架构&…

Linux第五讲----gcc与g++,makefile/make

1.代码编译 1.1预处理 我们通过vim编辑完文件之后&#xff0c;想看一下运行结果这时我们便可以试用gcc编译C语言&#xff0c;g编译c. 编译代码&#xff1a; 上述两种方法均可&#xff0c;code.c是我的c语言文件&#xff0c;mycode是我给编译后产生的二进制文件起的名&#x…

ubuntu22.04下Meshlab打开obj文件闪退——使用Appimage并放入收藏夹中

文章目录 ubuntu22.04下Meshlab打开obj文件闪退,查了下是meshlab的apt没做好。 官网下载:https://www.meshlab.net/#download 赋予权限 sudo chmod a+x MeshLab2023.12-linux.AppImage 双击运行即可 打开权限——下面操作是放在桌面上的 创建桌面快捷方式 # 在 ~/desktop (…

MAVEN的环境配置

在下载好maven后或解压maven安装包后进行环境配置 1.在用户环境变量中 新建一个MAVEN_HOME 地址为MAVEN目录 注&#xff1a;地址为解压后maven文件的根目录&#xff01;&#xff01;&#xff01; 2.在系统环境变量的path中添加该变量 %MAVEN_HOME%\bin 3. 测试maven安装是否成…

强化学习无痛上手笔记第1课

文章目录 Markov Decision ProcessDefinitionRelated Concepts Policy for MDP AgentDefinitionJudgement for PolicyValue FunctionsTD formula for value functionsRelation of V and QPolicy CriterionPolicy Improvement TheoremOptimal PolicyReinforcement Learning Fund…

智能设备上的 AI 移植与部署:新趋势与实践案例

1. 引言&#xff1a;智能设备如何运行 AI&#xff1f; 随着人工智能&#xff08;AI&#xff09;技术的快速发展&#xff0c;AI 计算已经从云端走向边缘&#xff0c;嵌入到智能设备中&#xff0c;如智能手机、智能摄像头、机器人、自动驾驶汽车等。这种本地化 AI 计算能够减少延…

【USRP】NVIDIA Sionna:用于 6G 物理层研究的开源库

目录 Sionna&#xff1a;用于 6G 物理层研究的开源库主要特点实现6G研究的民主化支持 5G、6G 等模块化、可扩展、可伸缩快速启动您的研究 好处原生人工智能支持综合研究平台开放生态系统 安装笔记使用 pip 安装基于Docker的安装从源代码安装“你好世界&#xff01;”探索锡奥纳…

LLM大型语言模型(一)

1. 什么是 LLM&#xff1f; LLM&#xff08;大型语言模型&#xff09;是一种神经网络&#xff0c;专门用于理解、生成并对人类文本作出响应。这些模型是深度神经网络&#xff0c;通常训练于海量文本数据上&#xff0c;有时甚至覆盖了整个互联网的公开文本。 LLM 中的 “大” …

BUU44 [BJDCTF2020]ZJCTF,不过如此1 [php://filter][正则表达式get输入数据][捕获组反向引用][php中单双引号]

题目&#xff1a; 我仿佛见到了一位故人。。。也难怪&#xff0c;题目就是ZJCTF 按要求提交/?textdata://,I have a dream&filenext.php后&#xff1a; ......不太行&#xff0c;好像得用filephp://filter/convert.base64-encode/resourcenext.php 耶&#xff1f;那 f…

软考中级-数据库-3.3 数据结构-树

定义:树是n(n>=0)个结点的有限集合。当n=0时称为空树。在任一非空树中,有且仅有一个称为根的结点:其余结点可分为m(m>=0)个互不相交的有限集T1,T2,T3...,Tm…,其中每个集合又都是一棵树,并且称为根结点的子树。 树的相关概念 1、双亲、孩子和兄弟: 2、结点的度:一个结…

磁盘空间不足|如何安全清理以释放磁盘空间(开源+节流)

背景&#xff1a; 最近往数据库里存的东西有点多&#xff0c;磁盘不够用 查看磁盘使用情况 df -h /dev/sda5&#xff08;根目录 /&#xff09; 已使用 92% 咱们来开源节流 目录 背景&#xff1a; 一、开源 二、节流 1.查找 大于 500MB 的文件&#xff1a; 1. Snap 缓存…