kdump功能

news2026/3/6 6:42:56

kdump功能

前言
1 kdump流程
2 kdump配置
- 2.1 kexec、makedumpfile编译
- 2.2 系统内核
- 2.3 捕获内核
3 kdump测试
4 kdump的不足

前言

kdump 是一种先进的基于 kexec 的内核崩溃转储机制。当系统崩溃时，kdump会将内存导出为vmcore保存到磁盘。

在kernel1运行的时候，在内存中给kernel2（捕获内核）预留空间。在kernel1 crash的时候，就会进入kernel2，kernel2 执行用户态程序makedumpfile对kernel1的内存镜像进行裁剪和压缩，最后将kernel1的vmcore保留在磁盘中并重启。

1 kdump流程

在这里插入图片描述

当系统内核启动时，它会为捕获内核保留一小部分内存。保留内存大小可以在cmdline中指定，比如crashkernel=64M。
kexec-p命令将捕获内核和根文件系统加载到保留内存中
有关系统内核的内存使用和分布等所有必要信息都以ELF格式编码，并在崩溃之前存储在内存的保留区域中。这个ELF文件头的物理地址由kexec通过在kernel2的cmdline里添加elfcorehdr= 选项的方式传递给捕获内核，通过分析它，捕获内核就可以生成出/proc/vmcore。
可以看到图中给捕获内核预留的内存里面有捕获内核镜像、根文件系统、Elf core headers。
捕获内核通过/proc/vmcore访问内存映像
捕获内核的ramdisk中的脚本可以通过通常的文件复制命令（如cp或scp）拷贝vmcore，也可以使用makedumpfile工具分析过滤内容，例如，使用“-d 31”，则只拷贝内核数据。

2 kdump配置

2.1 kexec、makedumpfile编译

下载编译kexec-tools：
http://kernel.org/pub/linux/utils/kernel/kexec/kexec-tools.tar.gz
下载编译makedumpfile：
https://github.com/makedumpfile/makedumpfile
里面有编译的方法，可以自行编译。

2.2 系统内核

1.config配置
CONFIG_KEXEC_CORE=y
2.给捕获内核预留内存
在cmdline里添加：crashkernel=64M
3.在脚本文件里添加kexec执行命令

   kexec -p <dump-capture-kernel-Image> \
   --initrd=<initrd-for-dump-capture-kernel> \
   --append="root=<root-dev> <arch-specific-options>"

–append是传递给捕获内核的cmdline，一般要加上

"nr_cpus=1 reset_devices"

2.3 捕获内核

1.config配置
CONFIG_CRASH_DUMP=y
2.制作根文件系统
3.在ramdisk脚本里加拷贝vmcore的命令

cp /proc/vmcore <dump-file>  
或
makedumpfile -l --message-level 1 -d 31 /proc/vmcore <dump-file>
reboot

4.如果内存资源有限，还需裁剪内核

3 kdump测试

1.主动触发panic

echo c > /proc/sysrq-trigger

2.使用crash解析vmcore

./crash vmlinux <dump-file>

Crash是一个用于分析内核转储文件的工具，和Kdump配套使用。

4 kdump的不足

没有reset硬件，系统不稳定
watchdog等hung死的问题无法使用kdump，需结合其他手段
占用资源较多，嵌入式设备资源有限，不过有很大优化空间，后面有空可以谈

后续打算在树莓派4B上使能kdump功能。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/112488.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

kdump功能

kdump功能

前言

1 kdump流程

2 kdump配置

2.1 kexec、makedumpfile编译

2.2 系统内核

2.3 捕获内核

3 kdump测试

4 kdump的不足

相关文章

RabbitMQ——延迟队列

spring mvc 通过异常封装验证方法

【Spring】核心部分之AOP:通过列举代码例子，从底层刨析，深入源码，轻轻松松理解Spring的核心AOP，AOP有这一篇足以

AQS 对资源的共享方式

概要设计说明书（GB8567——88）基于协同的在线表格forture-sheet

医疗检测数据存储管理系统

Github惊现神作，这份算法宝典让你横扫各大厂算法面试题

使用Docker搭建Nacos的持久化和集群部署

【考研加油】所有上岸的考研人都有一个共同的特点，就是他们都参加考试了。2023考研加油。

阿里人在Github分享的Spring Cloud全栈笔记，你想象不到有多全

RV1126笔记十六：吸烟行为检测及部署＜四＞

java之多线程的三种不同创建方式and通过多线程模拟龟兔赛跑

视频素材网，视频剪辑必备。

自动控制原理笔记-线性系统的时域分析与校正

Github一夜爆火的阿里高并发技术小册究竟有什么魅力

python中的json数据和pyecharts模块入门

RabbitMQ 第一天基础 3 RabbitMQ 快速入门 3.2 入门程序【消费者】

客快物流大数据项目（九十八）：ClickHouse的SQL函数

Verilog刷题HDLBits——Exams/review2015 fancytimer

gateway中的限流与熔断