kdump功能

news2025/1/12 3:59:36

kdump功能

  • 前言
  • 1 kdump流程
  • 2 kdump配置
    • 2.1 kexec、makedumpfile编译
    • 2.2 系统内核
    • 2.3 捕获内核
  • 3 kdump测试
  • 4 kdump的不足

前言

kdump 是一种先进的基于 kexec 的内核崩溃转储机制。当系统崩溃时,kdump会将内存导出为vmcore保存到磁盘。

在kernel1运行的时候,在内存中给kernel2(捕获内核)预留空间。在kernel1 crash的时候,就会进入kernel2,kernel2 执行用户态程序makedumpfile对kernel1的内存镜像进行裁剪和压缩,最后将kernel1的vmcore保留在磁盘中并重启。

1 kdump流程

在这里插入图片描述

  • 当系统内核启动时,它会为捕获内核保留一小部分内存。保留内存大小可以在cmdline中指定,比如crashkernel=64M。

  • kexec-p命令将捕获内核和根文件系统加载到保留内存中
    有关系统内核的内存使用和分布等所有必要信息都以ELF格式编码,并在崩溃之前存储在内存的保留区域中。这个ELF文件头的物理地址由kexec通过在kernel2的cmdline里添加elfcorehdr= 选项的方式传递给捕获内核,通过分析它,捕获内核就可以生成出/proc/vmcore。
    可以看到图中给捕获内核预留的内存里面有捕获内核镜像、根文件系统、Elf core headers。

  • 捕获内核通过/proc/vmcore访问内存映像
    捕获内核的ramdisk中的脚本可以通过通常的文件复制命令(如cp或scp)拷贝vmcore,也可以使用makedumpfile工具分析过滤内容,例如,使用“-d 31”,则只拷贝内核数据。

2 kdump配置

2.1 kexec、makedumpfile编译

下载编译kexec-tools:
http://kernel.org/pub/linux/utils/kernel/kexec/kexec-tools.tar.gz
下载编译makedumpfile:
https://github.com/makedumpfile/makedumpfile
里面有编译的方法,可以自行编译。

2.2 系统内核

1.config配置
CONFIG_KEXEC_CORE=y
2.给捕获内核预留内存
在cmdline里添加:crashkernel=64M
3.在脚本文件里添加kexec执行命令

   kexec -p <dump-capture-kernel-Image> \
   --initrd=<initrd-for-dump-capture-kernel> \
   --append="root=<root-dev> <arch-specific-options>"

–append是传递给捕获内核的cmdline,一般要加上

"nr_cpus=1 reset_devices"

2.3 捕获内核

1.config配置
CONFIG_CRASH_DUMP=y
2.制作根文件系统
3.在ramdisk脚本里加拷贝vmcore的命令

cp /proc/vmcore <dump-file>  
或
makedumpfile -l --message-level 1 -d 31 /proc/vmcore <dump-file>
reboot

4.如果内存资源有限,还需裁剪内核

3 kdump测试

1.主动触发panic

echo c > /proc/sysrq-trigger

2.使用crash解析vmcore

./crash vmlinux <dump-file>

Crash是一个用于分析内核转储文件的工具,和Kdump配套使用。

4 kdump的不足

  • 没有reset硬件,系统不稳定
  • watchdog等hung死的问题无法使用kdump,需结合其他手段
  • 占用资源较多,嵌入式设备资源有限,不过有很大优化空间,后面有空可以谈

后续打算在树莓派4B上使能kdump功能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/112488.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RabbitMQ——延迟队列

目录 一、延迟队列的应用场景 1. 场景&#xff1a;"订单下单成功后&#xff0c;15分钟未支付自动取消" ① 传统处理超时订单 ② RabbitMQ延时队列方案 二、延迟队列中的消息投递和消息消费 1.TTL 和 DLX ① TTL ② DLX和死信队列 ③ 延迟队列 ④ 开发步骤 …

spring mvc 通过异常封装 验证 方法

正常情况 我们先演示一下正常情况下我们验证的方法。 首先定义一个LoginBean Data public class LoginBean {// Blank 不允许保存空格&#xff0c;空格不算内容NotBlank(message "用户名不能为空")String username;// Empty 允许保留空格&#xff0c;是空格也算内容…

【Spring】核心部分之AOP:通过列举代码例子,从底层刨析,深入源码,轻轻松松理解Spring的核心AOP,AOP有这一篇足以

AOP基本概念基本原理专业术语案例演示基于注解&#xff08;重点&#xff09;基于配置文件基本概念 面向切面编程&#xff0c;也叫面向方面编程&#xff0c;利用aop可以对业务逻辑的各个部分进行隔离&#xff0c;从而使得业务逻辑各个部分之间降低耦合&#xff0c;提高程序的可…

AQS 对资源的共享方式

AQS 定义两种资源共享方式 1) Exclusive&#xff08;独占&#xff09; 只有一个线程能执行&#xff0c;如 ReentrantLock。又可分为公平锁和非公平锁,ReentrantLock 同时支持两种锁,下面以 ReentrantLock 对这两种锁的定义做介绍&#xff1a; 下面来看 ReentrantLock 中相关的…

概要设计说明书(GB8567——88)基于协同的在线表格forture-sheet

概要设计说明书 1引言 1.1编写目的 为了帮助用户更好的了解和使用本在线表格&#xff0c;提高用户与软件的亲和度。 用户手册描述配置和使用改在线表格&#xff0c;以及该软件使用过程中应该注意的一下问题。 1.2背景 说明&#xff1a; 本用户手册所描述的软件系统的名称…

医疗检测数据存储管理系统

摘要 医疗信息化的迅速发展导致了医疗数据的指数型增长&#xff0c;医疗检测数据存储管理系统给医院现有信息系统带了巨大的压力。一方面,随着各种非结构化数据的不断涌现&#xff0c;现有的医疗信息系统在存储空间&#xff0c;存储速度、存储结构上达不到医疗检测数据的要求,不…

Github惊现神作,这份算法宝典让你横扫各大厂算法面试题

时间飞逝&#xff0c;转眼间毕业七年多&#xff0c;从事 Java 开发也六年了。我在想&#xff0c;也是时候将自己的 Java 整理成一套体系。 这一次的知识体系面试题涉及到 Java 知识部分、性能优化、微服务、并发编程、开源框架、分布式等多个方面的知识点。 写这一套 Java 面试…

使用Docker搭建Nacos的持久化和集群部署

1. 准备 1.1 mysql安装 下载镜像 docker pull mysql/mysql-server:5.7 在宿主机中相关目录&#xff0c;用于挂载容器的相关数据 mkdir -p /data/mysql/{conf,data} 编写my.cnf配置文件&#xff0c;在/data/mysql/conf目录中 (或下载 直接上传即可) my.cnf.txt - 蓝奏云 / …

【考研加油】所有上岸的考研人都有一个共同的特点,就是他们都参加考试了。2023考研加油。

声明:为 2023考研的朋友加油! 2023考研加油 今明两天,将是大部分2023考研人,真正“上战场”的时候。 我想,只有经历过的人,才能对这一历程,感同身受吧! 为你们加油! 以下是在QQ空间看到的一组图,与你们共勉。 距考研还有____天! 确定目标院校中…跨考又能如何?…

阿里人在Github分享的Spring Cloud全栈笔记,你想象不到有多全

微服务到底是什么 微服务到底是什么&#xff0c;一直众说纷纭&#xff0c;我们只知道各大企业纷纷追捧和实践微服务架构&#xff0c;有的项目可能使用了Spring Cloud就算是使用微服务了&#xff0c;然后说微服务就是Spring Cloud&#xff0c;有的系统可能越做越像SOA&#xff…

RV1126笔记十六:吸烟行为检测及部署<四>

若该文为原创文章&#xff0c;转载请注明原文出处。 转换成onnx模型(windows) 一、查看pt文件 准备好训练好的pt文件,可以用Netron打开看看大概长啥样: 二、模型转换 主要的目的是想把训练好的pt文件转成onnx模型&#xff0c;为后面RV1126的部署做铺垫。 我们是在py38的con…

java之多线程的三种不同创建方式and通过多线程模拟龟兔赛跑

Process与Thread&#xff1a; 程序是指令和数据的有序集合&#xff0c;其本身没有任何运行的含义&#xff0c;是一个静态的概念&#xff0c;而进程则是执行程序的一次执行过程&#xff0c;它是一个动态的概念&#xff0c;是系统资源分配的单位&#xff0c;通常在一个进程中可以…

视频素材网,视频剪辑必备。

视频剪辑没素材&#xff0c;推荐6个网站帮你解决&#xff0c;免费可商用&#xff0c;建议收藏&#xff01; 1、菜鸟图库 视频素材下载_mp4视频大全 - 菜鸟图库 网站有超多视频素材&#xff0c;全部都是高清无水印&#xff0c;各种类型都有&#xff0c;像自然、城市、动物、科技…

自动控制原理笔记-线性系统的时域分析与校正

目录 时域法的概述&#xff1a; 时域法的作用和特点&#xff1a; 时域法常用的四个时间信号&#xff1a; 线性系统时域性能指标&#xff1a; 五个常用的性能指标&#xff1a; 一阶系统的时间响应及动态性能&#xff1a; 一阶系统动态指标的计算&#xff1a; 一阶系统的典型…

Github一夜爆火的阿里高并发技术小册究竟有什么魅力

阿里在农历2021到来之前却是又搞了一个大动作&#xff01;把阿里这一年在应对高并发流量的技术经验整合成一份技术小册开源分享供大家学习借鉴。我也是昨天才发现这份小册开源至Github上居然一夜爆火&#xff01; 看了小册之后才知道&#xff0c;原来阿里在应对高并发大流量时也…

python中的json数据和pyecharts模块入门

目录 一json数据格式 1.什么是json 2.json有什么用 3.json格式数据转化 4.python数据和json数据的相互转化 5.json总结 二.pyecharts模块入门 1.基础折线图 全局配置选项——set_global_opts方法 一json数据格式 1.什么是json JSON是一种轻量级的数据交互格式。可以按…

RabbitMQ 第一天 基础 3 RabbitMQ 快速入门 3.2 入门程序【消费者】

RabbitMQ 【黑马程序员RabbitMQ全套教程&#xff0c;rabbitmq消息中间件到实战】 文章目录RabbitMQ第一天 基础3 RabbitMQ 快速入门3.2 入门程序3.2.1 消费者3.2.2 小结第一天 基础 3 RabbitMQ 快速入门 3.2 入门程序 3.2.1 消费者 之前我们 已经完成了生产者的基本代码编…

客快物流大数据项目(九十八):ClickHouse的SQL函数

文章目录 ClickHouse的SQL函数 一、​​​​​​​​​​​​​​类型检测函数

Verilog刷题HDLBits——Exams/review2015 fancytimer

Verilog刷题HDLBits——Exams/review2015 fancytimer题目描述代码结果题目描述 This is the fifth component in a series of five exercises that builds a complex counter out of several smaller circuits. You may wish to do the four previous exercises first (counte…

gateway中的限流与熔断

目录 1. 限流的使用场景 2. gateway限流实现 2.1 前提&#xff1a; 2.2 导入依赖包 2.3 在项目配置文件中配置redis 2.4 开发限流需要的Bean 2.5 为服务配置限流参数 2.6 压力测试 3. 熔断 3.1 熔断的使用场景 3.2 熔断配置 1. 限流的使用场景 为什么限流 限流就是限…