oom相关日志分析:
Oom-killer错误是因系统内存分配不足,为保障系统正常运行会随机kill掉占用较多的内存进程。
该日志已经输出内存占满相关提示,内存上限为16G,当前已使用16G,内存限制导致分配失败次数为586755次。
OOPS相关日志分析
BUG: unable to handle kernel paging request at ffff9545bfffffff
表示内存访问错误
CPU: 101 PID: 3183042 Comm: exe Kdump: loaded Tainted: G W OE
当时发生错误的进程为:exe 进程号:3183042
Tainted: G W OE内核状态标记为 “Tainted”,表示可能存在不稳定的模块或驱动。
具体标记:
G:代码是开源的
W:使用了带有警告的模块
O:使用了不符合内核标准的模块
E:发生了错误
Call Trace调用栈信息,与qax_tq_base模块中的函数有关
内核模块的相关信息,在这里qax_tq_base 模块可能导致了错误具体如下:
Modules linked in:显示当前加载的内核模块
Last unloaded:卸载的模块是qax_tq_base
表明内核在执行过程中遇到了一个致命错误,导致系统崩溃,无法继续运行。
结果:
1、oom日志报错问题是由于pod内存限制16G当前使用已经超过了16G,解决方法建议提升内存限制。
2、Oops问题初步判断为qax_tq_base模块导致。