文章目录
- 前言
- 一、现象
- 二、问题定位
- 1.docker服务检查
- 2.message日志检查
- 3.检查Cgroup Driver的配置
- 4.修改/etc/docker/daemon.json文件
- 总结
前言
Cgroup Driver配置异常导致的节点k8s涉及到的pod无法启动问题的处理。
同事有台云主机重启之后,发现k8s相关的pod全部都无法自动启动了,进行处理。
一、现象
机器重启之后,首先是出现了cert过期的问题,更新cert之后发现机器上的pod一直无法自行启动。
密钥过期提示截图
pod 异常问题截图
二、问题定位
1.docker服务检查
使用docker-compose启动的服务正常运行
2.message日志检查
发现存在node not found的输出
3.检查Cgroup Driver的配置
使用docker info |grep Cgroup发现目前配置的是cgroupfs,而不是systemd
4.修改/etc/docker/daemon.json文件
增加
"exec-opts": ["native.cgroupdriver=systemd"],
后重启docker服务,问题解决
总结
还是要在集群部署的时候,使用标准化的流程去进行部署。