Kubernetes 节点 Not Ready 时 Pod 驱逐机制深度解析(下)

news2025/4/26 3:38:56

#作者:邓伟

文章目录

  • 三、深度解析:源码逻辑与调优策略
  • 四、常见问题与排查
  • 五、最新动态与技术演进
  • 总结

三、深度解析:源码逻辑与调优策略

  1. TaintManager 核心源码逻辑
    (1)参数定义(kube-controller-manager)
// cmd/kube-controller-manager/app/options/controller_manager.go
fs.BoolVar(&o.EnableTaintManager, "enable-taint-manager", true, 
  "If set to true enables NoExecute Taints and will evict all not-tolerating Pod running on Nodes tainted with this kind of Taints.")

默认启用,通过命令行参数控制,生产环境不建议关闭。
(2)驱逐触发逻辑

// pkg/controller/taint/taint_manager.go
func (t *TaintManager) syncNode(node *v1.Node) {
    // 检查节点Taint
    for _, taint := range node.Spec.Taints {
        if taint.Effect == v1.TaintEffectNoExecute {
            // 查找节点上所有Pod
            pods := t.podLister.Pods(node.Namespace).List(selector.Empty())
            for _, pod := range pods {
                // 检查Pod是否容忍该Taint
                if !toleration.ToleratesTaint(pod.Spec.Tolerations, taint) {
                    // 生成驱逐事件
                    t.evictPod(pod, node, taint)
                }
            }
        }
    }
}

核心逻辑:遍历节点 Taint,对每个NoExecute类型的 Taint,检查 Pod 是否具备 Toleration,不满足则触发驱逐。

  1. 生产环境调优参数
参数名称作用默认值
–node-monitor-grace-period节点状态未更新时的容忍时间,避免短暂网络波动触发驱逐40s
–pod-eviction-timeoutPod 驱逐超时时间(针对 Terminating 状态的 Pod)5m0s
–enable-taint-manager启用 TaintManager(控制驱逐逻辑)true
–termination-grace-period Pod终止宽限期(可通过 Pod.spec.terminationGracePeriodSeconds 覆盖)30s
–eviction-soft软驱逐阈值(如memory.available<100Mi)
–eviction-hard硬驱逐阈值(如memory.available<250Mi)
  1. 高级场景:策略优化与风险控制
    (1)混合使用 Toleration 与 NodeAffinity
# Pod配置示例
tolerations:
- key: "node.kubernetes.io/not-ready"
  operator: "Exists"
  effect: "NoExecute"
  tolerationSeconds: 600  # 10分钟宽限期
affinity:
  nodeAffinity:
    preferredDuringSchedulingIgnoredDuringExecution:
    - weight: 100
      preference:
        matchExpressions:
        - key: kubernetes.io/hostname
          operator: NotIn
          values: ["node01", "node02"]

通过 Toleration 允许短暂停留,通过 NodeAffinity 引导调度到其他节点。

(2)节点问题自动检测(NodeProblemDetector)
NPD 可自动检测节点硬件故障、内核错误等,并触发对应的 Taint 添加,增强驱逐机制的智能化:

# 检测磁盘故障后添加Taint
- key: disk.error
  value: "true"
  effect: NoExecute

(3)驱逐风暴防御
当多个节点同时变为NotReady时,可能触发大规模驱逐,导致集群震荡。解决方案:

  • 启用节点分区容忍(–experimental-zone-migration,需谨慎评估)
  • 限制单节点驱逐并发数(通过自定义控制器实现)
  • 结合 HPA 动态调整副本数,避免资源过载

四、常见问题与排查

  1. Pod 未被驱逐的可能原因
  • Toleration 配置错误:Pod 未正确设置node.kubernetes.io/not-ready的 Toleration
  • TaintManager 未启用:检查kube-controller-manager的–enable-taint-manager参数
  • 节点状态未正确更新:通过kubectl describe node确认Ready状态是否为False或Unknown
  • 驱逐宽限期未到:若设置了tolerationSeconds,需等待宽限期结束
  1. 驱逐策略冲突处理
    当 TaintManager 驱逐与 Kubelet 资源压力驱逐同时触发时,可能导致 Pod 重复驱逐。解决方案:
  • 优先通过 Toleration 配置明确驱逐优先级
  • 调整资源压力驱逐阈值(–eviction-soft/–eviction-hard)
  • 使用PodDisruptionBudget限制驱逐并发数
  1. 驱逐后服务恢复验证
    驱逐完成后,需验证以下内容:
  • 新 Pod 是否成功调度到健康节点
  • 服务是否保持连续性(通过负载均衡器检查)
  • 持久化数据是否完整(如 PVC 挂载验证)

五、最新动态与技术演进

  1. Kubernetes 1.25 + 新特性
  • PodSecurity Admission 稳定化:替代已废弃的 PodSecurityPolicy,强化 Pod 安全策略
  • 不可重试的 Job 故障:针对基础设施故障(如驱逐)设置策略,避免无效重试
  • 多 ClusterCIDR 支持:灵活扩展集群网络范围,优化 IP 资源利用率
  1. 未来发展方向
  • 智能驱逐决策:结合机器学习预测节点故障,提前迁移 Pod
  • 分层驱逐策略:针对不同业务优先级,制定差异化的驱逐规则
  • 边缘节点支持:优化边缘场景下的节点状态同步与驱逐机制

总结

Kubernetes 通过 Taint/Toleration 与 TaintManager 的协同,实现了节点NotReady时的自动化 Pod 驱逐。理解这一机制的核心在于掌握:

  1. NodeCondition 与 Taint 的映射关系
  2. NoExecute 类型 Taint 的驱逐语义
  3. TaintManager 的触发条件与源码逻辑
    在生产环境中,需结合业务场景配置合理的 Toleration 策略,调优控制平面参数,并通过监控系统(如 Prometheus+Grafana)实时追踪节点状态与 Pod 驱逐事件,确保集群在节点故障时能够优雅迁移服务,最大化服务可用性。
    通过深入理解 Kubernetes 的驱逐机制,运维人员可以更高效地处理节点故障,开发团队也能针对性地设计容错性更强的应用部署方案,共同构建稳定可靠的云原生基础设施。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2342934.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SIEMENS PLC程序解读 -BLKMOV (指定长度数据批量传输)

1、程序代码 2、程序解读 这段西门子 PLC 程序&#xff08;程序段 10&#xff09;实现了基于条件的数据块移动功能&#xff0c;具体解释如下&#xff1a; 条件触点&#xff1a; %M0.1 Always<>(TRUE)&#xff08;注释为 AT<>1&#xff09;&#xff1a;当 M0.1 的值…

初识HashMap

HashMap&#xff1a;无序&#xff0c;不重复&#xff0c;无索引 HashMap小练习&#xff1a; import java.text.ParseException; import java.util.*; import java.util.function.BiConsumer; import java.util.function.Consumer;import static java.lang.Math.abs;public cla…

隧道高清晰广播如何提升行车安全体验?

在隧道中行驶时&#xff0c;驾驶员常面临回声干扰、语音模糊、信息过载等问题&#xff0c;传统广播系统可能不仅未能提供有效信息&#xff0c;反而因噪音增加驾驶压力。高清晰广播通过数字降噪、动态音效优化等技术&#xff0c;显著改善驾驶员的听觉体验&#xff0c;进而提升行…

从0开始搭建一套工具函数库,发布npm,支持commonjs模块es模块和script引入使用

文章目录 文章目标技术选型工程搭建1. 初始化项目2. 安装开发依赖3. 项目结构4. 配置文件tsconfig.json.eslintrc.jseslint.config.prettierrc.jsrollup.config.cjs创建 .gitignore文件 设置 Git 钩子创建示例工具函数8. 版本管理和发布9 工具函数测试方案1. 安装测试依赖2. 配…

Cadence学习笔记之---原理图设计基本操作

目录 01 | 引 言 02 | 环境描述 03 | 原理图工具介绍 04 | 原理图设计基本操作 05 | 生成页间引用 06 | 元件自动编号 07 | 结 尾 01 | 引 言 书接上回&#xff0c;在前文中讲述了怎样制作常用的库元件&#xff0c;如电阻、二极管&#xff0c;IC器件&#xff0c;以及怎…

进行性核上性麻痹饮食指南:科学膳食助力对抗疾病

进行性核上性麻痹是一种进展性神经退行性疾病&#xff0c;常导致患者出现吞咽困难、运动障碍等症状。科学合理的饮食不仅能为患者提供必要的营养支持&#xff0c;还能降低并发症风险&#xff0c;改善生活质量。 蛋白质是维持身体机能的关键&#xff0c;患者应注重优质蛋白的摄取…

opencv函数展示4

一、形态学操作函数 1.基本形态学操作 &#xff08;1&#xff09;cv2.getStructuringElement() &#xff08;2&#xff09;cv2.erode() &#xff08;3&#xff09;cv2.dilate() 2.高级形态学操作 &#xff08;1&#xff09;cv2.morphologyEx() 二、直方图处理函数 1.直方图…

附赠二张图,阐述我对大模型的生态发展、技术架构认识。

文章精炼&#xff0c;用两张图说明大模型发展业态方向&#xff0c;以及大模型主体技术架构。&#xff08;目前还需要进一步验证我的Thought && ideas&#xff0c;等待机会吧.........&#xff09; 图一&#xff1a;探究大模型三个层次应用方向&#xff0c;浅层次入门简…

OpenCv高阶(九)——背景建模

目录 一、背景建模的核心目标与核心挑战 1. 核心目标 2. 核心挑战 ​二、背景建模模型 1、帧差法原理 2. 概率模型&#xff08;Parametric Models&#xff09; &#xff08;1&#xff09;高斯混合模型&#xff08;Gaussian Mixture Model, GMM&#xff09; &#xff08;…

leetcode - 字符串

字符串 466. 统计重复个数 题目 定义 str [s, n] 表示 str 由 n 个字符串 s 连接构成。 例如&#xff0c;str ["abc", 3] "abcabcabc" 。 如果可以从 s2( )中删除某些字符使其变为 s1&#xff0c;则称字符串 s1( )可以从字符串 s2 获得。 例如&#xf…

【基础IO上】复习C语言文件接口 | 学习系统文件接口 | 认识文件描述符 | Linux系统下,一切皆文件 | 重定向原理

1.关于文件的预备知识 1.1 文件的宏观理解 广义上理解&#xff0c;键盘、显示器等都是文件&#xff0c;因为我们说过“Linux下&#xff0c;一切皆文件”&#xff0c;当然我们现在对于这句话的理解是片面的&#xff1b;狭义上理解&#xff0c;文件在磁盘上&#xff0c;磁盘是一…

Freertos--统计所有任务栈信息以及CPU占比和钩子函数

一、概念 在 FreeRTOS 中统计任务栈信息和 CPU 占比是为了分析栈使用情况防止溢出、优化性能识别高负载任务、合理分配资源避免内存浪费、调试系统排查阻塞或优先级问题&#xff0c;有助于提升效率、确保稳定性、快速定位问题并防止崩溃&#xff0c;比如在你的蜂鸣器任务中可以…

京东商品详情API接口调用技术指南‌

本文基于京东宙斯开放平台&#xff08;JD Open API&#xff09;的 jingdong.ware.product.detail.search.get 接口&#xff0c;提供商品详情数据获取的完整技术方案&#xff0c;包含参数说明、代码实现及实战避坑指南。 一、接口功能与权限‌ 核心能力‌ 获取商品SKU的完整信…

基于Java(JSP)+MySQL实现深度学习的音乐推荐系统

基于深度学习的音乐推荐系统简述 本文简要介绍我做的基于深度学习的音乐推荐系统。主要从需求分析与设计实现的角度来进行介绍。 需求分析 基于深度学习的音乐推荐系统旨在以个性化音乐推荐模型为基础&#xff0c;使用B/S架构的形式实现。个性化推荐模型使用了 随机梯度下降…

Linux:进程间通信---匿名管道

文章目录 1. 进程间通信1.1 什么是进程间通信&#xff1f;1.2 为什么进程要进行进程间通信&#xff1f;1.3 怎么实现进程间通信&#xff1f; 2. 匿名管道2.1 匿名管道的原理2.2 匿名管道的系统接口2.3 匿名管道的使用2.4 匿名管道的运用场景 序&#xff1a;在上一篇文章中我们知…

深度学习小记(包括pytorch 还有一些神经网络架构)

这个是用来增加深度学习的知识面或者就是记录一些常用的命令,会不断的更新 import torchvision.transforms as transforms toPIL transforms.ToPILImage()#可以把tensor转换为Image类型的 imgtoPIL(img) #利用save就可以保存下来 img.save("/opt/data/private/stable_si…

【数据可视化-32】全球住房市场分析(2015-2024 年)数据集可视化分析

&#x1f9d1; 博主简介&#xff1a;曾任某智慧城市类企业算法总监&#xff0c;目前在美国市场的物流公司从事高级算法工程师一职&#xff0c;深耕人工智能领域&#xff0c;精通python数据挖掘、可视化、机器学习等&#xff0c;发表过AI相关的专利并多次在AI类比赛中获奖。CSDN…

DAX Studio将PowerBI与EXCEL连接

DAX Studio将PowerBI与EXCEL连接 具体步骤如下&#xff1a; 第一步&#xff1a;先打开一个PowerBI的文件&#xff0c;在外部工具栏里打开DAXStudio&#xff0c;如图&#xff1a; 第二步&#xff1a;DAXStudio界面&#xff0c;点击Advanced选项卡-->Analyze in Excel&#…

使用spring boot vue 上传mp4转码为dash并播放

1.前端实现 <template><div class"video-upload"><el-uploadclass"upload-demo"action"/api/upload":before-upload"beforeUpload":on-success"handleSuccess":on-error"handleError":show-file-…

深入理解指针 (1)

1.内存和地址 1.1内存 1.1.1内存的使用和管理 &#xff08;1&#xff09;内存划分为一个个的内存单元&#xff0c;每个内存单元的大小是1个字节&#xff0c;一个内存单元可以存放8个bit。 &#xff08;2&#xff09;每个内存单元有一个编号&#xff0c;内存单元的编号在计…