(sum by(namespace,pod,container)(rate(container_cpu_usage_seconds_total{container!=""}[5m]))/ sum by(namespace,pod,container)(kube_pod_container_resource_limits{resource="cpu"}))>0.8
CPU 在 Kubernetes 中使用 shares 处理,每个 CPU 核心被分成 1024 份,然后使用 Linux 内核的 cgroups(控制组)功能在所有运行的进程之间分配。
可以处理所有当前进程,则不需要任何操作。如果进程使用超过 100% 的 CPU,那么份额就会到位。与任何 Linux Kernel 一样,Kubernetes 使用 CFS(Completely Fair Scheduler)机制,因此拥有更多份额的进程将获得更多的 CPU 时间。
与内存不同,Kubernetes 不会因为节流而杀死 Pod:
可以在 /sys/fs/cgroup/cpu/cpu.stat 中查看 CPU 统计信息。
四、CPU 过度使用
当想要限制进程的资源消耗时,设置限制或请求很重要。然而,请注意不要将请求总数设置为大于实际 CPU 大小,因为这意味着每个容器都应该有一定数量的 CPU。
监控 Kubernetes CPU 节流,可以检查进程与 Kubernetes 限制的接近程度:
(sum by(namespace,pod,container)(rate(container_cpu_usage_seconds_total
{container!=""}[5m]))/ sum by(namespace,pod,container)(kube_pod_container_resource_limits{resource="cpu"}))>0.8
如果想跟踪集群中发生的节流量,cadvisor 提供 container_cpu_cfs_throttled_periods_total 和 container_cpu_cfs_periods_total,有了这两个,就可以轻松计算出所有 CPU 周期的 throttling 百分比。
1、报错
Linux服务器报错磁盘没空间了:
no space left on device2、排错
从根目录看下哪个目录有问题:
cd /
du -sh *
# s即只显示总和,h即显示人类可读格式,就是数字单位的格式目录有点多,sort排序下:…