一、本文概述及主要术语

1.1 概述

本文基于 Pod 、Service 和 Ingress 三大模块进行划分，对于 Kubernetes 日常可能出现的故障问题，提供了较为具体的排查步骤，并附上相关解决方法或参考文献。

Pod: Kubernetes 中创建和管理的、最小的可部署的计算单元。是一组（一个或多个）容器；这些容器共享存储、网络、以及怎样运行这些容器的声明。
Port-forward: 通过端口转发映射本地端口到指定的应用端口。
Service: 一个 Kubernetes 的 Service 是一种抽象，它定义了一组 Pods 的逻辑集合和一个用于访问它们的策略 - 有时被称为微服务。
Ingress: 提供了集群外部到内部 HTTP 和 HTTPS 服务的路由通信，流量路由通过 Ingress 资源上定义的规则控制。

[root@10-186-65-37 ~]# kubectl get pods
NAME READY STATUS RESTARTS AGE
myapp-deploy-55b54d55b8-5msx8 0/1 Pending 0 5m

2 kubectl describe pod <pod-name>：若正确输出指定的一个或多个资源的详细信息,则判断是否集群资源不足，若不足则进行拓展，否则前往 2.1.2 。

2 如有限制则进行相应资源释放或拓展，参考：https://kubernetes.io/zh/docs/concepts/configuration/manage-resources-containers/#extended-resources

否则前往 2.1.3

持久卷（PersistentVolume，PV）是集群中的一块存储，可以由管理员事先供应，或者使用存储类（Storage Class）来动态供应;持久卷申领（ PersistentVolumeClaim, PVC ）表达的是用户对存储的请求。
kubectl describe pvc <pvc-name>：若 STATUS 为 Pending

则参考如下链接进行解决：https://kubernetes.io/zh/docs/concepts/storage/persistent-volumes/

否则前往 2.1.4 。

则是 Scheduler 方面的问题,参考如下链接进行解决：https://kubernetes.io/zh/docs/concepts/scheduling-eviction/kube-scheduler/

否则为 Kubectl 的问题。

若能正确获取日志则根据日志修复相关问题。

kubectl describe pod <pod-name>：查看 status 是否为 ImagePullBackOff ？不为 ImagePullBackOff 则前往2.1.8 。
查看 image 名称是否正确，错误则修正。
查看 image tag 是否存在并经过验证。
是否从 private registry 拉取镜像？若是则确认配置信息正确。
若并非从 private registry 拉取镜像，问题可能出在 CRI（容器运行时接口）或 kubectl 。

kubectl describe pod <pod-name>：查看 status 是否为 CrashLoopBackOff ？否则前往 2.1.9 。
若是则查看日志并修复应用程序崩溃。
确认是否遗漏了 Dockerfile 中的 CMD 指令？Docker history < image-id > (后可加 --no-trunc 显示完整输出)

Pod 状态是否频繁重启且状态处于 Running 和 CrashLoopBackOff 之间切换？若是则需修复 liveness probe（存活探测器）的问题，请参考如下链接：https://kubernetes.io/zh/docs/tasks/configure-pod-container/configure-liveness-readiness-startup-probes/

kubectl describe pod <pod-name>：查看 status 是否为 RunContainerError 。
若状态为 RunContainerError 问题可能由于挂载卷 (volume) 导致,请参考如下链接：https://kubernetes.io/zh/docs/concepts/storage/volumes/
否则请在 StackOverflow 等网站寻求帮助。

若无处于 READY 状态的 pods 则前往 2.1.11 。

2. kubectl port-forward <pod-name> 8080:<pod-port>

3. 映射成功前往 2.2 。

a)进行映射

b)验证映射成功

失败则需确认程序可被所有地址监听，设置语句如下

若无法被所有地址监听则为未知状态(Unknown state)。

kubectl describe pod <pod-name>
正常输出则根据日志和参考如下链接修复相应问题 https://kubernetes.io/zh/docs/tasks/configure-pod-container/configure-liveness-readiness-startup-probes/
失败则为未知状态(Unknown state)。