Kubernetes常见问题解答

news2026/2/19 16:33:10

云原生学习路线导航页（持续更新中）

本文对Kubernetes学习中常见的一些问题，进行解答

1.什么时候使用公有云，什么时候使用自建k8s

一个集群应该设计为多大规模，需要从很多个维度去考虑

无状态应用
- 假设一个Web应用，只有一个war包，没有任何本地数据，所有的数据都存在云端数据库中，即数据的存储和应用本身分离了，那么这个应用就是一个无状态应用了
- 无状态应用实例坏了，可以直接启动一个替换它，没有任何本地的依赖
- 还有一些应用，本地会记录一些Session信息，现在也不推荐了，鼓励应用内部无状态，这样能够更好的和Kubernetes等云平台融合
- 目前大多数应用都是无状态应用，之前讲过12 factor的原则，就是鼓励无状态
  - https://www.huweihuang.com/kubernetes-notes/paas/12-factor.html
- 有人说90%应用都是无状态的，不知道怎么统计的
有状态应用
- 一般来说，有本地数据存储的应用都是有状态的，实例坏了后，依赖本地数据，无法直接启动一个新的实例替代它
- statefulset为什么有时无法满足需求？因为statefulset它本身也比较简单，对于太复杂的应用，它做不了。另一方面，statefulset也有一些故障转移等能力，如果这个能力会破坏你的应用，那就不能用了
- 比如mysql集群，不同实例还需要区分身份，配置和启动脚本也可能有所不同，所以mysql就是没有办法简单描述的，一般都需要单独定制Operator

比如要给pod做 HPA 自动扩缩容，肯定是需要一些cpu、memory等指标数据的，这些指标要在APIServer中取
在原生APIServer中是不包含这些指标的，因此可以自己写一个 Metrics APIServer，以 Aggregated APIServer的方式嵌入到APIServer中去，HPA的一些Controller就可以在APIServer中获取这些metrics指标数据了
目前kubernetes社区已经有了开源的 metrics APIServer：即 metrics-server
- https://github.com/kubernetes-sigs/metrics-server
- 官方文档
安装之后，可以使用kubectl top命令，查看指标
- 比如 kubectl top node 就可以展示node的cpu、memory等使用情况

Deployment实现冗余部署、故障转移、滚动发布
- .spec.raplicas 值>1，即冗余部署
- Deployment 会负责故障转移，pod被删除后会自动重建
- Deployment 的 .spec.strategy 可以设置滚动更新配置
Service提供多pod的负载均衡，外部访问的时候就有统一的ip+port，不依赖于具体的podIp，当pod重建后Podip改变，也不会影响外部的访问
冗余部署 + 负载均衡，其实就实现了一个生产级的高可用。

在这里插入图片描述

执行kubectl命令的时候，添加 -v 9，即可开启debug日志，可以看到kubectl到底干了什么
- 可以看到，kubectl命令首先加载了 /root/.kube/config 文件，获取到了当前要连接的集群信息，及user认证信息cert、key
- 然后向apiserver发送get请求
kubeconfig内容
- kubectl从其中获取当前正在使用的上下文，并使用该上下文中指定的user 连接指定的cluster
- kubeconfig 默认路径：/root/.kube/config，当然你可以通过设置 KUBECONFIG 环境变量或者设置 --kubeconfig参数来指定其他 kubeconfig 文件
- 官方文档：https://kubernetes.io/zh-cn/docs/concepts/configuration/organize-cluster-access-kubeconfig/

就像微服务设计思想，我们更希望让多个组件各自做自己关心的事情，而不是所有的逻辑都放在一个组件中做
Deployment直接管理pod当然可以，但是会使得Deployment的逻辑变得很复杂
相反，Deployment直接管理ReplicaSet，可以让Deployment直接获得pod的伸缩等基本能力，Deployment可以更专注于滚动升级等更高层次的功能