Pod 异常 / 重启排查(最常用)
1. 看 Pod 状态、重启次数、节点
kubectl get pod -o wide | grep 你的服务名
2. 看 Pod 详细事件(为什么重启 / 创建失败)
kubectl describe pod pod名称
3. 看上一次崩溃的日志(重启必备)
kubectl logs pod名称 --previous
4. 看 Service 是否正常
kubectl get svc | grep 服务名
5. 看 Endpoints(有没有绑定 Pod IP),没有 IP = 服务绑定失败
kubectl get endpoints 服务名
6. 进入容器内部 curl 测试(最强排查)进入容器
curl localhost:端口
二、服务访问不通 / 网络问题
看 Service 是否正常
kubectl get svc | grep 服务名
看 Endpoints(有没有绑定 Pod IP)
kubectl get endpoints 服务名
进入容器内部 curl 测试(最强排查)
kubectl exec -it pod名称
curl localhost:端口
三、资源问题(OOM、CPU 高、启动慢)
看 Pod 资源使用
kubectl top pod
看节点资源
kubectl top node
看资源限制(request/limit)
kubectl describe pod pod名称 | grep -A 10 "Limits"
发布 / 更新问题(镜像拉取失败、启动失败)
查看部署状态
kubectl get deploy