K8S常用运维命令

10 阅读1分钟

Pod 异常 / 重启排查(最常用)

1. 看 Pod 状态、重启次数、节点

kubectl get pod -o wide | grep 你的服务名

2. 看 Pod 详细事件(为什么重启 / 创建失败)

kubectl describe pod pod名称

3. 看上一次崩溃的日志(重启必备)

kubectl logs pod名称 --previous

4. 看 Service 是否正常

kubectl get svc | grep 服务名

5. 看 Endpoints(有没有绑定 Pod IP),没有 IP = 服务绑定失败

kubectl get endpoints 服务名

6. 进入容器内部 curl 测试(最强排查)进入容器

 curl localhost:端口

二、服务访问不通 / 网络问题

看 Service 是否正常

kubectl get svc | grep 服务名

看 Endpoints(有没有绑定 Pod IP)

kubectl get endpoints 服务名

进入容器内部 curl 测试(最强排查)

kubectl exec -it pod名称 -- sh
curl localhost:端口

三、资源问题(OOM、CPU 高、启动慢)

看 Pod 资源使用

kubectl top pod

看节点资源

kubectl top node

看资源限制(request/limit)

kubectl describe pod pod名称 | grep -A 10 "Limits"

发布 / 更新问题(镜像拉取失败、启动失败)

查看部署状态

kubectl get deploy