k8s系列-机器重启/集群恢复
背景
1.本系列k8s文章全部为内网离线部署。
2.全部为root用户执行。
3.k8s版本为1.22.2
k8s-系列目录
本案例中使用的image镜像,如需在生产环境内网中使用,应该全部使用内网Docker仓库中的镜像。
概述
本篇文章讲述在需要k8s机器重启时,或者在k8s机器挂掉时,如何拉起k8s节点。
停止服务
Master机器先停止keepalived+nginx
# 如果做了keepalived+nginx执行如下命令
# cd nginx目录
./nginx -s stop
service keepalived stop
systemctl stop kubelet
systemctl stop docker
工作节点执行
systemctl stop kubelet
systemctl stop docker
启动服务
Master机器先启动keepalived+nginx
# cd nginx目录
./nginx
service keepalived start
systemctl start kubelet
systemctl start docker
工作节点执行
systemctl start kubelet
systemctl start docker
检查节点启动状态
#检查启动成功状态
systemctl status <服务名称>
# 检查节点状态
kubectl get nodes
常见问题
如果发现机器重启后,k8s集群没有恢复
,kubelet启动不起来,可以通过systemctl status kubelet
查看原因。
这里出现问题一般是因为:k8s在部署的时候,有一些系统参数或配置
,只是临时
设置好了,并没有做持久化配置。
例如:内存交换,可以通过执行以下命令临时关闭swapoff -a
。但是重启后又失效了,需要重新执行命令。这个可以通过修改系统配置文件vi /etc/fstab
,将/dev/mapper/centos-swap swap swap default 0 0
这一行前面加个#号将其注释掉,就可以实现持久化配置了。