介绍
Deployment 一个非常重要的功能就是实现了 Pod 的“水平扩展/收缩”,比如我们应用更新了,我们只需要更新我们的容器镜像,然后修改 Deployment 里面的 Pod 模板镜像,那么 Deployment 就会用**滚动更新(Rolling Update)**的方式来升级现在的 Pod,这个能力是非常重要的,因为对于线上的服务我们需要做到不中断服务,所以滚动更新就成了必须的一个功能。而 Deployment 这个能力的实现,依赖的就是 ReplicaSet 这个资源对象。
创建Deployment
下面是一个Deployment的示例,其中创建了一个ReplicaSet,负责启动三个nginx Pods:
# nginx-deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deployment
labels:
app: nginx
spec:
replicas: 3
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
spec:
containers:
- name: nginx
image: nginx:1.17.1
ports:
- containerPort: 80
在该例中:
-
创建了名为`nginx-deployment(由.metadata.name)的Deployment
-
该Deployment创建三个(由replicas字段标明)Pod副本
-
selector字段定义Deployment如何查找要管理的Pods。在这里,Pod模版中定义的标签是app:nginx。说明:
spec.selector.matchLabels字段{key,value}键值映射。在matchLabels映射中的每个{key,value}映射等效于matchexpressions中的一个元素,即其key字段是"key",operator为"In",values数组仅包含"value"。在matchLabels和matchExpressions中给出的所有条件都必须满足才能匹配。 -
template字段包含以下字段:- Pod被使用
.metadata.labels字段搭上app:nginx标签 - Pod模版规约(即
.template.spec字段)指示Pods运行一个nginx容器,该容器运行版本为1.17.1的nginxDocker Hub 镜像。 - 创建一个容器并使用
.spec.template.spec.containers[0].name字段将其命名为nginx。
- Pod被使用
按照以下步骤创建上述的Deployment:
1、通过运行以下命令创建Deployment:
kubectl apply -f nginx-deployment.yaml
2、通过运行kubectl get deploy检查Deploy是否已创建。如果仍在创建Deployment,则输出类似于:
NAME READY UP-TO-DATE AVAILABLE AGE
nginx-deployment 0/3 3 0 21s
在检查集群中Deployment时,所显示的字段有:
NAME列出了集群中Deployment的名称READY显示应用程序的可用的"副本"数。显示的模式时"就绪个数/期望个数"UP-TO-DATE显示为了达到期望状态已经更新的副本数AVAILABLE显示应用可提供用户使用的副本数AGE显示应用程序运行的时间
请注意期望副本数时根据.spec.replicas字段设置3。
3、要查看Deployment上线状态,运行kubectl rollout status deployment/nginx-deployment。
输出类似于:
deployment "nginx-deployment" successfully rolled out
4、一段时间过后,再次运行kubectl get deploy,输出类似于:
NAME READY UP-TO-DATE AVAILABLE AGE
nginx-deployment 3/3 3 3 104s
注意 Deployment 已创建全部三个副本,并且所有副本都是最新的(它们包含最新的 Pod 模板) 并且可用。
5、要查看Deployment创建的ReplicaSet(rs),运行kubectl get rs,输出类似于:
NAME DESIRED CURRENT READY AGE
nginx-deployment-78bc4f47cf 3 3 3 17m
ReplocaSet 输出中包含以下字段:
NAME列出命名空间中ReplicaSet的名称DESIRED显示应用的期望副本个数,即在创建Deployment时所定义的值。此为期望状态CURRENT显示当前运行状态中的副本个数READ显示应用中有多个副本可以为用户提供服务AGE显示应用已经运行的时间长度
注意:
ReplicaSet 的名字使用被格式化为[Deployment名称]-[随机字符串]。其中的随机字符串时使用
pod-template-hash作为种子随机生成的
6、要查看每个Pod自动生成的标签,运行kubectl get pods --show-labels。返回类似以下输出:
NAME READY STATUS RESTARTS AGE LABELS
nginx-deployment-78bc4f47cf-b2nnh 1/1 Running 0 44m app=nginx,pod-template-hash=78bc4f47cf
nginx-deployment-78bc4f47cf-xznp7 1/1 Running 0 44m app=nginx,pod-template-hash=78bc4f47cf
nginx-deployment-78bc4f47cf-zhcdr 1/1 Running 0 44m app=nginx,pod-template-hash=78bc4f47cf
说明
必须在 Deployment 中指定适当的选择算符和 Pod 模板标签(在本例中为
app: nginx)。 标签或者选择算符不要与其他控制器(包括其他 Deployment 和 StatefulSet)重叠。 Kubernetes 不会阻止你这样做,但是如果多个控制器具有重叠的选择算符, 它们可能会发生冲突执行难以预料的操作。
Pod-template-hash 标签
注意:不要更改此标签
Deployment 控制器将 pod-template-hash 标签添加到 Deployment 所创建或收留的每个 ReplicaSet 。
此标签可以确保Deployment的子ReplicaSets不重叠。标签时通过对ReplicaSet的PodTemplate进行哈希处理。所以生成的哈希值被添加ReplicaSet选择算符、Pod模板标签,并存在于在ReplicaSet可能拥有的任何现有Pod中。
更新Deployment
说明
仅当Deployment Pod模板(即
.spec.template)发生改变时,例如模版的标签或容器镜像被更新,才会触发Deployment上线。其他更新(如对Deployment执行扩缩容的操作)不会出发上线动作。
按照以下步骤更新Deployment:
1、先来更新nginx Pod 使用nginx:1.17.2镜像,而不是nginx1.17.1
kubectl set image deployment/nginx-deployment nginx=nginx:1.17.2
输出类似于:
deployment.apps/nginx-deployment image updated
或者,可以对Deployment执行edit操作并将.spec.template.spec.containers[0].image从nginx:1.17.1更改至nginx:1.17.2。
kubectl edit deployment/nginx-deployment
输出类似于:
deployment/nginx-deployment edited
2、要查看上线状态,运行:
kubectl rollout status deployment/nginx-deployment
输出类似于:
Waiting for rollout to finish: 2 out of 3 new replicas have been updated...
或者
deployment "nginx-deployment" successfully rolled out
3、获取关于已更新的Deployment的更多信息:
在上线成功后,可以通过运行kubectl get deployments来查看Deployment,运行kubectl get rs以查看Deployment通过创建新的ReplicaSet并将其扩容到3个副本并将旧ReplicaSet索容到0个副本完成Pod的更新操作。
NAME DESIRED CURRENT READY AGE
nginx-deployment-78bc4f47cf 0 0 0 4h15m
nginx-deployment-8c9c5f4 3 3 3 3h1m
现在运行get pods应该是仅显示新的Pods,输出类似于:
NAME READY STATUS RESTARTS AGE
nginx-deployment-8c9c5f4-grcmq 1/1 Running 0 170m
nginx-deployment-8c9c5f4-lwdlg 1/1 Running 0 179m
nginx-deployment-8c9c5f4-qv68r 1/1 Running 0 3h2m
下次要更新这些 Pods 时,只需再次更新 Deployment Pod 模板即可。
Deployment 可确保在更新时仅关闭一定数量的 Pod。默认情况下,它确保至少所需 Pods 75% 处于运行状态(最大不可用比例为 25%)。
Deployment 还确保仅所创建 Pod 数量只可能比期望 Pods 数高一点点。 默认情况下,它可确保启动的 Pod 个数比期望个数最多多出 25%(最大峰值 25%)。
例如,如果仔细查看上述 Deployment ,将看到它首先创建了一个新的 Pod,然后删除了一些旧的 Pods, 并创建了新的 Pods。它不会杀死老 Pods,直到有足够的数量新的 Pods 已经出现。 在足够数量的旧 Pods 被杀死前并没有创建新 Pods。它确保至少 2 个 Pod 可用, 同时最多总共 4 个 Pod 可用。 当 Deployment 设置为 4 个副本时,Pod 的个数会介于 3 和 5 之间。
4、获取Deployment的更多信息
kubectl describe deploy nginx-deployment
输出类似于:
Name: nginx-deployment
Namespace: default
CreationTimestamp: Tue, 21 Jun 2022 15:25:35 +0800
Labels: app=nginx
Annotations: deployment.kubernetes.io/revision: 3
Selector: app=nginx
Replicas: 3 desired | 3 updated | 3 total | 3 available | 0 unavailable
StrategyType: RollingUpdate
MinReadySeconds: 0
RollingUpdateStrategy: 25% max unavailable, 25% max surge
Pod Template:
Labels: app=nginx
Containers:
nginx:
Image: nginx:1.17.2
Port: 80/TCP
Host Port: 0/TCP
Environment: <none>
Mounts: <none>
Volumes: <none>
Conditions:
Type Status Reason
---- ------ ------
Available True MinimumReplicasAvailable
Progressing True NewReplicaSetAvailable
OldReplicaSets: <none>
NewReplicaSet: nginx-deployment-78bc4f47cf (3/3 replicas created)
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal ScalingReplicaSet 6m38s deployment-controller Scaled up replica set nginx-deployment-78bc4f47cf to 1
Normal ScalingReplicaSet 6m33s deployment-controller Scaled down replica set nginx-deployment-8c9c5f4 to 2
Normal ScalingReplicaSet 6m33s deployment-controller Scaled up replica set nginx-deployment-78bc4f47cf to 2
Normal ScalingReplicaSet 6m30s deployment-controller Scaled down replica set nginx-deployment-8c9c5f4 to 1
Normal ScalingReplicaSet 6m30s deployment-controller Scaled up replica set nginx-deployment-78bc4f47cf to 3
Normal ScalingReplicaSet 5m57s deployment-controller Scaled down replica set nginx-deployment-8c9c5f4 to 0
翻转(多Deployment动态更新)
Deployment 控制器每次注意到新的 Deployment 时,都会创建一个 ReplicaSet 以启动所需的 Pods。 如果更新了 Deployment,则控制标签匹配 .spec.selector 但模板不匹配 .spec.template 的 Pods 的现有 ReplicaSet 被缩容。最终,新的 ReplicaSet 缩放为 .spec.replicas 个副本, 所有旧 ReplicaSets 缩放为 0 个副本。
当 Deployment 正在上线时被更新,Deployment 会针对更新创建一个新的 ReplicaSet 并开始对其扩容,之前正在被扩容的 ReplicaSet 会被翻转,添加到旧 ReplicaSets 列表并开始缩容。
例如,假定你在创建一个 Deployment 以生成 nginx:1.17.1 的 5 个副本,但接下来 更新 Deployment 以创建 5 个 nginx:1.17.2 的副本,而此时只有 3 个nginx:1.17.1 副本已创建。在这种情况下,Deployment 会立即开始杀死 3 个 nginx:1.17.1 Pods, 并开始创建 nginx:1.17.2 Pods。它不会等待 nginx:1.17.1 的 5 个副本都创建完成后才开始执行变更动作。
回滚Deployment
有时可能想要回滚Deployment;例如,当Deployment不稳定时(例如进入反复崩溃状态)。默认情况下,Deployment的所有上线记录都保留在系统中,以便可以随时回滚(可以通过修改修订历史记录限制来更改这一约束)。
说明:
Deployment被触发上线时,系统就会创建Deployment的新的修订版本。这意味着仅当Deployment的Pod模版(.spec.template)发生更改时,才会创建新修订版本。例如模板的标签或容器镜像发生变化,其他更新。如Deployment的扩缩容操作不会创建Deployment修订版本。这是为了方便同时执行手动缩放或自动缩放。换言之,当你回滚到较早的修订版本时,只有Deployment的Pod模板部分会被回滚。
假设在更新Deployment时犯了一个拼写错误,将镜像名称命名设置为nginx:1.161而不是nginx:1.16.1:
kubectl set image deployment/nginx-deployment nginx=nginx:1.161 --record=true
输出类似于:
deployment.apps/nginx-deployment image updated
此上线进程会出现停滞,可以通过检查上线状态来验证:
kubectl rollout status deployment/nginx-deployment
输出类似于:
Waiting for deployment "nginx-deployment" rollout to finish: 1 out of 3 new replicas have been updated...
按Ctrl + C停止上述上线状态观测。
使用kubectl get rs进行查看,输出类似如下:
NAME DESIRED CURRENT READY AGE
nginx-deployment-5b4685b9bd 1 1 0 4m4s
nginx-deployment-78bc4f47cf 3 3 3 5h8m
nginx-deployment-8c9c5f4 0 0 0 3h54m
可以看到旧的副本有两个(nginx-deployment-78bc4f47cf和nginx-deployment-8c9c5f4),新的副本有一个(nginx-deployment-5b4685b9bd)
查看所创建的Pod,会发现新ReplicaSet所创建的1个Pod卡顿在镜像拉取的循环中,输出类似于:
NAME READY STATUS RESTARTS AGE
nginx-deployment-5b4685b9bd-qbbv2 0/1 ErrImagePull 0 8m49s
nginx-deployment-78bc4f47cf-694v2 1/1 Running 0 47m
nginx-deployment-78bc4f47cf-9wb6x 1/1 Running 0 47m
nginx-deployment-78bc4f47cf-dzd9g 1/1 Running 0 48m
说明
Deployment控制器自动停止有问题的上线过程,并停止对新的ReplicaSet扩容。这行为取决于所指定的rollingUpdate参数(具体为
maxUnavailable)。默认情况下,Kubernetes将此值设置为25%。
使用kubectl describe 获取Deployment的详细信息:
Name: nginx-deployment
Namespace: default
CreationTimestamp: Tue, 21 Jun 2022 15:25:35 +0800
Labels: app=nginx
Annotations: deployment.kubernetes.io/revision: 4
kubernetes.io/change-cause: kubectl set image deployment/nginx-deployment nginx=nginx:1.161 --record=true
Selector: app=nginx
Replicas: 3 desired | 1 updated | 4 total | 3 available | 1 unavailable
StrategyType: RollingUpdate
MinReadySeconds: 0
RollingUpdateStrategy: 25% max unavailable, 25% max surge
Pod Template:
Labels: app=nginx
Containers:
nginx:
Image: nginx:1.161
Port: 80/TCP
Host Port: 0/TCP
Environment: <none>
Mounts: <none>
Volumes: <none>
Conditions:
Type Status Reason
---- ------ ------
Available True MinimumReplicasAvailable
Progressing False ProgressDeadlineExceeded
OldReplicaSets: nginx-deployment-78bc4f47cf (3/3 replicas created)
NewReplicaSet: nginx-deployment-5b4685b9bd (1/1 replicas created)
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal ScalingReplicaSet 51m deployment-controller Scaled up replica set nginx-deployment-78bc4f47cf to 1
Normal ScalingReplicaSet 51m deployment-controller Scaled down replica set nginx-deployment-8c9c5f4 to 2
Normal ScalingReplicaSet 51m deployment-controller Scaled up replica set nginx-deployment-78bc4f47cf to 2
Normal ScalingReplicaSet 51m deployment-controller Scaled down replica set nginx-deployment-8c9c5f4 to 1
Normal ScalingReplicaSet 51m deployment-controller Scaled up replica set nginx-deployment-78bc4f47cf to 3
Normal ScalingReplicaSet 51m deployment-controller Scaled down replica set nginx-deployment-8c9c5f4 to 0
Normal ScalingReplicaSet 12m deployment-controller Scaled up replica set nginx-deployment-5b4685b9bd to 1
要解决此问题,需要回滚到以前稳定的Deployment版本。
检查Deployment上线历史
按照如下步骤检查回滚历史:
1、首先检查Deployment修订历史:
kubectl rollout history deployment/nginx-deployment
输出类似于:
deployment.apps/nginx-deployment
REVISION CHANGE-CAUSE
2 <none>
3 <none>
4 kubectl set image deployment/nginx-deployment nginx=nginx:1.161 --record=true
CHANGE-CAUSE 的内容是从 Deployment 的 kubernetes.io/change-cause 注解复制过来的。 复制动作发生在修订版本创建时。可以通过以下方式设置 CHANGE-CAUSE 消息:
- 使用
kubectl annotate deployment/nginx-deployment kubernetes.io/change-cause="image updated to 1.16.1"为 Deployment 添加注解。 - 手动编辑资源的清单。
2、要查看修订历史的详细信息,运行:
kubectl rollout history deployment/nginx-deployment --revision=2
输出类似于:
deployment.apps/nginx-deployment with revision #2
Pod Template:
Labels: app=nginx
pod-template-hash=8c9c5f4
Containers:
nginx:
Image: nginx:1.17.2
Port: 80/TCP
Host Port: 0/TCP
Environment: <none>
Mounts: <none>
Volumes: <none>
回滚到之前的修订版本
按照下面给出的步骤将 Deployment 从当前版本回滚到以前的版本(即版本 2)。
1、假定现在你已决定撤消当前上线并回滚到以前的修订版本:
kubectl rollout undo deployment/nginx-deployment --to-revision=2
输出类似于:
deployment.apps/nginx-deployment rolled back
现在,Deployment 正在回滚到以前的稳定版本。正如所看到的,Deployment 控制器生成了回滚到修订版本 2 的 DeploymentRollback 事件。
2、检查回滚时否成功以及Deployment是否正在运行:
kubectl get deployment nginx-deployment
输出类似于:
NAME READY UP-TO-DATE AVAILABLE AGE
nginx-deployment 3/3 3 3 5h30m
3、获取Deployment描述信息:
kubectl describe deployment nginx-deployment
输出类似于:
Name: nginx-deployment
Namespace: default
CreationTimestamp: Tue, 21 Jun 2022 15:25:35 +0800
Labels: app=nginx
Annotations: deployment.kubernetes.io/revision: 6
Selector: app=nginx
Replicas: 3 desired | 3 updated | 3 total | 3 available | 0 unavailable
StrategyType: RollingUpdate
MinReadySeconds: 0
RollingUpdateStrategy: 25% max unavailable, 25% max surge
Pod Template:
Labels: app=nginx
Containers:
nginx:
Image: nginx:1.17.2
Port: 80/TCP
Host Port: 0/TCP
Environment: <none>
Mounts: <none>
Volumes: <none>
Conditions:
Type Status Reason
---- ------ ------
Available True MinimumReplicasAvailable
Progressing True NewReplicaSetAvailable
OldReplicaSets: <none>
NewReplicaSet: nginx-deployment-8c9c5f4 (3/3 replicas created)
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal ScalingReplicaSet 28m deployment-controller Scaled up replica set nginx-deployment-5b4685b9bd to 1
Normal ScalingReplicaSet 4m2s deployment-controller Scaled down replica set nginx-deployment-5b4685b9bd to 0
Normal ScalingReplicaSet 3m39s deployment-controller Scaled up replica set nginx-deployment-8c9c5f4 to 1
Normal ScalingReplicaSet 3m37s deployment-controller Scaled down replica set nginx-deployment-78bc4f47cf to 2
Normal ScalingReplicaSet 3m37s deployment-controller Scaled up replica set nginx-deployment-8c9c5f4 to 2
Normal ScalingReplicaSet 3m34s deployment-controller Scaled down replica set nginx-deployment-78bc4f47cf to 1
Normal ScalingReplicaSet 3m34s deployment-controller Scaled up replica set nginx-deployment-8c9c5f4 to 3
Normal ScalingReplicaSet 3m25s (x2 over 3h58m) deployment-controller Scaled down replica set nginx-deployment-78bc4f47cf to 0
缩放Deployment
可以使用如下指令缩放Deployment:
kubectl scale deployment/nginx-deployment --replicas=10
输出类似于:
deployment.apps/nginx-deployment scaled
比例缩放
RollingUpdate的Deployment支持同时运行应用程序的多个版本。当自动缩放器缩放处于上线进程(仍在进行中或暂停)中的RollingUpdate Deployment时,Deployment控制器会平衡现有的活跃状态的replicaSets(含Pods的ReplicaSets)中的额外副本,以降低风险。这就是比例缩放(Proportional Scaling)。
例如,正在运行一个10个副本的Deployment,其maxSurge=3,maxUnavailable=2。
1、确保Deployment的这10个副本都在运行。
kubectl get deploy nginx-deployment
输出类似于:
NAME READY UP-TO-DATE AVAILABLE AGE
nginx-deployment 10/10 10 10 17h
2、更新Deployment使用的镜像,碰巧该镜像无法从集群内部解析:
kubectl set image deployment/nginx-deployment nginx=nginx:sometag
输出类似于:
deployment.apps/nginx-deployment image updated
3、镜像更新使用ReplicaSet nginx-deployment-745c49b799启动新的上线过程,但是由于上面提到的maxUnavailable要求,该进程被阻塞了。检查上线状态:
kubectl get rs
输出类似于:
NAME DESIRED CURRENT READY AGE
nginx-deployment-745c49b799 5 5 0 58s
nginx-deployment-8c9c5f4 8 8 8 16h
4、然后,出现了新的Deployment扩缩请求。自动缩放器将 Deployment 副本增加到 15。 Deployment 控制器需要决定在何处添加 5 个新副本。如果未使用比例缩放,所有 5 个副本 都将添加到新的 ReplicaSet 中。使用比例缩放时,可以将额外的副本分布到所有 ReplicaSet。 较大比例的副本会被添加到拥有最多副本的 ReplicaSet,而较低比例的副本会进入到 副本较少的 ReplicaSet。所有剩下的副本都会添加到副本最多的 ReplicaSet。 具有零副本的 ReplicaSets 不会被扩容。
在上面的示例中,3个副本被添加到旧ReplicaSet中,2个副本被添加到新ReplicasSet。假设新的副本都很健康,假定新的副本都很健康,上线过程最终应将所有副本迁移到新的ReplicaSet中。要确认这一点,请运行:
kubectl get deploy nginx-deployment
输出类似于:
NAME READY UP-TO-DATE AVAILABLE AGE
nginx-deployment 8/10 5 8 18h
上线状态确认了副本时如何被添加到每个ReplicaSet的。
kubectl get rs
输出类似于:
NAME DESIRED CURRENT READY AGE
nginx-deployment-745c49b799 5 5 0 10m
nginx-deployment-8c9c5f4 8 8 8 16h
暂停、恢复Deployment的上线过程
在更新一个 Deployment 的时候,或者计划更新它的时候, 可以在触发一个或多个更新之前暂停 Deployment 的上线过程。 当准备应用这些变更时,可以重新恢复 Deployment 上线过程。 这样做使得能够在暂停和恢复执行之间应用多个修补程序,而不会触发不必要的上线操作。
1、例如对于一个刚创建的Deploy,获取该Deployment信息:
kubectl get deploy
输出类似于:
NAME READY UP-TO-DATE AVAILABLE AGE
nginx 3/3 3 3 26s
2、获取上线状态:
kubectl get rs
输出类似于:
NAME DESIRED CURRENT READY AGE
nginx-5d5dd5dd49 3 3 3 67s
3、使用如下命令暂停上线:
kubectl rollout pause deploy nginx
输出类似于:
deployment.apps/nginx paused
4、接下来更新Deployment镜像:
kubectl set image deployment/nginx nginx=nginx:1.16.1
输出类似于:
deployment.apps/nginx image updated
5、注意这时候没有新的上线被触发:
kubectl rollout history deploy nginx
输出类似于:
deployment.apps/nginx
REVISION CHANGE-CAUSE
1 <none>
6、获取上线状态验证现有的ReplicaSet没有被更改:
kubectl get rs
输出类似于:
NAME DESIRED CURRENT READY AGE
nginx-5d5dd5dd49 3 3 3 7m4s
7、可以执行很多更新操作,例如可以设置资源限制:
kubectl set resources deployment/nginx -c=nginx --limits=cpu=200m,memory=512Mi
输出类似于:
deployment.apps/nginx resource requirements updated
暂停Deployment上线之前的初始状态将继续发挥作用,但新的更新在Deployment上线被暂停期间不会产生任何效果。
8、最终,恢复Deployment上线并观察新的replicaSet的创建过程,其中包含了所应用的所有更新:
kubectl rollout resume deployment/nginx
输出类似于:
deployment.apps/nginx resumed
9、观察上线的状态,直到完成。
kubectl get rs -w
输出类似于:
NAME DESIRED CURRENT READY AGE
nginx-5d5dd5dd49 3 3 3 2m7s
nginx-84864d5954 1 1 0 5s
nginx-84864d5954 1 1 1 77s
nginx-5d5dd5dd49 2 3 3 3m19s
nginx-84864d5954 2 1 1 77s
nginx-5d5dd5dd49 2 3 3 3m19s
nginx-5d5dd5dd49 2 2 2 3m19s
nginx-84864d5954 2 1 1 77s
nginx-84864d5954 2 2 1 77s
nginx-84864d5954 2 2 2 78s
nginx-5d5dd5dd49 1 2 2 3m20s
nginx-84864d5954 3 2 2 78s
nginx-5d5dd5dd49 1 2 2 3m20s
nginx-84864d5954 3 2 2 78s
nginx-5d5dd5dd49 1 1 1 3m20s
nginx-84864d5954 3 3 2 78s
nginx-84864d5954 3 3 3 80s
nginx-5d5dd5dd49 0 1 1 3m22s
nginx-5d5dd5dd49 0 1 1 3m22s
nginx-5d5dd5dd49 0 0 0 3m22s
10、获取最近的上线状态
kubectl get rs
输出类似于:
NAME DESIRED CURRENT READY AGE
nginx-5d5dd5dd49 0 0 0 4m56s
nginx-84864d5954 3 3 3 2m54s
说明:
不可以回滚处于暂停状态的Deployment,除非先恢复其执行状态。
Deployment状态
Deployment的生命周期中会有许多状态,上线新的replicaSet期间可能处于Progressing(进行中),可能是Complete(已完成),也可能是Failed(失败)以至于无法继续进行。
进行中的Deployment
执行下面的任务期间,kubernetes标记Deployment为进行中(Progressing)
- Deployment创建新的ReplicaSet
- Deployment正在为其最新的ReplicaSet扩容
- Deployment正在为其旧的ReplicaSet(s)缩容
- 新的Pods已经就绪或者可用(就绪至少持续了MinReadySeconds秒)
当上线过程进入"Progressing"状态时,Deployment控制器会向Deployment的.status.conditions中添加包含下面属性的状况条目:
type: Progressingstatus: "True"reason: NewReplicaSetCreate|reason: FoundNewReplicaSet|resopn: ReplicaSetUpdated
可以使用kubectl rollout status监视Deployment的进度。
完成的Deployment
当Deployment具有以下特征时,Kubernetes将其标记为完成(Complete):
- 与 Deployment 关联的所有副本都已更新到指定的最新版本,这意味着之前请求的所有更新都已完成。
- 与 Deployment 关联的所有副本都可用。
- 未运行 Deployment 的旧副本。
当上线过程进入"Complete"状态时,Deployment控制器会向Deployment的.status.conditions中添加包含瞎main属性的状态条目:
type: Progressingstatus: "True"reason: NewReplicaSetAvailable
这一 Progressing 状况的状态值会持续为 "True",直至新的上线动作被触发。 即使副本的可用状态发生变化(进而影响 Available 状况),Progressing 状况的值也不会变化。
可以使用kubectl rollout status检查Deployments是否已完成。如果上线成功完成,kubectl rollout status返回退出代码为0.
kubectl rollout status deploy nginx
输出类似于:
deployment "nginx" successfully rolled out
从kubectl rollout命令获得返回状态为0(成功):
ehco $?
输出:
0
失败的Deployment
Deployment可能会在尝试部署其最新的ReplicaSet受挫,一直处于未完成状态。造成此情况一些可能因素如下:
- 配额(Quota)不足
- 就绪探测(Readiness Probe)失败
- 镜像拉取错误
- 权限不足
- 限制范围(Limit Ranges)问题
- 应用程序运行时的配置错误
检测此状况的一种方法是在 Deployment 规约中指定截止时间参数: .spec.progressDeadlineSeconds,spec.progressDeadlineSeconds 给出的是一个秒数值,Deployment 控制器在(通过 Deployment 状态) 标示 Deployment 进展停滞之前,需要等待所给的时长。
以下kubectl命令设置规约中的progressDeadlineSeconds,从而告知控制器在10分钟后报告Deployment没有进展:
kubectl patch deployment/nginx -p '{"spec":{"progressDeadlineSeconds":600}}'
输出类似于:
deployment.apps/nginx patched
超过截止时间后,Deployment控制器将添加具有以下属性的Deployment状态到Deployment的.status.conditions中:
- Type=Progressing
- Status=False
- Reason=ProgressDeadlineexceeded
这一状况也可能会比较早地失败,因而其状态值被设置为 "False", 其原因为 ReplicaSetCreateError。 一旦 Deployment 上线完成,就不再考虑其期限。
说明:
除了报告
Reason=ProgressDeadLineExceeded状态之外,Kubernetes对已停止的Deployment不执行任何操作。更高级的编排器可以利用这一设计并相应地采取行动。例如,将Deployment回滚到其他版本。如果暂停了某个Deployment上线,Kubernetes不再更具指定的截止时间检查Deployment进展。可以在上线过程中见安全地暂停Deployment再恢复其执行,这样做不会导致超出最后时限的问题。
Deployment可能会出现瞬时性的错误,可能因为设置的超时时间过短, 也可能因为其他可认为是临时性的问题。例如,假定所遇到的问题是配额不足。 如果描述 Deployment,你将会注意到以下部分:
kubectl describe deployment nginx
输出类似于:
<...>
Conditions:
Type Status Reason
---- ------ ------
Available True MinimumReplicasAvailable
Progressing True ReplicaSetUpdated
ReplicaFailure True FailedCreate
<...>
最终,一旦超过 Deployment 进度限期,Kubernetes 将更新状态和进度状况的原因:
Conditions:
Type Status Reason
---- ------ ------
Available True MinimumReplicasAvailable
Progressing False ProgressDeadlineExceeded
ReplicaFailure True FailedCreate
可以通过缩容 Deployment 或者缩容其他运行状态的控制器,或者直接在命名空间中增加配额 来解决配额不足的问题。如果配额条件满足,Deployment 控制器完成了 Deployment 上线操作, Deployment 状态会更新为成功状况(Status=True and Reason=NewReplicaSetAvailable)。
Conditions:
Type Status Reason
---- ------ ------
Available True MinimumReplicasAvailable
Progressing True NewReplicaSetAvailable
type: Available 加上 status: True 意味着 Deployment 具有最低可用性。 最低可用性由 Deployment 策略中的参数指定。 type: Progressing 加上 status: True 表示 Deployment 处于上线过程中,并且正在运行, 或者已成功完成进度,最小所需新副本处于可用。 请参阅对应状况的 Reason 了解相关细节。 在我们的案例中 reason: NewReplicaSetAvailable 表示 Deployment 已完成。
可以使用 kubectl rollout status 检查 Deployment 是否未能取得进展。 如果 Deployment 已超过进度限期,kubectl rollout status 返回非零退出代码。
kubectl rollout status deploy nginx
输出类似于:
error: deployment "nginx" exceeded its progress deadline
kubectl rollout命令的退出状态为1(表明发生了错误):
echo $1
输出:
1
对失败的Deployment的操作
可应用于已完成的Deployment的所有操作也适用于失败的Deployment。可以对其执行扩缩容、回滚到以前的修订版本等操作,或者在需要对Deployment的Pod模版应用多项调整时,将Deployment暂停。
清理策略
可以在 Deployment 中设置 .spec.revisionHistoryLimit 字段以指定保留此 Deployment 的多少个旧有 ReplicaSet。其余的 ReplicaSet 将在后台被垃圾回收。 默认情况下,此值为 10。
说明:
显式将此字段设置为0将导致Deployment的所有历史记录被清空,因此Deployment将无法回滚。
编写Deployment规约
同其他 Kubernetes 配置一样, Deployment 需要 apiVersion,kind 和 metadata 字段。
Deployment对象的名称必须时合法的DNS子域名。Deployment还需要.spec部分。
Pod模版
.spec中只有.spec.template和.spec.selector是必需的字段。
.spec.template是一个Pod模版。它和Pod的语法规则完全相同。只是这里它是嵌套的,因此不需要apiVersion或kind。
除了Pod的必填字段外,Deployment中的Pod模版必须指定适当的标签和适当的重新启动策略,对于标签,请确保不要与其他控制器重叠。
只有.spec.template.spec.restartPolicy等于Always才是被允许的,这也是在没有指定时的默认设置。
副本
.spec.replicas是指定所需Pod的可选字段,它的默认值是1.
如果对某个Deployment执行了手动扩缩操作(例如,通过kubectl scale deployment deployment --replicas=X),之后基于清单对Deployment执行了更新操作(例如通过运行kubectl apply -f deployment.yaml),那么通过应用清单而完成的更新会覆盖之前手动扩缩所作的变更。
恰恰相反,应该允许Kubernetes控制面来自动管理.spec.replicas字段。
选择算符
.spec.selector是指定本Deployment的Pod标签选择算符的必需字段。
.spec.selector必需匹配.spce.template.metadata.labels,否则请求会被API拒绝。
在API apps/v1版本中,.spec.selector和.metadata.labels如果没有设置的话,不会被默认设置为.spec.template.metadata.labels,所以需要明确进行设置。同时在apps/v1版本中,Deployment创建后.spce.selector是不可变的。
当Pod的标签和选择算符匹配,但其模版和.spec.template不同时,或者此类Pod的总数超过.spec.replicas的设置时,Deployment会终结之。如果Pods总数未达到期望值,Deployment会基于.spec.template创建新的Pod。
说明:
不应该直接创建与此选择算符匹配的Pod,也不应该通过创建另一个Deployment或者类似于ReplicaSet或者ReplicationCOntroller这类控制器来创建标签与此选择算符匹配的Pod。如果这样做,第一个Deployment会认为它创建了这些Pod。Kubernetes不会阻止你这么做。
如果有多个控制器的选择算符发生重叠,则控制器之间会因冲突而无法正常工作。
策略
.spce.strategy策略指定用于新Pods替换旧Pods的策略。.spce.strategy.type可以是Recreate或RollingUpdate。RolllingUpdate是默认值。
重新创建Deployment
如果.spce.strategy.type=Recreate,在创建新Pods之前,所有现有的Pods会被杀死。
说明:
这只会确保为了升级而创建新 Pod 之前其他 Pod 都已终止。如果你升级一个 Deployment, 所有旧版本的 Pod 都会立即被终止。控制器等待这些 Pod 被成功移除之后, 才会创建新版本的 Pod。如果你手动删除一个 Pod,其生命周期是由 ReplicaSet 来控制的, 后者会立即创建一个替换 Pod(即使旧的 Pod 仍然处于 Terminating 状态)。
滚动更新Deployment
Deployment会在.spce.strategy.type==RollingUpdate时,采取滚动更新的方式来更新Pods。可以指定maxUnavailable和maxSurge来控制滚动更新过程。
最大不可用
.spce.strategy.rollingUpdate.maxUnavailable是一个可选字段,用来指定 更新过程中不可用的 Pod 的个数上限。该值可以是绝对数字(例如,5),也可以是所需 Pods 的百分比(例如,10%)。百分比值会转换成绝对数并去除小数部分。 如果 .spec.strategy.rollingUpdate.maxSurge 为 0,则此值不能为 0。 默认值为 25%。
例如,当此值设置为 30% 时,滚动更新开始时会立即将旧 ReplicaSet 缩容到期望 Pod 个数的70%。 新 Pod 准备就绪后,可以继续缩容旧有的 ReplicaSet,然后对新的 ReplicaSet 扩容, 确保在更新期间可用的 Pods 总数在任何时候都至少为所需的 Pod 个数的 70%。
最大峰值
.spec.strategy.rollingUpdate.maxSurge 是一个可选字段,用来指定可以创建的超出期望 Pod 个数的 Pod 数量。此值可以是绝对数(例如,5)或所需 Pods 的百分比(例如,10%)。 如果 MaxUnavailable 为 0,则此值不能为 0。百分比值会通过向上取整转换为绝对数。 此字段的默认值为 25%。
例如,当此值为 30% 时,启动滚动更新后,会立即对新的 ReplicaSet 扩容,同时保证新旧 Pod 的总数不超过所需 Pod 总数的 130%。一旦旧 Pods 被杀死,新的 ReplicaSet 可以进一步扩容, 同时确保更新期间的任何时候运行中的 Pods 总数最多为所需 Pods 总数的 130%。
进度期限秒数
.spec.progressDeadlineSeconds 是一个可选字段,用于指定系统在报告 Deployment 进展失败 之前等待 Deployment 取得进展的秒数。 这类报告会在资源状态中体现为 type: Progressing、status: False、 reason: ProgressDeadlineExceeded。Deployment 控制器将持续重试 Deployment。 将来,一旦实现了自动回滚,Deployment 控制器将在探测到这样的条件时立即回滚 Deployment。
如果指定,则此字段值需要大于 .spec.minReadySeconds 取值。
最短就绪时间
.spec.minReadySeconds 是一个可选字段,用于指定新创建的 Pod 在没有任意容器崩溃情况下的最小就绪时间, 只有超出这个时间 Pod 才被视为可用。默认值为 0(Pod 在准备就绪后立即将被视为可用)。
修订历史限制
Deployment 的修订历史记录存储在它所控制的 ReplicaSets 中。
.spec.revisionHistoryLimit 是一个可选字段,用来设定出于回滚目的所要保留的旧 ReplicaSet 数量。 这些旧 ReplicaSet 会消耗 etcd 中的资源,并占用 kubectl get rs 的输出。 每个 Deployment 修订版本的配置都存储在其 ReplicaSets 中;因此,一旦删除了旧的 ReplicaSet, 将失去回滚到 Deployment 的对应修订版本的能力。 默认情况下,系统保留 10 个旧 ReplicaSet,但其理想值取决于新 Deployment 的频率和稳定性。
更具体地说,将此字段设置为 0 意味着将清理所有具有 0 个副本的旧 ReplicaSet。 在这种情况下,无法撤消新的 Deployment 上线,因为它的修订历史被清除了。
paused(暂停的)
.spec.paused 是用于暂停和恢复 Deployment 的可选布尔字段。 暂停的 Deployment 和未暂停的 Deployment 的唯一区别是,Deployment 处于暂停状态时, PodTemplateSpec 的任何修改都不会触发新的上线。 Deployment 在创建时是默认不会处于暂停状态。