污点和容忍度

134 阅读4分钟

Kubernetes 污点与容忍

要搞清楚什么是污点?什么是容忍度? 污点  Taint 容忍度  Toleration

Taint(污点)和 Toleration(容忍)可以作用于node和 pod 上(即:污点是给node节点设置的,容忍度是给pod设置的),其目的是优化pod在集群间的调度,这跟节点亲和性类似,只不过它们作用的方式相反,具有Taint的node和pod是互斥关系,而具有节点亲和性关系的node和pod是相吸的。另外还有可以给node节点设置label,通过给pod设置nodeSelector将pod调度到具有匹配标签的节点上。

使用 kubectl taint 命令可以给某个Node节点设置污点,Node 被设置上污点之后就和 Pod 之间存在了一种互斥的关系,可以让 Node 拒绝 Pod 的调度执行,甚至将 Node 已经存在的 Pod 驱逐出去。
设置了污点的 Node 将根据 taint 的 effect:NoSchedule、PreferNoSchedule、NoExecute 和 Pod 之间产生互斥的关系,Pod 将在一定程度上不会被调度到 Node 上。 但我们可以在 Pod 上设置容忍 ( Toleration ) ,意思是设置了容忍的 Pod 将可以容忍污点的存在,可以被调度到存在污点的 Node 上。

Taint 和 toleration 相互配合,可以用来避免pod被分配到不合适的节点上。每个节点上都可以应用一个或多个taint,这表示对于那些不能容忍这些taint的 pod,是不会被该节点接受的。如果将Toleration应用于pod上,则表示这些pod可以(但不要求)被调度到具有相应taint的节点上。

一、污点(Taint)详解及命令

1、污点 ( Taint ) 的组成

使用kubectl taint命令可以给某个Node节点设置污点,Node被设置上污点之后就和Pod之间存在了一种相斥的关系,可以让Node拒绝Pod的调度执行,甚至将Node已经存在的Pod驱逐出去。

每个污点的组成如下:

key=value:effect

每个污点有一个 key 和 value 作为污点的标签,其中 value 可以为空,effect 描述污点的作用。

当前 taint effect 支持如下三个选项:

NoSchedule:表示k8s将不会将Pod调度到具有该污点的Node上
PreferNoSchedule:表示k8s将尽量避免将Pod调度到具有该污点的Node上
NoExecute:表示k8s将不会将Pod调度到具有该污点的Node上,同时会将Node上已经存在的Pod驱逐出去

2、污点的设置、查看和去除

复制代码

# 设置污点
kubectl taint nodes k8s-node02 key=value:NoSchedule
kubectl taint nodes k8s-node2 check=yuanzhang:NoExecute
#查看污点
kubectl describe node k8s-node02 |grep Taints

#删除污点
kubectl taint nodes k8s-node2 key:NoSchedule-
[root@node2 ~]# kubectl taint node node2 check=yuanzhang:NoExecute-
node/node2 untainted

复制代码

 注意:kubectl taint node [节点] [任意值]:[NoSchedule、NoExecute、PreferNoSchedule]

#删除和创建中的值要对应上,node节点的名称需要通过kubectl get node对应上

二、容忍度(Toleration)详解及命令

 设置了污点的 Node 将根据 taint 的 effect:NoSchedule、PreferNoSchedule、NoExecute 和 Pod 之间产生互斥的关系,Pod 将在一定程度上不会被调度到 Node 上。 但我们可以在 Pod 上设置容忍 ( Toleration ) ,意思是设置了容忍的 Pod 将可以容忍污点的存在,可以被调度到存在污点的 Node 上。

接下来我们编写yaml文件,例如将nginx 添加容忍,并且使用硬策略只捆绑在k8s-01上 (这里使用硬策略和软策略或者不添加都是可以的。)

tolerations:          #添加容忍策略
    - key: "key1"      #对应我们添加节点的变量名
    operator: "Equal"    #操作符
    value: "value"      #容忍的值   key1=value对应
    effect: NoExecute    #添加容忍的规则,这里必须和我们标记的五点规则相同
    tolerationSeconds: 3600
  • 其中 key, vaule, effect 要与 Node 上设置的 taint 保持一致。
  • *operator 的值为 Exists 将会忽略 value 值。
  • tolerationSeconds 用于描述当 Pod 需要被驱逐时可以在 Pod 上继续保留运行的时间,类似限期驱离。*

1、当不指定 key 值时,表示容忍所有的污点 key

tolerations: 
- operator: "Exists"

2、当不指定 effect 值时,表示容忍所有的污点作用

tolerations: 
- key: "key1" 
operator: "Exists"

3、有多个 Master 存在时,防止资源浪费,可以如下设置,让master也启动pod

kubectl taint nodes <Node-Name> node-role.kubernetes.io/master=:PreferNoSchedule

多个Taints污点和多个Tolerations容忍怎么判断

可以在同一个node节点上设置多个污点(Taints),在同一个pod上设置多个容忍(Tolerations)。Kubernetes处理多个污点和容忍的方式就像一个过滤器:从节点的所有污点开始,然后忽略可以被Pod容忍匹配的污点;保留其余不可忽略的污点,污点的effect对Pod具有显示效果:特别是:

  • 如果有至少一个不可忽略污点,effect为NoSchedule,那么Kubernetes将不调度Pod到该节点
  • 如果没有effect为NoSchedule的不可忽视污点,但有至少一个不可忽视污点,effect为PreferNoSchedule,那么Kubernetes将尽量不调度Pod到该节点
  • 如果有至少一个不可忽视污点,effect为NoExecute,那么Pod将被从该节点驱逐(如果Pod已经在该节点运行),并且不会被调度到该节点(如果Pod还未在该节点运行)

更详细的论述:www.cnblogs.com/zhangliangh…

转自:www.cnblogs.com/panw/p/1634…

参考来源:i4t.com/4520.htmlcloud.tencent.com/developer/a…