大规模k8s优化

254 阅读1分钟

Calico维护的网络在默认是(Node-to-Node Mesh)全互联模式,Calico集群中的节点之间都会相互建立连接,用于路由交换。但是随着集群规模的扩大,mesh模式将形成一个巨大服务网格,连接数成倍增加。

这时就需要使用Route Reflector(路由器反射)模式解决这个问题。

参考:

blog.51cto.com/14143894/24…

www.jianshu.com/p/3f29d826a…

cloud.tencent.com/developer/a…

zhuanlan.zhihu.com/p/111244925

apiserver

kubelet的PATCH请求(节点每10秒汇报一次心跳),NPD(Node-Problem-Detector)和其他组件也会同时PATCH节点,如果用于patch node的tcp长链接到3个apiserver实例的分布不均匀,或者某些apiserver宕掉,亦或是patch操作受到长的READ事务的影响,那么很容易触碰到默认200的inflight-limit,请求就会被拒绝(错误码429)。这样一来,请求就会被频繁重试,给apiserver带来更大的压力。

--max-mutating-requests-inflight=1000

etcd

参考:

blog.tianfeiyu.com/