Kubernetes 调度器概览时机调度分类分级调度拥有当前集群所有的资源, 并发的调度集回写状态, 如果发生锁

概览

时机

调度分类

分级调度拥有当前集群所有的资源, 并发的调度集回写状态, 如果发生锁冲突就进行重试

数据本地化, 启动worker处理数据, 本地启动 worker 远程启动job 远程传输文件会存在效率问题, 哪里有数据就将job下发到哪里, 将执行代码copy到目标节点

反相似 cpu密集 IO密集的任务混合到一起这样不会存在资源的争抢

监听apiserver 还未分配节点的pod 然后根据调度策略将pod绑定到节点(node)

调度阶段&绑定阶段

percidate预选将不满足需求的节点过滤掉

每一个阶段里面实现了很多的SQL(扩展点) 其实就是framework + 插件

调度插件 fit.go pod--container 根据container的需求计算pod需要的资源

leastallocate 哪个节点已经分配的少谁的分配资源少谁的优先级就高 mosttallocate 谁的分配资源多谁的优先级就高

所有的插件并行顺序执行, 所有的插件都过滤完成剩下的就是结果

左边的 pod的需求右边节点上的资源情况(已经用的、总量)

例如节点8c (分时复用)

控制container使用cpu的资源

period = 10W ms的周期中

业务能用的ms /10W ms

cpu争抢的时候会按照1:2的比例争抢资源

带SSD卡的机器打一个lable pod支持node selecter 可以选择具有哪些lable的机器

更灵活

DuringScheduler首次调度的时候需要亲和的指标 DuringExecution 运行期间是否还满足亲和要求如果不满足要求的时候会重新进行调度 DuringIgnore 不需要管

保证业务不被调度到这个节点

高优业务优先被调用高优的资源可以让低优的资源被清除掉

任务执行的过程中持续的监听集群如果存在调度策略违法、异常需要将pod驱逐掉重新走调度器找一个更合适的节点

额外的服务跑到一个webhook中 extender

基于 framework扩展

负载感知调度例如设置调度水位 cpu70% 通过promethues监控如果超过cpu70% 停止调度到改节点将超过目标水位的节点过滤掉, 优先将业务调度到负载低的节点解决负载不均衡的问题

为了提升cpu和内存