首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
揭秘云原生混布资源调度器Koordinator
冬天的风滚草
创建于2026-01-28
订阅专栏
Koordinator是一款基于k8s原生协议的调度器,能够精细化的调度资源
暂无订阅
共16篇文章
创建于2026-01-28
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
揭秘云原生混布资源调度器Koordinator (九)驱逐机制
核心使命与设计理念 9.1 What - 驱逐机制是什么? 驱逐(Eviction)是 Koordinator 在资源压力严重时,主动终止低优先级 Pod 以释放资源,保障高优先级 Pod 的 SLO
揭秘云原生混布资源调度器Koordinator (十一)CGroup 管理机制
核心使命与设计理念 11.1 CGroup 管理是什么? CGroup 管理是 Koordinator 对 Linux CGroup 的抽象封装和生命周期管理,提供统一的 API 来控制 Pod 的资
揭秘云原生混布资源调度器Koordinator (十四)DeviceShare 调度插件详解
一、核心使命与设计理念 1.1 DeviceShare 插件的使命 DeviceShare 是 Koordinator Scheduler 中的核心插件,负责 GPU、FPGA、RDMA 等异构设备的
揭秘云原生混布资源调度器Koordinator (十)ResourceExecutor 执行引擎
核心使命与设计理念 10.1 What - ResourceExecutor 是什么? ResourceExecutor 是 Koordlet 中的资源操作执行引擎,负责将 QOSManager 的决
揭秘云原生混布资源调度器Koordinator (十五)GPU 信息采集与上报机制
一、核心使命与设计理念 1.1 GPU 信息采集的使命 在 Koordinator GPU 调度体系中,Koordlet 承担着关键的数据采集角色。它负责从节点上获取 GPU 设备信息并上报到 Kub
揭秘云原生混布资源调度器Koordinator (八)资源隔离机制
核心使命与设计理念 8.1 What - 资源隔离是什么? 资源隔离是 Koordinator 通过 Linux CGroup 机制,实现不同 QoS 等级 Pod 之间的资源边界控制,防止相互干扰。
揭秘云原生混布资源调度器Koordinator (五)MetricAdvisor 指标采集与分析
核心使命与设计理念 5.1 What - MetricAdvisor 是什么? MetricAdvisor 是 Koordlet 中的指标采集和分析模块,负责实时收集节点和 Pod 的各种资源使用指标
揭秘云原生混布资源调度器Koordinator (六)MetricCache 指标缓存机制
核心使命与设计理念 6.1 What - MetricCache 是什么? MetricCache 是 Koordlet 中的时间序列数据库(TSDB),用于存储和查询历史指标数据。 核心职责: 接收
揭秘云原生混布资源调度器Koordinator (十六)GPU 资源隔离与 RuntimeHooks
一、核心使命与设计理念 1.1 GPU 资源隔离的使命 在 GPU 共享场景下,多个容器共享同一张 GPU 会面临严重的资源竞争和隔离问题: 生产案例 - 某AI平台的 GPU 隔离问题: 未隔离场景
揭秘云原生混布资源调度器Koordinator (二)核心 CRD 与 API 设计
API 体系概览 2.1 What - Koordinator API 设计的核心理念 Koordinator 的所有功能都通过 Kubernetes CRD(Custom Resource Defi
揭秘云原生混布资源调度器Koordinator (三)Koordlet 整体架构与工作流程
Koordlet 的核心地位 3.1 What - Koordlet 是什么? Koordlet 是 Koordinator 在每个 Kubernetes Node 上运行的 DaemonSet,是节
揭秘云原生混布资源调度器Koordinator (十二)CPU Throttle 机制
核心使命与设计理念 12.1 CPU Throttle 是什么? CPU Throttle 是 Linux CFS 调度器在 Pod 超过 CPU quota 限制时采取的限流措施,通过拒绝 CPU
揭秘云原生混布资源调度器Koordinator (十三)GPU 资源管理总览
一、核心使命与设计理念 1.1 Koordinator GPU 调度的使命 在 Kubernetes 原生环境中,GPU 资源调度存在以下痛点: 生产案例场景: 某互联网公司机器学习平台,拥有 200
揭秘云原生混布资源调度器Koordinator (四)StatesInformer 状态同步机制
核心使命与设计理念 4.1 What - StatesInformer 是什么? StatesInformer 是 Koordlet 中的状态同步和缓存模块,维护节点上所有 Pod、Node、Node
揭秘云原生混布资源调度器Koordinator (七)QOSManager 决策引擎
## 核心使命与设计理念 ### 7.1 What - QOSManager 是什么? QOSManager 是 Koordlet 中的**资源协调决策引擎**,负责根据节点资源状态和 Pod QoS
揭秘云原生混布资源调度器Koordinator (一)Koordinator 整体架构设计
核心概念与系统定位 1.1 What - Koordinator 是什么? Koordinator 是一个开源的 Kubernetes 混部调度系统,专门解决在线服务(LS)和批处理任务(BE)在同一