首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
冬天的风滚草
掘友等级
守夜人
Higress Agent SIG Member 就算悲伤难抑,痛苦难明。也绝不能停止演奏。只有这样,我们才是真正活着的. ----- 宫园薰 github: undertaker86001
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
揭秘云原生混布资源调度器Koordinator (十六)GPU 资源隔离与 RuntimeHooks
一、核心使命与设计理念 1.1 GPU 资源隔离的使命 在 GPU 共享场景下,多个容器共享同一张 GPU 会面临严重的资源竞争和隔离问题: 生产案例 - 某AI平台的 GPU 隔离问题: 未隔离场景
揭秘云原生混布资源调度器Koordinator (十五)GPU 信息采集与上报机制
一、核心使命与设计理念 1.1 GPU 信息采集的使命 在 Koordinator GPU 调度体系中,Koordlet 承担着关键的数据采集角色。它负责从节点上获取 GPU 设备信息并上报到 Kub
揭秘云原生混布资源调度器Koordinator (十四)DeviceShare 调度插件详解
一、核心使命与设计理念 1.1 DeviceShare 插件的使命 DeviceShare 是 Koordinator Scheduler 中的核心插件,负责 GPU、FPGA、RDMA 等异构设备的
揭秘云原生混布资源调度器Koordinator (十三)GPU 资源管理总览
一、核心使命与设计理念 1.1 Koordinator GPU 调度的使命 在 Kubernetes 原生环境中,GPU 资源调度存在以下痛点: 生产案例场景: 某互联网公司机器学习平台,拥有 200
揭秘云原生混布资源调度器Koordinator (十二)CPU Throttle 机制
核心使命与设计理念 12.1 CPU Throttle 是什么? CPU Throttle 是 Linux CFS 调度器在 Pod 超过 CPU quota 限制时采取的限流措施,通过拒绝 CPU
揭秘云原生混布资源调度器Koordinator (十一)CGroup 管理机制
核心使命与设计理念 11.1 CGroup 管理是什么? CGroup 管理是 Koordinator 对 Linux CGroup 的抽象封装和生命周期管理,提供统一的 API 来控制 Pod 的资
揭秘云原生混布资源调度器Koordinator (十)ResourceExecutor 执行引擎
核心使命与设计理念 10.1 What - ResourceExecutor 是什么? ResourceExecutor 是 Koordlet 中的资源操作执行引擎,负责将 QOSManager 的决
揭秘云原生混布资源调度器Koordinator (九)驱逐机制
核心使命与设计理念 9.1 What - 驱逐机制是什么? 驱逐(Eviction)是 Koordinator 在资源压力严重时,主动终止低优先级 Pod 以释放资源,保障高优先级 Pod 的 SLO
揭秘云原生混布资源调度器Koordinator (八)资源隔离机制
核心使命与设计理念 8.1 What - 资源隔离是什么? 资源隔离是 Koordinator 通过 Linux CGroup 机制,实现不同 QoS 等级 Pod 之间的资源边界控制,防止相互干扰。
揭秘云原生混布资源调度器Koordinator (七)QOSManager 决策引擎
## 核心使命与设计理念 ### 7.1 What - QOSManager 是什么? QOSManager 是 Koordlet 中的**资源协调决策引擎**,负责根据节点资源状态和 Pod QoS
下一页
个人成就
文章被点赞
5
文章被阅读
5,139
掘力值
520
关注了
1
关注者
9
收藏集
0
关注标签
2
加入于
2022-11-25