首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
冬天的风滚草
掘友等级
守夜人
Higress Agent SIG Member 就算悲伤难抑,痛苦难明。也绝不能停止演奏。只有这样,我们才是真正活着的. ----- 宫园薰 github: undertaker86001
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
揭秘云原生混布资源调度器Koordinator (十六)GPU 资源隔离与 RuntimeHooks
一、核心使命与设计理念 1.1 GPU 资源隔离的使命 在 GPU 共享场景下,多个容器共享同一张 GPU 会面临严重的资源竞争和隔离问题: 生产案例 - 某AI平台的 GPU 隔离问题: 未隔离场景
揭秘云原生混布资源调度器Koordinator (十五)GPU 信息采集与上报机制
一、核心使命与设计理念 1.1 GPU 信息采集的使命 在 Koordinator GPU 调度体系中,Koordlet 承担着关键的数据采集角色。它负责从节点上获取 GPU 设备信息并上报到 Kub
揭秘云原生混布资源调度器Koordinator (十四)DeviceShare 调度插件详解
一、核心使命与设计理念 1.1 DeviceShare 插件的使命 DeviceShare 是 Koordinator Scheduler 中的核心插件,负责 GPU、FPGA、RDMA 等异构设备的
揭秘云原生混布资源调度器Koordinator (十三)GPU 资源管理总览
一、核心使命与设计理念 1.1 Koordinator GPU 调度的使命 在 Kubernetes 原生环境中,GPU 资源调度存在以下痛点: 生产案例场景: 某互联网公司机器学习平台,拥有 200
揭秘云原生混布资源调度器Koordinator (十二)CPU Throttle 机制
核心使命与设计理念 12.1 CPU Throttle 是什么? CPU Throttle 是 Linux CFS 调度器在 Pod 超过 CPU quota 限制时采取的限流措施,通过拒绝 CPU
揭秘云原生混布资源调度器Koordinator (十一)CGroup 管理机制
核心使命与设计理念 11.1 CGroup 管理是什么? CGroup 管理是 Koordinator 对 Linux CGroup 的抽象封装和生命周期管理,提供统一的 API 来控制 Pod 的资
揭秘云原生混布资源调度器Koordinator (十)ResourceExecutor 执行引擎
核心使命与设计理念 10.1 What - ResourceExecutor 是什么? ResourceExecutor 是 Koordlet 中的资源操作执行引擎,负责将 QOSManager 的决
揭秘云原生混布资源调度器Koordinator (九)驱逐机制
核心使命与设计理念 9.1 What - 驱逐机制是什么? 驱逐(Eviction)是 Koordinator 在资源压力严重时,主动终止低优先级 Pod 以释放资源,保障高优先级 Pod 的 SLO
揭秘云原生混布资源调度器Koordinator (八)资源隔离机制
核心使命与设计理念 8.1 What - 资源隔离是什么? 资源隔离是 Koordinator 通过 Linux CGroup 机制,实现不同 QoS 等级 Pod 之间的资源边界控制,防止相互干扰。
揭秘云原生混布资源调度器Koordinator (七)QOSManager 决策引擎
## 核心使命与设计理念 ### 7.1 What - QOSManager 是什么? QOSManager 是 Koordlet 中的**资源协调决策引擎**,负责根据节点资源状态和 Pod QoS
下一页
个人成就
文章被点赞
5
文章被阅读
6,090
掘力值
522
关注了
1
关注者
10
收藏集
0
关注标签
2
加入于
2022-11-25