首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
DCOS
掘友等级
公众号:DCOS
云原生
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
15
文章 15
沸点 0
赞
15
返回
|
搜索文章
DCOS
公众号:DCOS
·
4年前
关注
DCGM:监控Kubernetes集群的GPU资源
NVIDIA DCGM是用于管理和监控基于Linux系统的NVIDIA GPU大规模集群的一体化工具。它是一个低开销的工具,提供多种能力,包括主动健康监控、诊断、系统验证、...
0
1
分享
DCOS
公众号:DCOS
·
4年前
关注
Kubelet从入门到放弃系列:GPU加持
<Kubelet从入门到放弃>系列将对Kubelet组件由基础知识到源码进行深入梳理。在这篇文章<Kubernetes与GPU齐飞>中zouyee会先介...
2
1
分享
DCOS
公众号:DCOS
·
4年前
关注
Kubelet从入门到放弃:拓扑管理(下)
<Kubelet从入门到放弃>系列将对Kubelet组件由基础知识到源码进行深入梳理。上一篇zouyee带各位看了CPU 管理的相关内容,其中提及拓扑管理,本文将...
2
评论
分享
DCOS
公众号:DCOS
·
4年前
关注
Kubelet从入门到放弃:拓扑管理(上)
<Kubelet从入门到放弃>系列将对Kubelet组件由基础知识到源码进行深入梳理。上一篇zouyee带各位看了CPU 管理的相关内容,其中提及拓扑管理,本文将...
1
评论
分享
DCOS
公众号:DCOS
·
4年前
关注
Kubelet从入门到放弃:识透CPU管理(下)
三、源码分析对于上图的内容,zouyee总结流程如下:pkg/kubelet/cm/container_manager_linux.go涉及代码pkg/kubelet/cm...
2
评论
分享
DCOS
公众号:DCOS
·
4年前
关注
Kubelet从入门到放弃:识透CPU管理
<Kubelet从入门到放弃>系列将对Kubelet组件由基础知识到源码进行深入梳理。在这篇文章中zouyee会介绍CPU的相关概念以及Kubelet组件CPU ...
1
评论
分享
DCOS
公众号:DCOS
·
4年前
关注
OpenAI关于Kubernetes集群近万节点的生产实践
OpenAI已经将Kubernetes集群规模扩展至7500个节点,为大型神经网络模型(如GPT-3,CLIP和DALL·E)及小型实验性研究提供了可扩展的基础架构。 很少...
5
评论
分享
DCOS
公众号:DCOS
·
4年前
关注
Kubernetes废弃PodSecurityPolicy后续
Kubernetes社区将在1.21版本中弃用PSP,并将1.25版本中移除该API。目前CNCF生态圈类似项目:Kyverno与Open Policy Agen(OPA)...
2
评论
分享
DCOS
公众号:DCOS
·
4年前
关注
Kubernetes调度由浅入深:框架
书接上文《Kubernetes调度系统由浅入深系列:初探》,今天zouyee为大家带来《kuberneter调度由浅入深:框架》,该系列对应版本为1.20.+. 在《Kub...
6
2
分享
DCOS
公众号:DCOS
·
4年前
关注
Containerd镜像lazy-pulling解读
今天zouyee朋友段全锋童鞋为大家带来《Containerd镜像lazy-pulling解读》,其中《kuberneter调度由浅入深:框架》正在编写中,敬请期待。一、背...
6
1
分享
DCOS
公众号:DCOS
·
4年前
关注
CloudEvents三部曲:实践篇
随着云原生的发展(云原生的下一个五年在哪里?),逐步进入深水区,业界需要一种统一的事件定义和描述规范,以提供跨服务、跨平台的交互能力。CloudEvents事件规范应运而生...
2
评论
分享
DCOS
公众号:DCOS
·
4年前
关注
Kubernetes调度由浅入深:初探
在开始前,先来看看Kubernetes的架构示意图,其中控制平面包含以下三大组件:kube-scheduler、kube-apiserver、kube-controll...
8
2
分享
个人成就
文章被点赞
37
文章被阅读
26,280
掘力值
582
关注了
0
关注者
28
收藏集
0
关注标签
0
加入于
2019-09-25