首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Z同学
掘友等级
机器学习平台开发
|
贝壳找房
一个玩基金的程序员
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
6
文章 6
沸点 0
赞
6
返回
|
搜索文章
最新
热门
容器化nccl-test与参数详解
基于容器的nccl-tests测试。包含容器构建,ssh配置,nccl-test测试流程及结果分析。
GPU虚拟化实践
随着AI应用的普及,GPU资源的使用越来越多,如何提高资源利用率降低公司成本很重要,本文主要介绍基于k8s的GPU虚拟化方案。
基于fluentd+kafka的容器日志收集
k8s集群中的服务需要收集日志,采用fluentd收集容器的日志文件,并通过kafka达到ELK中。
二进制部署的k8s集群更换到期证书
对于二进制部署的k8s集群,更换过期的认证证书,同时需要保证线上服务不受影响,主要解释证书的相关概念及操作流程。
基于Prometheus+grafana+mysql的k8s集群监控
基于Prometheus-operator的GPU集群监控,主要监控机器学习平台中训练及推理任务的相关指标。
个人成就
文章被点赞
28
文章被阅读
14,421
掘力值
330
关注了
5
关注者
10
收藏集
0
关注标签
13
加入于
2022-01-03