首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Z同学
掘友等级
机器学习平台开发
|
贝壳找房
一个玩基金的程序员
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
6
文章 6
沸点 0
赞
6
返回
|
搜索文章
赞
文章( 6 )
沸点( 0 )
容器化nccl-test与参数详解
基于容器的nccl-tests测试。包含容器构建,ssh配置,nccl-test测试流程及结果分析。
FasterTransformer框架速览
asterTransformer 包含 Transformer 块的高度优化版本的实现,其中包含编码器 Encoder 和解码器 Decoder部分。基于 FT 可以运行完整的编码器-解码器架构模型。
网易云音乐机器学习平台实践
机器学习平台为算法相关工作者提供基础的开发调度环境,为机器学习各个系统提供集成与接入的能力,为各个机器学习相关子系统形成一套标准化流程提供保障。
基于Prometheus+grafana+mysql的k8s集群监控
基于Prometheus-operator的GPU集群监控,主要监控机器学习平台中训练及推理任务的相关指标。
二进制部署的k8s集群更换到期证书
对于二进制部署的k8s集群,更换过期的认证证书,同时需要保证线上服务不受影响,主要解释证书的相关概念及操作流程。
基于fluentd+kafka的容器日志收集
k8s集群中的服务需要收集日志,采用fluentd收集容器的日志文件,并通过kafka达到ELK中。
个人成就
文章被点赞
28
文章被阅读
15,362
掘力值
332
关注了
5
关注者
10
收藏集
0
关注标签
13
加入于
2022-01-03