首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
分布式训练学习记录
谁tm抢我神奇小饼干
创建于2024-11-14
订阅专栏
记录分布式训练的学习
暂无订阅
共3篇文章
创建于2024-11-14
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
学习记录:分布式训练03
Distributed Data Parallel 原理及应用 Distributed Data Parallel 原理 训练流程: Step1 使用多个进程,每个进程都加载数据和模型 Step2 各
学习记录:分布式训练02
Data Parallerl 原理与应用 Data Parrallel 原理 什么是数据并行 每个GPU里都存一份完整的模型,训练时每个GPU里的模型训练不同的数据 适用于单卡能够运行完整训练流程的情
学习记录:分布式训练01
分布式训练基础与环境配置 来源:【手把手带你实战HuggingFace Transformers-分布式训练篇】分布式训练与环境配置 什么是分布式训练 分布式(Distributed)是指系统或计算任