稀土掘金 稀土掘金
    • 首页
    • 沸点
    • 课程
    • 数据标注 HOT
    • AI Coding
    • 更多
      • 直播
      • 活动
      • APP
      • 插件
    • 直播
    • 活动
    • APP
    • 插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
用户53009365363的个人资料头像

用户53009365363

掘友等级
掘友2级:见习掘友
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
3
文章 3 沸点 0
赞
3
返回
|
搜索文章
赞
文章( 3 ) 沸点( 0 )
  • 大模型分布式训练并行技术(三)-流水线并行
    近年来,随着Transformer、MOE 架构的提出,使得深度学习模型轻松突破上万亿规模参数,传统的单机单
    • 吃果冻不吐果冻皮
    • 2年前
    • 12k
    • 10
    • 评论
    LLM 人工智能
    大模型分布式训练并行技术(三)-流水线并行
  • 大模型分布式训练并行技术(六)-多维混合并行
    近年来,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,传统的单机单卡
    • 吃果冻不吐果冻皮
    • 2年前
    • 7.9k
    • 11
    • 3
    LLM
  • 大模型分布式训练并行技术(九)-总结
    近年来,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,传统的单机单卡模式已经无法满足超大模型进行训练的要求。因此,我们需要基于单机多卡、甚至是多机多卡进行分布式
    • 吃果冻不吐果冻皮
    • 2年前
    • 5.4k
    • 4
    • 1
    LLM
  • 关注了
    1
    关注者
    0
    收藏集
    1
    关注标签
    20
    加入于
    2025-08-12