稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
微调
订阅
avatar
houchenll 创作等级LV.3
更多收藏集

微信扫码分享

微信
新浪微博
QQ

3篇文章 · 0订阅
  • 大模型训练中优化策略(数据并行、模型并行、ZeRO等)
    大模型训练中的优化策略简述,包括数据并行、模型并行、ZeRO。首先分析显存占用,然后分析这些操作的原理。
    • Pickup
    • 1年前
    • 2.3k
    • 9
    • 3
    算法 深度学习
    大模型训练中优化策略(数据并行、模型并行、ZeRO等)
  • 大模型分布式训练并行技术(四)-张量并行
    近年来,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,传统的单机单卡
    • 吃果冻不吐果冻皮
    • 2年前
    • 8.0k
    • 5
    • 3
    LLM
  • 使用微调定制属于自己的大模型
    模型效果差?输出不够稳定?本文将介绍大模型微调原理与实践以及所适用的场景。试试用微调定制属于自己的大模型吧。
    • 火石
    • 1年前
    • 8.4k
    • 37
    • 10
    前端 后端 算法
    使用微调定制属于自己的大模型