稀土掘金 稀土掘金
  • 首页
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
rl
订阅
avatar
风雨中的小七 创作等级LV.4
更多收藏集

微信扫码分享

微信
新浪微博
QQ

1篇文章 · 0订阅
  • 在一张 24 GB 的消费级显卡上用 RLHF 微调 20B LLMs
    我们很高兴正式发布 trl 与 peft 的集成,使任何人都可以更轻松地使用强化学习进行大型语言模型 (LLM) 微调!在这篇文章中,我们解释了为什么这是现有微调方法的有竞争力的替代方案。 请注意,
    • HuggingFace
    • 2年前
    • 1.8k
    • 12
    • 1
    人工智能
    在一张 24 GB 的消费级显卡上用 RLHF 微调 20B LLMs