稀土掘金 稀土掘金
    • 首页
    • 沸点
    • 课程
    • 数据标注 HOT
    • AI Coding
    • 更多
      • 直播
      • 活动
      • APP
      • 插件
    • 直播
    • 活动
    • APP
    • 插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
ai
订阅
avatar
halamarcus
更多收藏集

微信扫码分享

微信
新浪微博
QQ

1篇文章 · 0订阅
  • DeepSeek-R1:开源Top推理模型的实现细节、使用与复现
    直接用强化学习就可以让模型获得显著的推理能力,说明并不一定需要SFT才行。 强化学习并不一定需要复杂的奖励模型,使用简单的规则反而取得意想不到的效果。 通过知识蒸馏让小模型一定程
    • 深度学习机器
    • 1年前
    • 667
    • 1
    • 评论
    算法 人工智能 开源
    DeepSeek-R1:开源Top推理模型的实现细节、使用与复现