稀土掘金 稀土掘金
    • 首页
    • AI Coding
    • 数据标注 NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
lhn的个人资料头像

lhn

掘友等级
掘友3级:新星掘友
算法
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0 沸点 0
赞
0
返回
|
搜索文章
最新 热门
  • 记录一次SSH登录实验室服务器失败的解决办法
    排查 SSH 登录失败:常规连接数分钟后被 22 端口断开。先用 nc -vz 验证端口可达,再强制使用密码认证(禁用公钥尝试)立即弹出密码提示,输入后成功登录,确认问题出在默认公钥认证流程而非网络。
    • 4小时前
    • 5
    • 点赞
    • 评论
    算法
  • 大模型强化学习总结
    将强化学习应用于强大的基础模型,并结合已经验证的奖励机制,能够显著提升模型的推理能力和性能。Deepseek-R1、Kimi K1.5均是通过策略梯度算法训练而成的。
    • 4小时前
    • 13
    • 点赞
    • 评论
    算法
    大模型强化学习总结
  • 个人成就
    文章被阅读 18
    关注了
    0
    关注者
    0
    收藏集
    0
    关注标签
    3
    加入于
    2024-10-23