首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
lhn
掘友等级
算法
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
记录一次SSH登录实验室服务器失败的解决办法
排查 SSH 登录失败:常规连接数分钟后被 22 端口断开。先用 nc -vz 验证端口可达,再强制使用密码认证(禁用公钥尝试)立即弹出密码提示,输入后成功登录,确认问题出在默认公钥认证流程而非网络。
大模型强化学习总结
将强化学习应用于强大的基础模型,并结合已经验证的奖励机制,能够显著提升模型的推理能力和性能。Deepseek-R1、Kimi K1.5均是通过策略梯度算法训练而成的。
个人成就
文章被阅读
18
关注了
0
关注者
0
收藏集
0
关注标签
3
加入于
2024-10-23