首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
胡萝北
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
胡萝北
9月前
关注
RL学习路线
一、基础入门阶段 书籍 深入浅出强化学习,郭宪著 reinforcement learning: an introduction, by Sutton,俞凯等译 视频 强化...
0
评论
分享
胡萝北
9月前
关注
综述阅读:后训练综述阅读笔记
后训练综述阅读笔记。主要介绍了微调(fine-tuning)、强化学习(RL)和测试时扩展(test-time scaling)等方法。...
1
评论
分享
个人成就
文章被点赞
1
文章被阅读
207
掘力值
21
关注了
0
关注者
0
收藏集
0
关注标签
4
加入于
2025-04-14