首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
接歌也
掘友等级
获得徽章 1
动态
文章
专栏
沸点
收藏集
关注
作品
赞
50
文章 42
沸点 8
赞
50
返回
|
搜索文章
最新
热门
Datawhale 大模型后训练 学习笔记 task1
这个教程是参考吴恩达的deeplearning.ai的课程编写的,并介绍了三种大模型后训练方法:监督微调、DPO、Online RL。本次的内容比较简单,只对这三种方法进行了简要介绍,具体的原理和实现
个人成就
文章被阅读
23
掘力值
10
关注了
41
关注者
1
收藏集
0
关注标签
0
加入于
2022-08-17