首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
我是王大你是谁
掘友等级
NLP,算法,大模型
|
宇宙尽头
每天进步一点点,不断提升自己,同时为行业做一点微不足道的贡献,vx:wangyansong_13
获得徽章 27
动态
文章
专栏
沸点
收藏集
关注
作品
赞
12.6K
文章 6.9K
沸点 5.7K
赞
12.6K
返回
|
搜索文章
最新
热门
DeepSeek LLM 论文精读
本文记录了精读了最强开源模型 DeepSeek LLM 的论文,并记录了重要内容,供大家学习和交流
LLAVA 系列论文精读
本文记录了精读了视觉语言模型 LLAVA 和 LLAVA 1.5 系列的论文,并记录了重要内容,供大家学习和交流。
Qwen2-VL 论文精读
本文记录了精读了阿里的视觉语言模型 Qwen2-VL 的论文,并记录了重要内容,供大家学习、讨论和交流。
Qwen-VL 论文精读
本文记录了精读了阿里的视觉语言模型 Qwen-VL 的论文,并记录了重要内容,供大家学习、讨论和交流。
QWEN 2.5 TECHNICAL REPORT 精华
本文记录了精读 QWEN 2.5 TECHNICAL REPORT 全论文,并且将要点全部进行了整理,供大家学习交流
QWEN 2 TECHNICAL REPORT 精华
本文记录了精读 QWEN 2 TECHNICAL REPORT 全论文,并且将要点全部进行了整理,供大家学习和交流。
QWEN TECHNICAL REPORT 精华
本文记录了精读 QWEN TECHNICAL REPORT 全论文,并且将要点全部进行了整理,供大家学习和交流
复现 LLAMA 模型
本文实现了简单结构的 LLAMA 模型,并且在实现模型结构的过程中,将介绍了涉及到的技术点,欢迎学习交流。
深入剖析 deepspeed-chat 中 RLHF 的 PPO 算法代码细节
本文深入剖析 deepspeed-chat 开源项目中关于 RLHF 中的 PPO 算法代码细节,欢迎讨论学习
深入剖析 deepspeed-chat 中 RLHF 训练 SFT 和 Reward 的代码细节
本文深入剖析了 deepspeed-chat 中 RLHF 训练 SFT 和 Reward 的代码细节。
下一页
个人成就
2023年度人气作者No.74
优秀创作者
文章被点赞
6,542
文章被阅读
973,736
掘力值
33,686
关注了
17
关注者
562
收藏集
3
关注标签
12
加入于
2019-07-03