我是王大你是谁

NLP，算法，大模型 | 宇宙尽头

每天进步一点点，不断提升自己，同时为行业做一点微不足道的贡献，vx：wangyansong_13

获得徽章 27

赞

12.7K

|

搜索文章

DeepSeek LLM 论文精读

本文记录了精读了最强开源模型 DeepSeek LLM 的论文，并记录了重要内容，供大家学习和交流

1年前
380
1
评论

DeepSeek LLM 论文精读

LLAVA 系列论文精读

本文记录了精读了视觉语言模型 LLAVA 和 LLAVA 1.5 系列的论文，并记录了重要内容，供大家学习和交流。

1年前
491
1
评论

Qwen2-VL 论文精读

本文记录了精读了阿里的视觉语言模型 Qwen2-VL 的论文，并记录了重要内容，供大家学习、讨论和交流。

1年前
526
1
评论

Qwen-VL 论文精读

本文记录了精读了阿里的视觉语言模型 Qwen-VL 的论文，并记录了重要内容，供大家学习、讨论和交流。

1年前
421
1
评论

QWEN 2.5 TECHNICAL REPORT 精华

本文记录了精读 QWEN 2.5 TECHNICAL REPORT 全论文，并且将要点全部进行了整理，供大家学习交流

1年前
914
1
评论

QWEN 2.5 TECHNICAL REPORT 精华

QWEN 2 TECHNICAL REPORT 精华

本文记录了精读 QWEN 2 TECHNICAL REPORT 全论文，并且将要点全部进行了整理，供大家学习和交流。

1年前
547
1
评论

QWEN 2 TECHNICAL REPORT 精华

QWEN TECHNICAL REPORT 精华

本文记录了精读 QWEN TECHNICAL REPORT 全论文，并且将要点全部进行了整理，供大家学习和交流

1年前
294
1
评论

QWEN TECHNICAL REPORT 精华

复现 LLAMA 模型

本文实现了简单结构的 LLAMA 模型，并且在实现模型结构的过程中，将介绍了涉及到的技术点，欢迎学习交流。

1年前
525
1
评论

深入剖析 deepspeed-chat 中 RLHF 的 PPO 算法代码细节

本文深入剖析 deepspeed-chat 开源项目中关于 RLHF 中的 PPO 算法代码细节，欢迎讨论学习

1年前
736
2
评论

深入剖析 deepspeed-chat 中 RLHF 的 PPO 算法代码细节

深入剖析 deepspeed-chat 中 RLHF 训练 SFT 和 Reward 的代码细节

本文深入剖析了 deepspeed-chat 中 RLHF 训练 SFT 和 Reward 的代码细节。

1年前
700
3
评论

深入剖析 deepspeed-chat 中 RLHF 训练 SFT 和 Reward 的代码细节

个人成就

2023年度人气作者No.74

优秀创作者

文章被点赞 6,552

文章被阅读 1,096,175

掘力值 33,962

加入于

2019-07-03