人工智能

人工智能

人工智能

主要包含 Tensorflow 、计算机视觉、自然语言处理、大模型、多模态等相关技术文章。

等 66 人订阅共177篇文章创建于2021-05-13

π0:一种用于通用机器人控制的视觉-语言-动作流模型

本文详细介绍了论文《π0:一种用于通用机器人控制的视觉-语言-动作流模型》中的关于模型的主要架构组成和数据搜集

1月前
70
1
评论

π0:一种用于通用机器人控制的视觉-语言-动作流模型

SmolVLA:一种用于经济实惠和高效的机器人视觉-语言-动作模型

SmolVLA:一种用于经济实惠和高效的机器人视觉-语言-动作模型，本文主要精读了该论文的核心内容。

1月前
84
2
评论

SmolVLA:一种用于经济实惠和高效的机器人视觉-语言-动作模型

详细比较 QLORA、LORA、MORA、LORI 常见参数高效微调方法

本文详细介绍了 QLORA、LORA、MORA、LORI 等常见参数高效微调方法的原理、优缺点，欢迎讨论交流。

2月前
221
1
评论

详细比较 QLORA、LORA、MORA、LORI 常见参数高效微调方法

VLA 模型综述：概念、进展、应用、挑战

Vision-Language-Action Models: Concepts, Progress, Applications and Challenges

2月前
574
1
评论

QWEN2.5-3B 蒸馏 QWEN2.5-0.5B

本文主要介绍了使用 QWEN2.5-3B 蒸馏 QWEN2.5-0.5B 的全过程，以及数据的制作过程。

2月前
102
1
评论

QWEN2.5-3B 蒸馏 QWEN2.5-0.5B

QWEN 3 TECHNICAL REPORT 精华

本文详细介绍了 QWEN 3 TECHNICAL REPORT 这篇论文中的核心精华部分，力求简洁明了。

2月前
191
1
2

QWEN 3 TECHNICAL REPORT 精华

Qwen2.5-VL 论文精读

本文主要介绍了 Qwen2.5-VL Technical Report 论文中的模型架构方面的新亮点。

2月前
281
1
评论

Qwen2.5-VL 论文精读

DeepSeek-V2 论文精读

本文记录了精读了最强开源模型 DeepSeek-V2 的论文，并记录了重要内容，供大家学习、交流和讨论

5月前
217
3
评论

DeepSeek-V2 论文精读

多卡 Deepspeed + Lora 微调 Qwen2.5-14B-Instruct

本文介绍了使用自定义数据集，多卡 Deepspeed + Lora 微调 Qwen2.5-14B-Instruct 过程，并介绍对比了多个实验结论

5月前
1.1k
2
1

多卡 Deepspeed + Lora 微调 Qwen2.5-14B-Instruct

DeepSeekMoE 论文精读

本文记录了精读了最强开源模型 DeepSeekMoE 的论文，并记录了重要内容，供大家学习、交流。

5月前
177
3
评论

DeepSeekMoE 论文精读

DeepSeek LLM 论文精读

本文记录了精读了最强开源模型 DeepSeek LLM 的论文，并记录了重要内容，供大家学习和交流

5月前
175
1
评论

DeepSeek LLM 论文精读

LLAVA 系列论文精读

本文记录了精读了视觉语言模型 LLAVA 和 LLAVA 1.5 系列的论文，并记录了重要内容，供大家学习和交流。

5月前
217
1
评论

Qwen2-VL 论文精读

本文记录了精读了阿里的视觉语言模型 Qwen2-VL 的论文，并记录了重要内容，供大家学习、讨论和交流。

5月前
174
1
评论

Qwen-VL 论文精读

本文记录了精读了阿里的视觉语言模型 Qwen-VL 的论文，并记录了重要内容，供大家学习、讨论和交流。

5月前
89
1
评论

QWEN 2.5 TECHNICAL REPORT 精华

本文记录了精读 QWEN 2.5 TECHNICAL REPORT 全论文，并且将要点全部进行了整理，供大家学习交流

5月前
489
1
评论

QWEN 2.5 TECHNICAL REPORT 精华

QWEN 2 TECHNICAL REPORT 精华

本文记录了精读 QWEN 2 TECHNICAL REPORT 全论文，并且将要点全部进行了整理，供大家学习和交流。

5月前
210
1
评论

QWEN 2 TECHNICAL REPORT 精华

QWEN TECHNICAL REPORT 精华

本文记录了精读 QWEN TECHNICAL REPORT 全论文，并且将要点全部进行了整理，供大家学习和交流

5月前
74
1
评论

QWEN TECHNICAL REPORT 精华

复现 LLAMA 模型

本文实现了简单结构的 LLAMA 模型，并且在实现模型结构的过程中，将介绍了涉及到的技术点，欢迎学习交流。

8月前
319
1
评论

深入剖析 deepspeed-chat 中 RLHF 的 PPO 算法代码细节

本文深入剖析 deepspeed-chat 开源项目中关于 RLHF 中的 PPO 算法代码细节，欢迎讨论学习

8月前
466
2
评论

深入剖析 deepspeed-chat 中 RLHF 的 PPO 算法代码细节

深入剖析 deepspeed-chat 中 RLHF 训练 SFT 和 Reward 的代码细节

本文深入剖析了 deepspeed-chat 中 RLHF 训练 SFT 和 Reward 的代码细节。

8月前
420
3
评论

深入剖析 deepspeed-chat 中 RLHF 训练 SFT 和 Reward 的代码细节