首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
我是王大你是谁
掘友等级
NLP,算法,大模型
|
宇宙尽头
每天进步一点点,不断提升自己,同时为行业做一点微不足道的贡献,vx:wangyansong_13
获得徽章 27
动态
文章
专栏
沸点
收藏集
关注
作品
赞
12.6K
文章 6.9K
沸点 5.8K
赞
12.6K
返回
|
搜索文章
最新
热门
π0:一种用于通用机器人控制的视觉-语言-动作流模型
本文详细介绍了论文《π0:一种用于通用机器人控制的视觉-语言-动作流模型》中的关于模型的主要架构组成和数据搜集
SmolVLA:一种用于经济实惠和高效的机器人视觉-语言-动作模型
SmolVLA:一种用于经济实惠和高效的机器人视觉-语言-动作模型,本文主要精读了该论文的核心内容。
详细比较 QLORA、LORA、MORA、LORI 常见参数高效微调方法
本文详细介绍了 QLORA、LORA、MORA、LORI 等常见参数高效微调方法的原理、优缺点,欢迎讨论交流。
VLA 模型综述:概念、进展、应用、挑战
Vision-Language-Action Models: Concepts, Progress, Applications and Challenges
QWEN2.5-3B 蒸馏 QWEN2.5-0.5B
本文主要介绍了使用 QWEN2.5-3B 蒸馏 QWEN2.5-0.5B 的全过程,以及数据的制作过程。
QWEN 3 TECHNICAL REPORT 精华
本文详细介绍了 QWEN 3 TECHNICAL REPORT 这篇论文中的核心精华部分,力求简洁明了。
Qwen2.5-VL 论文精读
本文主要介绍了 Qwen2.5-VL Technical Report 论文中的模型架构方面的新亮点。
DeepSeek-V2 论文精读
本文记录了精读了最强开源模型 DeepSeek-V2 的论文,并记录了重要内容,供大家学习、交流和讨论
多卡 Deepspeed + Lora 微调 Qwen2.5-14B-Instruct
本文介绍了使用自定义数据集,多卡 Deepspeed + Lora 微调 Qwen2.5-14B-Instruct 过程,并介绍对比了多个实验结论
DeepSeekMoE 论文精读
本文记录了精读了最强开源模型 DeepSeekMoE 的论文,并记录了重要内容,供大家学习、交流。
下一页
个人成就
2023年度人气作者No.74
优秀创作者
文章被点赞
6,542
文章被阅读
973,684
掘力值
33,686
关注了
17
关注者
562
收藏集
3
关注标签
12
加入于
2019-07-03