首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
yumuing
掘友等级
人工智能领域开发者@yumuing
探索技术的每一个角落,解码世界的每一种可能! 人工智能领域开发者,博客:https://yumuing.top
获得徽章 1
动态
文章
专栏
沸点
收藏集
关注
作品
赞
111
文章 100
沸点 11
赞
111
返回
|
搜索文章
yumuing
人工智能领域开发者@yumuing
·
25天前
关注
Visual-RFT视觉强化微调:用「试错学习」教会AI看图说话
上海AI实验室最新突破!Visual-RFT技术让视觉模型像人类一样通过"尝试-反馈-改进"的强化学习机制,仅用几十张图片就能精通目标检测、细粒度分类等高难度任务,多项指标...
1
评论
分享
yumuing
关注了
楷鹏Dev
人工智能领域开发者@yumuing
yumuing
人工智能领域开发者@yumuing
·
7月前
关注
[论文解读]AI Scientist:不到15美元,写完你的毕业论文,优秀的论文写作工具
几十年来,每次AI取得重大进展后,研究人员经常开玩笑说:“是时候研究让AI帮我们写论文了”。现在,这个想法终于从玩笑变成现实。不到 15 美元,你就可以拥有一篇高质量的毕业...
1
评论
分享
yumuing
关注了
量子位
人工智能领域开发者@yumuing
yumuing
人工智能领域开发者@yumuing
·
8月前
举报
自动驾驶独角兽Wayve 开源 WayveScenes101 数据集啦!101 个高度多样化的真实动态驾驶场景,包含丰富路况与细粒度模型评估的场景级属性,它会成为自动驾驶的神奇魔法棒,加速自动驾驶的普及,准备好和它一起出发了吗?
解码 WayveScenes101 数据集:自动驾驶独角兽Wayve背后的超级引擎
juejin.cn
好文推荐
等人赞过
分享
3
4
yumuing
赞了这篇文章
TF男孩
掘金签约作者,编程表演艺术家
·
2年前
关注
你来掘金不看技术文章吗?
最近有种错觉,谁能给我分析一下:我感觉在掘金,技术干货文章慢慢没落,闲聊的文章却很受追捧。当然,这个妄想,仅仅就我个人而言。...
219
150
分享
yumuing
人工智能领域开发者@yumuing
·
8月前
关注
解码 WayveScenes101 数据集:自动驾驶独角兽Wayve背后的超级引擎
自动驾驶独角兽Wayve 开源 WayveScenes101 数据集啦!101 个高度多样化的真实动态驾驶场景,包含丰富路况与细粒度模型评估的场景级属性,它会成为自动驾驶神...
2
评论
分享
yumuing
关注了
机器之心
人工智能领域开发者@yumuing
yumuing
人工智能领域开发者@yumuing
·
9月前
关注
【论文解读】AGENTLESS:揭开LLM软件工程助手的神秘面纱,重塑软件工程自动化新基线
一种自动解决软件开发问题的无代理方法:更简化且无需复杂工具设计或自主决策规划的高性能方案,将有助于重置自治软件代理的基线、起点和视野,并激发未来朝着这一关键方向开展工作。...
1
评论
分享
yumuing
人工智能领域开发者@yumuing
·
9月前
关注
LivePortrait:让人脸动起来的魔法秀|可灵(快手)
想让人脸动起来吗?LivePortrait来啦!它能把静态肖像变成生动动画,速度超快,质量超高!还有特别模块,让你轻松控制效果。快来体验,让你的个人照焕发神奇魅力!...
6
1
分享
yumuing
人工智能领域开发者@yumuing
·
9月前
关注
TextGrad:即插即用 LLM 自动优化框架,提高各专业文本领域零样本准确率
TEXTGRAD成功地展示了通过文本反馈进行复合AI系统优化的能力,不仅提升了模型性能,还降低了运行成本。它为复杂AI系统的自动化优化提供了一种新的、有效的途径,证明了自然...
1
评论
分享
yumuing
人工智能领域开发者@yumuing
·
9月前
关注
ExVideo: 提升5倍性能-用于视频合成模型的新型后调谐方法
该研究的核心在于开发了一种创新的后调优方法——ExVideo,它致力于克服当前视频扩散模型在生成长时间视频方面的限制。ExVideo的设计目标是增强现有模型的功能,使之在不...
1
评论
分享
yumuing
人工智能领域开发者@yumuing
·
9月前
关注
LangGPT:高质量提示词框架
研究团队开发了一种名为LangGPT的框架,旨在为大型语言模型(LLMs)提供结构化且可重用的提示设计方法。LangGPT的设计灵感来源于编程语言的结构化特性,以解决非AI...
1
评论
分享
yumuing
人工智能领域开发者@yumuing
·
9月前
关注
Depth Anything V2:抖音开源高性能任何单目图像深度估计V2版本,并开放具有精确注释和多样化场景的多功能评估基准
实现了一种名为“深度任意物V2”的单目深度估计算法,旨在通过三个关键实践:使用合成图像代替真实标记图、增加教师模型容量以及通过大规模伪标记的真实图像教授学生模型等方法,提高...
2
评论
分享
yumuing
人工智能领域开发者@yumuing
·
9月前
关注
MCT Self-Refine:创新集成蒙特卡洛树搜索 (MCTS)提高复杂数学推理任务的性能,超GPT4,使用 LLaMa-3 8B 进行自我优化
本文介绍了一种名为MCTSelf-Refine(MCTSr)的新算法,它将大型语言模型(LLMs)与蒙特卡罗树搜索(MCTS)相结合,旨在提高复杂数学推理任务的表现。...
1
评论
分享
yumuing
人工智能领域开发者@yumuing
·
9月前
关注
自回归模型胜过扩散模型:用于可扩展图像生成的 Llama
将大型语言模型(LLMs)的“下一个令牌预测”范式应用于视觉生成领域。LlamaGen探索了是否未经视觉信号归纳偏置调整的原始自回归模型,如Llama,通过适当扩展后能实现...
1
评论
分享
yumuing
人工智能领域开发者@yumuing
·
9月前
关注
X-LoRA:高效微调 LoRA 系列,实现不同领域知识专家混合模型
X-LoRA框架的提出是一个重大的创新,它为大型语言模型的适应性和扩展性开辟了新的路径。其能够动态混合不同领域的专家知识,为解决复杂、跨学科问题提供了强大的工具。...
2
评论
分享
yumuing
人工智能领域开发者@yumuing
·
9月前
关注
Samba:用于高效无限上下文语言建模的简单混合状态空间模型
SAMBA通过巧妙结合不同的建模方法,解决了无限上下文建模的效率与能力问题。其在处理超长序列时的性能提升尤为引人注目,同时也展示了在不同任务上的广泛适用性和优越性。...
1
评论
分享
yumuing
人工智能领域开发者@yumuing
·
9月前
关注
MeshAnything:艺术家级别的自回归3D网格生成
MeshAnything通过创新地将网格提取视为一个生成问题,成功地缩小了自动生产与手工创建3D资产之间的差距。该模型不仅提升了网格的拓扑效率,降低了存储和处理成本,还通过...
1
评论
分享
yumuing
人工智能领域开发者@yumuing
·
10月前
关注
LLaVA UHD:一种可感知任意纵横比和高分辨率图像的LMM
(1)一种图像模块化策略,将原生分辨率图像划分为更小的可变大小切片,以实现高效和可扩展的编码,(2)一个压缩模块,进一步压缩来自视觉编码器的图像标记,以及(3)一个空间模式...
2
评论
分享
下一页
个人成就
文章被点赞
236
文章被阅读
50,184
掘力值
1,819
关注了
6
关注者
52
收藏集
1
关注标签
14
加入于
2021-11-28