CoovallyAIHub

赞

0

|

搜索文章

告别碎片化！Dinomaly2：一个极简框架统一所有异常检测任务

简单，是终极的复杂。——列奥纳多·达·芬奇在工业质检、医疗诊断、安防监控等领域，异常检测一直扮演着至关重要的角色。然而，这个领域长期以来面临着一个核心痛点：方法碎片化。想象一下，你的工厂需要检测2

5月前
263
点赞
评论

告别碎片化！Dinomaly2：一个极简框架统一所有异常检测任务

当视觉语言模型接收到相互矛盾的信息时，它会相信哪个信号？

多模态AI并非平等处理所有信息，其偏好暗藏玄机近年来，视觉语言模型（VLMs）在多种任务上展现出了令人印象深刻的能力，它们能够同时理解图像和文本信息，完成复杂的推理任务。然而，当图像和文本信息相互矛

5月前
146
1
评论

当视觉语言模型接收到相互矛盾的信息时，它会相信哪个信号？

未来已来：从 CVPR & ICCV 观察 2025→2026 年计算机视觉的七大走向

国际计算机视觉与模式识别会议（CVPR 2025）和国际计算机视觉大会（ICCV 2025）作为计算机视觉领域的两大顶级会议，今年呈现了领域内的最新突破与前沿趋势。 CVPR 2025的整体接收率仅为

6月前
710
点赞
评论

未来已来：从 CVPR & ICCV 观察 2025→2026 年计算机视觉的七大走向

Cursor 2.0 太离谱了！8 个 AI 同时写代码，还能自己测！

Cursor 2.0 发布了，真的太炸裂了！这次发布时间也太巧了——就在几天前，Claude Code 才刚刚发布它的 2.0 版本。 Cursor 2.0 可以说是一次对「AI 编码编辑器」的彻底

6月前
1.0k
2
评论

Cursor 2.0 太离谱了！8 个 AI 同时写代码，还能自己测！

视觉语言模型（VLM）深度解析：如何用它来处理文档？

视觉语言模型是一类强大的机器学习模型，能够同时处理视觉（图像）和文本信息。随着最近 Qwen 3 VL 模型的发布，我想带大家深入探讨一下，如何利用这些强大的 VLM 来处理文档。为什么你需要使用

6月前
311
点赞
评论

视觉语言模型（VLM）深度解析：如何用它来处理文档？

估值百亿独角兽创始人硕士论文曝光！宇树科技王兴兴的“性价比”思维10年前就已注定

“人火了是连毕业论文都要被翻出来的。”这条互联网定律再次应验——宇树科技CEO王兴兴的硕士毕业论文近日被网友们掘地三尺找了出来。令人惊讶的是，这篇近十年前的论文不仅预示了如今机器人行业的技术路线转变

6月前
458
点赞
评论

估值百亿独角兽创始人硕士论文曝光！宇树科技王兴兴的“性价比”思维10年前就已注定

超越传统3D生成：OccScene实现感知与生成的跨任务共赢

无需依赖真实标注，仅凭文字提示即可生成高质量3D场景在自动驾驶、机器人导航等领域，3D场景的感知与生成一直是研究热点。然而，传统方法通常将这两个过程分离：生成模型仅仅作为数据增强工具，为下游感知任务

6月前
154
点赞
评论

超越传统3D生成：OccScene实现感知与生成的跨任务共赢

华为世界模型来了！30分钟生成272㎡室内场景，虚拟人导航不迷路

3D场景生成迎来突破，大平层里虚拟人也能自由行走近日，华为联合上海交通大学、华中科技大学推出了全新的世界模型WorldGrow，该模型能够生成高达1800㎡的超大室内场景（19x39块），且单张A1

6月前
457
1
评论

一致性模型：单步生成高质量图像，破解扩散模型速度瓶颈

这篇名为《一致性模型》的论文提出了一类新的生成模型，能够一步到位地生成高质量图像，解决了扩散模型的主要瓶颈——采样过程慢、需要多次迭代。它的核心贡献在于证明了：在保持扩散模型强大表达能力和训练稳定性的

6月前
221
2
评论

一致性模型：单步生成高质量图像，破解扩散模型速度瓶颈

搞定边缘AI部署：开源神器RamaLama，让视觉语言模型无处不在

人工智能的前沿不再只是数据中心；它在于工厂车间、零售店、公共基础设施以及我们周围的智能设备。推动这一转变的是视觉语言模型（VLM），这是一个革命性的人工智能，可以解释和推理图像和视频。潜力巨大，但任何

6月前
182
2
评论

搞定边缘AI部署：开源神器RamaLama，让视觉语言模型无处不在

个人成就

优秀创作者

文章被点赞 189

文章被阅读 146,527

掘力值 9,977

加入于

2025-01-02