首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
CoovallyAIHub
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
告别碎片化!Dinomaly2:一个极简框架统一所有异常检测任务
简单,是终极的复杂。——列奥纳多·达·芬奇 在工业质检、医疗诊断、安防监控等领域,异常检测一直扮演着至关重要的角色。然而,这个领域长期以来面临着一个核心痛点:方法碎片化。 想象一下,你的工厂需要检测2
当视觉语言模型接收到相互矛盾的信息时,它会相信哪个信号?
多模态AI并非平等处理所有信息,其偏好暗藏玄机 近年来,视觉语言模型(VLMs)在多种任务上展现出了令人印象深刻的能力,它们能够同时理解图像和文本信息,完成复杂的推理任务。然而,当图像和文本信息相互矛
未来已来:从 CVPR & ICCV 观察 2025→2026 年计算机视觉的七大走向
国际计算机视觉与模式识别会议(CVPR 2025)和国际计算机视觉大会(ICCV 2025)作为计算机视觉领域的两大顶级会议,今年呈现了领域内的最新突破与前沿趋势。 CVPR 2025的整体接收率仅为
Cursor 2.0 太离谱了!8 个 AI 同时写代码,还能自己测!
Cursor 2.0 发布了,真的太炸裂了! 这次发布时间也太巧了——就在几天前,Claude Code 才刚刚发布它的 2.0 版本。 Cursor 2.0 可以说是一次对「AI 编码编辑器」的彻底
视觉语言模型(VLM)深度解析:如何用它来处理文档?
视觉语言模型是一类强大的机器学习模型,能够同时处理视觉(图像)和文本信息。随着最近 Qwen 3 VL 模型的发布,我想带大家深入探讨一下,如何利用这些强大的 VLM 来处理文档。 为什么你需要使用
估值百亿独角兽创始人硕士论文曝光!宇树科技王兴兴的“性价比”思维10年前就已注定
“人火了是连毕业论文都要被翻出来的。”这条互联网定律再次应验——宇树科技CEO王兴兴的硕士毕业论文近日被网友们掘地三尺找了出来。 令人惊讶的是,这篇近十年前的论文不仅预示了如今机器人行业的技术路线转变
超越传统3D生成:OccScene实现感知与生成的跨任务共赢
无需依赖真实标注,仅凭文字提示即可生成高质量3D场景 在自动驾驶、机器人导航等领域,3D场景的感知与生成一直是研究热点。然而,传统方法通常将这两个过程分离:生成模型仅仅作为数据增强工具,为下游感知任务
华为世界模型来了!30分钟生成272㎡室内场景,虚拟人导航不迷路
3D场景生成迎来突破,大平层里虚拟人也能自由行走 近日,华为联合上海交通大学、华中科技大学推出了全新的世界模型WorldGrow,该模型能够生成高达1800㎡的超大室内场景(19x39块),且单张A1
一致性模型:单步生成高质量图像,破解扩散模型速度瓶颈
这篇名为《一致性模型》的论文提出了一类新的生成模型,能够一步到位地生成高质量图像,解决了扩散模型的主要瓶颈——采样过程慢、需要多次迭代。它的核心贡献在于证明了:在保持扩散模型强大表达能力和训练稳定性的
搞定边缘AI部署:开源神器RamaLama,让视觉语言模型无处不在
人工智能的前沿不再只是数据中心;它在于工厂车间、零售店、公共基础设施以及我们周围的智能设备。推动这一转变的是视觉语言模型(VLM),这是一个革命性的人工智能,可以解释和推理图像和视频。潜力巨大,但任何
下一页
个人成就
优秀创作者
文章被点赞
189
文章被阅读
146,527
掘力值
9,977
关注了
0
关注者
101
收藏集
0
关注标签
0
加入于
2025-01-02