首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
CoovallyAIHub
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
CoovallyAIHub
9小时前
关注
当 Agent 成为主角,视觉研究者该怎么办?
有一个变化,正在悄悄发生。 它没有体现在排行榜上,也没有写在 SOTA 的红字里,但你一旦意识到,就很难再忽视。 在越来越多系统里,计算机视觉不再是“核心模型”,而是一个被...
0
评论
分享
CoovallyAIHub
9小时前
关注
突破认知边界!中科院等提出MIRROR框架:AI鉴伪从此有了“真实之镜”
当AI画作已能以假乱真,人类如何守住现实边界?新一代检测框架通过建模“真实本身”实现超人级鉴别能力。 近日,中国科学院自动化研究所、清华大学、华中科技大学及腾讯优图实验室等...
0
评论
分享
CoovallyAIHub
1天前
关注
让本地知识引导AI追踪社区变迁,让AI真正理解社会现象
最近有一项研究让我十分好奇,它似乎在尝试翻转我们熟悉的剧本——不是用人工智能去“分析”社区,而是让社区来“教会”人工智能如何看世界。这听起来像是一种充满温度的技术民主化实验...
0
评论
分享
CoovallyAIHub
1天前
关注
AAAI 2026这篇杰出论文说了什么?用LLM给CLIP换了个“聪明大脑”
在多模态大模型飞速发展的今天,CLIP作为连接视觉与语言的“基石”依然发挥着重要作用。然而,随着应用场景的深入,研究人员逐渐发现CLIP的文本编码器已经成为整个系统的瓶...
0
评论
分享
CoovallyAIHub
4天前
关注
为什么 2026 年,3D 工业视觉成为视觉算法分化的一年?
这几年,3D 工业视觉走得很快,也走得有点累。 参数一路狂飙:像素更高、帧率更快、功率更猛、视角更广、体积更小。单看规格表,很难不让人兴奋。但真正把设备装上产线的人,往往会...
0
评论
分享
CoovallyAIHub
4天前
关注
YOLOE-26发布:能听懂人话的实时开放词汇分割模型来了!
在计算机视觉领域,YOLO系列一直是速度和精度的代名词。但长期以来,所有YOLO模型都存在一个根本性限制:它们只能识别训练时见过的类别。 当面对新的物体类型——比如特殊的工...
0
评论
分享
CoovallyAIHub
5天前
关注
红外小目标检测新突破!浙大团队提出DQAligner:大位移场景下依然稳定跟踪
红外成像领域的小目标检测一直是个技术难题——目标可能只是几个像素点,还常常淹没在复杂的云层、海面背景或者传感器噪声里。 为了解决这个难题,研究者们开始利用多帧时空信息,但新...
0
评论
分享
CoovallyAIHub
5天前
关注
参数仅6.31亿反超7B模型,NVIDIA用「多教师蒸馏」融合三大模型绝学
在追求模型规模的竞赛中,一个反直觉的事实正在发生:NVIDIA 的 C-RADIOv4 仅用 6.31 亿个参数就达到了 DINOv3 的 70 亿参数模型的性能。多教师蒸...
0
评论
分享
CoovallyAIHub
6天前
关注
为视觉建模注入物理灵魂:WaveFormer证明,下一站是“物理启发模型”
近年来,Transformer 席卷了计算机视觉领域,从图像分类到目标检测,表现亮眼。然而,当任务从静态图像扩展到视频理解、动态场景分析时,Transformer 的“硬扛...
0
评论
分享
CoovallyAIHub
6天前
关注
“看起来像世界”≠“真世界”!WorldLens全维度解构自动驾驶世界模型
近年来,随着生成式AI技术的突破,世界模型(World Models) 已成为自动驾驶与具身智能领域的核心研究方向。从文本直接生成驾驶视频,到可控的4D动态场景合成,当前模...
0
评论
分享
CoovallyAIHub
7天前
关注
一步生成,像素空间,何恺明让 pMF 做到了
何恺明团队最近抛出的这篇工作,多少有点“把老问题直接掀桌子重来”的味道。他们提出的 **Pixel MeanFlow(pMF) **,在不借助潜在空间、不依赖多步采样的前提...
0
评论
分享
CoovallyAIHub
7天前
关注
CVPR 2025 Oral | 港大提出OverLoCK:模仿人类视觉机制,让模型“先见森林,再见树木”
人类在观察复杂场景时,通常会先快速扫视整体轮廓,形成初步认知,再集中注意力到关键区域进行细节分析。这种 “纵观全局-聚焦细节” 的两阶段认知机制被称为自上而下注意力(Top...
0
评论
分享
CoovallyAIHub
8天前
关注
告别CLIP局限!SSVP框架实现零样本异常检测,刷新7大数据集SOTA
工业视觉检测一直是智能制造领域的关键技术,而零样本异常检测(ZSAD) 更是被视为行业的“圣杯”——无需针对特定产线进行训练,即可直接投入使用的理想解决方案。然而,现有基于...
0
评论
分享
CoovallyAIHub
8天前
关注
测试里“无所不能”,一上线就“ bug 频出”,你的CV模型到底缺了什么?
那个在象牙塔里从未失手的“学霸”,理论知识门门满分,实验操作无可挑剔。可当他第一次踏入纷繁复杂、充满意外的真实社会,却步步维艰,处处碰壁——这画面,是不是像极了如今许多计算...
0
评论
分享
CoovallyAIHub
11天前
关注
96%准确率!中科院提出ACLNet,攻克骨架动作识别最难问题:相似动作区分
在计算机视觉领域,基于骨架的人体动作识别一直备受关注。相比传统视频流,骨架数据不仅计算高效,还对环境光照、背景干扰有着天然的免疫力。然而,骨架模型也有自己的“心病”:由于缺...
0
评论
分享
CoovallyAIHub
11天前
关注
模型太大跑不动?工业视觉轻量化,降低延迟、减少功耗、提升稳定性
车间里的景象总是带着某种永恒的韵律:传送带不知疲倦地滚动,机械臂精准地起落,金属部件泛着冷冽的光泽。就在这井然有序的乐章里,一个视觉检测工位却像是卡了壳的齿轮——那台装着最...
0
评论
分享
CoovallyAIHub
12天前
关注
什么是图像计算?解析AI视觉背后的科学,快速入门指南
当你走过购物中心或繁忙的公共街道时,安装在入口和走道上方的摄像头记录着人们的一举一动。它们每秒都在产生视觉数据,而大多数时候我们甚至毫无察觉。 这股持续不断的数据流,为现代...
0
评论
分享
CoovallyAIHub
12天前
关注
字节跳动开源HUVR:一个视觉模型同时搞定识别与生成,96倍压缩令牌性能不减!
统一视觉表征的“次元壁”被打破了,这项研究让AI既能看懂世界又能创造世界。 近日,字节跳动旗下研究团队发布了一项颠覆性研究,提出了名为 “用于统一视觉表征的超网络”(Hyp...
0
评论
分享
CoovallyAIHub
13天前
关注
10亿参数刷新OCR记录:LightOnOCR-2如何以小博大?
最近,法国AI公司LightOn在文档理解领域投下了一枚重磅炸弹——他们推出的LightOnOCR-2-1B模型仅凭10亿参数,就在权威OCR评测基准OlmOCR-Benc...
0
评论
分享
CoovallyAIHub
13天前
关注
今日,DeepSeek再次“拆掉重做”,开源架构炸场:OCR 2只是起点,这次要重构AI的“眼睛”和“大脑”?
就在今年十月,DeepSeek 放出其全新的 DeepSeek-OCR 模型时,业内还在消化它在文档解析上带来的震动。没想到,短短时间,他们又抛出了一篇重磅论文——Deep...
0
评论
分享
下一页
个人成就
优秀创作者
文章被点赞
136
文章被阅读
91,302
掘力值
8,058
关注了
0
关注者
67
收藏集
0
关注标签
0
加入于
2025-01-02