首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
CoovallyAIHub
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
CoovallyAIHub
8小时前
关注
CV研究告别数据荒?PAN世界模型实现「多步推理与规划」,可自造高质量训练数据
导读 你是否曾想象过,如果AI不仅能生成视频,还能像人类一样“想象”世界的演变、预测动作的后果、甚至进行多步推理与规划,会是怎样的情景? 来自MBZUAI的PAN团队最新发...
0
评论
分享
CoovallyAIHub
9小时前
关注
智能体与小模型:AI迈向平民化的新浪潮
数百亿参数、庞大算力需求、昂贵的部署成本……当科技巨头们还在追求“更大更强”的AI模型时,一股反向而行的趋势正悄然兴起,并可能彻底改变人工智能的应用格局。 过去一年,AI智...
0
评论
分享
CoovallyAIHub
1天前
关注
超越像素的视觉:亚像素边缘检测原理、方法与实战
在计算机视觉领域,单个像素常常会成为我们测量能力的极限——但这并非无法突破。在计量学和精密机器人等领域,哪怕仅仅一个像素的误差,都可能转化为微米级的实际偏差。为了突破传感器...
0
评论
分享
CoovallyAIHub
1天前
关注
中科大西工大提出RSKT-Seg:精度速度双提升,开放词汇分割不再难
近年来,随着视觉-语言模型的快速发展,开放词汇分割(OVS)技术已成为自然图像处理领域的热点。这项技术让模型能够根据文本描述来分割任意类别的物体,打破了传统语义分割模型只能...
0
评论
分享
CoovallyAIHub
4天前
关注
结构化数据迎来“ChatGPT时刻”!LimitX:一个模型统一所有表格任务
在大语言模型如ChatGPT、GPT-4重塑自然语言处理范式,多模态模型征服图像、视频之后,人工智能的下一个前沿阵地正悄然浮现——结构化数据。 我们日常接触的金融风控、医疗...
0
评论
分享
CoovallyAIHub
5天前
关注
让Qwen-VL的检测能力像YOLO一样强,VLM-FO1如何打通大模型的视觉任督二脉
在当今多模态大模型(VLMs)飞速发展的时代,一个令人尴尬的问题依然存在:为什么这些能看懂图像、生成描述的模型,却难以精确地定位图像中的物体? 答案在于一个根本性矛盾:让一...
0
评论
分享
CoovallyAIHub
5天前
关注
突破跨模态识别瓶颈!火箭军工程大学提出MFENet:让AI在白天黑夜都能准确识人
想象这样一个安防场景:白天,监控摄像头(可见光模式)清晰地捕捉到一个人的影像;到了夜晚,摄像头自动切换到红外模式,画面变成了基于热辐射的黑白图像。对于人类来说,我们很容易判...
0
评论
分享
CoovallyAIHub
5天前
关注
TypeScript超越Python,以66%增速跃升第一,Python稳居AI领域王座
各位开发者朋友们,你们准备好了吗?技术世界的风向标再次转动!全球最大的开发者社区GitHub刚刚发布了2025年的编程语言趋势报告,结果可能出乎很多人的意料——TypeSc...
3
评论
分享
CoovallyAIHub
6天前
关注
外科医生离手术世界模型还有多远?首次提出SurgVeo基准,揭示AI生成手术视频的惊人差距
外科医生离手术世界模型还有多远?首次提出SurgVeo基准,揭示AI生成手术视频的惊人差距 近年来,视频生成领域的基石模型展现出作为潜在“世界模型”模拟物理世界的惊人能力。...
0
评论
分享
CoovallyAIHub
7天前
关注
空间智能!李飞飞、LeCun&谢赛宁联手提出“空间超感知”,长文阐述世界模型蓝图
近日,由Yann LeCun、李飞飞、Rob Fergus等AI领域顶级学者共同署名的论文《Cambrian-S: Towards Spatial Supersensing...
0
评论
分享
CoovallyAIHub
7天前
关注
注意力机制不再计算相似性?清华北大新研究让ViT转向“找差异”,效果出奇制胜
一篇来自清华大学和北京大学的最新研究,它给热门的Vision Transformer(ViT)带来了一次相当漂亮的“线性提速”。 这篇被NeurIPS 2025录用的论文,...
0
评论
分享
CoovallyAIHub
7天前
关注
从图像导数到边缘检测:探索Sobel与Scharr算子的原理与实践
计算机视觉是一个分析图像和视频的广阔领域。虽然很多人一听到计算机视觉,首先想到的通常是机器学习模型,但实际上,还有很多其他现有算法,在某些情况下,它们表现得比人工智能还要好...
1
评论
分享
CoovallyAIHub
8天前
关注
1.2MB超轻量模型实现草莓苗精准分级检测与定位,准确率超96%
在现代化的草莓育苗工厂中,一排排整齐的穴盘里孕育着成千上万的草莓幼苗。然而,一个长期困扰农户的难题是:如何快速准确地识别出哪些穴孔缺苗、哪些幼苗生长不良? 传统的解决方式主...
3
1
分享
CoovallyAIHub
8天前
关注
终结AI偏见!Sony AI发布Nature论文与FHIBE数据集,重塑公平性评估基准
近年来,人工智能(尤其是计算机视觉)技术快速发展,广泛应用于安防、金融、医疗、自动驾驶等领域。然而,数据偏见问题一直如影随形,制约着AI系统的公平性与可信度。 你是否曾想过...
0
评论
分享
CoovallyAIHub
12天前
关注
首个大规模、跨模态医学影像编辑数据集,Med-Banana-50K数据集专为医学AI打造(附数据集地址)
在人工智能迅猛发展的今天,多模态大模型已经展现出令人惊叹的图像编辑能力。然而,在专业性极强的医学影像领域,AI编辑的研究却一直受限于高质量、大规模、可公开访问数据集的缺失。...
0
评论
分享
CoovallyAIHub
12天前
关注
突破360°跟踪极限!OmniTrack++:全景MOT新范式,HOTA指标狂飙43%
全景相机能够捕捉360°完整环境信息,在自动驾驶、机器人导航等领域有着广泛应用。然而,这种超广视野也给多目标跟踪(MOT)带来了前所未有的挑战:严重的图像畸变、分辨率不均匀...
0
评论
分享
CoovallyAIHub
13天前
关注
OCR战场再起风云:LightOnOCR-1B凭什么比DeepSeekOCR快1.7倍?(附演示开源地址)
就在前不久DeepSeekOCR开源发布,大家在感叹其体积和速度的时候,LightOnOCR又给我们带来全新的效果,这款全新的视觉语言模型正在重新定义机器阅读和理解商业信息...
1
评论
分享
CoovallyAIHub
13天前
关注
首届AI交易大赛对决!中国模型包揽冠亚军,GPT-5亏损62%垫底
一场没有人类干预的AI实盘交易大赛,展现了中国大模型在实战中的惊人潜力。在一场历时17天的AI实盘投资大赛“Alpha Arena”中,来自中国的阿里千问Qwen和Deep...
0
1
分享
CoovallyAIHub
13天前
关注
告别碎片化!Dinomaly2:一个极简框架统一所有异常检测任务
简单,是终极的复杂。——列奥纳多·达·芬奇 在工业质检、医疗诊断、安防监控等领域,异常检测一直扮演着至关重要的角色。然而,这个领域长期以来面临着一个核心痛点:方法碎片化。 ...
0
评论
分享
下一页
个人成就
优秀创作者
文章被点赞
129
文章被阅读
53,803
掘力值
5,909
关注了
0
关注者
44
收藏集
0
关注标签
0
加入于
2025-01-02