首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
CoovallyAIHub
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
告别“模糊”与“迟钝”!首创波动方程建模视觉,ImageNet 84.2%,推理速度飙升
在深度学习视觉建模领域,如何既实现高效的全局语义交互,又能精准保留图像中的高频细节(如边缘和纹理),一直是一个关键难题。传统的卷积神经网络(CNN)依赖局部感受野,难以建模长程依赖;而视觉Transf
大道至简:腾讯优图只用纯视觉模型,4张图超越全量训练SOTA
近年来,计算机视觉领域掀起了一股“视觉-语言大模型”的浪潮。从CLIP到各种多模态模型,研究者们似乎默认:解决复杂视觉任务必须依赖语言模型的加持。 但在工业质检、医疗影像分析等高度依赖视觉信息的异常检
从“单例模仿”到“多面融合”,视觉上下文学习迈向“团队协作”式提示融合
在人工智能领域,让模型具备 “看几个例子就能学会新任务” 的能力,一直是研究者追求的目标。这种在自然语言处理中已趋成熟的上下文学习 (In-Context Learning) ,如今正被深入应用于视觉
还在用“网格”预测深度?浙大新方法让你直接“函数调用”,打破分辨率枷锁!
深度估计是计算机视觉的基石,广泛应用于自动驾驶、机器人、AR/VR等领域。传统深度估计方法一直受限于一个根本性约束:它们只能在预设的离散像素网格上输出深度。 这导致了两个核心问题: 分辨率僵化: 训练
计算机视觉的 2026:从“堆算力”竞赛,到“省算力”智慧
2026 年,计算机视觉早已不是实验室里的小众技术 —— 它是自动驾驶汽车的 “眼睛”,是医疗影像诊断的 “辅助手”,是机器人交互的 “感知中枢”,更是多模态大模型理解世界的核心支柱。从手机端的实时美
视频超分辨率如何提升跨视角行人识别?让监控画面“看清”每一个人
在城市的天空与地面之间,无数摄像头正默默记录着行人的轨迹。但你是否想过,当一个模糊的身影从无人机画面中掠过,我们如何在地面监控中准确找到同一个人?这正是跨视角行人重识别技术的核心挑战。最近,一项名为S
英伟达CES 2026炸场:没有新显卡,却掏出了让全球AI公司彻夜难眠的“算力核弹”
英伟达在CES 2026上抛出一系列重磅炸弹,直接宣告了AI算力工厂时代的到来。没有游戏显卡的更新,却有一场彻底改变AI产业格局的技术革命。 算力革命,Vera Rubin平台横空出世 “全球AI算力
如何用10%的标注数据,达到可媲美全监督模型的性能?AAAI 2026论文揭秘BCSI三大创新设计
随着人工智能在医学影像分析领域的深入应用,精确的图像分割已成为计算机辅助诊断、手术规划和疗效评估的关键技术。然而,高质量医学图像的标注不仅成本高昂,还需要顶级专家的专业知识,这一“数据困境”长期制约着
YOLO26正式亮相!极致速度优化,为落地而生!
就在刚刚,Ultralytics 正式发布 YOLO26,这是迄今为止最先进、最易部署的 YOLO 模型。就是那个在 YOLO Vision 2025 大会上首次亮相的新一代视觉模型。不得不说,每次
仅192万参数的目标检测模型,Micro-YOLO如何做到目标检测精度与效率兼得
随着目标检测技术在自动驾驶、安防监控、智能终端等领域的广泛应用,如何在计算资源有限的嵌入式设备中高效部署检测模型,已成为工业界与学术界共同关注的核心问题。传统的检测模型如Faster R-CNN、YO
下一页
个人成就
优秀创作者
文章被点赞
132
文章被阅读
81,520
掘力值
7,433
关注了
0
关注者
64
收藏集
0
关注标签
0
加入于
2025-01-02