首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
CoovallyAIHub
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
突破性开源模型DepthLM问世:视觉语言模型首次实现精准三维空间理解
无需改变架构,仅通过创新训练策略,就让视觉语言模型具备了与专业视觉模型相媲美的三维感知能力 在多模态人工智能蓬勃发展的今天,一项突破性研究正悄然改写我们对视觉语言模型的认知边界。Meta公司高级研究员
ICCV 2025 最佳论文出炉:CMU 团队用「AI 积木大师」BrickGPT 摘得桂冠!
今天凌晨,在夏威夷举行的国际计算机视觉大会ICCV 2025揭晓了本届会议的最佳论文等奖项。全球计算机视觉三大顶会之一的ICCV今年共收到11239份有效投稿,最终录用2699篇论文,录用率为24%。
IDEA研究院发布Rex-Omni:3B参数MLLM重塑目标检测,零样本性能超越DINO
把目标检测变成“下一个点预测”,用2200万数据+强化学习解决行业难题 目标检测技术正在迎来一场范式革命!传统方法如YOLO、DETR依赖复杂的坐标回归,而IDEA(粤港澳大湾区数字经济研究院)研究院
一夜之间,大模型处理长文本的难题被DeepSeek新模型彻底颠覆!
就在百度刚刚发布PaddleOCR-VL,以0.9B参数量重新定义文档解析效率之际,DeepSeek也正式开源了其颠覆性的DeepSeek-OCR模型。不过,它的野心远不止于“识别”,而是直指大模型处
超越“识别”:下一代机器视觉如何破解具身智能落地难题?
AI不再只是屏幕后的代码,它正在长出“眼睛”和“手脚”,走进我们的世界。 全球科技巨头和顶尖实验室,如今都在疯狂追逐同一个圣杯——具身智能。这不仅是学术热点,更是一场关乎科技竞争力与未来产业主导权的战
全球OCR新标杆!百度0.9B小模型斩获四项SOTA,读懂复杂文档像人一样自然
开源16小时就登顶HuggingFace Trending全球第一! 前不久,小编刚刚介绍了PaddleOCR开源最强OCR生态,不靠参数靠实力,56K+ Star见证实力(附开源地址),然而就在17
Mamba-3震撼登场!Transformer最强挑战者再进化,已进入ICLR 2026盲审
线性时间推理、超长文本处理、硬件高效利用,这条“算法巨蟒”正在悄然蜕变。 在AI领域,Transformer架构自2017年确立统治地位以来,各类“Transformer杀手”就如雨后春笋般涌现。在众
清华Mars Lab发布SLAM-Former:用一个Transformer统一SLAM的前端与后端(附项目地址)
将前端跟踪与后端优化统一在一个模型中,实现实时、高一致性的视觉SLAM 在机器人感知领域,同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)技术
AI基础设施新玩家:Tinker如何重新定义LLM微调工作流?
近日,人工智能公司Thinking Machines发布了名为Tinker的创新API服务,该服务旨在彻底改变开发人员微调开放权重语言模型的方式。对于那些苦于基础设施管理复杂性的AI研究团队来说,这无
CLIP, DINO等多模型融合DreamSim,让电脑“看懂”图片有多像!模型融合成为热门!
导读 你是否曾疑惑,为什么电脑总觉得一张坐着的狗和一张站着的狗是完全不同的两张图?今天,我们来聊聊一个能让电脑像人类一样感知图像相似度的新模型——DreamSim。>>更多资讯可加入CV技术群获取了解
下一页
个人成就
优秀创作者
文章被点赞
189
文章被阅读
146,530
掘力值
9,977
关注了
0
关注者
101
收藏集
0
关注标签
0
加入于
2025-01-02