首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
CoovallyAIHub
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
MSD-DETR:面向机车弹簧检测的可变形注意力Detection Transformer
机车螺旋弹簧是铁路车辆悬挂系统的核心部件,其缺陷可能导致脱轨等严重安全事故。传统的人工目视检查面临主观性强、疲劳易漏检、效率低等问题。弹簧缺陷检测的技术难点在于:缺陷形态多样(裂纹、腐蚀、脱碳等
不改权重、不用训练!BEM用背景记忆抑制固定摄像头误检,YOLO/RT-DETR全系有效
预训练检测器在COCO上精度亮眼,但一旦部署到固定摄像头监控场景,误检率往往大幅上升——阴影、栏杆、重复纹理都可能被当成目标。问题出在哪?
上交+阿里 | Interactive ASR:Agent框架做语音识别交互纠错,1轮交互语义错误率降57%
语音识别系统的评估长期依赖WER(词错误率),但WER对所有词一视同仁——把"the"识别成"a"和把人名"Sarah"识别成"Sara"受到同等惩罚,这显然不符合实际使用中对语义正确性的需求。
无人机拍叶片→AI找缺陷:CEA-DETR改进RT-DETR做风电叶片表面缺陷检测,mAP50达89.4%
风电叶片长期暴露在高空环境中,裂纹、烧蚀、剥落、锈蚀等表面缺陷不仅影响发电效率,严重时还会导致叶片断裂。无人机巡检替代了人工高空作业,但拍回来的图像仍然需要高效的检测模型来自动识别缺陷。
混合训练反而更差?VLM Agent在训练前协调跨数据集标注,文档布局检测F-score从0.860提升至0.883
多数据集混合训练是提升模型泛化能力的常见策略,但如果不同数据集对同一语义类别采用了不同的空间标注规范,直接混合会怎样?Unstructured Technologies的研究团队给出了一个反直觉
ICLR 2026 | VLM自己学会调检测器:VTool-R1用强化学习教视觉模型使用工具推理
让VLM(Vision-Language Model)用视觉工具辅助推理,听起来是个好主意——先高亮表格中的关键行列,再基于处理后的图像回答问题。但现实是,直接提示未经训练的VLM使用工具性能不升反降
RK3588上111 FPS:轻量YOLOv8+异步视频处理系统实现无人机自主电力巡检
无人机电力巡检正在从"按预设航点飞行+离线分析"向"实时检测+自主决策"演进,但边缘端算力始终是瓶颈——RK3588的NPU只有6 TOPS,功耗低至个位数瓦特,如何在这样的硬件上跑出可用的检测帧率?
斯坦福丨AirVLA:将地面机械臂模型迁移至无人机实现空中抓取,成功率从23%提升至50%
通用机器人基础模型(VLA)在桌面操作任务上已展现出强大能力,但能否直接迁移到空中操作场景?Stanford与Physical Intelligence团队用460次真实飞行实验给出了答案
视频理解新范式:Agent不再被动看视频,LensWalk让它自己决定看哪里
当前的视频理解模型有一个根本矛盾:推理和感知是脱节的。无论模型有多强,它所能"看到"的画面在推理开始前就已经固定——要么均匀采样丢失关键帧,要么启发式选帧无法在推理过程中调整策略。
不需要Memory Bank:CMDR-IAD用2D+3D双分支重建做工业异常检测,MVTec 3D 97.3%
在多模态工业异常检测中,Memory Bank方法长期占据主流地位,但它们需要存储大量正常样本特征,导致内存占用高、推理速度慢。有没有可能不用Memory Bank,也能达到同等甚至更好的检测精度。
下一页
个人成就
优秀创作者
文章被点赞
189
文章被阅读
145,420
掘力值
9,973
关注了
0
关注者
101
收藏集
0
关注标签
0
加入于
2025-01-02