首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
CoovallyAIHub
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
CoovallyAIHub
2天前
关注
不需要Memory Bank:CMDR-IAD用2D+3D双分支重建做工业异常检测,MVTec 3D 97.3%
在多模态工业异常检测中,Memory Bank方法长期占据主流地位,但它们需要存储大量正常样本特征,导致内存占用高、推理速度慢。有没有可能不用Memory Bank,也能达...
0
评论
分享
CoovallyAIHub
3天前
关注
先猜后验:四个Agent协作理解长视频,VideoMME三基准SOTA
长视频理解一直面临一个核心矛盾:视频越长,冗余信息越多,模型越容易在海量帧中"迷路"。现有的Agent方法大多采用反应式检索——先搜索相关片段,再根据搜到的内容重新规划——...
1
评论
分享
CoovallyAIHub
4天前
关注
Sensors 2026 | 从无人机拍摄到跑道缺陷地图,机场巡检全流程自动化——Zadar机场全跑道验证
机场跑道的安全状况直接关系到每一次起降。然而,目前全球大多数机场的跑道巡检仍然依赖人工步行目视——效率低、主观性强、难以形成数字化记录。一个自然的问题是:无人机+AI能否接...
0
评论
分享
CoovallyAIHub
4天前
关注
15K Star中文首发!$5部署一个会自我进化的私人Agent——NousResearch开源Hermes Agent
导读 "又一个Agent框架?"——这大概是很多人看到Hermes Agent时的第一反应。Agent框架已经多到让人麻木,大部分做的事差不多:接LLM、挂工具、编排流程。...
0
评论
分享
CoovallyAIHub
9天前
关注
AerialVLA:用VLA模型实现无人机端到端视觉-语言导航
无人机视觉-语言导航(Vision-Language Navigation, VLN)的目标是让无人机根据自然语言指令自主飞往目标。但现有方法普遍依赖两根"拐杖"...
0
评论
分享
CoovallyAIHub
9天前
关注
CVPR 2026|一张缺陷图变一百张:O2MAG免训练注意力嫁接生成高保真工业异常样本
工业异常检测长期面临一个核心瓶颈:正常样本充足,异常样本稀缺。为每种缺陷类型收集大量标注数据既耗时又昂贵,而现有的异常图像合成方法往往依赖针对性训练,动辄数百小时的GPU成...
0
评论
分享
CoovallyAIHub
11天前
关注
VisionClaw:智能眼镜 + Gemini + Agent,看一眼就能帮你搜、帮你发、帮你做
戴上智能眼镜,看到一家餐厅就能问"这家评分怎么样",AI 不仅看得懂还能帮你搜出来——这不是概念视频,而是一个已经跑通的开源项目。 VisionClaw 将 Meta 智能...
0
评论
分享
CoovallyAIHub
11天前
关注
低空安全刚需!西工大UAV-DETR反无人机小目标检测,参数减少40%,mAP50:95提升6.6个百分点
反无人机检测正在成为低空安全领域的核心需求,但无人机目标尺寸小、背景复杂、尺度变化剧烈,传统检测器在这一场景下的精度和召回率往往难以兼顾。 西北工业大学团队提出UAV-DE...
0
评论
分享
CoovallyAIHub
11天前
关注
IEEE Sensors | 湖南大学提出KGP-YOLO:先定位风电叶片再检测缺陷,三数据集mAP均超87%
导读 无人机拍摄的高分辨率图像中,风电叶片只占画面的一小部分,缺陷更是仅占像素总量的0.1%~1%——传统检测器直接在全图上做推理,背景干扰大、小目标漏检多。...
0
评论
分享
CoovallyAIHub
16天前
关注
Claude Code Review:多 Agent 自动审查 PR,代码产出翻倍后谁来把关?
2026 年 3 月 9 日,Anthropic 发布了 Code Review for Claude Code——一个多 Agent 自动审查 PR 的系统。发布背景是一...
1
评论
分享
CoovallyAIHub
16天前
关注
传感器数据相互矛盾时,无人机蜂群如何做出可靠的管道泄漏检测决策?
天然气管道泄漏检测是一个"慢不得"的高风险问题——延误几分钟,可能意味着爆炸、环境污染和巨额损失。近年来,联邦边缘AI驱动的自主无人机蜂群...
0
评论
分享
CoovallyAIHub
17天前
关注
AAAI 2026 | AnoStyler:文本驱动风格迁移实现零样本异常图像生成,轻量高效(附代码)
异常检测模型的训练离不开异常样本,但真实工业场景中异常图像极度稀缺。现有异常图像生成方法要么依赖扩散模型等重量级架构(参数量超过1B)...
0
评论
分享
CoovallyAIHub
17天前
关注
500M参数就能跑视觉语言模型?Moondream把VLM塞进了边缘设备
导读 视觉语言模型(VLM)通常意味着大参数、大显存、大算力——GPT-4o、Gemini、Claude的视觉能力背后是数百亿甚至更大规模的模型。...
0
评论
分享
CoovallyAIHub
19天前
关注
MSSP | 不停机不贴标监测旋转风机叶片:无人机+YOLOv5+DeepSORT,2MW 风机现场测试频率误差<2%
风电叶片的结构健康监测通常依赖贴在叶片表面的传感器或人工标记物,但给正在运行的大型风机贴传感器既危险又耗时,严重制约了监测的规模化应用。...
0
评论
分享
CoovallyAIHub
19天前
关注
把 Whisper、Moonshine、SenseVoice 统统装进手机:sherpa-onnx 离线语音部署框架,GitHub 10.9K Star
语音 AI 模型更新很快——Whisper、Moonshine、SenseVoice、FireRedASR、Paraformer,几乎每个月都有新模型发布。但对开发者来说,...
0
评论
分享
CoovallyAIHub
19天前
关注
多 Agent 手术推理框架:Agent 辩论+RAG 补上手术知识,零样本超越监督基线 14.6 个百分点
导读 达芬奇手术机器人等机器人辅助手术(RAS)系统已在现代手术室中广泛应用,但术中场景理解仍然是一个未解难题——器械频繁遮挡、解剖结构快速变化、多个任务(器械识别、动作识...
0
评论
分享
CoovallyAIHub
19天前
关注
AAAI 2026 | 华中科大联合清华等提出Anomagic:跨模态提示零样本异常生成+万级AnomVerse数据集(附代码)
导读 现有零样本异常图像生成方法大多仅依赖文本提示引导扩散模型,语义控制力有限,生成的异常掩码精度也不够高。 华中科技大学联合湖南大学、清华大学、中科院自动化所团队提出 A...
0
评论
分享
CoovallyAIHub
20天前
关注
编码智能体做 CV 任务,实际能力到哪一步了?——五项视觉任务实测解读
导读 编码智能体(Coding Agent)能自动写代码、跑脚本、调 bug、迭代优化,但如果交给它一个视觉任务——比如数一张图里有多少只鸟、从视频里跟踪计数车辆、识别车牌...
0
评论
分享
CoovallyAIHub
20天前
关注
Pipecat:构建实时语音 AI Agent 的开源编排框架,500ms 级端到端延迟
导读 语音 AI 的模型越来越多——ASR 有 Deepgram、Whisper,LLM 有 GPT、Claude、Gemini,TTS 有 ElevenLabs、Azur...
0
评论
分享
CoovallyAIHub
20天前
关注
Energies | 8版YOLO对8版Transformer实测光伏缺陷检测,RF-DETR-Small综合胜出
导读 大型光伏电站中,一块面板出现热斑或裂纹,肉眼难以在数千块面板中定位它。无人机搭载热红外相机的巡检方案已成为行业标配,但拍下来的热图交给哪个检测模型更合适?YOLO 系...
0
评论
分享
下一页
个人成就
优秀创作者
文章被点赞
186
文章被阅读
135,155
掘力值
9,726
关注了
0
关注者
97
收藏集
0
关注标签
0
加入于
2025-01-02