CoovallyAIHub

赞

0

|

搜索文章

化工厂气体泄漏怎么用AI检测？30张图3D重建气体泄漏场景——美国国家实验室NeRF新研究

数据：DIRSIG合成LWIR HSI，128通道（7.8-13.4µm），SF6气体，231张图像核心指标（30张训练图像）：PSNR 39.6dB，气体检测AUC 0.821，检出率55.7%

1月前
114
点赞
评论

化工厂气体泄漏怎么用AI检测？30张图3D重建气体泄漏场景——美国国家实验室NeRF新研究

OpenClaw 近 2000 个 Skills，为什么没有一个好用的视觉检测工具？

OpenClaw，212K Star，GitHub 历史第一。中国部署量全球第一。字节、阿里、腾讯争着上线云服务。 Skills 社区接近 2000 个技能包，从写代码到发邮件，从浏览器自动化到数据

1月前
554
1
评论

OpenClaw 近 2000 个 Skills，为什么没有一个好用的视觉检测工具？

CVPR 2026 | 用一句话告诉 AI 分割什么——MedCLIPSeg 让医学图像分割不再需要海量标注

假设你是一名放射科医生。你面前有一张乳腺超声图像，你需要 AI 帮你标出肿瘤边界。传统方法：你需要先准备几千张标注好的图像来训练模型，换个器官就得从头再来，换个医院的设备可能就不准了。 MedCL

1月前
123
点赞
评论

CVPR 2026 | 用一句话告诉 AI 分割什么——MedCLIPSeg 让医学图像分割不再需要海量标注

Claude Code 突然变成了 66 个专家？这个 5.8k Star 的开源项目，让我重新理解了什么叫"会用 AI"

前两天在 GitHub 上刷到一个项目，看完之后说实话——沉默了大概三秒钟。不是因为技术多炸裂，而是因为它让我意识到：大多数人用 Claude Code，可能只用了它 5% 的能力。这个项目叫 c

1月前
328
3
评论

Claude Code 突然变成了 66 个专家？这个 5.8k Star 的开源项目，让我重新理解了什么叫"会用 AI"

9个视觉语言模型工厂实测：Qwen 87.9%碾压全场，你的显卡能跑哪个？

同一批图片、同一条prompt、未裁剪的真实工厂环境——奥地利克拉根福大学团队在双臂机器人纺织回收系统上硬测了9个VLM。结果：Qwen包揽前四，35b小模型打平235b大模型，Llama全线溃败。

1月前
160
1
评论

9个视觉语言模型工厂实测：Qwen 87.9%碾压全场，你的显卡能跑哪个？

181小时视频丢给GPT-5，准确率只有15%——南大联合NVIDIA等五校发布多模态终身理解数据集

南京大学联合NVIDIA、浙江大学、上海交通大学、东京大学发布MM-Lifelong数据集，定义"多模态终身理解"新任务。181.1小时视频横跨三个时间尺度，GPT-5只能采样50帧来处理，准确率14

1月前
89
点赞
评论

181小时视频丢给GPT-5，准确率只有15%——南大联合NVIDIA等五校发布多模态终身理解数据集

CVPR 2026 | GS-CLIP：3D几何先验+双流视觉融合，零样本工业缺陷检测新SOTA，四大3D工业数据集全面领先！

论文标题：GS-CLIP: Zero-shot 3D Anomaly Detection by Geometry-Aware Prompt and Synergistic View Represent

1月前
170
点赞
评论

CVPR 2026 | GS-CLIP：3D几何先验+双流视觉融合，零样本工业缺陷检测新SOTA，四大3D工业数据集全面领先！

语音AI Agent编排框架！Pipecat斩获10K+ Star，60+集成开箱即用，亚秒级对话延迟接近真人反应速度！

一个开源框架，用几行Python代码就能搭出能"听"、能"说"、还能"看"的实时对话AI智能体——这就是 Daily.co 团队开源的 Pipecat。这个项目到底是干嘛的？一句话概括：Pipec

1月前
147
2
评论

语音AI Agent编排框架！Pipecat斩获10K+ Star，60+集成开箱即用，亚秒级对话延迟接近真人反应速度！

Moonshine：比 Whisper 快 100 倍的端侧语音识别神器，Star 6.6K！

告别云端 API，语音识别也能跑在树莓派上？还在为语音识别的高延迟、隐私泄露、API 调用费用发愁吗？来自 Moonshine AI 的开源项目 Moonshine Voice 给出了一个令人惊艳的

1月前
478
1
评论

Moonshine：比 Whisper 快 100 倍的端侧语音识别神器，Star 6.6K！

速度暴涨10倍、成本暴降6倍！Mercury 2用扩散取代自回归，重新定义LLM推理速度

等AI回消息的间隙，你是切出去刷了个短视频，还是盯着屏幕数它蹦出来的字？现在的GPT、Claude、Gemini，看着聪明，骨子里其实都是老式打字员——一个字接一个字往外敲，前一个不落地，后一个就得干

1月前
147
点赞
评论

速度暴涨10倍、成本暴降6倍！Mercury 2用扩散取代自回归，重新定义LLM推理速度

个人成就

优秀创作者

文章被点赞 189

文章被阅读 145,597

掘力值 9,975

加入于

2025-01-02