首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
CoovallyAIHub
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
化工厂气体泄漏怎么用AI检测?30张图3D重建气体泄漏场景——美国国家实验室NeRF新研究
数据:DIRSIG合成LWIR HSI,128通道(7.8-13.4µm),SF6气体,231张图像 核心指标(30张训练图像) :PSNR 39.6dB,气体检测AUC 0.821,检出率55.7%
OpenClaw 近 2000 个 Skills,为什么没有一个好用的视觉检测工具?
OpenClaw,212K Star,GitHub 历史第一。 中国部署量全球第一。字节、阿里、腾讯争着上线云服务。 Skills 社区接近 2000 个技能包,从写代码到发邮件,从浏览器自动化到数据
CVPR 2026 | 用一句话告诉 AI 分割什么——MedCLIPSeg 让医学图像分割不再需要海量标注
假设你是一名放射科医生。 你面前有一张乳腺超声图像,你需要 AI 帮你标出肿瘤边界。 传统方法:你需要先准备几千张标注好的图像来训练模型,换个器官就得从头再来,换个医院的设备可能就不准了。 MedCL
Claude Code 突然变成了 66 个专家?这个 5.8k Star 的开源项目,让我重新理解了什么叫"会用 AI"
前两天在 GitHub 上刷到一个项目,看完之后说实话——沉默了大概三秒钟。 不是因为技术多炸裂,而是因为它让我意识到:大多数人用 Claude Code,可能只用了它 5% 的能力。 这个项目叫 c
9个视觉语言模型工厂实测:Qwen 87.9%碾压全场,你的显卡能跑哪个?
同一批图片、同一条prompt、未裁剪的真实工厂环境——奥地利克拉根福大学团队在双臂机器人纺织回收系统上硬测了9个VLM。结果:Qwen包揽前四,35b小模型打平235b大模型,Llama全线溃败。
181小时视频丢给GPT-5,准确率只有15%——南大联合NVIDIA等五校发布多模态终身理解数据集
南京大学联合NVIDIA、浙江大学、上海交通大学、东京大学发布MM-Lifelong数据集,定义"多模态终身理解"新任务。181.1小时视频横跨三个时间尺度,GPT-5只能采样50帧来处理,准确率14
CVPR 2026 | GS-CLIP:3D几何先验+双流视觉融合,零样本工业缺陷检测新SOTA,四大3D工业数据集全面领先!
论文标题:GS-CLIP: Zero-shot 3D Anomaly Detection by Geometry-Aware Prompt and Synergistic View Represent
语音AI Agent编排框架!Pipecat斩获10K+ Star,60+集成开箱即用,亚秒级对话延迟接近真人反应速度!
一个开源框架,用几行Python代码就能搭出能"听"、能"说"、还能"看"的实时对话AI智能体——这就是 Daily.co 团队开源的 Pipecat。 这个项目到底是干嘛的? 一句话概括:Pipec
Moonshine:比 Whisper 快 100 倍的端侧语音识别神器,Star 6.6K!
告别云端 API,语音识别也能跑在树莓派上? 还在为语音识别的高延迟、隐私泄露、API 调用费用发愁吗?来自 Moonshine AI 的开源项目 Moonshine Voice 给出了一个令人惊艳的
速度暴涨10倍、成本暴降6倍!Mercury 2用扩散取代自回归,重新定义LLM推理速度
等AI回消息的间隙,你是切出去刷了个短视频,还是盯着屏幕数它蹦出来的字?现在的GPT、Claude、Gemini,看着聪明,骨子里其实都是老式打字员——一个字接一个字往外敲,前一个不落地,后一个就得干
下一页
个人成就
优秀创作者
文章被点赞
189
文章被阅读
145,597
掘力值
9,975
关注了
0
关注者
101
收藏集
0
关注标签
0
加入于
2025-01-02