首页
AI Coding
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
人工智能
LLM
Agent
AIGC
程序员
OpenAI
后端
前端
AI编程
展开
全部
人工智能
LLM
Agent
AIGC
程序员
OpenAI
后端
前端
AI编程
算法
Python
LangChain
深度学习
架构
计算机视觉
暂无数据
推荐
最新
NeurIPS 2025时间检验奖:10年之后再谈Faster R-CNN
近日,深度学习目标检测领域《Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks》荣获NeurIP
1024层网络让强化学习性能飙升50倍,NeurIPS 2025最佳论文揭示深度scaling的力量
在自然语言处理和计算机视觉领域,模型规模的扩大已经催生了无数突破,但强化学习(RL)领域的类似进展却一直难以实现。大多数RL研究仍在使用2-5层的浅层网络架构,而如今的LLaMA和Stable Dif
如何在手机上轻松识别多种鸟类?我们发现了更简单的秘密……
导读 基于深度学习与迁移学习技术,只需一部手机,就能让每个人轻松识别鸟类物种——本文将详细介绍如何利用MobileNetV2构建高精度鸟类识别模型,并探讨如何借助Coovally平台高效实现从开发到部
抛弃LLM!MIT用纯视觉方法破解ARC难题,性能接近人类水平
在追求通用人工智能的道路上,抽象推理能力一直被视为皇冠上的明珠。Abstraction and Reasoning Corpus(ARC)基准,正是为了衡量这种核心能力而设计。它包含了数百个独特的“视
量化技术:如何让你的 3D 模型和 AI 模型瘦身又飞快
本文深入解析量化技术在 3D 渲染和机器学习中的应用,讲解均匀与非均匀量化原理,介绍 Draco 与 MeshOpt 网格压缩库,并扩展到 PyTorch、TensorFlow 等模型量化实践。
超越YOLOv8/v11!自研RKM-YOLO为输电线路巡检精度、速度双提升
输电线路作为电力系统的关键组成部分,其正常运行对电网稳定性至关重要。绝缘子和防震锤等关键部件长期暴露在恶劣环境中,易受冰损、风损、酸雨和雷击等不利因素影响,引发故障。 传统人工巡检不仅耗时费力,还容易
破局红外小目标检测:异常感知Anomaly-Aware YOLO以“俭”驭“繁”
在当前复杂多变的国际安全形势下,国防现代化建设对感知与预警能力提出了更高要求。红外探测技术作为战场态势感知的关键组成部分,其性能直接关系到国防安全的保障水平。在此背景下,高效准确的红外小目标检测算法成
只改一个后缀,环境冲突全消失?这个“.onnx”魔法文件做到了
简化部署,统一标准,AI模型应用从未如此轻松 你是否曾在尝试运行某个炫酷的AI模型时,被复杂的环境配置折磨得痛不欲生? “这个模型需要PyTorch 1.9,但我环境里是2.0…” “什么?另一个模型
存储风暴下的边缘智能韧性:瑞芯微RK3588如何将供应链挑战转化为市场机遇
近期的全球存储市场波动,为高速发展的边缘AI产业上了一堂生动的“供应链安全”课。DDR4颗粒从短缺到价格暴涨,如同一面镜子,照出了不同技术路线的抗风险能力。在这场考验中,瑞芯微旗舰芯片RK3588及其
1.2MB超轻量模型实现草莓苗精准分级检测与定位,准确率超96%
在现代化的草莓育苗工厂中,一排排整齐的穴盘里孕育着成千上万的草莓幼苗。然而,一个长期困扰农户的难题是:如何快速准确地识别出哪些穴孔缺苗、哪些幼苗生长不良? 传统的解决方式主要依赖人工肉眼识别,效率低下
LeCun在Meta的最后绝唱?50行代码证明AI的另一种可能
就在AI界为Yann LeCun离职Meta的消息震惊时,一份意外的“告别礼物”悄然出现在arXiv上——这位图灵奖得主与Randall Balestriero合作的新论文 《LeJEPA:一种简约且
去噪扩散模型,根本不去噪?何恺明新论文回归「去噪」本质
导读 高质量的图像生成如今几乎都由扩散模型实现。从艺术创作到商业设计,从人脸生成到自然场景合成,基于扩散的生成模型已经成为多模态领域的重要基石。 但有没有一种可能,「去噪扩散模型」实际上并没有做到「去
智能体与小模型:AI迈向平民化的新浪潮
数百亿参数、庞大算力需求、昂贵的部署成本……当科技巨头们还在追求“更大更强”的AI模型时,一股反向而行的趋势正悄然兴起,并可能彻底改变人工智能的应用格局。 过去一年,AI智能体(AI Agent)热度
让Qwen-VL的检测能力像YOLO一样强,VLM-FO1如何打通大模型的视觉任督二脉
在当今多模态大模型(VLMs)飞速发展的时代,一个令人尴尬的问题依然存在:为什么这些能看懂图像、生成描述的模型,却难以精确地定位图像中的物体? 答案在于一个根本性矛盾:让一个为语言生成而设计的模型,去
中科大西工大提出RSKT-Seg:精度速度双提升,开放词汇分割不再难
近年来,随着视觉-语言模型的快速发展,开放词汇分割(OVS)技术已成为自然图像处理领域的热点。这项技术让模型能够根据文本描述来分割任意类别的物体,打破了传统语义分割模型只能识别预设类别的限制。 很自然
超越像素的视觉:亚像素边缘检测原理、方法与实战
在计算机视觉领域,单个像素常常会成为我们测量能力的极限——但这并非无法突破。在计量学和精密机器人等领域,哪怕仅仅一个像素的误差,都可能转化为微米级的实际偏差。为了突破传感器物理极限,工程师们采用了一种
搞定边缘AI部署:开源神器RamaLama,让视觉语言模型无处不在
人工智能的前沿不再只是数据中心;它在于工厂车间、零售店、公共基础设施以及我们周围的智能设备。推动这一转变的是视觉语言模型(VLM),这是一个革命性的人工智能,可以解释和推理图像和视频。潜力巨大,但任何
【论文导读】ORB-SLAM3:An Accurate Open-Source Library for Visual, Visual-Inertial and
这篇论文主要做的是多传感器融合/视觉-惯性SLAM系统,提出了ORB-SLAM3,一个支持以下配置的开源SLAM系统,而不是基于深度学习的预测模型
CV研究告别数据荒?PAN世界模型实现「多步推理与规划」,可自造高质量训练数据
导读 你是否曾想象过,如果AI不仅能生成视频,还能像人类一样“想象”世界的演变、预测动作的后果、甚至进行多步推理与规划,会是怎样的情景? 来自MBZUAI的PAN团队最新发布的PAN世界模型,正是这样
一致性模型:单步生成高质量图像,破解扩散模型速度瓶颈
这篇名为《一致性模型》的论文提出了一类新的生成模型,能够一步到位地生成高质量图像,解决了扩散模型的主要瓶颈——采样过程慢、需要多次迭代。它的核心贡献在于证明了:在保持扩散模型强大表达能力和训练稳定性的