首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
人工智能
LLM
Agent
AIGC
OpenAI
程序员
AI编程
后端
前端
展开
全部
人工智能
LLM
Agent
AIGC
OpenAI
程序员
AI编程
后端
前端
算法
Python
深度学习
计算机视觉
JavaScript
MCP
暂无数据
推荐
最新
LeCun在Meta的最后绝唱?50行代码证明AI的另一种可能
就在AI界为Yann LeCun离职Meta的消息震惊时,一份意外的“告别礼物”悄然出现在arXiv上——这位图灵奖得主与Randall Balestriero合作的新论文 《LeJEPA:一种简约且
去噪扩散模型,根本不去噪?何恺明新论文回归「去噪」本质
导读 高质量的图像生成如今几乎都由扩散模型实现。从艺术创作到商业设计,从人脸生成到自然场景合成,基于扩散的生成模型已经成为多模态领域的重要基石。 但有没有一种可能,「去噪扩散模型」实际上并没有做到「去
基于SimCLR的自监督 YOLO:YOLOv5/8也能在低标注场景目标检测性能飙升
自监督学习的核心思想是:从数据本身自动生成“标签”或“监督信号”,而无需依赖昂贵且耗时的人工标注。 想象一下,你教一个孩子认识“猫”。传统方法(监督学习)是拿出一堆猫的图片,每张都告诉他“这是猫”。而
智能体与小模型:AI迈向平民化的新浪潮
数百亿参数、庞大算力需求、昂贵的部署成本……当科技巨头们还在追求“更大更强”的AI模型时,一股反向而行的趋势正悄然兴起,并可能彻底改变人工智能的应用格局。 过去一年,AI智能体(AI Agent)热度
CV研究告别数据荒?PAN世界模型实现「多步推理与规划」,可自造高质量训练数据
导读 你是否曾想象过,如果AI不仅能生成视频,还能像人类一样“想象”世界的演变、预测动作的后果、甚至进行多步推理与规划,会是怎样的情景? 来自MBZUAI的PAN团队最新发布的PAN世界模型,正是这样
开发需掌握的知识:高精地图
高精度地图(HD Map, High-Definition Map)是自动驾驶、智能交通和导航领域的核心技术之一,其精度可达厘米级(对比传统导航地图的米级),并提供精细化车道模型和动态语义信息。以下是
体验RWKV-7训练全过程,只需400行代码训练3分钟
基于 2 层 RWKV-7 模型(仅30860 个参数)训练“数字翻转”任务,实现良好准确率和运算效率
超越像素的视觉:亚像素边缘检测原理、方法与实战
在计算机视觉领域,单个像素常常会成为我们测量能力的极限——但这并非无法突破。在计量学和精密机器人等领域,哪怕仅仅一个像素的误差,都可能转化为微米级的实际偏差。为了突破传感器物理极限,工程师们采用了一种
中科大西工大提出RSKT-Seg:精度速度双提升,开放词汇分割不再难
近年来,随着视觉-语言模型的快速发展,开放词汇分割(OVS)技术已成为自然图像处理领域的热点。这项技术让模型能够根据文本描述来分割任意类别的物体,打破了传统语义分割模型只能识别预设类别的限制。 很自然
1.2MB超轻量模型实现草莓苗精准分级检测与定位,准确率超96%
在现代化的草莓育苗工厂中,一排排整齐的穴盘里孕育着成千上万的草莓幼苗。然而,一个长期困扰农户的难题是:如何快速准确地识别出哪些穴孔缺苗、哪些幼苗生长不良? 传统的解决方式主要依赖人工肉眼识别,效率低下
征程 6X 常见 kernel panic 问题
kernel panic 包含了多种内核异常类型,包括但不限于:空指针/异常指针、HungTask、RCU Stall、softlockup、hardlockup、OOM、BUG_ON。
不同传感器前中后融合方案简介
在自动驾驶场景下,摄像头 + 激光雷达的传感器融合方案是最常见的感知技术路线,目标是充分利用二者的互补性: 摄像头优势:分辨率高、纹理丰富、颜色信息齐全,有利于识别语义信息(车道线、交通灯、行人类别等
RAG Chunking 2.0:提升文档分块效果的一些经验
在基于大语言模型的RAG系统里,文本分块是非常关键的一步。分块做得好,后续的向量检索、结果召回和生成质量都会更稳更准。
让Qwen-VL的检测能力像YOLO一样强,VLM-FO1如何打通大模型的视觉任督二脉
在当今多模态大模型(VLMs)飞速发展的时代,一个令人尴尬的问题依然存在:为什么这些能看懂图像、生成描述的模型,却难以精确地定位图像中的物体? 答案在于一个根本性矛盾:让一个为语言生成而设计的模型,去
vLLM主要模块Scheduler详解
vLLM主要模块Scheduler详解 在 vLLM 中有许多的模块,而在这篇文章中,我们主要来介绍 vLLM 中如调度管理prompt的。 本文章是按照vLLM版本:v0.11.0
突破跨模态识别瓶颈!火箭军工程大学提出MFENet:让AI在白天黑夜都能准确识人
想象这样一个安防场景:白天,监控摄像头(可见光模式)清晰地捕捉到一个人的影像;到了夜晚,摄像头自动切换到红外模式,画面变成了基于热辐射的黑白图像。对于人类来说,我们很容易判断这是同一个人,但对于AI系
结构化数据迎来“ChatGPT时刻”!LimitX:一个模型统一所有表格任务
在大语言模型如ChatGPT、GPT-4重塑自然语言处理范式,多模态模型征服图像、视频之后,人工智能的下一个前沿阵地正悄然浮现——结构化数据。 我们日常接触的金融风控、医疗诊断、商业决策,背后都依赖于
RAG—Chunking策略实战|得物技术
在 RAG 系统中,即便采用性能卓越的 LLM 并反复打磨 Prompt,问答仍可能出现上下文缺失、事实性错误或拼接不连贯等问题。多数团队会频繁更换检索算法与 Embedding模型,但收
🌟【刷题赢矿石】黄金矿工上班计划来喽
🌟【刷题赢矿石】黄金矿工上班计划来喽!活动打卡赚矿石了!活动:时间 12月5日-12月30日(27天)
『译』迄今为止最强的 RAG 技术?Anthropic 的上下文检索与混合搜索
RAG(检索增强生成)似乎是当下最热门的话题,这也不难理解。它通过让大语言模型(例如 Claude 3.5)访问外部知识源,为用户查询提供额外的上下文,从而减少幻觉现象。此外,它还被设计用来克服语言模