首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
人工智能
LLM
Agent
AIGC
AI编程
OpenAI
后端
程序员
前端
展开
全部
人工智能
LLM
Agent
AIGC
AI编程
OpenAI
后端
程序员
前端
算法
Python
深度学习
计算机视觉
MCP
JavaScript
暂无数据
推荐
最新
vLLM主要模块Scheduler详解
vLLM主要模块Scheduler详解 在 vLLM 中有许多的模块,而在这篇文章中,我们主要来介绍 vLLM 中如调度管理prompt的。 本文章是按照vLLM版本:v0.11.0
让Qwen-VL的检测能力像YOLO一样强,VLM-FO1如何打通大模型的视觉任督二脉
在当今多模态大模型(VLMs)飞速发展的时代,一个令人尴尬的问题依然存在:为什么这些能看懂图像、生成描述的模型,却难以精确地定位图像中的物体? 答案在于一个根本性矛盾:让一个为语言生成而设计的模型,去
TypeScript超越Python,以66%增速跃升第一,Python稳居AI领域王座
各位开发者朋友们,你们准备好了吗?技术世界的风向标再次转动!全球最大的开发者社区GitHub刚刚发布了2025年的编程语言趋势报告,结果可能出乎很多人的意料——TypeScript 首次超越Pytho
突破跨模态识别瓶颈!火箭军工程大学提出MFENet:让AI在白天黑夜都能准确识人
想象这样一个安防场景:白天,监控摄像头(可见光模式)清晰地捕捉到一个人的影像;到了夜晚,摄像头自动切换到红外模式,画面变成了基于热辐射的黑白图像。对于人类来说,我们很容易判断这是同一个人,但对于AI系
外科医生离手术世界模型还有多远?首次提出SurgVeo基准,揭示AI生成手术视频的惊人差距
外科医生离手术世界模型还有多远?首次提出SurgVeo基准,揭示AI生成手术视频的惊人差距 近年来,视频生成领域的基石模型展现出作为潜在“世界模型”模拟物理世界的惊人能力。谷歌的Veo等模型已经能够生
1.2MB超轻量模型实现草莓苗精准分级检测与定位,准确率超96%
在现代化的草莓育苗工厂中,一排排整齐的穴盘里孕育着成千上万的草莓幼苗。然而,一个长期困扰农户的难题是:如何快速准确地识别出哪些穴孔缺苗、哪些幼苗生长不良? 传统的解决方式主要依赖人工肉眼识别,效率低下
从图像导数到边缘检测:探索Sobel与Scharr算子的原理与实践
计算机视觉是一个分析图像和视频的广阔领域。虽然很多人一听到计算机视觉,首先想到的通常是机器学习模型,但实际上,还有很多其他现有算法,在某些情况下,它们表现得比人工智能还要好! 在计算机视觉中,特征检测
注意力机制不再计算相似性?清华北大新研究让ViT转向“找差异”,效果出奇制胜
一篇来自清华大学和北京大学的最新研究,它给热门的Vision Transformer(ViT)带来了一次相当漂亮的“线性提速”。 这篇被NeurIPS 2025录用的论文,标题为 《Linear Di
终结AI偏见!Sony AI发布Nature论文与FHIBE数据集,重塑公平性评估基准
近年来,人工智能(尤其是计算机视觉)技术快速发展,广泛应用于安防、金融、医疗、自动驾驶等领域。然而,数据偏见问题一直如影随形,制约着AI系统的公平性与可信度。 你是否曾想过,训练AI的图像数据是否真正
【Agent】生成式隐式记忆 MemGen 源码解读
【Agent】生成式隐式记忆 MemGen 源码解读 [toc] 0x00 概要 MemGen旨在构建一个动态、生成式的记忆框架,其核心由两个协同工作的轻量级模块构成:一个基于强化学习(RL)训练的记
RAG—Chunking策略实战|得物技术
在 RAG 系统中,即便采用性能卓越的 LLM 并反复打磨 Prompt,问答仍可能出现上下文缺失、事实性错误或拼接不连贯等问题。多数团队会频繁更换检索算法与 Embedding模型,但收
LLM 训练基础概念与流程简介
LLM 首先要学习的并非直接与人交流,而是让网络参数中充满知识的墨水,“墨水” 理论上喝的越饱越好,产生大量的对世界的知识积累。
『译』迄今为止最强的 RAG 技术?Anthropic 的上下文检索与混合搜索
RAG(检索增强生成)似乎是当下最热门的话题,这也不难理解。它通过让大语言模型(例如 Claude 3.5)访问外部知识源,为用户查询提供额外的上下文,从而减少幻觉现象。此外,它还被设计用来克服语言模
Agent架构新方向?Claude Skills工作原理解析
Claude Skills为模型提供了一种全新的插件式增强能力:通过封装说明、示例和代码,让 Claude 具备特定领域的专业知识,并在需要时动态加载。
当搜索遇见 AIGC:京东零售的“千人千面”素材生成实践
在 AIGC 技术席卷各行业的浪潮中,视觉生成技术正成为重构电商生态的核心力量。当电商从“商品陈列”转向“内容驱动”,品牌对海量、多元、精准的视觉素材需求空前迫切,而传统人工制作模式早已难以应对存量市
大模型如何革新搜索相关性?智能升级让搜索更“懂你”|得物技术
你是否曾在社区搜索时遇到这样的困扰:想找一双“平价学生党球鞋”,结果出现的多是限量联名款?或者输入“初冬轻薄通勤羽绒服”,却看到厚重登山款?这类“搜不准”的情况,正是搜索相关性技术要解决的
Camsys 时间戳信息简介
不同平台时间戳介绍,征程 3、征程 5、征程 6 这几个不同平台的时间戳有什么不同?本文具体介绍其中不同
OCR战场再起风云:LightOnOCR-1B凭什么比DeepSeekOCR快1.7倍?(附演示开源地址)
就在前不久DeepSeekOCR开源发布,大家在感叹其体积和速度的时候,LightOnOCR又给我们带来全新的效果,这款全新的视觉语言模型正在重新定义机器阅读和理解商业信息的方式。 LightOnOC
空间智能!李飞飞、LeCun&谢赛宁联手提出“空间超感知”,长文阐述世界模型蓝图
近日,由Yann LeCun、李飞飞、Rob Fergus等AI领域顶级学者共同署名的论文《Cambrian-S: Towards Spatial Supersensing in Video》首次系统
🌟【刷题赢矿石】黄金矿工上班计划来喽
🌟【刷题赢矿石】黄金矿工上班计划来喽!活动打卡赚矿石了!活动:时间 12月5日-12月30日(27天)