RAG 去哪儿了？从爆火到“退场”，它真的消失了吗？一年多前，如果你在捣鼓 AI Agent，RAG（检索增强生成）几

曾经“不懂 RAG 就不算懂 Agent”，如今为何鲜少被提及？本文用一张全景图、五个核心原因和一张对比表，说透 RAG 的“沉寂”真相。

一年多前，如果你在捣鼓 AI Agent，RAG（检索增强生成） 几乎是必选项。向量数据库、Embedding、文档切片……这些概念是技术圈的“顶流”。

但最近你可能会发现，社区里聊 RAG 的声音越来越小。取而代之的是 Skills、Tools、MCP、Memory 这些词。RAG 过气了吗？还是说，我们对它的认知需要一次彻底的更新？

我梳理了背后的五个关键原因，这或许能帮你看清当前 AI 应用架构的一次重要演进。

📊 一张图看懂 RAG 的“退场”逻辑

在展开之前，先看这张全景图。五个力量共同将 RAG 从 C 位拉向了后台，但它们并非要“消灭”RAG，而是在重新定义它的战场。

flowchart LR
    subgraph A [ 五重力量压缩RAG生存空间 ]
 direction LR
        A1[Skill/Tool<br>足够好用] --> C((RAG<br>暂时退场))
        A2[RAG<br>成本不低] --> C
        A3[LLM自身<br>能力增强] --> C
        A4[Context Window<br>持续变大] --> C
        A5[Agent生态<br>以ToC为主] --> C
    end

    C --> D{等待新主场}
    D --> E[ToB Agent爆发<br>海量私有数据/精确检索]
    E --> F[RAG重回<br>大众视野]

原因一：Skill + Tool，简单到无法拒绝

最直接的原因：对大多数个人开发者和日常场景，Skill 和 Tool 已经完全够用，而且出奇地“轻”。

用 Agent 在做什么？ 写代码、搜资料、整理信息、管理日程……一个web_search工具、一个run_code工具基本全覆盖。
Skill 是什么？ 它就是一个用自然语言写的“说明书”文件，告诉 Agent 在某类任务上应该遵循的规则、风格和流程。
为何传播快？ 零配置。一个文件，分享下载即用。在 Claude Code、OpenClaw 这类产品里，社区贡献的 Skill 开箱即用，效果直观，出了问题也容易排查。

原因二：RAG 的成本，远比想象中高

RAG 的流程听起来很优雅，但实际落地时，成本体现在三个层面：

搭建成本高：选型纠结、文档切片调参、跑通 Embedding 流程……没有一两天搞不定。
费用成本不菲：主流的向量数据库、Embedding 模型调用、存储和查询，几乎都要付费。对个人或小项目，积少成多。
维护成本惊人：数据不是静态的。源文档一更新，就需要重新切片、Embedding、增量同步。这套维护逻辑的复杂度，甚至超过了业务代码本身。

对比一个只需 API 调用的免费 Tool，个人开发者自然会用脚投票。

原因三：LLM 自己，正在“内化”RAG 的价值

这是最根本的技术原因。RAG 的核心——语义搜索，正被越来越强的 LLM 自身能力覆盖。

RAG 当初要解决两大硬伤：Context Window 太小 和 理解能力有限。所以需要先检索筛选，再喂给模型。

但现在，这两块短板在快速消失：

上下文窗口从 4K 暴涨到 128K、200K+，很多内容根本不需要预筛选，直接全塞进去即可。
模型理解力远超当年的专用 Embedding 模型，让 LLM 自己从大量内容里找答案，反而更准。

一个典型例子是 Tool 选择问题。过去几百个 Tool 需要 RAG 预筛选，现在直接把所有 Tool 描述全部发给 LLM，让它自行判断。多花一点 Token 费用，远低于维护整套 RAG 服务的成本。这种“替代”正在许多场景悄悄发生。

原因四：张雪峰.skill 的深刻启发

前阵子，考研名师张雪峰不幸离世后，有人将他十几年的核心方法论和表达风格，整理成了一个张雪峰.skill 文件，让 Agent 能用他的风格回答问题。

这件事揭示了一个关键洞察：绝大多数人的“专业知识”，本质上是一套可以被高度结构化压缩的判断框架、经验规则和表达风格。 这些东西，一个精心编写的 System Prompt 就能承载。

真正需要 RAG 的，是无法被规则化的、必须逐条精确检索的细粒度数据，比如企业的海量客户记录、合同原文。这清晰地画出了两者的边界：

❓ 能被规则化、结构化的知识 → Skill
❓ 必须逐条精确检索的碎片化数据 → RAG

原因五：当下的 Agent 明星产品，几乎全是 ToC

把这五点串联起来的宏观视角是：当前令人兴奋的 Agent 产品，全是面向个人（ToC）的。

Claude Code、Cursor、Devin……它们的目标用户是个人开发者。这决定了一切：

数据量不大：个人代码库、笔记，完全用不上向量数据库。
成本极度敏感：不愿为功能额外付费。
追求开箱即用：下载必须立刻能用，才能广泛传播。

这三点，天然排斥重而贵的 RAG，天然偏好轻而快的 Skill/Tool。例如 OpenClaw 内部没有 RAG，完全靠 LLM 自身能力和 Skill 体系就运转流畅。

而 RAG 真正的用武之地——ToB 场景，企业虽有海量私有数据和精确检索的刚需，但因为数据敏感、系统接入壁垒高、决策链长、容错率低等问题，现象级的 ToB Agent 产品尚未出现。RAG 还在等待自己的主场。

总结：RAG 没有消失，它只是在等更大的舞台

最后，我们用一张表来清晰对比 Skill/Tool 与 RAG 的“此消彼长”，以及它们的本质区别：

特性对比	🛠️ Skill / Tool	🗄️ RAG (检索增强生成)
核心载体	自然语言描述文件 (Skill) 或 API 调用 (Tool)	向量数据库 + Embedding 模型 + 切片逻辑
处理知识类型	可规则化、可结构化的知识 (判断框架、风格)	海量、细粒度、必须精确检索的碎片化数据
使用成本	极低，分享即用，多免费	高 (算力、存储、维护)
维护复杂度	极低，修改 Prompt 即可	高，需处理数据同步、更新、失效
当前主战场	ToC 应用 (个人知识库、代码辅助等)	等待中的 ToB 应用 (企业数据、合规审计等)
一句话本质	AI Agent 的思维框架与工具箱	AI Agent 按需调阅的外部专业档案馆

技术没有好坏，只有适不适合当下的场景。

RAG 并没有“死”，它只是从需要开发者手搓的“明星技术”，变成了被云厂商封装好的后台基础能力，就像 HTTP 协议，无处不在但鲜被专门讨论。它暂时的沉寂，只是在等待企业级 Agent 应用真正爆发的那一天。到那时，RAG 将作为不可或缺的核心组件，重返舞台中央。

感谢阅读！ 如果你觉得这篇文章理清了思路，欢迎点赞、收藏和转发。你对 RAG 或 Skill 的未来怎么看？评论区聊聊。