Agentic RAG 和 传统 RAG 的核心区别在于:
是否引入“Agent(代理)”的自主决策、规划与多步执行能力。
下面用一句话、再展开说明。
一句话对比
- 传统 RAG:
👉 “我按你的问题检索一次资料,然后直接生成答案。” - Agentic RAG:
👉 “我先想清楚要做什么 → 该查什么 → 查几次 → 用不用工具 → 再决定下一步,直到完成目标。”
传统 RAG(Retrieval-Augmented Generation)
工作流程(线性、一次性)
- 用户提问
- 向向量数据库检索相关文档
- 把文档 + 问题一起喂给 LLM
- 生成回答(结束)
特点
- 单轮检索
- 无规划能力
- 流程固定
- 快、简单、成本低
适合场景
- FAQ / 知识库问答
- 文档助手
- 客服机器人
- 搜索增强型问答
局限
- 问题问错就“查错”
- 查一次不够也不会再查
- 无法拆解复杂问题
- 不知道“现在缺什么信息”
Agentic RAG(代理式 RAG)
工作流程(多步、可循环)
-
用户给一个目标
-
Agent 思考 & 制定计划(Plan)
-
判断是否需要检索 → 检索哪类信息
-
分析结果
-
决定:
- 再查一次?
- 换关键词?
- 用别的工具?
-
多轮迭代后再生成最终答案
特点
- 多轮检索
- 有推理 / 规划能力
- 能自我纠错
- 能调用多种工具
- 更像“人在做研究”
常见 Agent 能力
- Query 重写 / 扩展
- 多跳检索(multi-hop)
- 工具调用(搜索、代码、数据库)
- 自评估(answer good enough?)
核心差异对比表
| 维度 | 传统 RAG | Agentic RAG |
|---|---|---|
| 检索次数 | 1 次 | 多次(可循环) |
| 是否有规划 | ❌ | ✅ |
| 是否能拆任务 | ❌ | ✅ |
| 是否能自我纠错 | ❌ | ✅ |
| 实现复杂度 | 低 | 高 |
| 推理能力 | 弱 | 强 |
| 延迟 & 成本 | 低 | 较高 |
什么时候该用哪一个?
用 传统 RAG,如果你:
- 追求低延迟、低成本
- 问题结构清晰
- 文档质量高、召回稳定
- 场景偏“查资料”
用 Agentic RAG,如果你:
- 问题复杂、开放式
- 需要多步推理 / 多源信息
- 用户给的是“目标”而不是问题
- 场景偏“分析 / 决策 / 研究”
一个直观例子
用户问题:
“帮我分析 2024 年东南亚电商增长趋势,并给出 Shopee 的机会点。”
-
传统 RAG:
→ 查一堆报告 → 总结(可能不完整) -
Agentic RAG:
→ 拆解:- 查宏观增长
- 查各国差异
- 查 Shopee 现状
- 对比 Lazada / TikTok
→ 综合分析 → 输出策略建议
总结一句
传统 RAG = 带搜索的回答器
Agentic RAG = 会思考、会查资料、会反复修正的“研究助理”