深度解码:大模型RAG架构全图谱(16种主流框架汇总)

79 阅读4分钟

一、 基础与进阶检索架构

  1. Standard RAG (标准型):经典的“Query → 向量检索 → 拼接上下文 → LLM”流水线。

    • 适用: FAQ、企业Wiki。

    • 建议: 必须搭配 Reranker(重排序) 解决向量相似度不等于语义相关性的问题。

  2. Hybrid RAG (混合型):语义向量 + BM25关键词 + 规则式过滤的多信号召回。

    • 适用: 包含专有名词、缩写或特定编码的搜索场景。
  3. Modular RAG (模块化):将检索、重排、推理、生成拆分为独立微服务。

    • 适用: 大型开发团队,利用 Kafka 记录检索日志实现场景复现和AB测试。
  4. Domain-Specific RAG (行业定制型):针对医疗、法律等垂直行业深度调优 Embedding 模型与切分策略。

    • 关键: 需持续维护行业词典与知识图谱,确保术语理解的一致性。

二、 认知增强与自我博弈

  1. Self-RAG (自反思型):模型生成答案后进行“自我质检”,判断是否需要重新检索。

    • 亮点: 类似“AI同行评审”,有效降低生成幻觉。
  2. Corrective RAG (CRAG,纠错增强型)【补充】 引入轻量级检索评估器,将检索结果分为“正确、错误、模糊”。若检索质量极差,则触发 Web 搜索补全。

    • 适用: 对准确度要求极高的知识库。
  3. Speculative RAG (投机型)【补充】 使用小模型快速进行多次检索与草稿生成,大模型仅负责最后的校验与润色。

    • 核心: 在保证质量的前提下,大幅降低推理成本和响应延迟。
  4. Recursive / Multi-Step RAG (递归/多跳型):在生成过程中多次检索、不断重构上下文。

    • 适用: 投研深度报告等链式推理任务。注意其算力消耗通常是标准型的2-4倍。

三、 跨模态与复杂数据结构

  1. Graph RAG (图谱增强型):基于知识图谱,擅长回答“关系路径”问题(如依赖链分析)。

    • 挑战: 数据建模难度大,需解决实体对齐与本体构建。
  2. Multi-Modal RAG (多模态型):跨文本、图像、音频。常用 CLIP 编码图像与文本向量统一召回。

    • 适用: 技术图纸问答、短视频摘要、电商多维搜索。
  3. Knowledge-Enhanced RAG (知识融合型):融合结构化(数据库/表格)与非结构化文件。

    • 关键: 需统一引用格式,并提供来源置信度评分。

四、 场景化与交互策略

  1. Agentic RAG (智能体型):引入 Planning 与 Tool Call。Agent 决定何时调 API、何时读表。

    • 落地: 必须设置工具权限白名单与审计日志,防止 Agent 误操作。
  2. Memory-Augmented RAG (记忆增强型):利用 Redis/Pinecone 存储对话轨迹或用户画像。

    • 注意: 务必设置 TTL(生存时间),防止记忆膨胀导致的噪声干扰。
  3. Contextual Retrieval RAG (上下文检索型):深度理解对话历史,不仅看当前 Query,还看会话状态。

    • 适用: 多轮交互式客服。

五、 实时性与合规安全

  1. Streaming RAG (流式实时型):监听 Kafka/Kinesis 等实时流,秒级更新索引。

    • 建议: 采用“冷热索引隔离”策略,确保查询效率。
  2. Federated RAG (联邦检索型):数据不出本地,仅交换检索摘要或梯度。

    • 适用: 医疗、政务等对数据隐私极度敏感的跨机构协作场景。

核心总结与实施决策:

  1. 关于成本与效果的平衡

    • 低成本方案:采用 Standard + Hybrid + Rerank。这是目前性价比最高的配置,能解决 80% 的业务问题。

    • 高精度方案:采用 Self-RAG 或 CRAG。虽然推理成本增加约 1.5 倍,但幻觉率(Hallucination)显著下降。

  2. 关于数据结构的挑战

    • 如果你的数据里有很多表格,不要指望 Standard RAG,必须走 Knowledge-Enhanced RAG

    • 如果你的数据里有很多逻辑关联,必须考虑 Graph RAG

  3. 未来的终极形态Agentic RAG 是趋势。它不再是死板的流水线,是让 AI 像人一样,根据问题的难易程度,决定是“概括”还是“深入“ 还是”延展“。