RAG 技术演化:Naive RAG、Advanced RAG 与 Graph RAG
Naive RAG(初级 / 朴素 RAG)
流程简单:用户提问→文档切块做向量检索→找到最相似片段交给大模型生成答案。核心问题是检索精度低,类似关键词匹配的 “实习生”,用户问题模糊或文档关键词偏移时易返回不相关内容,导致 “垃圾进垃圾出”。解决了大模型 “有没有私有知识” 的问题,但未解决 “查得准不准” 的问题。
Advanced RAG(进阶版 RAG)
通过 “打补丁” 策略优化检索精度,在检索前中后增加工程化手段:第一步查询优化(机器修正模糊问题);第二步混合检索(向量检索 + 关键词检索双管齐下);第三步重排序(对检索结果重新打分,优先最相关内容)。核心是解决 “查不准” 的问题,是目前企业落地的主流方案。
Graph RAG(基于知识图谱的 RAG)
将文档视为实体关系网络,先提取文档中的实体(人名、地名、概念等)并构建实体间关系。解决复杂问题或跨文档推理时,系统可沿实体关系 “顺藤摸瓜” 进行结构化深度理解,解决碎片化和 “看不全” 的问题。代价是实现成本更高、速度更慢。
三者关系与总结
- Naive RAG:0-1 突破,解决大模型 “有没有知识” 的问题。
- Advanced RAG:工程精细化,通过策略解决 “检索准不准” 的问题,企业落地主流。
- Graph RAG:结构升维,引入图谱解决复杂问题 “回答全不全、深不深” 的问题。
三者非淘汰关系,而是针对不同场景的技术选择,如同瑞士军刀应对不同需求。