RAG 系统内容缺失问题解决方法

伟哥ai大模型

2026-03-15 0 阅读2分钟

RAG 系统内容缺失问题解决方法

内容缺失的三种类型

内容缺失在实际项目中分为三类：库里有但没搜着；搜着了但大模型没看见；库里真没有。

输入与意图层（解决没搜对问题）

query 重写和指代消解：将用户模糊的代代词问题转化为标准清晰的检索词，例如解决 “他去年的收入” 中 “他” 的指代不明问题。

多路并发扩展（Multiquery） ：当用户用词与知识库专业词汇不匹配时，让模型从不同角度生成多个语义相同但用词不同的问题同时检索，提高核心信息获取概率。

数据与检索层（解决搜不到问题）

混合检索：向量检索负责意思相近匹配，关键词检索负责精准匹配（如产品型号、身份证号等字符串），提升检索准度。

知识图谱增强（graph Rag） ：将文档中的实体连成网络，检索时顺藤摸瓜获取相关背景知识。

羽翼分块和父子文档策略：检索时用精准小块提高命中率，提供给模型时使用内容完整的复块，避免模型因缺乏上下文而断章取义。

上下文组装层（解决大模型看漏问题）

强力重排：使用专门的重排模型对检索到的信息二次打分，将最核心的 TOP5 信息推送给模型，避免 “中间迷失现象”。

上下文动态压缩：剔除无用信息，确保每个 TOKEN 都用于核心内容，防止核心信息被噪音掩盖。

生成与兜底层（解决库里真没有问题）

self-frag 机制：模型生成前自省参考资料是否足够回答问题，相关度低则触发 agented 外部搜索补充实时信息。

优雅降级：若无法获取信息，向用户提供相近内容（如 “未查到 a，但找到相近的 b，是否需要查看”），提升用户体验。

数据飞轮：记录缺失的 query，反馈给业务人员补充文档，持续优化知识库。

满分回答逻辑总结

按照输入、检索、组装、生成的全链路排查思维，强调重排和父子文档对语义缺失的解决，结合 self check 和联网搜索的兜底能力，最后提及数据飞轮的工程化态度，展现技术深度和解决复杂问题的系统性思维。