RAG 系统内容缺失问题解决方法

0 阅读2分钟

RAG 系统内容缺失问题解决方法

内容缺失的三种类型

内容缺失在实际项目中分为三类:库里有但没搜着;搜着了但大模型没看见;库里真没有。

输入与意图层(解决没搜对问题)

  • query 重写和指代消解:将用户模糊的代代词问题转化为标准清晰的检索词,例如解决 “他去年的收入” 中 “他” 的指代不明问题。
  • 多路并发扩展(Multiquery) :当用户用词与知识库专业词汇不匹配时,让模型从不同角度生成多个语义相同但用词不同的问题同时检索,提高核心信息获取概率。

数据与检索层(解决搜不到问题)

  • 混合检索:向量检索负责意思相近匹配,关键词检索负责精准匹配(如产品型号、身份证号等字符串),提升检索准度。
  • 知识图谱增强(graph Rag) :将文档中的实体连成网络,检索时顺藤摸瓜获取相关背景知识。
  • 羽翼分块和父子文档策略:检索时用精准小块提高命中率,提供给模型时使用内容完整的复块,避免模型因缺乏上下文而断章取义。

上下文组装层(解决大模型看漏问题)

  • 强力重排:使用专门的重排模型对检索到的信息二次打分,将最核心的 TOP5 信息推送给模型,避免 “中间迷失现象”。
  • 上下文动态压缩:剔除无用信息,确保每个 TOKEN 都用于核心内容,防止核心信息被噪音掩盖。

生成与兜底层(解决库里真没有问题)

  • self-frag 机制:模型生成前自省参考资料是否足够回答问题,相关度低则触发 agented 外部搜索补充实时信息。
  • 优雅降级:若无法获取信息,向用户提供相近内容(如 “未查到 a,但找到相近的 b,是否需要查看”),提升用户体验。
  • 数据飞轮:记录缺失的 query,反馈给业务人员补充文档,持续优化知识库。

满分回答逻辑总结

按照输入、检索、组装、生成的全链路排查思维,强调重排和父子文档对语义缺失的解决,结合 self check 和联网搜索的兜底能力,最后提及数据飞轮的工程化态度,展现技术深度和解决复杂问题的系统性思维。