多路召回比关键词检索和向量检索更强,因为它结合多种方法,能找得更准、找得更多、不容易漏掉好内容。

多路召回的知识库准备:
1 数据准备
a 数据源
b 数据获取、解析、清洗
c 文本分块:切片
d 数据入库:关系型数据库
2 建立全文检索引擎(比如基于 BM25 算法)
3 建立向量检索引擎(比如使用 FAISS)

基于多路召回的问答流程(串行多路召回):
1 用户提问
2 召回
a 初筛:全文检索(关键词检索)
b 精排:向量检索
c 融合:将多个通道召回的结果融合。使用简单的算法或重排序模型实现。
3 生成提示词:结合用户提问和召回片段构造提示词
4 调用大模型,获取回答
展开
评论