RAG 的基本流程
1 创建向量数据库(知识库):输入文本 - 使用 embedding 模型将文本转化成向量 - 存入向量数据库
2 提问:用户和 ai 说话提问
3 检索:将提问文本使用 embedding 模型转化成提问向量,并在数据库中检索,返回相关的文本段
4 拼接 prompt: 将提问文本和检索到的文本段拼接成最终 prompt 文本
5 调用大模型:使用 prompt 调用大模型,返回最终回答
展开
2