本文深入解析AI大模型中的RAG架构与技术要点,详细介绍了其适用场景与局限性。文章提出了一种数据库与RAG融合的最佳实践方案:将数据保存到数据库,文档整理为结构化数据,利用大模型SQL调用能力处理任务,RAG技术作为兜底。此方法让大模型专注于需求描述和指令生成,外挂模块完成计算统计,提高准确率和可扩展性,同时支持预置人工定义概念,便于知识更新。
更多AI大模型应用开发学习视频及资料,在智泊AI。
一、AI大模型中知识库常用框架——RAG架构图
二、RAG的技术要点
三、RAG技术可适用的业务范围有限
RAG技术方案适用场景和局限性:
1.单文档问答
2.基于文档具体内容的多文档问答
3.提问语义与文档内容相近
4.非统计类问答,比如总共有多份、带时间范围的统计、带类别统计等
四、最佳实践方案
我们用的技术选型是数据库和RAG融合,即将数据比如主题词保存到数据库中。我们将文档整理为结构化数据(数据库,es索引或表格),选择强化大模型的Sql-Call的能力,来完成对任务的处理。同时用RAG技术进行兜底。
完整版此处有技术架构图
让大模型解决精确计算和统计的问题,业界常见的方法就是生成python代码,外挂数据库和外挂知识库。大模型负责描述需求和生成指令,由外挂的模进行计算和统计部分。
业界技术方法优缺点对比:
| 优点 | 缺点 | |
| 将计算需求改成python代码,运行代码后得到结果。 | 大模型充分接触过相关任务,通用性强,做通用任务时不需要做额外的训练。 | 深入到具体垂直场景之后,准确率很低。 不可预置人工定义的概念,无法做定制扩展。 |
| 使用数据库(关系型数据库,ES等) | 统计结果精准,可以预置人工定义的概念,可以更新知识便捷,可读性和可解释性好 | 开发工作量较大 |
| 外挂其他计算和统计工具,比如:Pandas | 业界有成熟的实践经验,只需预定义数据库的字段而无需建库,开发成本低,准确率较高 | 不可预置人工定义的概念 |
更多AI大模型应用开发学习视频及资料,在智泊AI。