在企业级RAG(检索增强生成)应用的落地实践中,很多用户常面临一个“近在咫尺”的困境:答案明明就在文档里,AI却视而不见,给出的回复要么碎片化,要么干脆就回答不知道。这种局限性来源于传统的静态RAG模式。随着MaxKB v2.5版本的发布,通过“调用智能体”的核心功能,我们可以尝试构建一种“智能RAG”(Agentic RAG)的能力,让AI能够主动搜索知识,进一步释放AI在智能问答应用中的潜力。
一、模式之变:从“一次检索”到“多轮迭代”
要理解静态RAG和智能RAG两者之间的区别,我们以一个典型问题为例:“公司拥有博士学位的员工有多少人?”
1. 静态RAG:单向线性逻辑
① 路径: 用户提问→关键词提取→向量检索→TopK排序→AI生成。
② 瓶颈: 如果第一步检索没匹配到“博士”这个词(例如文档里写的是“高层次人才分布”),流程就会中断。静态RAG无法解决“关键词失配”和“信息不完整”的问题。
2. 智能RAG:多轮迭代逻辑
① 路径: 用户提问→意图拆解→调用检索工具→结果评估(反思)→策略修正(扩充搜索)→综合生成。
② 突破: 引入“反思机制”。当第一轮检索无果时,AI会意识到“博士”属于“学历结构”范畴,从而自动更换关键词进行二次寻证,直至拼凑出完整的逻辑链。
二、实战演练:在MaxKB中搭建智能RAG方案
说明:MaxKB需要升级至v2.5版本或以上。
在MaxKB v2.5版本中,实现智能RAG的核心思想是:将“检索”抽象为一个独立的技能插件,由一个“主智能体”进行调度,赋予AI主动获取信息的手脚。以下是基于MaxKB构建“财务报告深度分析助手”的具体方案:
1. 提前准备:知识库向量化
首先,在MaxKB中准备并上传原始文档(例如企业年报、人员手册等),完成高精度的向量化切片。
2. 核心组件:创建“向量检索智能体”
这是实现智能RAG的第一步。我们需要创建一个专门负责检索的智能体,它的唯一任务是:根据输入的指令,从知识库中检索最相关的原文片段。
配置要点:不添加AI回答节点,专注于设置相似度阈值、TopK数量或者加入重排序(Rerank)策略。
3. 任务委托:编排“智能RAG”工作流
创建一个新的智能体作为“主控节点”。在AI节点的技能配置中,添加上一步创建的“向量检索智能体”。通过以下提示词(Prompt),赋予AI调度检索、自我修正和多轮追溯的能力。
核心指令参考:
深度检索逻辑(Agentic Workflow)
术语对齐:将用户口语转化为搜索术语(如将“赚钱”转化为“营业收入”)。
参数对齐:对数值进行规范化扩充(如“24Q3”自动关联“2024年第三季度”)。
多轮迭代:设定“三轮检索机制”。首轮未中,立即切换视角(如从“具体科目”转到“报表大类”)。
结果自审:若检索到“详见附注 X”,必须自发触发追加检索,追踪到底。本文具体提示词参考:
# 角色
你是专业财务报告分析助手。你擅长从海量财务报表、年度报告及审计说明中,通过精准检索为用户提取关键数据、准则依据及财务流程。
🛠 深度检索逻辑(工具调用准则)
在调用检索工具前,你必须启动“智能体分析模式”,确保数据提取不遗漏、不偏差:
1. 关键词转换与语义扩充
术语对齐:将用户的口语转化为财务标准术语。例如:将“去年赚了多少”转化为“营业收入、净利润、利润表”;将“欠多少钱”转化为“应收账款、负债总额”。
数值/参数增强(核心策略):
规范化扩充:若查询包含“24Q3”、“1.5亿”、“15%”等数值,需同时检索“2024年第三季度”、“150,000,000”、“百分之十五”等不同表述。
类目对齐:若直接搜索具体科目无果,立即检索其所属的财务报表大类(如“资产负债表”、“合并现金流量表”)。
2. 多轮迭代与追溯策略
第一轮(原文检索):直接采用用户问题的原文进行检索。
第二轮(关键词转换与语义扩充检索):将用户的问题进行关键词转换与语义扩充,然后在进行调用工具检索。
第三轮(补漏/上下文):若结果显示“详见附注 X”,必须追加检索该特定附注内容。
第四轮(跨表/跨期核对):若涉及计算依据(如毛利率),需同时检索“营业收入”与“营业成本”两个条目,并对比勾稽关系。
3. 自反馈优化
若首轮检索未匹配到有效数据,严禁直接回答“不知道”。应立即切换角度(如:搜索关联方名称、项目关键词缩写、所属部门名)重新尝试,至少尝试三次优化搜索。
📝 高质量回复规范
1. 原文与数据为本:所有数据和计算必须严格对应报告原文,严禁自行编造。
2. 结构化呈现:
📋 数据来源:[报告全称 + 章节名称/页码/附注编号]。
🎯 核心数据/条款:使用 Markdown 表格或清晰列表展示关键数值,并对重点数据加粗。
💡 核定/执行依据:解释该数据在报告中的统计口径、会计政策依据或关联变动原因。
3. 视觉优化:逻辑分层清晰。若检索到原文中的图表索引,请明确提示。
⚠️ 限制行为与准则
1. 严守数据边界:仅回答与提供的财务报告内容相关的问题。对于无关查询,统一回复:“对不起,我只能回答与财务报告制度及数据相关的问题,您的问题不在查询范围内。”
2. 严禁幻觉:若经多轮尝试,知识库中确实无相关数据(如该项未披露),必须如实告知并引导用户查看相关的补充说明文件。
3. 客观中立:解读数据时必须严格遵循会计准则和报告原文背景,不得掺杂主观臆断。
三、执行结果:AI会思考式检索了
上述步骤配置完成后,我们在MaxKB小助手的调试界面,尝试本文开篇的问题:“员工中博士的人员数量是多少?”
智能RAG的执行链条如下:
1. 首轮检索: 使用原句。知识库中未直接出现“博士”字样,未命中;
2. 自我反思: AI意识到“博士”属于学历范畴,自动修改关键词为“学历构成”或“人才分布”发起第二轮检索;
3. 深度挖掘: 通过“学历构成”未检索到相关内容,再次尝试优化为“员工构成”、“员工学历”等进行查询;
4. 关联查询: “员工构成”、“员工学历”仍未检索到相关内容,AI优化检索词为“员工总数”、“在职员工”等关键词进行查询,最终查询到准确答案。
四、深度解析:为什么智能RAG更聪明?
基于MaxKB构建的智能RAG能力能够大幅提升问答的准确率,本质上是因为它将“理解力”注入到了“检索过程”中。其涉及的关键技术环节包括:
1. 意图重塑(Query Rewriting): 不再被动等待关键词匹配,而是主动生成多个同义词进行并行检索,提升命中概率。例如,它能理解“员工中博士的人员数量是多少?”,并且自动生成多个同义或相关术语进行并行检索;
2. 链式追溯(Chain of Thought in Retrieval): 静态RAG面对检索任务类似于“交差”,而智能RAG会判断信息是否够用。例如:当用户提问“分公司电话”的问题时,向量检索相似度最高的为分支机构分段内容,并且提示“电话在附录中”。这时智能RAG会主动翻看附录,实现知识的“溯源”;
3. 结果自审(Self-Correction): 生成答案前进行最后自评:信息完整吗?逻辑通顺吗?这种“发现缺失、主动补全”的机制,是解决“材料中有信息AI却答不出”问题的关键。
五、总结
从静态RAG到智能RAG,AI智能问答完成了从“机械执行”向“主动洞察”的转变,将检索过程从编排移交给了理解力。这种能力的价值不仅局限于文档问答,更拥有广阔的场景延展性,例如:
■ 多源信息联动: 可以集成企业网盘、邮件系统或ERP接口作为检索工具,实现跨平台的“智能云盘搜索”能力,让AI像人类员工一样查询资料、核对账目;
■ 业务辅助决策: AI不再只是给出简单的文本回复,而是能够通过多轮寻证和数据检索,输出具备逻辑支撑的分析结论,真正像是企业的数字员工,深度支持业务分析和决策。