Agent智能体实施:让AI学会思考:ReAct 与 Plan-and-Execute 推理策略实战指南(五)
导语
在上一篇文章中,我们介绍了“小智伴”模型模块的具体应用方案,重点讨论了业务如何接入大模型以及对大模型有一个更深入的认识。【AI大模型教程】
本文我们将聚焦于现实业务场景如何运用到大****模型的规划逻辑来完成需求任务,让我们的产品在使用大模型的过程中,模型思考如何决策调用那个工具,将产品需求“翻译”成可计算、可推理过程的工作,本次着重讲两大推理策略ReAct和Plan-and-Execute,它们如何决定大模型思考和推进工作。
思考?
- 产品需求的目标是什么,如何理解规划推理逻辑?
- 推理步骤需要包含哪些思考在里面?
- 判断输出结果好坏的标准是什么?
规划推理逻辑
针对小智伴这个项目,我们需要先梳理清楚那些业务场景,是需要用到大模型的。下面我们通过产品架构图来梳理一下。
在这张图里面,我们可以看到标红颜色的,就是我们需要进行大模型决策推理所涉及到需求。
需求确定以后,我们需要把需求再次转化为流程图,从流程图里面,我们能知道我们需要抽象出来那部分是推理逻辑,那部分我们需要设置工具供推理逻辑调用。接下来,我们针对试题生成画流程图,逐一进行分析。
可以看到这个流程图中,方框部门就是我们工具的所在之处(不是所有的都是工具)。菱形部分就是大模型需要设置的推理条件。抽象完这一部分,接下来,我们需要了解大模型推理逻辑经常用到的两大策略:ReAct和Plan-and-Execute
ReAct模式
概念:模型在“推理(reason)”与“动作(action)”之间循环:先推理决定要做什么,然后直接调用工具(检索、计算器、API),再基于工具结果继续推理,形成交错的推理—执行链。
场景:需要频繁查证外部证据或交互式工具调用(比如:联网检索试题信息、调用图片处理API、知识库检索)。
**优点:**高效、能实时使用外部工具补强事实;
**缺点:**需要规范化action接口、控制复杂性。
Plan-and-Execute
**概念:**先让模型/规划器生成一份明确的“计划(plan)”,把大任务拆成子任务序列,再逐个执行由Executor(可以是另一个模型或程序)完成。强调“先画路线,再走路”。
**场景:**复杂多步骤任务(如“把试题生成结合知识库和简历、图片优化、分析报告”)。
**优点:**结构化、易监控、便于并行执行;
**缺点:**规划错误会影响后续执行,需要回溯机制。
推理步骤拆解
有了上面针对两大策略的介绍,我们应该怎么设计推理步骤呢?
首先,我们需要分析我们目标识别推理的类型,比如你的业务场景更偏向于以下哪种?
**分类判断:**例如,判断一封邮件是咨询、投诉还是表扬;判断一个客户的风险等级。
**归因分析:**例如,分析本月销售额下降的主要原因。
**决策支持:**例如,根据客户的资料和历史行为,推荐最合适的产品。
**信息提取与校验:**例如,从一份合同中提取关键条款,并检查与标准模板的差异。
**流程规划:**例如,为用户设计一个个性化的旅游行程。
**第二步,**也就是我们需要画流程图,然后把流程图转变为我们的代码逻辑。
**第三步,**定义输入与输出规范
**输入:**用户的一段非结构化文本。
**输出:**一个结构化的JSON对象,包含字段如:{"problem_type": "试题类型", "order_id": "12345", "suggested_solution": "试题内容", "urgency": "high"}。
结构化输出是连接大模型推理与后端系统的关键。
结果评定标准
1.小智伴的题型输出的校验,更多的是,从内容跟用户画像的匹配度,比如:技术方向、简历关联、知识库关联等。这就需要溯源来判断。
2.有评测集的,需要提前收集评测案例,包括输入和期望的输出,针对结果评估准确百分比,来调整整个流程。
3.迭代自己的决策逻辑,通过多次的循环调用,分析、修正。比如:把提示词工程直接放到chatgpt、deepseek直接测试结果的准确性
4.兜底方案,我们还需要人工接入,在某些场景下,触发我们的审核触发器,就需要人工干预,强制其失败。
这里需要强****调的是:修改的是提示词工程,不在本期讨论。
总结
**从目标倒推:**先想清楚这个功能的最终输出是什么。
**设计推理链:**把达成这个目标需要经历的“思考步骤”画出来。核心是 “如果...那么...” 的逻辑。
**识别工具调用点:**在推理链中,凡是需要精确、实时、私有数据的环节,就是调用外部工具/函数的时机(如查价格、查库存)。
**定义结束条件:**为每个推理路径设定清晰的终点。通常是两种:
**自动完成:**所有检查通过,置信度足够高,执行最终动作。
**转人工处理:**遇到规则未覆盖的异常、数据缺失或低置信度情况。
掌握这套思考方式,比掌握技术更重要,大家一定要寻找解决问题的方法论。关于提示词工程我会拆解出来讲解,敬请期待。