Workflow vs Agent:AI应用选型框架
01 正本清源:核心定义与区分
Anthropic提出的"代理式系统"(Agentic Systems)概念,将AI应用分为两个核心类别:
工作流 (Workflow)
- 定义:任务流程由人类预先编码固定,LLM作为"超级函数"嵌入特定步骤执行子任务
- 核心特征:决策权在代码,不在LLM
- 类比:自动化工厂流水线——流程固定、产出稳定、可预测
智能体 (Agent)
- 定义:系统仅被赋予总目标,由LLM动态决定"下一步做什么"、"使用什么工具"、"何时完成"
- 核心特征:决策权在LLM,不在代码
- 类比:探索未知大陆的探险家——路径未知、需要自主决策
区分关键:完成任务的"路线图"是人预先画好的,还是AI自己边走边画的?
02 技术选型金字塔
Anthropic的黄金原则:"简单优先 (Start simple)"——只有当更简单的方案无法满足需求时,才增加复杂性。
层级 方案 适用场景 核心优势 第一层 优化单个LLM调用 简单任务 成本最低、速度最快 第二层 工作流 (Workflow) 流程固定、质量要求高 结果可预测、一致性强 第三层 智能体 (Agent) 开放式任务、需大规模自主决策 灵活性最高、能力最强
关键洞察:Agent虽强大,但也是最复杂、最昂贵的方案,不可滥用
03 实战案例:翻译工具的选型决策
场景一:单个LLM调用 → 成本优先
- 实现:单Prompt:"请将以下文本翻译成中文,并检查语法"
- 决策依据:速度和成本优先,"足够好"即可
- 适用场景:快速理解外文内部邮件大意
场景二:工作流 (Workflow) → 质量优先
- 实现:两步提示链:
- "翻译专家"LLM全力翻译
- "母语编辑"LLM全力润色
- 决策依据:质量和可靠性至关重要,愿意承担更高成本
- 适用场景:翻译对外发布的官网介绍或营销文案
- 原理:将"创作"和"批判"两个认知不同的任务分离,显著提升质量
场景三:智能体 (Agent) → 灵活性优先
- 实现:赋予总目标,让Agent自主规划
- 决策依据:任务开放式,需要动态探索和决策
- 适用场景:"将英文文件翻译并发布到全球多市场本地化博客,根据当地文化和SEO优化"
- Agent能力:自主调研各市场文化、搜索SEO关键词、多次迭代、决定发布API
04 架构演进:从Workflow到Agent的混合模式
现代企业级AI应用往往采用混合架构 :
宏观Agent + 微观Workflow:Agent负责意图识别和任务分发,Workflow执行具体原子任务
示例:运维Agent接收"排查服务器故障"指令后:
- Agent层:自主判断需检查CPU和内存
- Workflow/Skill层:调用固定的"服务器巡检脚本"获取数据
- Agent层:根据数据生成报告
这种分层设计既保留了Agent的灵活性,又确保了关键步骤的可控性。
05 选型决策矩阵
场景特征 推荐方案 典型应用 低容错 + 低复杂度 Workflow 财务报销审批、发票录入 高容错 + 高复杂度 Agent + Skills 创意写作助手、开放式数据分析 中间地带 混合模式 智能客服、代码助手、运维诊断
06 总结:避免"Agent滥用"
Workflow与Agent并非竞争关系,而是处于"自主性光谱"不同位置的解决方案 。
作为AI产品经理或开发者,我们的任务不是追求最炫酷的技术,而是基于对业务场景(质量、风险)、成本和速度的深刻理解,在"技术选型金字塔"中找到最恰当的那一层。
核心原则:Agent虽好,但不要滥用。简单问题用简单方案,复杂问题才用复杂方案。