1、什么是 AI Agent?
Agent,中文翻译为代理,顾名思义,代替用户在代理权限内去处理相关事宜。例如我聘请你作为代理律师,那么你将以我的名义进行民事法律行为;再例如我今天休假了,设置同事作为我的代理,去处理审批流等任务。
而 AI Agent 是指在普通代理的基础上,具备对任务的理解、环境的感知、信息的获取能力,并通过推理能力,自主进行决策和执行。AI Agent 就是 LLM + 客户端(Chatbot、AI IDE 等)组成的产品,代替我们去自主的完成下达的任务,这里的客户端具备规划、工具使用,甚至记忆的功能,目的都是为了更准确的执行任务。
2、AI Agent 与传统软件、传统自动化软件,有何区别?
传统软件往往依赖用户的明确指令和操作要求,并按照后端系统预设的规则和流程运行,用户须深度参与其中。而 AI Agent 借助 LLM 的感知、理解和推理能力,依据任务要求,提取外部知识库(RAG)、联网搜索、借助各种工具和网页、其他软件等进行交互,从而完成代理目标。
例如,在客服场景,Agent 能像经验丰富的客服人员一样,准确理解客户的问题,迅速从起呀专有知识库中检索相关信息,组织语言,给出恰当且专业的回复,从而独立处理客户咨询、投诉等各类问题。
例如,在办公场景中,只需告知报告的主题和详细要求,Agent 便能自主收集资料,提取有效信息,梳理文章结构,根据用户偏好或行业规范(例如正式、技术范儿、诙谐、科普等)完成报告的撰写,并绘制表图,进行排版。
传统自动化软件虽然也具备依据任务要求,自动对任务进行拆解,并完成目标。例如一些自动化的处理程序,像每天定点发送代金券,定点汇总当日的账单。但 LLM 驱动的 Agent 可以处理那些传统自动化方法难以应对的复杂任务。例如:
- 需要决策:根据代码上下文灵活理解意图、自主定位错误、自主规划修复步骤,如代码场景。传统自动化软件只能按规则跑流程,遇到异常或不确定性时无法自主推理和修正。
- 需要连续推理与多步计划: 自动完成有逻辑连贯性的复杂任务,例如撰写长篇技术报告场景。传统自动化软件最多能模板化填充内容,无法根据目标动态规划章节结构、铺设推理链条、前后自洽。
- 需要跨系统自主整合数据:在多个 ERP、CRM、财务系统之间自动生成综合运营报告。传统 RPA(机器人流程自动化)只能定向拉取数据,无法理解数据之间的隐含关联或异常。
- 需要处理模糊、不完整输入: 用户只给出一句含糊需求(如 "帮我优化一下销售流程"),系统理解后完成多步落地执行,传统自动化软件需要结构化清晰指令,无法理解模糊自然语言并自主澄清、细化、规划。
- 需要自主学习和演化:持续优化任务,进行自我纠错。传统自动化工具需要人为设定优化规则,无法根据实际结果自我改进。
简单来讲,AI Agent 是自动化 + 智能,这就解释了 AI Agent 出现前,已经通过自动化能做的事,AI Agent 能带来哪些变化。