概念
AI Agent 可以理解为在大语言模型的基础上能够自主感知、规划决策、执行复杂任务的智能产品,它可以通过独立思考和调用工具逐步完成给定的目标,无需人类去指定每一步的操作。
AI Agent = LLM(大型语言模型) + 记忆(Memory) + 规划(Planning)技能 + 工具(Tools)使用
其中 LLM 是核心大脑;记忆(Memory)、规划技能(Planning)、工具使用(Tools)则是 Agents 系统实现的三个关键组件。
也可以用大白话说:LLM能告诉你做什么事情什么流程之类的,而agent能直接帮你完成事情完成流程。
比如:
实例1: 当你想点外卖时,AI Agent 可以直接打开美团APP,结合你的历史订单信息来选择外卖商家并调用微信支付下单,这一连串的操作完全不需要你的介入,只用安心等待外卖送上门即可。
实例2: 当你做自媒体和做素材的时候(说白了就是照别人抄呗[高端词语:元素打散重组]),你可以让你的agent自动的每天定时定点的去抄同行,看看同行做了什么东西,agent去分析,然后它自己决定我们需要什么素材,文案,图文,全流程不需要你参与一丁点。你只需要告诉他:你的指令是什么,你每天做什么事,按照什么操作去做,会用到哪些工具。
工作原理
感知(Perception)
AI 通过传感器、摄像头、麦克风等,建立起对外部世界进行感知,包括信息的输入(Input)以及系统的环境或上下文(Environment)。
信息处理(Brain)
-
信息存储:
- Storage:长期数据,如个人基础信息、爱好等;
- Memory:短期数据,如消耗物品剩余个数等;
- Knowledge:知识库,专业知识等。
-
大模型处理:基于感知的信息(输入+环境 )、记忆、知识库信息,进行加工处理,得出结论。
-
制定计划:制定下一步的具体动作,但还没执行
执行(Action)
大模型本身不能完成这些任务,需要调用第三方工具(Tools 和 Calling API),通过接口或者应用,与其他App进行互动,达到最终效果。