1.AI Agent的概念以及工作原理

427 阅读2分钟

概念

AI Agent 可以理解为在大语言模型的基础上能够自主感知、规划决策、执行复杂任务的智能产品,它可以通过独立思考和调用工具逐步完成给定的目标,无需人类去指定每一步的操作。

AI Agent = LLM(大型语言模型) + 记忆(Memory) + 规划(Planning)技能 + 工具(Tools)使用

其中 LLM 是核心大脑;记忆(Memory)、规划技能(Planning)、工具使用(Tools)则是 Agents 系统实现的三个关键组件。

也可以用大白话说:LLM能告诉你做什么事情什么流程之类的,而agent能直接帮你完成事情完成流程。

比如:

实例1: 当你想点外卖时,AI Agent 可以直接打开美团APP,结合你的历史订单信息来选择外卖商家并调用微信支付下单,这一连串的操作完全不需要你的介入,只用安心等待外卖送上门即可。

实例2: 当你做自媒体和做素材的时候(说白了就是照别人抄呗[高端词语:元素打散重组]),你可以让你的agent自动的每天定时定点的去抄同行,看看同行做了什么东西,agent去分析,然后它自己决定我们需要什么素材,文案,图文,全流程不需要你参与一丁点。你只需要告诉他:你的指令是什么,你每天做什么事,按照什么操作去做,会用到哪些工具。


工作原理

感知(Perception)

AI 通过传感器、摄像头、麦克风等,建立起对外部世界进行感知,包括信息的输入(Input)以及系统的环境或上下文(Environment)。

信息处理(Brain)

  1. 信息存储:

    1. Storage:长期数据,如个人基础信息、爱好等;
    2. Memory:短期数据,如消耗物品剩余个数等;
    3. Knowledge:知识库,专业知识等。
  2. 大模型处理:基于感知的信息(输入+环境 )、记忆、知识库信息,进行加工处理,得出结论。

  3. 制定计划:制定下一步的具体动作,但还没执行

执行(Action)

大模型本身不能完成这些任务,需要调用第三方工具(Tools 和 Calling API),通过接口或者应用,与其他App进行互动,达到最终效果。


image.png