AI智能体(AI Agent)基础入门
本文是AI智能体专栏系列文章的首篇,将简要介绍AI智能体的概念、与大语言模型的主要区别、以及AI智能体的核心组成模块。后续文章将陆续介绍AI智能体各方面的知识。
AI智能体( Agent)
AI智能体(AI Agent)是指基于大模型的、可以自主完成任务的系统。从中可以看出,AI智能体的核心基础是大模型;而AI智能体有别于传统AI产品的关键在于AI智能体具有自主性。AI智能体通常拥有感知、规划、记忆、工具使用、行动等诸多能力。
AI智能体与大语言模型(LLM)的主要区别
简单来说,大语言模型拥有强大的语言理解和生成能力,但是无法独自完成任务,需要外在的引导;而AI智能体是一个系统,具备自主性,能够独自完成任务。
| 大语言模型(LLM) | AI智能体(Agent) | |
| 本质 | 语言模型 | 自主系统 |
| 核心能力 | 文本理解、文本生成、逻辑推理等 | 感知、规划、记忆、工具、行动等 |
| 自主性 | 被动,需要用户提示引导完成任务 | 主动,能够自主完成任务 |
AI智能体的核心模块
AI智能体核心模块通常包含:Profile、感知、规划、记忆、工具调用、行动等。
Profile模块
Profile模块是智能体的身份描述,用于识别智能体。Profile模块清晰地定义了智能体的基本信息、角色、任务、能力、行为模式等特征。这些特性共同约束了智能体的行为,保证了智能体的个性化,以及在与外部环境交互时行事风格的稳定性和一致性。
感知模块
感知模块是智能体了解外部环境的窗口,主要负责观察智能体所处的环境,接收和初步处理环境中的原始数据。感知数据可以由摄像头、麦克风等设备进行采集,类型包括文本、图像、视频、语音等多种形式。感知模块是连接外部环境与智能体的纽带,为智能体后续的决策行动过程提供基础信息。
规划模块
规划模块是智能体的核心决策引擎,通常由大语言模型来驱动。借助于大模型强大的理解和推理能力,规划模块负责将复杂任务进行分解、制定执行步骤,并且在过程中进行反思。规划模块是智能体自主性的重要来源。
记忆模块
记忆模块是智能体的存储单元,负责保存和管理智能体获得的数据和信息。记忆模块的主要功能包括信息的写入、存储、管理、检索、读取等。记忆分为两种形式:短期记忆和长期记忆。短期记忆是指那些与现阶段工作强相关的信息;长期记忆通常为数据库存储的知识、历史数据和经验等。记忆模块是智能体个性化、行为一致性、持续自我提升等特点的基础保障。
工具调用模块
工具调用模块是智能体集成外部工具的单元,是智能体的百宝箱。通过调用外部工具,智能体能够有效突破纯语言模型自身的局限性,极大地扩展了智能体的能力。外部工具通常包括计算器、搜索引擎、代码解释器、各类API等等。
行动模块
行动模块是智能体的具体执行单元,直接与外部环境交互,负责将之前规划模块的决策实际操作落地,从而影响外部环境。