AI智能体（AI Agent）基础入门AI智能体（AI Agent）基础入门本文是AI智能体专栏系列文章的首篇，将简要

AI智能体（AI Agent）基础入门

本文是AI智能体专栏系列文章的首篇，将简要介绍AI智能体的概念、与大语言模型的主要区别、以及AI智能体的核心组成模块。后续文章将陆续介绍AI智能体各方面的知识。

AI智能体（ Agent）

AI智能体（AI Agent）是指基于大模型的、可以自主完成任务的系统。从中可以看出，AI智能体的核心基础是大模型；而AI智能体有别于传统AI产品的关键在于AI智能体具有自主性。AI智能体通常拥有感知、规划、记忆、工具使用、行动等诸多能力。

AI智能体与大语言模型（LLM）的主要区别

简单来说，大语言模型拥有强大的语言理解和生成能力，但是无法独自完成任务，需要外在的引导；而AI智能体是一个系统，具备自主性，能够独自完成任务。


	大语言模型（LLM）	AI智能体（Agent)
本质	语言模型	自主系统
核心能力	文本理解、文本生成、逻辑推理等	感知、规划、记忆、工具、行动等
自主性	被动，需要用户提示引导完成任务	主动，能够自主完成任务

AI智能体的核心模块

AI智能体核心模块通常包含：Profile、感知、规划、记忆、工具调用、行动等。

Profile模块

Profile模块是智能体的身份描述，用于识别智能体。Profile模块清晰地定义了智能体的基本信息、角色、任务、能力、行为模式等特征。这些特性共同约束了智能体的行为，保证了智能体的个性化，以及在与外部环境交互时行事风格的稳定性和一致性。

感知模块

感知模块是智能体了解外部环境的窗口，主要负责观察智能体所处的环境，接收和初步处理环境中的原始数据。感知数据可以由摄像头、麦克风等设备进行采集，类型包括文本、图像、视频、语音等多种形式。感知模块是连接外部环境与智能体的纽带，为智能体后续的决策行动过程提供基础信息。

规划模块

规划模块是智能体的核心决策引擎，通常由大语言模型来驱动。借助于大模型强大的理解和推理能力，规划模块负责将复杂任务进行分解、制定执行步骤，并且在过程中进行反思。规划模块是智能体自主性的重要来源。

记忆模块

记忆模块是智能体的存储单元，负责保存和管理智能体获得的数据和信息。记忆模块的主要功能包括信息的写入、存储、管理、检索、读取等。记忆分为两种形式：短期记忆和长期记忆。短期记忆是指那些与现阶段工作强相关的信息；长期记忆通常为数据库存储的知识、历史数据和经验等。记忆模块是智能体个性化、行为一致性、持续自我提升等特点的基础保障。

工具调用模块

工具调用模块是智能体集成外部工具的单元，是智能体的百宝箱。通过调用外部工具，智能体能够有效突破纯语言模型自身的局限性，极大地扩展了智能体的能力。外部工具通常包括计算器、搜索引擎、代码解释器、各类API等等。

行动模块

行动模块是智能体的具体执行单元，直接与外部环境交互，负责将之前规划模块的决策实际操作落地，从而影响外部环境。