大模型应用开发面试 • 第1期｜Agent 基础概念考点

2026-05-12 231 阅读2分钟

大模型应用开发工程师-面试刷题系列｜每日三题 · 第001期

ChatGPT Image 2026年5月12日 08_15_41.png

LLM Agent（大语言模型智能体）面试复习指南：

核心考点一：Agent 的定义与架构 (Q1)

1. 本质定义
Agent 不仅仅是聊天机器人，它是一个能感知、思考、规划、行动并调用工具来完成复杂任务的 AI 系统。

2. 核心能力循环 (7大能力)

感知 (Perception) ：听懂人话。
推理 (Reasoning) ：分析问题。
规划 (Planning) ：拆解任务（最关键）。
行动 (Action) ：调用工具。
记忆 (Memory) ：存上下文（短期/长期/向量）。
反思 (Reflection) ：自我纠错。
多轮迭代：不达目标不停止。

3. 核心架构组件

大脑：LLM 推理核心。
手脚：Tool Use (调用搜索、代码、API 等外部工具)。
记忆库：Memory 系统。
** planner**：Planning 模块。
环境：外部环境/工具。

4. 面试加分点 (Agent vs. Chatbot/Workflow)

Chatbot：一次性回答，无规划，无工具。
Workflow：固定步骤，人工设定好的流程。
Agent：动态规划、自主决策、自主选工具、可纠错。
本质理解：Agent 本质上是一个状态机 (State Machine) 。

核心考点二：ReAct 框架 (Q2)

1. 核心概念
ReAct = Reasoning (思考) + Acting (行动) 。
它是一种将“思维链”和“行动”紧密结合的范式。

2. 工作流程 (核心循环)
这是一个闭环系统：

Thought (思考) ：LLM 想下一步干嘛。
Action (行动) ：调用工具执行。
Observation (观察) ：看工具返回的结果。
Thought (再思考) ：根据结果决定下一步。

循环直到任务完成 (Finish)。

3. 优缺点

优点：推理透明（可见每一步）、行动灵活（动态调整）、减少幻觉（有事实反馈）。
缺点：步数多（效率低）、消耗上下文（Token 贵）。

核心考点三：规划能力 (Q3)

1. 为什么重要？
因为复杂任务无法一步完成，必须拆解、评估、动态调整。规划能力是 Agent 智能化的核心。

2. 主流规划方法 (8种)

CoT (思维链) ：线性推理，简单任务用。
ToT (思维树) ：多路径探索，像下棋一样看几步，选最优。
GoT (图式思维) ：构建步骤依赖图，支持回溯和跳转，适合超复杂任务。
Plan-and-Execute：先写好完整计划，再执行。稳定、可控。
ReAct：边想边做，动态规划。适合需要大量外部交互的任务。
Self-Refine：自我反思优化。先生成草稿，再修改，适合高质量输出。
LLM + Search：检索增强规划。结合外部知识做计划。
Memory-Augmented：记忆增强。基于历史经验做计划。

3. 如何选择？

简单任务 → CoT
复杂多路径 → ToT / GoT
需要稳定可控 → Plan-and-Execute
需要动态交互 → ReAct
需要高质量/知识 → Self-Refine / LLM+Search

4. 面试加分点

没有完美的单一方法，未来趋势是多种规划方法的融合 (Hybrid Agent) 。