大模型应用开发面试 • 每日三题|Day 001|Agent 基础概念考点

40 阅读2分钟

大模型应用开发工程师-面试刷题系列|每日三题 · 第001期

ChatGPT Image 2026年5月12日 08_15_41.png

LLM Agent(大语言模型智能体)面试复习指南

核心考点一:Agent 的定义与架构 (Q1)

1. 本质定义
Agent 不仅仅是聊天机器人,它是一个能感知、思考、规划、行动并调用工具来完成复杂任务的 AI 系统。

2. 核心能力循环 (7大能力)

  • 感知 (Perception) :听懂人话。
  • 推理 (Reasoning) :分析问题。
  • 规划 (Planning) :拆解任务(最关键)。
  • 行动 (Action) :调用工具。
  • 记忆 (Memory) :存上下文(短期/长期/向量)。
  • 反思 (Reflection) :自我纠错。
  • 多轮迭代:不达目标不停止。

3. 核心架构组件

  • 大脑:LLM 推理核心。
  • 手脚:Tool Use (调用搜索、代码、API 等外部工具)。
  • 记忆库:Memory 系统。
  • ** planner**:Planning 模块。
  • 环境:外部环境/工具。

4. 面试加分点 (Agent vs. Chatbot/Workflow)

  • Chatbot:一次性回答,无规划,无工具。
  • Workflow:固定步骤,人工设定好的流程。
  • Agent动态规划、自主决策、自主选工具、可纠错
  • 本质理解:Agent 本质上是一个状态机 (State Machine)

核心考点二:ReAct 框架 (Q2)

1. 核心概念
ReAct = Reasoning (思考) + Acting (行动)
它是一种将“思维链”和“行动”紧密结合的范式。

2. 工作流程 (核心循环)
这是一个闭环系统:

  1. Thought (思考) :LLM 想下一步干嘛。
  2. Action (行动) :调用工具执行。
  3. Observation (观察) :看工具返回的结果。
  4. Thought (再思考) :根据结果决定下一步。
  • 循环直到任务完成 (Finish)。

3. 优缺点

  • 优点:推理透明(可见每一步)、行动灵活(动态调整)、减少幻觉(有事实反馈)。
  • 缺点:步数多(效率低)、消耗上下文(Token 贵)。

核心考点三:规划能力 (Q3)

1. 为什么重要?
因为复杂任务无法一步完成,必须拆解、评估、动态调整。规划能力是 Agent 智能化的核心。

2. 主流规划方法 (8种)

  • CoT (思维链) :线性推理,简单任务用。
  • ToT (思维树) :多路径探索,像下棋一样看几步,选最优。
  • GoT (图式思维) :构建步骤依赖图,支持回溯和跳转,适合超复杂任务。
  • Plan-and-Execute:先写好完整计划,再执行。稳定、可控。
  • ReAct:边想边做,动态规划。适合需要大量外部交互的任务。
  • Self-Refine:自我反思优化。先生成草稿,再修改,适合高质量输出。
  • LLM + Search:检索增强规划。结合外部知识做计划。
  • Memory-Augmented:记忆增强。基于历史经验做计划。

3. 如何选择?

  • 简单任务 → CoT
  • 复杂多路径 → ToT / GoT
  • 需要稳定可控 → Plan-and-Execute
  • 需要动态交互 → ReAct
  • 需要高质量/知识 → Self-Refine / LLM+Search

4. 面试加分点

  • 没有完美的单一方法,未来趋势是多种规划方法的融合 (Hybrid Agent)