🤖 AI 核心专业术语详解 (2026版)
这份文档整理了当前人工智能领域(特别是大模型与智能体时代)最核心的专业术语,涵盖了从基础架构到应用落地的关键概念。
📊 核心术语速查表
| 术语 | 中文名称 | 核心定义 | 形象比喻 |
|---|---|---|---|
| LLM | 大语言模型 | 拥有海量参数的预训练模型,核心是预测下一个字。 | 博学但手无缚鸡之力的“大脑”。 |
| Agent | 智能体 | 能自主规划、使用工具、记忆并完成复杂目标的系统。 | 有大脑、有手脚、能干活儿的“全能管家”。 |
| AGI | 通用人工智能 | 具备像人类一样处理广泛任务、跨领域推理的终极 AI 形态。 | 像人类一样无所不能的“超级大脑”。 |
| Skill | 技能 | 预定义的结构化任务说明书或模块,让 Agent 具备特定专长。 | 给 Agent 的“标准作业程序 (SOP)”或“武功秘籍”。 |
| MCP | 模型上下文协议 | 连接 AI 模型与外部数据/工具的通用接口标准。 | AI 世界的“USB-C 接口”。 |
| Prompt | 提示词 | 给模型的输入指令,包含任务、上下文和约束。 | 给大脑下达的“具体命令”。 |
🧠 基础层:大脑与指令
1. LLM (Large Language Model,大语言模型)
- 含义:这是 AI 的基石。它是基于海量数据训练出来的神经网络,参数量通常在百亿级以上。它的核心能力是理解语言和预测下一个字(Token)。
- 局限性:原生的 LLM 只是一个“大脑”,它不知道今天的具体天气(除非联网),也不能直接帮你发邮件,而且它的知识截止于训练时间。
- 应用场景:聊天机器人、文本翻译、代码生成、文章续写。
- 代表产品:GPT-4o, Claude 3.5, Llama 3, Qwen 2.5。
2. Prompt (提示词 / 提示工程)
- 含义:这是人与 LLM 交互的界面。它不仅仅是问一个问题,而是“指令 + 上下文 + 示例 + 约束”的组合。高质量的 Prompt 决定了模型输出的质量。
- 应用场景:
- 零样本 (Zero-shot):直接问“怎么写 Python 代码?”
- 少样本 (Few-shot):给模型看几个例子,再让它回答。
- 思维链 (CoT):要求模型“一步一步思考”,提高逻辑准确率。
- 2026 趋势:现在流行结构化 Prompt(用 JSON 格式写指令)和角色扮演 Prompt(设定模型为“资深工程师”)。
🤖 进化层:从大脑到行动者
3. Agent (智能体)
- 含义:这是目前最火的概念。Agent = LLM(大脑) + 规划能力 + 记忆 + 工具使用能力。
- 普通的 LLM 是被动问答(你问它答)。
- Agent 是主动执行(你给目标,它自己拆解步骤、调用工具、反思结果)。
- 核心逻辑:感知环境 → 制定计划 → 调用工具 → 观察结果 → 反思修正。
- 应用场景:
- 个人助理:如 OpenAI 的 Operator,帮你订餐厅、买票。
- 软件开发:如 Cursor Agent,能自主写代码、调试、修复 Bug。
- 自动化办公:自动处理客户投诉、整理报表。
4. Skill (智能体技能)
- 含义:为了让 Agent 更专业,我们给它封装了“技能包”。在 2025-2026 年,Skill 通常指一个可移植的、模块化的文件夹,里面包含
SKILL.md(指令说明书)和相关的脚本/模板。 - 作用:它相当于给 Agent 的标准作业程序(SOP)。比如定义一个“前端调试 Skill”,Agent 遇到白屏问题时,就会自动加载这个 Skill,按照里面的步骤(检查 Props、检查 Hooks 等)去执行,而不需要用户每次都重新教它。
- 应用场景:垂直领域的专家助手(如法律审查助手、React 调试专家)。
🔗 连接与架构层:工具与生态
5. MCP (Model Context Protocol,模型上下文协议)
- 含义:这是 2026 年非常关键的连接标准。以前,让 AI 连接本地文件或第三方数据库很麻烦,每个都要单独写代码。MCP 就像AI 界的 USB-C 接口,提供了一种通用的方式,让 AI 模型能安全、统一地连接各种工具和数据源。
- 应用场景:
- 让 Claude 直接读取你电脑本地的 SQLite 数据库。
- 让 AI 直接访问公司的 Slack 历史记录或 Google Drive 文件。
- 与 Skill 的区别:Skill 侧重于“怎么做(流程/知识)”,MCP 侧重于“能连什么(数据/工具接口)”。
6. Workflow (工作流)
- 含义:指 Agent 完成任务的编排逻辑。简单的任务是线性的,复杂的任务需要分支、循环和并行处理。
- 技术实现:常用 LangGraph 等框架,通过“节点(Node)”和“边(Edge)”来设计流程。
- 应用场景:
- 客服流程:接待 → 分类(技术/售后) → 分流处理 → 反馈。
- 科研流程:文献检索 → 数据分析 → 论文写作 → 循环修改。
🎯 终极目标与形态
7. AGI (Artificial General Intelligence,通用人工智能)
- 含义:AI 发展的终极圣杯。指具备像人类一样(甚至超越人类)的广泛认知能力,能跨领域学习、推理、解决未知问题的智能。
- 现状:目前我们处于“弱人工智能”向“强人工智能”过渡的阶段,AGI 尚未完全实现,但 LLM 和 Agent 的发展正在加速这一进程。
8. Embodied AI (具身智能)
- 含义:AGI 的物理形态。它不仅是大脑(软件),还有身体(硬件)。它强调智能是通过“身体”与“环境”的交互产生的。
- 核心:感知(视觉/触觉)+ 决策(大模型)+ 控制(机械臂/腿)。
- 应用场景:人形机器人(如优必选 Walker S1)进工厂打螺丝、做家务;自动驾驶汽车。
💡 总结:它们是如何协同工作的?
为了让你更直观地理解,我们可以看一个**“帮我策划并预定周末去厦门的旅行”**的场景:
- 你发出指令(Prompt)。
- Agent(智能体)接收目标,它的LLM(大脑)开始思考。
- Agent 调用 Skill(技能):比如“旅行规划专家 Skill”,里面规定了要先查天气、再查攻略、最后比价。
- 在执行过程中,Agent 通过 MCP(接口)连接到你的 Google 日历(看空闲时间)和携程/去哪儿网(查机票酒店)。
- 整个流程通过 Workflow(工作流)进行编排,确保先买票再订房。
- 最终目标是实现像真人秘书一样的 AGI(通用人工智能)体验。