第一部分:核心基础(公司的“大脑”)
-
LLM 大语言模型:
- 通俗解释:这是公司的“超级学霸实习生”。他读过全世界所有的书,知识渊博,但最初他只是个“懂得多”的白纸,需要你指挥他干活。
-
Prompt 提示词:
- 通俗解释:这是你给实习生下的“工作指令”。指令越具体(比如“用表格形式总结”),实习生干的活儿就越让你满意。
- 深度视角:它是配置化的输入。好的 Prompt 实际上是在模型的隐空间(Latent Space)中进行搜索,定位到特定任务的激活路径。
-
Context 上下文:
- 通俗解释:这是“聊天记录”。实习生记性有限,如果你不提醒他刚才说了什么,他可能聊着聊着就忘了前面的事。
- 深度视角:受限于 Attention 机制的计算复杂度(通常是O(n2)),上下文长度决定了模型能“同时处理”的信息量边界。
-
Memory 记忆:
- 通俗解释:这是公司的“员工档案”。通过外挂数据库,让实习生能记住你的喜好、公司往期的项目经验,不再是“转头就忘”。
深度视角:通过维护一段对话历史(Window)或在数据库中存储用户画像,实现有状态的(Stateful)交互。
第二部分:进阶能力(实习生的“工具箱”)
-
Agent 智能体:
-
通俗解释:这不再是一个只会说话的实习生,而是一个“全能项目经理”。他不仅会思考,还会自己拆解任务、找工具、去执行,直到把结果交给你。
-
Agent (智能体) :具有 Reasoning (推理) + Planning (规划) + Tool Use (工具使用) 闭环的独立程序。
-
深度视角:它是以 LLM 为核心控制器的自治系统,通过 ReAct 等思维链模式,不断进行
观察-思考-行动的循环。
-
-
RAG 检索增强生成:
- 通俗解释:给实习生配一套“翻书查资料的能力”。当他遇到不懂的专业知识,先去公司的“内部文档库”查一下,再结合自己的知识回答,避免一本正经地胡说八道。
- 技术链路:
Query -> Embedding -> Vector DB Search -> Prompt Augmentation -> LLM。它解决了模型训练数据的滞后性,并提供了知识溯源。
-
Search 搜索:
- 通俗解释:给实习生开了“外网权限”。他可以实时去百度、谷歌查最新的新闻,保证信息不落后。
-
Function Calling(函数调用) :LLM 的“系统调用接口 (System Call)”。
- 通俗解释:实习生学会了“按电梯/点外卖”。他知道在什么时候该去按一下某个系统的开关,或者调用某个计算器工具。
- 深度视角:模型不再直接输出答案,而是输出结构化的 JSON。由宿主环境执行本地函数(如数据库查询、API请求)后,再将结果喂回模型进行二次汇总。
第三部分:协作框架(办公的“规章制度”)
-
MCP 模型上下文协议:
- 通俗解释:这是“万能插座标准”。让不同的 AI 工具、数据库能像电源插头一样,轻松插在同一个插座上互相通信,不用每次都重新接线。
-
Langchain:
- 通俗解释:这是一套“标准办公家具”。它把各种 AI 功能(记忆、搜索、指令)模块化了,让你能像搭积木一样快速组装出一个 AI 应用。
-
Workflow 工作流:
- 通俗解释:这是“SOP 标准作业程序”。第一步做什么,如果失败了第二步做什么,让 AI 按照既定的流程(流水线)干活,结果更稳定。
-
SKILL 技能:
- 通俗解释:这是实习生的“特长证书”。比如“擅长写代码”、“擅长画图”,是封装好的特定功能。
- 深度视角:它是对一段复杂业务逻辑的原子化封装,通常包含描述性的描述(供模型识别)和可执行的代码逻辑。
-
SubAgent 子智能体:
- 通俗解释:项目经理手下的“各部门组长”。大经理(Agent)把任务派给代码组长、设计组长(SubAgent),大家分工协作。
- 深度视角:通过角色定义(System Prompt 分离),让多个小模型各司其职。一个负责审计代码,一个负责编写逻辑,最后由主 Agent 汇总。
第四部分:当下热门工具(市面上的“明星员工”)
- Claude Code / Cursor / Trae / Codex:“AI 程序员”。你只要动嘴说想要什么软件,他们就直接在你电脑里把代码写好、改好。这些是 AI Native IDE 或 Coding Agents。
- Manus / OpenClaw / Clawdbot:这些是“全自动跑腿特工”。你可以让他去网上帮你订一张去上海的最便宜机票,他会自动打开网页、比价、甚至下单。