AI 领域名词爆炸(RAG、Agent、Embedding、Vector DB、LLM...),让人很难看清全貌。这里大致上整理下目前的一些名词解释,如有不足,欢迎提出。
一、核心模型类
| 术语 | 全称 | 通俗比喻 | 核心作用 | 常见例子 |
|---|
| AI | Artificial Intelligence | 智能机器 | 让计算机像人一样思考、学习、决策,不用人手把手教每一步 | Siri、自动驾驶、ChatGPT |
| LLM | Large Language Model | 超级学霸 | 读过海量文字,能听懂人类语言、聊天、写文章、写代码,就是AI的大脑 | GPT-4o、Claude 4、Qwen 2.5、Llama 4、Grok |
| 多模态模型 | Multimodal Model | 全能艺术家 | 不光看文字,还能看图、听声、看视频,一起处理 | GPT-4o、Gemini 2、Claude 4 Vision |
| 开源模型 | Open Source Model | 公开配方 | 模型权重全部公开,谁都能下载到自己电脑跑,不用花钱API | Llama 4、Qwen 2.5、DeepSeek R1、Mistral |
| 闭源模型 | Closed Source Model | 独家秘方 | 模型藏在公司服务器里,你只能通过API调用,质量最顶但要付费 | GPT-4o、Claude 4、Gemini 2 |
二、架构与技术类
| 术语 | 全称 | 通俗比喻 | 核心作用 | 常见例子 |
|---|
| RAG | Retrieval-Augmented Generation | 开卷考试 | 先去知识库查最新资料,再回答,极大减少“胡说八道” | AnythingLLM、Dify知识库、LangChain RAG |
| Agent | AI Agent | 全能管家 | 不只是聊天,还能自己想办法、调用工具、一步步完成任务 | OpenClaw、AutoGPT、Manus、Claude Computer Use |
| MCP | Model Context Protocol | 万能转接头 | 2025 Anthropic推出的开放标准,让AI安全、统一地连接各种外部工具和数据(现在全行业都在用) | Anthropic、OpenAI、Google、Cursor全支持 |
| Function Call | Function Calling | 打电话求助 | LLM需要实时数据时,自动调用外部API(天气、股价、查数据库) | OpenAI工具调用、Anthropic工具 |
| Workflow | AI Workflow | 流水线 | 把多个步骤画成流程图,让AI自动按顺序干活 | Dify工作流、LangGraph、n8n |
| 多智能体 | Multi-Agent System | 团队协作 | 多个AI各干各的活(一个查资料、一个写代码、一个检查),合作完成复杂任务 | CrewAI、AutoGen、OpenClaw多Session |
三、数据处理类
| 术语 | 全称 | 通俗比喻 | 核心作用 | 常见例子 |
|---|
| Embedding | 向量嵌入 | 文字转坐标 | 把一句话变成一串数字坐标,让电脑真正“懂”语义相似性 | BGE-M3、text-embedding-3-large、Snowflake-arctic-embed |
| Vector Database | 向量数据库 | 语义书架 | 专门存这些坐标,能秒搜“意思最像”的内容 | Chroma(本地最简单)、Milvus、Qdrant、LanceDB、Weaviate |
| Chunking | 文本分块 | 撕书成页 | 把超长文档切成小段(固定长度或按意思切),方便检索 | LangChain RecursiveCharacterTextSplitter |
| 知识图谱 | Knowledge Graph | 关系网 | 用“人-关系-人”这种图结构存知识(谁是谁老板、谁喜欢什么) | Neo4j、GraphRAG(2026新热门) |
| ETL | Extract-Transform-Load | 数据清洗工 | 把乱七八糟的数据抽出来、洗干净、再装进系统 | 文档解析、去重、清洗工具 |
四、交互与优化类
| 术语 | 全称 | 通俗比喻 | 核心作用 | 常见例子 |
|---|
| Prompt | 提示词 | 给AI下指令 | 你跟AI说的那句话,写得好坏直接决定答案质量 | “请用小学生能懂的话总结这篇文章” |
| Prompt Engineering | 提示工程 | 调教AI的话术 | 研究怎么写指令,才能让AI又准又听话(角色扮演、Few-Shot、思维链) | 零样本、少样本、CoT |
| Chain-of-Thought | 思维链 | 逐步推理 | 让AI“一步一步想”,准确率暴涨(尤其是数学、逻辑题) | “请一步一步思考,然后给出答案” |
| Fine-tuning | 微调 | 专业培训 | 用自己的数据继续训练模型,让它变成行业专家(客服、律师、医生) | LoRA(轻量微调,最常用) |
| RLHF | Reinforcement Learning from Human Feedback | 人类打分训练 | 真人给AI答案打分,慢慢让AI输出更符合人类喜好 | ChatGPT、Claude对齐训练 |
| Temperature | 温度 | 创意旋钮 | 0最严谨(像教科书),1最天马行空,0.7最常用 | 聊天用0.7,代码用0.2 |
| Top-P | Nucleus Sampling | 候选词筛选 | 只从最可能的词里挑,控制输出多样性 | 常用0.9 |
五、工具与平台类
| 术语 | 全称 | 通俗比喻 | 核心作用 | 常见例子 |
|---|
| LangChain | - | 万能胶水 | 把LLM、工具、数据库、记忆全部串起来(最经典框架) | Python/JS版本都超强 |
| LlamaIndex | - | 数据专线 | 专为RAG设计,索引文档、快速检索 | 企业知识库首选 |
| Ollama | - | 本地模型容器 | 一键在自己电脑跑各种开源大模型 | 跑Llama 4、Qwen 2.5 |
| LM Studio | - | 模型播放器 | 带图形界面的本地模型管理器(新手最友好) | Windows/Mac一键安装 |
| Dify | - | AI应用工厂 | 可视化拖拽就能做出AI应用(不用写代码) | 开源+支持Docker |
| Open WebUI | - | 本地ChatGPT界面 | 给Ollama穿上ChatGPT外衣 | 最像官方ChatGPT的本地版 |
| vLLM | - | 高速推理引擎 | 让大模型跑得飞快(企业部署必备) | 吞吐量比普通高3-5倍 |
六、性能与评估类
| 术语 | 全称 | 通俗比喻 | 核心作用 | 常见例子 |
|---|
| Token | 词元 | 文字计量单位 | AI算“字数”的单位(1汉字≈1.5-2 token),也是计费依据 | GPT-4o每百万token多少钱 |
| 上下文窗口 | Context Window | 短期记忆容量 | 一次能记住多少字(越大越能处理长文档) | Claude 4: 200K、GPT-4o: 128K、Gemini 2: 1M+ |
| 延迟 | Latency | 反应速度 | 从你问到它答要多久(<3秒才流畅) | 本地模型最快 |
| 吞吐量 | Throughput | 接待能力 | 一秒能处理多少请求(QPS) | vLLM企业级神器 |
| 幻觉 | Hallucination | 胡说八道 | AI自信满满地编假话(RAG+MCP能大幅减少) | 加上知识库后基本不犯 |
| 基准测试 | Benchmark | 考试评分 | 用标准考题测模型能力 | MMLU(知识)、GSM8K(数学)、HumanEval(代码) |
七、安全与合规类
| 术语 | 全称 | 通俗比喻 | 核心作用 | 常见例子 |
|---|
| 数据隐私 | Data Privacy | 信息保密 | 不让用户数据泄露(本地部署最安全) | Ollama、OpenClaw本地跑 |
| 内容过滤 | Content Filtering | 安全审查 | 自动挡住违法、有害内容 | OpenAI、Claude内置 |
| 对齐 | Alignment | 价值观校准 | 让AI不乱说话、不害人(RLHF主要干这事) | Claude特别“听话” |
| 可解释性 | Explainability | 透明决策 | 看懂AI为什么这么回答(注意力可视化) | |
AI = 大模型(大脑) + RAG/MCP(眼睛和手) + Agent(管家)。
最爽的事就是:本地跑个OpenClaw或Dify,再接上MCP,就能让AI真正“替你干活”了!
(最近龙虾挺火的,先在vm上研究研究,切记不要直接部署在主机上,虽然大概率后面会有某个“龙虾”,变成和微信一样,每天开电脑,就是第一个启动的,但现在风险还是太高了,小心自动把图片上传了)