不只有模型:完整AI技术栈的五大关键模块

55 阅读4分钟

不只有模型:完整AI技术栈的五大关键模块

不管你是做个人实验的原型,还是开发给大家用的应用,把 AI 技术栈的核心模块摸透,都是必不可少的。【AI大模型教程】

模型很重要,但它只是整个技术拼图里的一块而已。以下是构建一个完整 AI 系统所需的五大核心层。


基础设施层
GPU/云服务
数据层
向量数据库
RAG
模型层
LLM/多模态模型
编排层
任务协调
工具调用
应用层
用户界面
系统集成
  1. 🏗️ 基础设施 (Infrastructure)

模型得跑在合适的基础设施上。

不是所有大型语言模型(LLM)都能在普通服务器或者笔记本上顺畅跑起来,所以选对基础设施,直接影响最后部署的效果。

LLM 通常要靠 GPU 这类 AI 专用硬件才能跑起来,部署方式主要有三种:

  • • 本地部署 (On-premise):适合手里有自己的硬件资源、也有预算的团队。
  • • 云端部署 (Cloud):需要多少算力就租多少,很灵活,但是需要考虑网络条件和安全限制。
  • • 个人设备运行 (Local):有些轻量级 LLM 能在带 GPU 的笔记本上跑,但性能会受硬件限制。
  • DeepSeek R1私有部署GPU选择指南(英伟达A100、H100、A800、H800、H20系列)
  1. 🧠 模型 (Models)

选模型要考虑几个方面:

  • • 开源与专有:开源模型能随便改,专有模型一般有厂商帮忙维护。
  • • 模型大小:大模型能力全,需要的运行资源也多。小模型更轻巧,适合专门的任务。
  • • 专业化程度:不同模型各有擅长,有的擅长推理,有的擅长调用工具,还有的在代码生成、多语言处理上更厉害。

💡 像 Hugging Face 这类平台上已经有 200 多万个模型了,各种需求基本都能覆盖。

  1. 🗄️ 数据 (Data)

模型的知识是有 “保质期” 的。要是想分析最近的论文,就得补充新数据 —— 数据层就是干这个的,主要有这几个部分:

  • • 数据源:外面的知识库或者实时的数据流。
  • • 处理管道:给数据做清洗、转换的预处理和后处理步骤。
  • • 检索系统:比如向量数据库和 RAG(检索增强生成),把数据转成嵌入向量后,能帮模型快速调取额外的知识。

基础模型一般是用公开数据训练的,要是做特定任务,往往得补充领域数据,这样准确性才高。

  1. ⚙️ 编排 (Orchestration)

像论文分析这种复杂任务,光靠一个提示可能不够,得把问题拆解开、做好规划,一步步来解决。编排层就是来协调这个全过程的:

步骤作用
思考模型琢磨怎么把问题拆开。
执行调用工具或者函数获取信息。
审查模型自己检查生成的内容,发现问题、优化内容。

这一块发展得很快,MCP 这种新协议就是用来管理越来越复杂的任务流程。

MCP 是一种由 Anthropic 推动的开放通信标准,旨在为大型语言模型(LLM)应用提供一个标准化接口。它允许 LLM 安全地连接并与外部数据源和工具(如数据库、API、本地文件等)进行双向交互。

  1. 🖥️ 应用层 (Application Layer)

用户最后是通过应用层和系统打交道的,关键是要设计出好用的界面,还要做到无缝集成

  • • 接口设计
  • • 最基础的就是文字输入输出。
  • • 可能还要扩展到图片、音频、数据集这些多模态交互。
  • • 或许还得有修改和引用的功能,方便用户改结果、查来源。
  • • 系统集成
  • • 能从外部工具接收输入。
  • • 把 AI 的输出自动嵌到用户平时的工作流程里。

总结

从硬件基础设施、选模型、补数据、排任务(编排),到最后的应用,AI 技术栈的每一层都很重要。

深入理解这些组件才能设计出符合实际需求的 AI 系统。