一、一个根本问题:企业需要什么样的AI底座?
过去两年,我接触了上百家正在落地AI的企业。有一个问题反复出现:
“我们用了很多AI能力——GPT-4、Claude、DeepSeek、各种开源模型。每个人都用得挺嗨,但作为技术负责人,我问自己三个问题,一个都答不上来:
- 公司到底花了多少钱?
- 哪些能力是资产、可以复用?
- 出了合规问题,谁能负责?”
这不是个别现象。
AI工具的普及速度,远超企业组织能力的建设速度。结果是:工具越强,管理越弱。
这篇文章想聊的,是一个更底层的问题:企业到底需要一个什么样的AI底座?
ZGI的四层能力架构,是我们对这个问题的回答。
二、设计理念:从“工具集成”到“能力底座”
在ZGI的设计中,我们区分了两个概念:
| 概念 | 定义 | 特点 |
|---|---|---|
| AI工具 | 解决单点问题的软件 | 分散、异构、难以管控 |
| AI底座 | 承载所有AI能力的平台层 | 统一、可管、可演进 |
ZGI的定位是后者——企业AI底座。
它不是又一个“AI应用”,而是让所有AI应用能够规范运行、有序沉淀、安全可控的基础设施。
基于这个定位,我们设计了四层架构:
三、第一层:接入层——统一入口,降低接入成本
3.1 要解决的问题
在没有统一底座之前,每个AI应用都要自己对接模型厂商、处理API差异、管理密钥。结果是:重复造轮子、密钥散落各处、切换模型成本高。
3.2 设计思路
接入层的核心是统一API网关:
- 所有AI能力通过同一套API暴露
- 支持HTTP、WebSocket、gRPC多种协议
- 自动处理模型厂商的API差异
- 统一的密钥管理与鉴权
3.3 技术实现要点
接入层做的事情:
- 将
gpt-4路由到OpenAI、claude路由到Anthropic - 统一处理重试、超时、降级
- 记录原始请求/响应(用于审计和复盘)
3.4 价值
| 指标 | 效果 |
|---|---|
| 新应用接入时间 | 从天级降到分钟级 |
| 模型切换成本 | 改一行配置 vs 改全部代码 |
| 密钥管理 | 统一管理 vs 散落各处 |
四、第二层:管控层——安全合规,成本可控
4.1 要解决的问题
企业环境里,AI不能“裸奔”。需要回答:
- 谁在调用?调用了什么?
- 花了多少钱?预算还剩多少?
- 有没有敏感数据泄露风险?
4.2 设计思路
管控层是ZGI最核心的差异化能力,包含四个模块:
4.2.1 多模型智能网关
- 支持OpenAI、Claude、DeepSeek、Llama等主流模型
- 自动健康检查与故障转移
- 支持AB测试(10%流量走新模型对比效果)
4.2.2 细粒度权限管控
4.2.3 安全防护与脱敏
- 敏感信息自动识别(手机号、身份证、邮箱)
- 支持自定义脱敏规则
- 输入输出双向过滤
4.2.4 审计日志
- 记录每次调用的完整链路
- 日志不可篡改,满足合规要求
- 支持按用户、应用、时间范围检索
4.3 价值
| 能力 | 解决的问题 |
|---|---|
| 智能网关 | 模型厂商单一故障风险 |
| 权限管控 | 谁能用什么、用多少 |
| 安全脱敏 | 数据泄露风险 |
| 审计日志 | 合规审查、问题追溯 |
五、第三层:能力层——开箱即用的业务组件
5.1 要解决的问题
企业常用的AI场景高度重复——合同审查、入职档案解析、Text-to-SQL、知识库问答……每个团队都在重复实现同样的功能。
5.2 设计思路
能力层封装了高频业务场景的端到端能力:
Text-to-SQL:自然语言直接生成SQL
- 自动理解数据库Schema
- 内置安全防护(禁止DELETE/DROP)
- 支持复杂查询(多表JOIN、子查询)
合同审查:自动提取条款、标注风险
- 支持NDA、销售合同、劳动合同等多种类型
- 风险点带原文引用
- 可配置风险规则库
入职档案解析:自动提取身份证、毕业证、离职证明
- 支持20+种证照类型
- 结构化输出JSON
- 准确率95%+
知识库问答(RAG):基于企业文档的智能问答
- 支持多种文档格式(PDF、Word、Markdown)
- 自动分块、向量化、检索
- 可追溯原文位置
5.3 使用方式
5.4 价值
| 能力 | 自建成本 | 使用ZGI |
|---|---|---|
| Text-to-SQL | 2-3人月 | 1天接入 |
| 合同审查 | 1-2人月 | 2天接入 |
| 入职档案解析 | 1人月 | 1天接入 |
六、第四层:治理层——资产沉淀,持续演进
6.1 要解决的问题
这是最容易被忽视、但长期来看最重要的一层。
很多企业用了一两年AI后,发现:
- 每个人都在重复写同样的Prompt
- 踩过的坑反复再踩
- 老员工走了,经验也带走了
结果:AI能力无法沉淀为组织资产。
6.2 设计思路
治理层的核心是让每一次调用都变成可复用的资产:
资产沉淀
- Prompt版本管理:每次修改都有记录,可回溯
- 效果对比:同一个任务,不同Prompt的效果对比
- 复用统计:哪个Prompt被调用最多
效果度量
- 准确率追踪:人工标注正确/错误,持续优化
- 成本分析:按团队、应用、模型、用户多维度统计
- ROI计算:投入产出比可视化
持续迭代
- Badcase收集与复盘
- A/B测试框架
- 模型自动升级建议
6.3 价值
| 能力 | 解决的问题 |
|---|---|
| 资产沉淀 | 能力跟着人走 vs 能力留在平台 |
| 效果度量 | 凭感觉优化 vs 数据驱动优化 |
| 持续迭代 | 一次性的项目 vs 持续演进的平台 |
七、四层架构的协同逻辑
四层架构不是孤立的,而是层层递进、相互支撑:
text
复制下载
用户请求 → 接入层(统一入口) → 管控层(鉴权、脱敏、限流) → 能力层(执行业务逻辑) → 治理层(记录日志、沉淀资产)
一个完整的调用链路:
- 业务应用通过统一API发起请求
- 管控层验证权限、检查预算、脱敏敏感信息
- 能力层执行业务逻辑(如Text-to-SQL生成SQL)
- 治理层记录本次调用的完整信息
- 响应返回给业务应用
关键设计原则:
- 接入层无状态:可水平扩展
- 管控层可插拔:安全策略可动态配置
- 能力层模块化:新能力可独立接入
- 治理层异步化:不影响主流程性能
八、适用场景与选型建议
| 企业阶段 | 典型特征 | 建议 |
|---|---|---|
| 探索期 | 1-2个场景试用,月成本<2000元 | 直接用模型API,不需要底座 |
| 成长期 | 3-5个部门在用,月成本5000-20000元 | 开始出现管理问题,建议接入管控层 |
| 成熟期 | 多场景规模化,月成本>20000元 | 需要完整四层架构 |
| 强监管行业 | 金融、医疗、政务 | 必须私有化部署,管控层和治理层是刚需 |
九、写在最后
ZGI的四层架构,回答了一个根本问题:企业到底需要一个什么样的AI底座?
- 接入层:统一入口,降低接入成本
- 管控层:安全合规,成本可控
- 能力层:开箱即用,加速落地
- 治理层:资产沉淀,持续演进
这四层不是一次性建成的。企业可以根据自身阶段,从最痛的点切入:
- 成本失控了?先上管控层
- 重复造轮子?先上能力层
- 能力留不住?先上治理层
AI底座不是“又一个平台”,而是让AI能力能够规范运行、有序沉淀、安全可控的基础设施。
如果你也在思考企业AI底座的选型或自建,希望这篇文章能提供一些参考。
ZGI已支持私有化部署和SaaS两种模式,四层架构可渐进式落地。详情可访问ZGI官网了解。