三巨头同时下注同一件事:企业 Agent OS 之战,Microsoft、OpenAI、Google 到底在抢什么

8 阅读13分钟

2026 年 Q1,Microsoft 发布 Agent 365 + Copilot Cowork,OpenAI 发布 Frontier 并与 Amazon 达成战略合作,Google 推出 Gemini Enterprise 并持续推进 A2A 开放协议。三家几乎同时在做同一件事——给 Agent 建"企业操作系统"。这篇文章帮你看清楚:它们到底在解决什么共同问题、各自怎么切入、对工程师意味着什么。


一、先讲结论

过去三个月,企业 AI 领域发生了一件比任何新模型发布都重要的事:三大巨头几乎同时宣布,要给 Agent 建一套企业级运行基础设施。

  • Microsoft:2025 年 11 月发布 Agent 365(Agent 的控制平面),2026 年 3 月发布 Copilot Cowork(多步任务执行层)+ Wave 3 + M365 E7 Frontier Suite
  • OpenAI:2026 年 2 月发布 Frontier(企业 Agent 执行平台),同月底 Amazon 宣布 $500 亿战略合作,共同开发 Stateful Runtime Environment 并由 AWS 独家第三方云分发
  • Google:2025 年 10 月推出 Gemini Enterprise(以 Agentspace 为核心的企业 Agent 平台);此前已于 2025 年 4 月发起 A2A 协议,2025 年 6 月进入 Linux Foundation

三家不约而同地在说同一句话:模型够强了,但企业里的 Agent 就是跑不起来——问题不在脑子,在配套。

它们不是在推销新模型。它们都在试图回答一个更底层的工程问题:Agent 在企业里怎么上班?谁给它发工牌、分权限、记考勤、评绩效?

如果你是在做企业 AI 落地的工程师或架构师,这篇文章能帮你搞清楚三件事:

  1. 三家在解决的核心问题是什么(以及为什么这个问题比模型更重要)
  2. 三条路径有什么本质区别
  3. 选哪条路,取决于什么

二、共同问题:Agent 在企业里"跑不起来"

三家公司的公开材料里,不约而同地指向了同一个诊断。我把它翻译成工程师能直接对号入座的四个痛点:

痛点 1:上下文割裂——Agent 是个失忆症患者

Agent 每次启动都是白板。它不知道上周这个客户说了什么,不知道上次任务跑到哪里卡了,不知道"商机阶段"在你们公司怎么定义。

企业的业务流程是有状态的,但大多数 Agent 系统是无状态的——每次对话结束,记忆清零。

痛点 2:权限是黑洞——要么放得太开,要么管得太死

你给 Agent 接了 CRM、接了数据库。但谁有权限读哪张表?哪个 Agent 能触发退款?谁能看薪资?这些问题在 API 层面根本没人管。结果要么 over-permissioning(出了事没法溯源),要么收得太紧(Agent 能干的活寥寥无几)。

痛点 3:工具调用 ≠ 可靠执行

Function calling 让模型知道"我可以调用这个工具",但不等于调用是安全的、幂等的、可审计的、可回滚的。在真实业务里,Agent 帮你改了一条记录,你得回答:谁做的、什么时候、结果是什么、出了错能不能撤。

痛点 4:没有反馈回路——Agent 跑了 1000 次,你不知道好不好

Agent 执行了任务,你怎么知道哪些做得好、哪些错了?没有系统性评估,优化就是瞎猜。

三家公司各自用了不同的词来描述同一件事:

痛点Microsoft 的说法OpenAI 的说法Google 的说法
上下文割裂Work IQ(组织语义层)Business Context(业务上下文)Agentspace(统一知识入口)
权限管理Agent 365 + Entra Agent IDAgent Identity & IAMGoogle Cloud IAM 继承
可靠执行Copilot Cowork(执行层)Agent Execution(执行环境)Agent Engine(托管运行时)
评估闭环Visualization + 审计日志Evaluation & Optimization内置评估工具

词不一样,解的是同一道题。


三、三条路径:同一个目标,完全不同的切入方式

虽然在解决同一个问题,三家的路径差异非常大。理解这个差异,是做技术选型时最关键的判断。

Microsoft:从办公软件里长出 Agent

Microsoft 的策略可以用一句话概括:Agent 不是新系统,是现有办公生态的升级。

它的逻辑链是这样的:

  1. 全球数亿人每天在用 Word、Excel、Outlook、Teams
  2. 企业的数据、流程、权限已经在 Microsoft 365 + Entra 里了
  3. 与其让 Agent 从外面"接入"企业,不如让 Agent 直接在这些应用里干活

所以 Microsoft 做了两件事:

Agent 365 —— Agent 的控制平面。不管你的 Agent 是用 Copilot Studio 建的、用 OpenAI SDK 写的、还是用 LangChain 搭的,只要在企业里运行,都注册到 Agent 365 里统一管理。它提供五个能力:注册表(谁有哪些 Agent)、访问控制(Agent ID + 最小权限)、可视化(仪表盘 + 分析)、互操作(跨框架跨平台)、安全(Defender + Purview + Entra 联防)。

Copilot Cowork —— 多步任务执行层。截至 2026 年 3 月,Cowork 仍处于 Research Preview 阶段,面向有限客户通过 Frontier 计划测试,尚未广泛 GA。但它代表的方向已经很明确:之前的 Copilot 是"一问一答"——你问它一个问题,它给你一个回复。Cowork 把模式升级为"委托执行":你描述想要的结果,Copilot 拆解成计划,跨 Outlook、Excel、Word、Teams 多个应用协调执行,过程中有检查点,你可以随时审查和干预。

一个有意思的细节:Copilot Cowork 底层用的不只是 OpenAI 的模型——它同时集成了 Anthropic 的 Claude,由系统自动选择最合适的模型执行任务。Microsoft 把这叫"多模型优势",本质上是在说:我不绑定任何一个模型供应商,谁强用谁。

定价也值得注意:M365 E7 Frontier Suite 定价 99/用户/月(含Copilot+Agent365+安全),Agent365单独99/用户/月(含 Copilot + Agent 365 + 安全),Agent 365 单独 15/用户/月。

OpenAI:从消费端反攻企业

OpenAI 的路径是"消费端进入"(consumer-in):从 ChatGPT 这个产品出发,往企业需要的能力上叠加。

ChatGPT 是目前公开数据中用户规模最大的 AI 应用之一。Frontier 要做的是:在这个入口之下,搭建一套企业级 Agent 运行基础设施。

Frontier 的四根支柱:

  1. 业务上下文(Business Context)——不是对话记忆,是持久化的工作状态层。Agent 跨多个任务、多次启动都能拿到同一份"当前状态"。更接近"企业语义层",把"客户是谁、商机阶段怎么定义、哪个字段可信"这类业务语义接进来。
  2. 身份与权限——Agent 有自己的权限范围,权限在执行层强制,和模型输出无关。就算模型"决定"调某个接口,权限层不通就发不出去。
  3. 执行环境——每次工具调用留下日志,失败重试、超时降级都在平台层处理。
  4. 评估与优化——内置评估能力,追踪每次执行结果,标记异常,找出成功率下降的步骤。

Amazon 于 2026 年 2 月底宣布与 OpenAI 达成 $500 亿战略合作,共同开发 Stateful Runtime Environment,AWS 成为 Frontier 的独家第三方云分发渠道。但 Frontier 不仅限于 AWS——它也支持本地部署、企业自有云及 OpenAI 自身托管。如果你的企业数据在 AWS 上,这是一条很顺的路径,但不意味着只能走 AWS。

但 Frontier 目前仍在有限客户开放阶段,官方配了专门的 FDE(前线交付工程师)团队做重交付——这说明它不是"开个开关就能用"的轻量产品。

Google:从企业数据根据地长出 Agent

Google 的路径是"企业端出发"(enterprise-out):数据已经在 Google 生态(Drive、Gmail、BigQuery、Workspace),Agent 在数据之上自然生长。

Gemini Enterprise 不是一个单一产品,而是以 Agentspace 为核心的几个层的叠加:

  1. Agentspace —— 企业员工的统一入口。把内部散乱知识(Drive、Gmail、BigQuery、GitHub、Notion、Salesforce……)统一索引,用 Agent 回答跨源复杂问题。内置 Deep Research Agent,能自动规划研究步骤、跨数据源综合报告。
  2. Vertex AI Agent Builder —— 开发者的构建工具。ADK(开源多语言框架,支持 Python/TypeScript/Go/Java)+ Agent Engine(托管运行时)+ Agent Designer(低代码可视化,目前仍为 Preview)。权限直接复用 Google Cloud IAM。值得注意的是,ADK 不只支持 Google 自家模型,也能集成 Anthropic Claude 等第三方模型。
  3. A2A 协议 —— 这是 Google 战略里最值得注意的一手棋。A2A 是开放标准,解决"不同 Agent、不同厂商、不同框架之间怎么安全协作"。每个 Agent 发布一张"能力名片",通过 HTTP/SSE/JSON-RPC 标准接口发起任务。已提交 Linux Foundation,和 MCP 互补(MCP 解决 Agent 和工具通信,A2A 解决 Agent 和 Agent 通信)。

Google 的核心赌注是:如果你的数据已经在 Google 里,Agent 的冷启动成本极低——IAM 打通了数据就打通了,不需要另建数据管道。A2A 则是更大的棋——把 Agent 间的通信做成公共基础设施,然后在标准之上赢,和当年推 Kubernetes 的逻辑如出一辙。


四、核心对比:一张表看清差异

维度Microsoft (Agent 365 + Cowork)OpenAI (Frontier)Google (Gemini Enterprise)
一句话定位Office 生态内的 Agent 控制平面 + 执行层从零搭建的企业 Agent 运行平台以 Agentspace 为核心的企业 Agent 平台
切入路径办公软件-in(从现有生产力工具长出 Agent)消费端-in(从 ChatGPT 反攻企业)企业数据-out(从数据根据地长出 Agent)
上下文来源Work IQ(Outlook/Teams/SharePoint/OneDrive 信号)Business Context(业务上下文层)Agentspace(Drive/Gmail/BigQuery 原生索引)
权限模型Entra Agent ID + M365 现有权限体系平台层独建 Agent IAM复用 Google Cloud IAM
执行能力Copilot Cowork(跨 Office 应用多步执行)Agent Execution(受控运行时)Agent Engine(托管运行时)
Agent 构建Copilot Studio / Agent Framework / SDKAgents SDK / Responses APIADK(开源,Python/TS/Go/Java)/ Agent Designer
Agent 治理Agent 365(注册、监控、合规、安全)Frontier 内置(身份、审计、评估)Vertex AI + Google Cloud 治理工具
互操作策略支持 MCP Apps + 开源 Agent 注册自有生态为主,MCP 作接入层A2A 开放协议 + MCP 互补
模型策略多模型(OpenAI GPT-5.4 + Anthropic Claude)OpenAI 自家模型(GPT-5.4)Google 自家模型(Gemini 3.1 Pro)
云底座AzureOpenAI 托管 / 本地 / 企业云;AWS 为独家第三方云分发Google Cloud
定价M365 E7: 99/用户/月;Agent365单独99/用户/月;Agent 365 单独 15/用户/月大客户定制(FDE 重交付)Business 21/seat/月起;Standard/Plus21/seat/月起;Standard/Plus 30/seat/月起
成熟度Agent 365 GA 2026.5.1;Cowork Research Preview有限客户开放主体产品已商用;A2A agent registration、Agent Designer 仍为 Preview

五、深层比较:三个真正重要的差异

表格看起来密密麻麻,但真正决定选型的就三件事。

差异 1:数据在哪,就选哪家

这是最务实也最残酷的判断标准:你的企业数据和工作流在哪个生态里,哪家的冷启动成本就最低。

  • 如果你的员工每天在 Outlook、Teams、SharePoint 里工作 → Microsoft 的路径阻力最小。Work IQ 直接从这些应用的信号里提取上下文,Agent 365 复用 Entra 权限,几乎不需要额外的数据接入工作。
  • 如果你的数据在 Google Drive、Gmail、BigQuery 里 → Gemini Enterprise 上手最快。IAM 打通、数据自然可用、Agentspace 开箱即用。
  • 如果你的数据在 AWS、Salesforce、Snowflake 或自建系统里 → Frontier 可能更灵活,因为它本身就是从"外部接入数据"的逻辑出发的。

简单粗暴的判断公式:

数据在 Microsoft 365 → M365 Agent 365 + Cowork
数据在 Google Cloud  → Gemini Enterprise
数据在 AWS / 混合云  → OpenAI Frontier
数据分散在多个系统  → 三家都一样难,先整理数据再谈平台

差异 2:协议策略——开放 vs 围墙

三家在"Agent 怎么和外部世界互通"这件事上,策略截然不同:

Google 押注开放标准。A2A 协议提交 Linux Foundation,鼓励全行业用它做 Agent 间通信。这是"把标准做成公共基础设施,然后在标准之上赢"的策略——和推 Kubernetes 一个逻辑。如果 A2A 真的成为行业标准,Google 的先发优势巨大。

Microsoft 选择平台兼容。Agent 365 支持注册任何来源的 Agent(包括 OpenAI、LangChain、Crew.ai、甚至 Anthropic 的 Agent),Wave 3 也支持 MCP Apps 作为接入方式。它不是在推协议标准,而是在说"不管你用什么框架,来我的平台上注册管理就行"。

OpenAI 更偏向自有生态。Frontier 的工具层支持 MCP,但整体平台更鼓励用 OpenAI 自家的 Agents SDK 和 Responses API 来建 Agent。

对工程师的实际影响是:如果你看重 Agent 间互操作、不想绑定单一厂商 → A2A 值得认真研究;如果你需要一个统一管理面板管理来自不同框架的 Agent → Agent 365 是目前公开材料里对这个能力表述最明确的产品。

差异 3:模型策略——独家 vs 多源

这个差异容易被忽略,但对技术架构影响深远:

Microsoft 在三家中把多模型路线走得最彻底。Wave 3 的 Copilot 同时集成了 OpenAI GPT-5.4 和 Anthropic Claude,由系统自动选择最合适的模型。这意味着微软把自己定位为"模型中间层"——哪个模型强就用哪个,不绑定。

Google 的 ADK 也支持接入多家模型(包括 Claude),但主要体现在开发者构建层;OpenAI 则聚焦自家模型。微软的独特之处在于把多模型策略贯穿到了终端用户的工作流层面。

微软的多模型策略是一个很聪明的定位:如果你认为模型赛道还会洗牌、没有人能永远保持第一,那绑定一个不做模型但整合最好模型的平台,风险最小。


六、它们到底在抢什么:不是模型垄断,是企业 Agent OS

把三家的动作放在一起看,一个更大的图景浮出水面:

它们在抢的,是"企业 Agent 操作系统"这个位置。

就像 Windows 之于 PC、AWS 之于云计算、Kubernetes 之于容器编排——谁定义了 Agent 在企业里怎么运行,谁就拥有了企业 AI 时代最大的平台权力。

flowchart LR
    subgraph past["过去:模型之争"]
        M1[GPT-5.4] --- M2[Claude Opus 4.6]
        M2 --- M3[Gemini 3.1 Pro]
        M3 --- M4[谁的模型更强?]
    end

    subgraph present["现在:平台之争"]
        P1[Agent 365 + Cowork]
        P2[OpenAI Frontier]
        P3[Gemini Enterprise]
        P1 --- Q[谁定义 Agent 怎么在企业里上班?]
        P2 --- Q
        P3 --- Q
    end

    past ==>|战场转移| present

这场战争的核心不是"哪个 Agent 更聪明",而是:

  1. Agent 的身份谁来发? —— Microsoft 说用 Entra Agent ID,Google 说用 Cloud IAM,OpenAI 说我自己建一套
  2. Agent 的工作上下文从哪来? —— Microsoft 说从 Work IQ,Google 说从 Agentspace,OpenAI 说从 Business Context
  3. Agent 的执行在哪里可信? —— 各家各有自己的受控运行时
  4. Agent 之间怎么协作? —— Google 推 A2A 开放标准,Microsoft 做平台注册,OpenAI 走封闭生态

哪个平台占据了企业的 Agent 运行底座,哪个厂商就锁定了这家企业的 AI 支出。 模型可以换,平台换不动——就像你可以在 AWS 上跑任何语言,但你不会轻易把基础设施从 AWS 迁到 GCP。


七、一个场景走三条路:看见差异

假设一家 2000 人的 B2B SaaS 公司,销售运营团队每周要做一件事:从 CRM 拉本周 pipeline 数据,对比上周变化,找出停滞超过 14 天的商机,生成报告发给 VP,并给对应销售发提醒。

同一个需求,三条路径分别怎么落地:

Microsoft 路径

  • 数据源:Dynamics 365 / Salesforce(M365 连接器接入)+ SharePoint 文档
  • Agent 构建:用 Copilot Studio 定义销售运营 Agent,或直接用 Copilot Cowork 委托执行
  • 权限:Agent ID 注册到 Agent 365,Entra 控制只读 CRM + 可发 Teams 消息
  • 执行:Cowork 自动拉数据 → 在 Excel 里比对 → 生成 Word 报告 → 通过 Outlook 发送
  • 审计:Agent 365 仪表盘追踪执行记录,Purview 做合规审计

OpenAI Frontier 路径

  • 数据源:通过 MCP 连接器接 Salesforce + Snowflake + Slack
  • Agent 构建:用 Agents SDK 定义 Agent 逻辑,部署到 Frontier 托管 runtime
  • 权限:Frontier 的 Agent IAM 定义 read/write 边界
  • 执行:Agent 在受控环境里跑 SQL → 分析数据 → 生成报告 → 调 Slack API 发消息
  • 审计:Frontier 内置执行日志 + 评估闭环,VP 反馈进入优化队列

Google Gemini Enterprise 路径

  • 数据源:BigQuery(pipeline 数据)+ Google Drive(历史报告)+ Gmail(客户沟通记录)
  • Agent 构建:用 ADK 定义两个子 Agent,编排 Agent 用 Gemini 3.1 Pro 协调
  • 权限:直接继承 Google Cloud IAM,合规人员有数据权限,审批人只能看报告
  • 执行:Agent Engine 托管运行,Memory Bank 存储上周数据,增量更新
  • 跨系统:如果还有外部 Agent(比如 DocuSign 合同分析),通过 A2A 协议协作

三条路都能把这件事做成。区别不在能力,在摩擦力——你的数据和工作流已经在哪个生态里,哪条路就最短。


八、共同的局限——别被宣传稿骗了

三家都有同样的坑,说不清楚就成了厂商宣传稿,所以必须专门讲。

1. 企业数据并不天然可用

三个平台都假设企业数据是可以接入的。现实是:大量企业数据在老系统里,格式混乱,接口文档残缺,有的根本没有 API。你接进来的,可能是三张结构不对齐的 Excel 导出表。数据治理是平台解决不了的前提工作。

2. 权限治理是组织问题,不是技术问题

三家都提供了权限执行层,但"哪个 Agent 应该有什么权限"需要业务、合规、IT 安全一起定义。很多公司连内部员工的权限都是乱的,更别说 Agent 了。

3. "Agent 做对了"怎么定义,依然是难题

评估能力三家都在建,但如何定义"这个任务做好了"?有些结果好不好,人类自己都说不清楚。评估体系的建立比技术接入难得多。

4. 平台锁定是真实风险

选了 Microsoft 就绑定了 M365 + Azure。选了 Google 就绑定了 Workspace + GCP。选了 OpenAI Frontier 就绑定了 OpenAI 生态(虽然不限于 AWS,但 Amazon 是独家第三方云合作伙伴)。A2A 协议在 Agent 层缓解了锁定,但数据层和身份层的锁定是另一回事。

5. 缺的不是技术,是流程重构

最残酷的一点:很多公司把 Agent 失败归因为"模型不够好"或"平台不够强",但真正的问题是业务流程本身不清晰——连人都没想好怎么做这件事,Agent 就更难做好。


九、给工程师的选型建议

不做抽象建议,直接给判断框架:

第一步:看数据在哪

日常在 Outlook/Teams/SharePoint 里工作? → Microsoft
日常在 Gmail/Drive/BigQuery 里工作?    → Google
数据在 AWS/Snowflake/自建系统?         → OpenAI Frontier 或自建

第二步:看组织的技术能力

有成熟工程团队,想深度定制 Agent?     → OpenAI Frontier / Google ADK
偏好低代码/快速上手?                  → Microsoft Copilot Studio / Google Agent Designer
需要从头建 Agent 基础设施?            → 三家都需要相当投入

第三步:看战略关切

担心模型供应商锁定?                   → Microsoft(多模型策略)
看重 Agent 间开放互操作?              → Google(A2A 协议)
偏好 OpenAI 生态 / AWS 分发?              → OpenAI Frontier
需要立刻可用的企业治理能力?           → Microsoft Agent 365(2026.5 GA)

如果三条都不确定:别急着选平台。先把场景定清楚、数据理顺、权限模型画出来。这些前置工作做好了,上哪个平台都快;没做好,上哪个平台都卡。


十、最后判断

2026 年的企业 AI 战场,竞争维度已经从"谁的模型更强"彻底转移到了"谁能让 Agent 在企业里真正跑起来"。

三家巨头给出了三个不同的答案:

  • Microsoft 说:现有的办公生态就是最好的 Agent 运行底座,不用重建,升级就好
  • OpenAI 说:给 Agent 配一套完整的运行环境,把企业数据接进来
  • Google 说:数据本来就在这里,Agent 在数据之上自然生长;Agent 之间用开放标准通信

没有哪条路是绝对正确的。但有一件事是确定的:企业 Agent 的核心战场已经从模型层下沉到了平台层。 谁先把"Agent 在企业里怎么上班"这件事标准化,谁就拿到了这个时代的平台权力。

从工程视角看,我把这三个平台理解为同一件事的三个版本:Agent OS 的第一次认真尝试。 就像早期的 PC 操作系统之争——Windows、Mac OS、Linux 各有路径,最后占据企业桌面的是那个和企业现有基础设施绑定最深的。

历史可能正在重演。