2026 年 Q1,Microsoft 发布 Agent 365 + Copilot Cowork,OpenAI 发布 Frontier 并与 Amazon 达成战略合作,Google 推出 Gemini Enterprise 并持续推进 A2A 开放协议。三家几乎同时在做同一件事——给 Agent 建"企业操作系统"。这篇文章帮你看清楚:它们到底在解决什么共同问题、各自怎么切入、对工程师意味着什么。
一、先讲结论
过去三个月,企业 AI 领域发生了一件比任何新模型发布都重要的事:三大巨头几乎同时宣布,要给 Agent 建一套企业级运行基础设施。
- Microsoft:2025 年 11 月发布 Agent 365(Agent 的控制平面),2026 年 3 月发布 Copilot Cowork(多步任务执行层)+ Wave 3 + M365 E7 Frontier Suite
- OpenAI:2026 年 2 月发布 Frontier(企业 Agent 执行平台),同月底 Amazon 宣布 $500 亿战略合作,共同开发 Stateful Runtime Environment 并由 AWS 独家第三方云分发
- Google:2025 年 10 月推出 Gemini Enterprise(以 Agentspace 为核心的企业 Agent 平台);此前已于 2025 年 4 月发起 A2A 协议,2025 年 6 月进入 Linux Foundation
三家不约而同地在说同一句话:模型够强了,但企业里的 Agent 就是跑不起来——问题不在脑子,在配套。
它们不是在推销新模型。它们都在试图回答一个更底层的工程问题:Agent 在企业里怎么上班?谁给它发工牌、分权限、记考勤、评绩效?
如果你是在做企业 AI 落地的工程师或架构师,这篇文章能帮你搞清楚三件事:
- 三家在解决的核心问题是什么(以及为什么这个问题比模型更重要)
- 三条路径有什么本质区别
- 选哪条路,取决于什么
二、共同问题:Agent 在企业里"跑不起来"
三家公司的公开材料里,不约而同地指向了同一个诊断。我把它翻译成工程师能直接对号入座的四个痛点:
痛点 1:上下文割裂——Agent 是个失忆症患者
Agent 每次启动都是白板。它不知道上周这个客户说了什么,不知道上次任务跑到哪里卡了,不知道"商机阶段"在你们公司怎么定义。
企业的业务流程是有状态的,但大多数 Agent 系统是无状态的——每次对话结束,记忆清零。
痛点 2:权限是黑洞——要么放得太开,要么管得太死
你给 Agent 接了 CRM、接了数据库。但谁有权限读哪张表?哪个 Agent 能触发退款?谁能看薪资?这些问题在 API 层面根本没人管。结果要么 over-permissioning(出了事没法溯源),要么收得太紧(Agent 能干的活寥寥无几)。
痛点 3:工具调用 ≠ 可靠执行
Function calling 让模型知道"我可以调用这个工具",但不等于调用是安全的、幂等的、可审计的、可回滚的。在真实业务里,Agent 帮你改了一条记录,你得回答:谁做的、什么时候、结果是什么、出了错能不能撤。
痛点 4:没有反馈回路——Agent 跑了 1000 次,你不知道好不好
Agent 执行了任务,你怎么知道哪些做得好、哪些错了?没有系统性评估,优化就是瞎猜。
三家公司各自用了不同的词来描述同一件事:
| 痛点 | Microsoft 的说法 | OpenAI 的说法 | Google 的说法 |
|---|---|---|---|
| 上下文割裂 | Work IQ(组织语义层) | Business Context(业务上下文) | Agentspace(统一知识入口) |
| 权限管理 | Agent 365 + Entra Agent ID | Agent Identity & IAM | Google Cloud IAM 继承 |
| 可靠执行 | Copilot Cowork(执行层) | Agent Execution(执行环境) | Agent Engine(托管运行时) |
| 评估闭环 | Visualization + 审计日志 | Evaluation & Optimization | 内置评估工具 |
词不一样,解的是同一道题。
三、三条路径:同一个目标,完全不同的切入方式
虽然在解决同一个问题,三家的路径差异非常大。理解这个差异,是做技术选型时最关键的判断。
Microsoft:从办公软件里长出 Agent
Microsoft 的策略可以用一句话概括:Agent 不是新系统,是现有办公生态的升级。
它的逻辑链是这样的:
- 全球数亿人每天在用 Word、Excel、Outlook、Teams
- 企业的数据、流程、权限已经在 Microsoft 365 + Entra 里了
- 与其让 Agent 从外面"接入"企业,不如让 Agent 直接在这些应用里干活
所以 Microsoft 做了两件事:
Agent 365 —— Agent 的控制平面。不管你的 Agent 是用 Copilot Studio 建的、用 OpenAI SDK 写的、还是用 LangChain 搭的,只要在企业里运行,都注册到 Agent 365 里统一管理。它提供五个能力:注册表(谁有哪些 Agent)、访问控制(Agent ID + 最小权限)、可视化(仪表盘 + 分析)、互操作(跨框架跨平台)、安全(Defender + Purview + Entra 联防)。
Copilot Cowork —— 多步任务执行层。截至 2026 年 3 月,Cowork 仍处于 Research Preview 阶段,面向有限客户通过 Frontier 计划测试,尚未广泛 GA。但它代表的方向已经很明确:之前的 Copilot 是"一问一答"——你问它一个问题,它给你一个回复。Cowork 把模式升级为"委托执行":你描述想要的结果,Copilot 拆解成计划,跨 Outlook、Excel、Word、Teams 多个应用协调执行,过程中有检查点,你可以随时审查和干预。
一个有意思的细节:Copilot Cowork 底层用的不只是 OpenAI 的模型——它同时集成了 Anthropic 的 Claude,由系统自动选择最合适的模型执行任务。Microsoft 把这叫"多模型优势",本质上是在说:我不绑定任何一个模型供应商,谁强用谁。
定价也值得注意:M365 E7 Frontier Suite 定价 15/用户/月。
OpenAI:从消费端反攻企业
OpenAI 的路径是"消费端进入"(consumer-in):从 ChatGPT 这个产品出发,往企业需要的能力上叠加。
ChatGPT 是目前公开数据中用户规模最大的 AI 应用之一。Frontier 要做的是:在这个入口之下,搭建一套企业级 Agent 运行基础设施。
Frontier 的四根支柱:
- 业务上下文(Business Context)——不是对话记忆,是持久化的工作状态层。Agent 跨多个任务、多次启动都能拿到同一份"当前状态"。更接近"企业语义层",把"客户是谁、商机阶段怎么定义、哪个字段可信"这类业务语义接进来。
- 身份与权限——Agent 有自己的权限范围,权限在执行层强制,和模型输出无关。就算模型"决定"调某个接口,权限层不通就发不出去。
- 执行环境——每次工具调用留下日志,失败重试、超时降级都在平台层处理。
- 评估与优化——内置评估能力,追踪每次执行结果,标记异常,找出成功率下降的步骤。
Amazon 于 2026 年 2 月底宣布与 OpenAI 达成 $500 亿战略合作,共同开发 Stateful Runtime Environment,AWS 成为 Frontier 的独家第三方云分发渠道。但 Frontier 不仅限于 AWS——它也支持本地部署、企业自有云及 OpenAI 自身托管。如果你的企业数据在 AWS 上,这是一条很顺的路径,但不意味着只能走 AWS。
但 Frontier 目前仍在有限客户开放阶段,官方配了专门的 FDE(前线交付工程师)团队做重交付——这说明它不是"开个开关就能用"的轻量产品。
Google:从企业数据根据地长出 Agent
Google 的路径是"企业端出发"(enterprise-out):数据已经在 Google 生态(Drive、Gmail、BigQuery、Workspace),Agent 在数据之上自然生长。
Gemini Enterprise 不是一个单一产品,而是以 Agentspace 为核心的几个层的叠加:
- Agentspace —— 企业员工的统一入口。把内部散乱知识(Drive、Gmail、BigQuery、GitHub、Notion、Salesforce……)统一索引,用 Agent 回答跨源复杂问题。内置 Deep Research Agent,能自动规划研究步骤、跨数据源综合报告。
- Vertex AI Agent Builder —— 开发者的构建工具。ADK(开源多语言框架,支持 Python/TypeScript/Go/Java)+ Agent Engine(托管运行时)+ Agent Designer(低代码可视化,目前仍为 Preview)。权限直接复用 Google Cloud IAM。值得注意的是,ADK 不只支持 Google 自家模型,也能集成 Anthropic Claude 等第三方模型。
- A2A 协议 —— 这是 Google 战略里最值得注意的一手棋。A2A 是开放标准,解决"不同 Agent、不同厂商、不同框架之间怎么安全协作"。每个 Agent 发布一张"能力名片",通过 HTTP/SSE/JSON-RPC 标准接口发起任务。已提交 Linux Foundation,和 MCP 互补(MCP 解决 Agent 和工具通信,A2A 解决 Agent 和 Agent 通信)。
Google 的核心赌注是:如果你的数据已经在 Google 里,Agent 的冷启动成本极低——IAM 打通了数据就打通了,不需要另建数据管道。A2A 则是更大的棋——把 Agent 间的通信做成公共基础设施,然后在标准之上赢,和当年推 Kubernetes 的逻辑如出一辙。
四、核心对比:一张表看清差异
| 维度 | Microsoft (Agent 365 + Cowork) | OpenAI (Frontier) | Google (Gemini Enterprise) |
|---|---|---|---|
| 一句话定位 | Office 生态内的 Agent 控制平面 + 执行层 | 从零搭建的企业 Agent 运行平台 | 以 Agentspace 为核心的企业 Agent 平台 |
| 切入路径 | 办公软件-in(从现有生产力工具长出 Agent) | 消费端-in(从 ChatGPT 反攻企业) | 企业数据-out(从数据根据地长出 Agent) |
| 上下文来源 | Work IQ(Outlook/Teams/SharePoint/OneDrive 信号) | Business Context(业务上下文层) | Agentspace(Drive/Gmail/BigQuery 原生索引) |
| 权限模型 | Entra Agent ID + M365 现有权限体系 | 平台层独建 Agent IAM | 复用 Google Cloud IAM |
| 执行能力 | Copilot Cowork(跨 Office 应用多步执行) | Agent Execution(受控运行时) | Agent Engine(托管运行时) |
| Agent 构建 | Copilot Studio / Agent Framework / SDK | Agents SDK / Responses API | ADK(开源,Python/TS/Go/Java)/ Agent Designer |
| Agent 治理 | Agent 365(注册、监控、合规、安全) | Frontier 内置(身份、审计、评估) | Vertex AI + Google Cloud 治理工具 |
| 互操作策略 | 支持 MCP Apps + 开源 Agent 注册 | 自有生态为主,MCP 作接入层 | A2A 开放协议 + MCP 互补 |
| 模型策略 | 多模型(OpenAI GPT-5.4 + Anthropic Claude) | OpenAI 自家模型(GPT-5.4) | Google 自家模型(Gemini 3.1 Pro) |
| 云底座 | Azure | OpenAI 托管 / 本地 / 企业云;AWS 为独家第三方云分发 | Google Cloud |
| 定价 | M365 E7: 15/用户/月 | 大客户定制(FDE 重交付) | Business 30/seat/月起 |
| 成熟度 | Agent 365 GA 2026.5.1;Cowork Research Preview | 有限客户开放 | 主体产品已商用;A2A agent registration、Agent Designer 仍为 Preview |
五、深层比较:三个真正重要的差异
表格看起来密密麻麻,但真正决定选型的就三件事。
差异 1:数据在哪,就选哪家
这是最务实也最残酷的判断标准:你的企业数据和工作流在哪个生态里,哪家的冷启动成本就最低。
- 如果你的员工每天在 Outlook、Teams、SharePoint 里工作 → Microsoft 的路径阻力最小。Work IQ 直接从这些应用的信号里提取上下文,Agent 365 复用 Entra 权限,几乎不需要额外的数据接入工作。
- 如果你的数据在 Google Drive、Gmail、BigQuery 里 → Gemini Enterprise 上手最快。IAM 打通、数据自然可用、Agentspace 开箱即用。
- 如果你的数据在 AWS、Salesforce、Snowflake 或自建系统里 → Frontier 可能更灵活,因为它本身就是从"外部接入数据"的逻辑出发的。
简单粗暴的判断公式:
数据在 Microsoft 365 → M365 Agent 365 + Cowork
数据在 Google Cloud → Gemini Enterprise
数据在 AWS / 混合云 → OpenAI Frontier
数据分散在多个系统 → 三家都一样难,先整理数据再谈平台
差异 2:协议策略——开放 vs 围墙
三家在"Agent 怎么和外部世界互通"这件事上,策略截然不同:
Google 押注开放标准。A2A 协议提交 Linux Foundation,鼓励全行业用它做 Agent 间通信。这是"把标准做成公共基础设施,然后在标准之上赢"的策略——和推 Kubernetes 一个逻辑。如果 A2A 真的成为行业标准,Google 的先发优势巨大。
Microsoft 选择平台兼容。Agent 365 支持注册任何来源的 Agent(包括 OpenAI、LangChain、Crew.ai、甚至 Anthropic 的 Agent),Wave 3 也支持 MCP Apps 作为接入方式。它不是在推协议标准,而是在说"不管你用什么框架,来我的平台上注册管理就行"。
OpenAI 更偏向自有生态。Frontier 的工具层支持 MCP,但整体平台更鼓励用 OpenAI 自家的 Agents SDK 和 Responses API 来建 Agent。
对工程师的实际影响是:如果你看重 Agent 间互操作、不想绑定单一厂商 → A2A 值得认真研究;如果你需要一个统一管理面板管理来自不同框架的 Agent → Agent 365 是目前公开材料里对这个能力表述最明确的产品。
差异 3:模型策略——独家 vs 多源
这个差异容易被忽略,但对技术架构影响深远:
Microsoft 在三家中把多模型路线走得最彻底。Wave 3 的 Copilot 同时集成了 OpenAI GPT-5.4 和 Anthropic Claude,由系统自动选择最合适的模型。这意味着微软把自己定位为"模型中间层"——哪个模型强就用哪个,不绑定。
Google 的 ADK 也支持接入多家模型(包括 Claude),但主要体现在开发者构建层;OpenAI 则聚焦自家模型。微软的独特之处在于把多模型策略贯穿到了终端用户的工作流层面。
微软的多模型策略是一个很聪明的定位:如果你认为模型赛道还会洗牌、没有人能永远保持第一,那绑定一个不做模型但整合最好模型的平台,风险最小。
六、它们到底在抢什么:不是模型垄断,是企业 Agent OS
把三家的动作放在一起看,一个更大的图景浮出水面:
它们在抢的,是"企业 Agent 操作系统"这个位置。
就像 Windows 之于 PC、AWS 之于云计算、Kubernetes 之于容器编排——谁定义了 Agent 在企业里怎么运行,谁就拥有了企业 AI 时代最大的平台权力。
flowchart LR
subgraph past["过去:模型之争"]
M1[GPT-5.4] --- M2[Claude Opus 4.6]
M2 --- M3[Gemini 3.1 Pro]
M3 --- M4[谁的模型更强?]
end
subgraph present["现在:平台之争"]
P1[Agent 365 + Cowork]
P2[OpenAI Frontier]
P3[Gemini Enterprise]
P1 --- Q[谁定义 Agent 怎么在企业里上班?]
P2 --- Q
P3 --- Q
end
past ==>|战场转移| present
这场战争的核心不是"哪个 Agent 更聪明",而是:
- Agent 的身份谁来发? —— Microsoft 说用 Entra Agent ID,Google 说用 Cloud IAM,OpenAI 说我自己建一套
- Agent 的工作上下文从哪来? —— Microsoft 说从 Work IQ,Google 说从 Agentspace,OpenAI 说从 Business Context
- Agent 的执行在哪里可信? —— 各家各有自己的受控运行时
- Agent 之间怎么协作? —— Google 推 A2A 开放标准,Microsoft 做平台注册,OpenAI 走封闭生态
哪个平台占据了企业的 Agent 运行底座,哪个厂商就锁定了这家企业的 AI 支出。 模型可以换,平台换不动——就像你可以在 AWS 上跑任何语言,但你不会轻易把基础设施从 AWS 迁到 GCP。
七、一个场景走三条路:看见差异
假设一家 2000 人的 B2B SaaS 公司,销售运营团队每周要做一件事:从 CRM 拉本周 pipeline 数据,对比上周变化,找出停滞超过 14 天的商机,生成报告发给 VP,并给对应销售发提醒。
同一个需求,三条路径分别怎么落地:
Microsoft 路径:
- 数据源:Dynamics 365 / Salesforce(M365 连接器接入)+ SharePoint 文档
- Agent 构建:用 Copilot Studio 定义销售运营 Agent,或直接用 Copilot Cowork 委托执行
- 权限:Agent ID 注册到 Agent 365,Entra 控制只读 CRM + 可发 Teams 消息
- 执行:Cowork 自动拉数据 → 在 Excel 里比对 → 生成 Word 报告 → 通过 Outlook 发送
- 审计:Agent 365 仪表盘追踪执行记录,Purview 做合规审计
OpenAI Frontier 路径:
- 数据源:通过 MCP 连接器接 Salesforce + Snowflake + Slack
- Agent 构建:用 Agents SDK 定义 Agent 逻辑,部署到 Frontier 托管 runtime
- 权限:Frontier 的 Agent IAM 定义 read/write 边界
- 执行:Agent 在受控环境里跑 SQL → 分析数据 → 生成报告 → 调 Slack API 发消息
- 审计:Frontier 内置执行日志 + 评估闭环,VP 反馈进入优化队列
Google Gemini Enterprise 路径:
- 数据源:BigQuery(pipeline 数据)+ Google Drive(历史报告)+ Gmail(客户沟通记录)
- Agent 构建:用 ADK 定义两个子 Agent,编排 Agent 用 Gemini 3.1 Pro 协调
- 权限:直接继承 Google Cloud IAM,合规人员有数据权限,审批人只能看报告
- 执行:Agent Engine 托管运行,Memory Bank 存储上周数据,增量更新
- 跨系统:如果还有外部 Agent(比如 DocuSign 合同分析),通过 A2A 协议协作
三条路都能把这件事做成。区别不在能力,在摩擦力——你的数据和工作流已经在哪个生态里,哪条路就最短。
八、共同的局限——别被宣传稿骗了
三家都有同样的坑,说不清楚就成了厂商宣传稿,所以必须专门讲。
1. 企业数据并不天然可用
三个平台都假设企业数据是可以接入的。现实是:大量企业数据在老系统里,格式混乱,接口文档残缺,有的根本没有 API。你接进来的,可能是三张结构不对齐的 Excel 导出表。数据治理是平台解决不了的前提工作。
2. 权限治理是组织问题,不是技术问题
三家都提供了权限执行层,但"哪个 Agent 应该有什么权限"需要业务、合规、IT 安全一起定义。很多公司连内部员工的权限都是乱的,更别说 Agent 了。
3. "Agent 做对了"怎么定义,依然是难题
评估能力三家都在建,但如何定义"这个任务做好了"?有些结果好不好,人类自己都说不清楚。评估体系的建立比技术接入难得多。
4. 平台锁定是真实风险
选了 Microsoft 就绑定了 M365 + Azure。选了 Google 就绑定了 Workspace + GCP。选了 OpenAI Frontier 就绑定了 OpenAI 生态(虽然不限于 AWS,但 Amazon 是独家第三方云合作伙伴)。A2A 协议在 Agent 层缓解了锁定,但数据层和身份层的锁定是另一回事。
5. 缺的不是技术,是流程重构
最残酷的一点:很多公司把 Agent 失败归因为"模型不够好"或"平台不够强",但真正的问题是业务流程本身不清晰——连人都没想好怎么做这件事,Agent 就更难做好。
九、给工程师的选型建议
不做抽象建议,直接给判断框架:
第一步:看数据在哪
日常在 Outlook/Teams/SharePoint 里工作? → Microsoft
日常在 Gmail/Drive/BigQuery 里工作? → Google
数据在 AWS/Snowflake/自建系统? → OpenAI Frontier 或自建
第二步:看组织的技术能力
有成熟工程团队,想深度定制 Agent? → OpenAI Frontier / Google ADK
偏好低代码/快速上手? → Microsoft Copilot Studio / Google Agent Designer
需要从头建 Agent 基础设施? → 三家都需要相当投入
第三步:看战略关切
担心模型供应商锁定? → Microsoft(多模型策略)
看重 Agent 间开放互操作? → Google(A2A 协议)
偏好 OpenAI 生态 / AWS 分发? → OpenAI Frontier
需要立刻可用的企业治理能力? → Microsoft Agent 365(2026.5 GA)
如果三条都不确定:别急着选平台。先把场景定清楚、数据理顺、权限模型画出来。这些前置工作做好了,上哪个平台都快;没做好,上哪个平台都卡。
十、最后判断
2026 年的企业 AI 战场,竞争维度已经从"谁的模型更强"彻底转移到了"谁能让 Agent 在企业里真正跑起来"。
三家巨头给出了三个不同的答案:
- Microsoft 说:现有的办公生态就是最好的 Agent 运行底座,不用重建,升级就好
- OpenAI 说:给 Agent 配一套完整的运行环境,把企业数据接进来
- Google 说:数据本来就在这里,Agent 在数据之上自然生长;Agent 之间用开放标准通信
没有哪条路是绝对正确的。但有一件事是确定的:企业 Agent 的核心战场已经从模型层下沉到了平台层。 谁先把"Agent 在企业里怎么上班"这件事标准化,谁就拿到了这个时代的平台权力。
从工程视角看,我把这三个平台理解为同一件事的三个版本:Agent OS 的第一次认真尝试。 就像早期的 PC 操作系统之争——Windows、Mac OS、Linux 各有路径,最后占据企业桌面的是那个和企业现有基础设施绑定最深的。
历史可能正在重演。