Office被AI双雄接管：GPT 写稿、Claude 审稿，微软全新升级来了！微软最近一次升级被业内戏称为“Offic

微软最近一次升级被业内戏称为“Office被AI接管”，原因很简单：你在Word写的第一稿可能是ChatGPT写的，Claude再帮你审稿。Researcher智能体直接集成了这两个模型的“批判”与“智囊团”功能，微软也因此一度逼近了Perplexity的“深度研究”天花板。除此之外，Copilot Cowork也在这个月上线，直接把Anthropic的Claude Cowork技术平台引进了Office，让AI可以自主规划跨工具任务。

在刚刚过去的这几周，微软发布了Copilot的重大升级，直接把Office的工作流推向了深度研究和自主执行的阶段。具体来说，这次升级最引人注目的功能就是在Researcher智能体中引入了“批判”（Critique）和“智囊团”（Council）两个多模型能力。

1. 让 GPT 写稿，Claude 审稿：深度研究的“批判”模式

过去，AI写作工具的结构性缺陷在于：它们既要当“运动员”起草初稿，又要当“裁判”审稿。微软这次打破了这个逻辑，将“生成”和“评估”拆分成两个独立的角色。现在，当你在Word里输入研究任务时，GPT-4会负责上半场：任务规划、信息检索、起草初稿。而Claude则会接过下半场的“接力棒”，以专家评审员的身份，对这篇稿子进行逐条审查。

Claude审稿的标准非常严苛。它会检查你的引用是否来自权威来源，报告是否覆盖了所有用户请求的意图，并且要求每一个关键结论都能追溯到带有精确引用的可靠来源。这种“同行评审”模式虽然听起来像是让AI给AI审稿，但实质上是把学术界的评审机制工程化地嵌进了AI系统，用架构设计来压制幻觉，而不是一味指望单个模型变得更聪明。

这种双模型协作的效果非常惊人。根据微软提供的数据，在DRACO（深度研究准确性、完整性和客观性）基准测试中，这套架构的综合得分比此前被认为是天花板的Perplexity Deep Research（搭载Claude Opus 4.6）高出了13.8%。尤其在分析广度和深度上，提升了3.33分，这说明Critique最大的价值不仅在于纠错，而是能逼出更全面的分析视角。

2. AI会诊：Copilot Cowork 的“智囊团”模式

如果说Critique解决了“怎么让报告更准”的问题，那么Copilot Cowork则解决了“怎么让AI帮我做事”的问题。Copilot Cowork直接基于Anthropic的Claude Cowork技术平台构建，它的工作方式非常像人类的“会诊”。你只需要描述想要的结果，AI就会自动制定计划，跨工具（如Word、Excel、PowerPoint）进行逻辑推理，在推进过程中实时展示进度。

这意味着，你不再是一个人在对着电脑敲代码，而是把Anthropic的Agent骨架直接嵌进了M365的肌肉里。AI可以自主规划、跨工具推进多步任务，从一次性杂事到每月预算审查，都能高效完成。Capital Group等机构已经在使用这项技术，反馈集中在规划、排程、产出成果以及准备管理层审查等高价值场景。

3. 这意味着什么？

从单纯的“聊天机器人”，微软正在把Office转变为一个“工作系统”。它不再押注某一个模型能赢，而是押注无论谁赢，流量都经过它。这次升级不是一次简单的产品更新，而是一次架构级别的站队。微软从对OpenAI的深度依赖，转变为把Anthropic的技术深度整合进产品线，变成了“模型指挥中心”。

对于普通用户来说，这意味着未来的Office将更加智能化。你不再需要手动切换模型或检查幻觉，AI会帮你写稿、审稿、甚至代你开会。但这也带来了更高的期望值：多模型来回调用的成本谁买单？企业员工真的能把它融入日常工作流吗？这将是AI办公时代面临的下一个挑战。

结语：

微软这次的升级无疑在行业内引起了震动。它不是在押宝一个模型，而是在构建一个生态系统，让所有顶级模型的能力都经过它的编排。这也许是AI办公的下一个“转折点”，决定胜负的不再是单一模型的强弱，而是能否把多个模型编排成一条可靠的、可审计的、可落地的工作流。