Office被AI双雄接管:GPT 写稿、Claude 审稿,微软全新升级来了!

0 阅读4分钟

微软最近一次升级被业内戏称为“Office被AI接管”,原因很简单:你在Word写的第一稿可能是ChatGPT写的,Claude再帮你审稿。Researcher智能体直接集成了这两个模型的“批判”与“智囊团”功能,微软也因此一度逼近了Perplexity的“深度研究”天花板。除此之外,Copilot Cowork也在这个月上线,直接把Anthropic的Claude Cowork技术平台引进了Office,让AI可以自主规划跨工具任务。

在刚刚过去的这几周,微软发布了Copilot的重大升级,直接把Office的工作流推向了深度研究和自主执行的阶段。具体来说,这次升级最引人注目的功能就是在Researcher智能体中引入了“批判”(Critique)和“智囊团”(Council)两个多模型能力。

1. 让 GPT 写稿,Claude 审稿:深度研究的“批判”模式

过去,AI写作工具的结构性缺陷在于:它们既要当“运动员”起草初稿,又要当“裁判”审稿。微软这次打破了这个逻辑,将“生成”和“评估”拆分成两个独立的角色。现在,当你在Word里输入研究任务时,GPT-4会负责上半场:任务规划、信息检索、起草初稿。而Claude则会接过下半场的“接力棒”,以专家评审员的身份,对这篇稿子进行逐条审查。

Claude审稿的标准非常严苛。它会检查你的引用是否来自权威来源,报告是否覆盖了所有用户请求的意图,并且要求每一个关键结论都能追溯到带有精确引用的可靠来源。这种“同行评审”模式虽然听起来像是让AI给AI审稿,但实质上是把学术界的评审机制工程化地嵌进了AI系统,用架构设计来压制幻觉,而不是一味指望单个模型变得更聪明。

这种双模型协作的效果非常惊人。根据微软提供的数据,在DRACO(深度研究准确性、完整性和客观性)基准测试中,这套架构的综合得分比此前被认为是天花板的Perplexity Deep Research(搭载Claude Opus 4.6)高出了13.8%。尤其在分析广度和深度上,提升了3.33分,这说明Critique最大的价值不仅在于纠错,而是能逼出更全面的分析视角。

2. AI会诊:Copilot Cowork 的“智囊团”模式

如果说Critique解决了“怎么让报告更准”的问题,那么Copilot Cowork则解决了“怎么让AI帮我做事”的问题。Copilot Cowork直接基于Anthropic的Claude Cowork技术平台构建,它的工作方式非常像人类的“会诊”。你只需要描述想要的结果,AI就会自动制定计划,跨工具(如Word、Excel、PowerPoint)进行逻辑推理,在推进过程中实时展示进度。

这意味着,你不再是一个人在对着电脑敲代码,而是把Anthropic的Agent骨架直接嵌进了M365的肌肉里。AI可以自主规划、跨工具推进多步任务,从一次性杂事到每月预算审查,都能高效完成。Capital Group等机构已经在使用这项技术,反馈集中在规划、排程、产出成果以及准备管理层审查等高价值场景。

3. 这意味着什么?

从单纯的“聊天机器人”,微软正在把Office转变为一个“工作系统”。它不再押注某一个模型能赢,而是押注无论谁赢,流量都经过它。这次升级不是一次简单的产品更新,而是一次架构级别的站队。微软从对OpenAI的深度依赖,转变为把Anthropic的技术深度整合进产品线,变成了“模型指挥中心”。

对于普通用户来说,这意味着未来的Office将更加智能化。你不再需要手动切换模型或检查幻觉,AI会帮你写稿、审稿、甚至代你开会。但这也带来了更高的期望值:多模型来回调用的成本谁买单?企业员工真的能把它融入日常工作流吗?这将是AI办公时代面临的下一个挑战。

结语:

微软这次的升级无疑在行业内引起了震动。它不是在押宝一个模型,而是在构建一个生态系统,让所有顶级模型的能力都经过它的编排。这也许是AI办公的下一个“转折点”,决定胜负的不再是单一模型的强弱,而是能否把多个模型编排成一条可靠的、可审计的、可落地的工作流。