Claude 4：AI 编程新时代的幕布Anthropic 在其技术博客悄然发布 Claude 4 系列模型，引发全球

大家好，我是右子，一名喜爱编程的程序员。

Anthropic 在其技术博客悄然发布 Claude 4 系列模型，引发全球开发者社区与研究机构的高度关注。

本次发布包含 Claude Opus 4 与 Claude Sonnet 4 两个配置，并以经验证的基准测试结果展示了跨维度的性能跃迁。

本文会用简单的语言带你了解 Claude 4 是什么、它有哪些厉害之处，以及它可能如何改变未来的软件开发方式。

Claude Sonnet 4 是 Claude Sonnet 3.7 的重大升级，提供卓越的编码和推理能力，同时更精确地响应您的指令。

除了模型本身，Claude 现在还新增了一些强大的功能：

工具增强思考（测试中）：现在模型在推理过程中可以用工具（比如联网搜索），提升回答质量。
并行工具调用 + 更强指令遵循 + 本地文件访问：模型可以同时用多个工具，指令理解更精确；如果允许访问本地文件，还能增强记忆力，逐步建立长期知识。
Claude Code 正式上线：支持 GitHub Actions 执行后台任务，并和 VS Code、JetBrains 深度集成，代码编辑更高效，体验像“结对编程”一样。
新增 API 能力：包括代码执行、MCP 连接器、文件 API、提示缓存（最长可达 1 小时）这四大功能，开发 AI agent 更方便。
模型定价与渠道：Claude Opus 4 和 Sonnet 4 都是混合模型，既能秒回也能深度思考；Opus 每百万 tokens 为 $15 / $75（输入/输出），Sonnet 是 $3 / $15。它们都可以在 Anthropic API、Amazon Bedrock 和 Google Vertex AI 上使用。

Claude 4

Claude 4 是目前我用过最强的模型，尤其是 Claude Opus 4，在编程任务上表现非常惊艳，不仅在 SWE-bench 和 Terminal-bench 上领跑，还能长时间高效处理复杂任务，连续运行几小时都不掉速，远超以往的 Sonnet 系列。

它在处理复杂代码结构、跨文件大改动、重构和调试上都有突破。像 Cursor、Replit、Sourcegraph、Block 等都在用它来做自动编程和智能代理，实战反馈也很强，能真正提升代码质量和开发效率。

相比之下，Claude Sonnet 4 虽然不及 Opus 那么强大，但在实际使用中已经非常均衡了。它在编码、理解复杂指令、多特性应用开发等方面也有显著进步，而且运行成本更低，适合日常使用，是从 3.7 升级过来的不错选择。

现在，GitHub Copilot 的新智能代理就准备用上 Sonnet 4，可见它在代码自动化领域的认可度已经非常高了。

这次 Claude 4 的升级，不只是加入了“工具增强思考”、“并行工具调用”和“记忆能力提升”，它在模型行为上也做了很大优化——现在模型在执行任务时更少走捷径、钻空子，比 Sonnet 3.7 少了约 65%，尤其是在容易出问题的 agent 场景中，稳定性提升很明显。

Claude Opus 4 的记忆能力也大幅领先旧版本。如果开发者让它访问本地文件，它会主动创建和维护“记忆文件”，记录关键内容，像是在玩《口袋妖怪》时自己写了“导航指南”。这让它在长期任务中表现得更连贯、记忆更牢、操作也更精准。

官方展示了一个有趣的例子：Opus 4在玩《宝可梦》游戏时，自己创建了一份「导航指南」来记录游戏进度和策略。

此外，Claude 4 现在支持“思维摘要”功能：如果思考链太长，会调用一个小模型自动总结思路，只有大约 5% 的情况才会触发这个功能。对于需要完整推理过程、用于提示工程的开发者，也可以联系销售开通 开发者模式 来获取完整原始思维链。

今天起，Claude 4 系列就可以使用了，Sonnet 4 对免费用户也已开放。付费用户可同时体验 Opus 4 + Sonnet 4 两个版本，以及“扩展思考”等新功能。

API 定价依旧：

模型已部署于 Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI。

AI 的战斗节奏越来越快，每隔一段时间，就有一款新的「地表最强模型」登场。

大家不断刷新 benchmark、相互对比，掌声刚落，又轮到下一位登台。

这是一场没有终点的竞速游戏：

上上次是 O3，上次是 Gemini 2.5 Pro，这次轮到 Claude 4……

下一次，又会是谁？