重磅发布：Claude 3.7 Sonnet 引领 AI 编码革命Anthropic 发布 Claude 3.7 Son

Anthropic 在 2025 年 2 月 24 日发布了其最新的 AI 模型——Claude 3.7 Sonnet，这款被称为“最智能模型”的产品不仅在技术上带来了突破，还为开发者提供了前所未有的编码加速体验。本文将深入分析 Claude 3.7 Sonnet 的核心特性，特别是其混合推理模式与 Claude Code 工具的强大功能，帮助开发者解决日常编程中的各种挑战。

`Claude 3.7 Sonnet`：全新智能与编码能力的结合

Claude 3.7 Sonnet 是 Anthropic 迄今为止最为先进的 AI 模型，首次引入了混合推理功能。它不仅能在标准模式下提供快速答案，还能在扩展思考模式下进行更深度的推理，特别是在数学、物理和复杂编码任务中表现卓越。这一版本的发布，使得开发者能够更加灵活地选择不同的推理策略，以便在速度和质量之间进行权衡。

核心特性解析

以下是 Claude 3.7 Sonnet 的一些关键特性，让我们更深入了解它为开发者带来的价值：

类别	详情
模型类型	最智能模型，首个混合推理模型，集快速回答和深入思考于一体，非分离模型。
可用性	所有 `Claude` 计划（免费、`Pro`、`Team`、企业）可用，及 `Anthropic API`、`Amazon Bedrock`、`Google Cloud Vertex AI`。扩展思考模式不包括在免费层。
定价	每百万输入令牌 3 美元，每百万输出令牌 15 美元（包括思考令牌），与前代相同。
模式	标准模式（`Claude 3.5 Sonnet` 升级版），扩展思考模式（自我反思，提升数学、物理、编码等），`API` 可控制思考预算（最多 128K 令牌）。
编码改进	编码和前端网页开发显著提升，在 `Cursor`、`Cognition`、`Vercel`、`Replit`、`Canva` 评估中最佳。`SWE-bench Verified` 和 `TAU-bench` 上表现最先进。
基准测试	- `SWE-bench Verified`：高计算 70.3%（n=489 可解决任务），无脚手架 63.7%，列出 11 个不可解决问题。 - `TAU-bench`：最先进，规划工具得分，最大步数增至 100（大多数少于 30，1 个超过 50）。
安全与可靠性	测试广泛，较前代减少 45% 不必要拒绝，系统卡片在系统卡片页面，评估推理可信度。
`GitHub` 集成	在 `Claude.ai` 上改进，所有计划可用，连接仓库用于修复错误、开发功能、编写文档。
`Claude Code` 工具	有限研究预览，代理编码工具，搜索/读取代码、编辑文件、编写/运行测试、提交/推送至 `GitHub`，使用命令行工具。减少 45+ 分钟任务至单次通过，计划改进工具调用可靠性、长时间命令支持、应用内渲染。加入预览见 `Claude Code` 文档。

混合推理模式：速度与质量的完美平衡

Claude 3.7 Sonnet 的核心创新之一是其混合推理模式。与传统模型的单一模式不同，Claude 3.7 允许开发者根据需求灵活选择推理模式，调节速度和答案质量之间的平衡。用户可以选择扩展思考模式，在解答复杂问题时不急于求成，反而允许 AI 在计算和推理上花更多时间，特别是在逐步推理的任务中。

例如，在处理复杂的数学问题或物理问题时，Claude 3.7 Sonnet 会展示思维链，帮助开发者更清晰地理解问题的解决过程。这种深度推理能力，对于编程和技术分析尤为重要。

编码能力：从基础到高级的全面提升

在编码领域，Claude 3.7 Sonnet 的表现无疑令人惊艳。它在多项基准测试中均表现优异，尤其在**SWE-bench Verified和TAU-bench**中，准确率和任务解决能力均超过了其他竞争模型。具体来说，Claude 3.7 在高计算模式下达到了 70.3% 的准确率，在没有脚手架的情况下也能维持 63.7% 的准确性，远超 Claude 3.5 Sonnet 和其他主流模型。

在实际应用中，Cursor 和 Cognition 等开发平台已经证明 Claude 3.7 在处理复杂代码库、全栈开发和代码更改规划时具有显著优势。特别是在重构大型代码库或进行全栈更新时，Claude 3.7 Sonnet 提供了极大的效率提升。

TAU

`Claude Code`：命令行工具引领开发新方式

作为 Claude 3.7 Sonnet 的一部分，Claude Code 是一款命令行工具，能够直接从终端执行复杂的编码任务，极大缩短了开发周期。开发者可以使用 Claude Code 来：

搜索和读取代码；
编辑文件并编写测试；
提交和推送代码至 GitHub。

通过减少手动操作，Claude Code 可以将原本需要 45 分钟以上完成的任务缩短至一次操作即可完成。这不仅大大提高了开发效率，还特别适用于测试驱动开发（TDD）、复杂问题的调试以及大规模代码重构。

目前，Claude Code 仍处于有限预览阶段，但它的潜力无疑是巨大的。Anthropic 正在计划进一步改进工具的可靠性、长时间命令支持和应用内渲染功能，以便为开发者提供更加流畅的体验。

可用性与定价

Claude 3.7 Sonnet 已在所有 Claude 计划中上线，包括免费、Pro、Team 和 Enterprise 级别。用户还可以通过 Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 访问该模型。定价上与前代模型相同，输入令牌费用为每百万 3 美元，输出令牌费用为每百万 15 美元。需要注意的是，扩展思考模式会消耗更多令牌，预算有限的开发者应考虑是否使用该模式。

安全性与可靠性

在安全性方面，Anthropic 对 Claude 3.7 Sonnet 进行了严格的测试。相比前代产品，Claude 3.7 减少了 45% 的不必要拒绝，并通过系统卡片对推理可信度进行了评估。特别是在应对提示注入攻击时，Claude 3.7 展现了更高的安全性，为开发者提供了更多的信心。

总结：`Claude 3.7 Sonnet`，开发者的必备工具

Claude 3.7 Sonnet 是一款颠覆性的 AI 模型，它通过混合推理能力和强大的编码支持，极大提升了开发者的工作效率。无论是加速编码任务、解决复杂问题，还是优化开发流程，它都能够提供极大的帮助。如果你是开发者，特别是从事全栈开发或 AI 相关工作的开发者，不妨亲自体验 Claude 3.7 Sonnet，它可能会成为你工作中不可或缺的利器。

引用： Claude 3.7 Sonnet and Claude Code

重磅发布：Claude 3.7 Sonnet 引领 AI 编码革命

Claude 3.7 Sonnet：全新智能与编码能力的结合