Claude4 发布：可连续编程7小时，超长上下文！（附一些使用方案）Anthropic公司在2025年5月22日正式发

Anthropic公司在2025年5月22日正式发布了Claude模型的全新一代产品——Claude Opus 4和Claude Sonnet 4，这两款模型在编程能力、高级推理和AI代理方面树立了全新标准。这次升级不仅仅是简单的性能提升，而是代表着人工智能向真正的"思考机器"转变的重要里程碑。

随着这两款模型的发布，AI开发领域的竞争正式进入"超级计算力"与"高级认知"并重的新阶段，给所有开发者带来了全新的可能性和挑战。

Rakuten 通过一个要求严格的开源重构模型验证了其功能，该模型独立运行了 7 个小时，并保持了持续的性能。Cognition 指出，Opus 4 擅长解决其他模型无法解决的复杂挑战，能够成功处理先前模型遗漏的关键操作。

新版Claude一些特点

双模型并行，覆盖各类场景

Claude 4采用了双模型战略，Opus 4定位为旗舰顶级模型，而Sonnet 4则作为高性价比选择，两者共同构成了覆盖各类应用场景的完整解决方案。

Opus 4以"世界最佳编码模型"著称，在复杂长时间任务中展现持续卓越性能，能够连续工作数小时且保持高质量输出，这一特性使其特别适合需要长期专注的复杂开发项目。

基准测试：全面领先对手

在权威的软件工程能力评测中，Claude 4系列模型展示了令人印象深刻的表现，在多项关键指标上超越了包括Gemini 2.5 Pro在内的主要竞争对手。

• Opus 4: SWE-bench成绩达72.5% ，Terminal-bench达43.2%
• 高计算模式: Opus 4和Sonnet 4分别达到79.4%和80.2% 的成绩

在权威的软件工程能力评测中，Claude 4系列模型展示了令人印象深刻的表现，在多项关键指标上超越了包括Gemini 2.5 Pro在内的主要竞争对手。

• Opus 4: SWE-bench成绩达72.5% ，Terminal-bench达43.2%
• 高计算模式: Opus 4和Sonnet 4分别达到79.4%和80.2% 的成绩

思考与行动的无缝结合

Claude 4系列最令人兴奋的创新在于其"扩展思考与工具使用"能力，使模型能够在深度思考过程中灵活调用工具，形成思考-行动-再思考的闭环。

这种能力让AI不再局限于静态知识，而是可以主动获取信息、验证假设并根据新信息调整思路，极大地提升了解决复杂问题的能力和效率。

更值得注意的是，Claude 4还支持并行工具执行，可以同时处理多个任务，这意味着您的AI助手现在能够像真正的团队成员一样，同时推进多条工作线程。

记忆力突破

Claude Opus 4在记忆能力方面实现了革命性突破，当开发者提供本地文件访问权限时，它能够自主创建和维护"记忆文件"，存储关键信息并随时间构建知识库。

Claude Opus 4 能够“在《宝可梦》游戏中以智能体方式工作长达24 小时”，而此前模型最长只能玩45 分钟。Anthropic 甚至进行了一个名为“Claude Plays Pokémon”的Twitch 直播，展示了 Claude 3.7 Sonnet 在《宝可梦》游戏中的表现。

这项功能彻底改变了AI助手的使用方式，使其从短暂对话的参与者转变为能够保持长期任务意识的协作伙伴。

在实际测试中，Opus 4展示了令人惊叹的应用案例，例如在玩《宝可梦》游戏时自主创建导航指南，这表明其已具备某种形式的"持续学习"能力，可以在长期任务中积累经验并优化行为。

Claude Code正式面世

随着Claude Code的正式发布，Claude 4的强大能力被无缝集成到开发者的日常工作流程中，覆盖从命令行到集成开发环境的各个环节。

Claude Code允许开发者通过终端直接运行Anthropic模型执行特定任务，现已实现与集成开发环境（IDE）的深度整合，并推出软件开发工具包（SDK），使开发人员能将其与第三方应用程序对接。

Anthropic还发布了针对Microsoft VS Code、JetBrains系列IDE及GitHub的Claude Code扩展程序与连接器。其中GitHub连接器允许开发人员标记Claude Code以响应代码审查者的反馈意见，同时支持尝试修复代码中的错误或实施其他类型的自动化修改。

新推出的VS Code和JetBrains beta扩展让Claude的代码编辑建议直接显示在您的文件中，极大简化了代码审查和协作过程。

除了IDE集成外，Claude Code还提供了可扩展的SDK，允许开发者构建自己的AI代理和应用，同时推出的GitHub集成使得代码审查和修复变得异常简单，您只需在PR上标记Claude Code，它就能响应审阅者反馈、修复CI错误或进行代码修改。

不止于新模型

除新模型之外,Anthropic 还宣布了一系列新能力：

使用工具进行扩展思考（Beta 版）：两种新模型都可以在扩展思考过程中使用工具（如网络搜索），允许 Claude 在推理和工具使用之间交替选择，以提升模型输出效果。
新的模型能力：两种模型都可以并行使用工具，更精确地遵循指令。当开发人员授予其访问本地文件的权限时，它们会大幅提升记忆能力，提取和保存关键信息以保持连续性，并随着时间的推移构建隐性知识。
正式发布 Claude Code：Anthropic 扩展了开发人员与 Claude 的协作方式。Claude Code 现在支持通过 GitHub Actions 执行后台任务，并与 VS Code 和 JetBrains 原生集成，可直接在文件中显示编辑内容，从而实现无缝的结对编程。
新的 API 功能：Anthropic API 将发布四项新功能，让开发人员能够构建更强大的 AI 智能体：代码执行工具、MCP 连接器、Files API 以及 Prompt 缓存长达一小时的新功能。