重磅发布:claude 4 重登王位,国内免费通道限时开启!

254 阅读8分钟

在这里插入图片描述

零、前言

在这里插入图片描述 重磅新品: Anthropic 发布了全球最强大的 AI 大模型——Claude 4。

性能问鼎: Claude 4 被称为 Anthropic 迄今为止最强大的模型,也是全球最顶尖的编码模型。。

专属福利: 国内用户的 限时免费体验通道 现已开放。 (文末有体验码可直接使用)

虚竹哥系统已经集成了 Claude 4大模型(Claude Sonnet 4版本), 今天跟虚竹哥一起来测评这个大模型。

一、操作指南

操作指导

AI 平台国内直接访问地址:sass.xiaoxuzhu.cn/

在这里插入图片描述

输入授权码即可。

在这里插入图片描述

二、更新了啥

Claude 4 是一款全球领先的编码模型,在处理复杂、长时间运行的任务以及智能体工作流程方面展现出持续稳定的卓越表现。

作为 Claude Sonnet 3.7 的一次重大升级,Claude 4 在代码生成和推理方面实现了显著提升,同时能更精准地理解并执行用户指令。

这款模型采用混合架构,支持两种模式:快速响应模式和适用于深入推理的扩展思维模式。

在这里插入图片描述 大家迫不及待地开始上手体验,有网友称 Claude 4 仅用 30 秒就构建出了一个 CRM 仪表盘。 在这里插入图片描述 甚至有网友在 Cursor 中已经开始使用 Claude 4,并表示编程体验前所未有的顺畅。

在这里插入图片描述

Claude 一口气发布了这段时间积累的一系列新产品——

  • Claude 4 的混合模型,提供两种模式:几乎即时的响应和用于深度推理的扩展思考。

  • 扩展思考与工具使用(测试版):两款模型均能在扩展思考过程中灵活使用工具(例如网络搜索),实现推理与工具使用的无缝切换,从而提升响应质量。

  • 新的模型能力:两款模型可以并行使用工具,更精确地遵循指令,并且在开发者授权访问本地文件时,展现出显著增强的记忆力,能够提取、保存关键信息,保持连续性,并随着时间积累隐性知识。

  • Claude Code:支持通过 GitHub Actions 执行后台任务,并与 VS Code 和 JetBrains 原生集成,能够在文件中直接显示编辑内容,实现无缝配对编程。

  • 新的 API 能力:Anthropic API 增加了四项新功能,帮助开发者打造更强大的 AI 智能体——代码执行工具、MCP 连接器、文件 API,以及支持长达一小时的提示词缓存功能。

三、官网定价

什么人能在官网用上这次的新模型?

目前,订阅了Pro、Max、Team和Enterprise版的Claude用户,可以立即体验到这两款模型及扩展思考功能。

  • Pro 版:按年订阅为 17/月(一次性按年支付17/月(一次性按年支付 200);按月订阅为 $20/月
  • Max 版:按月每人最低 $100 起,可选择「5× Pro 用量」或「20× Pro 用量」两档;不含税,每月按用户计费
  • Team 版:按年订阅每人 25/月(需至少5名成员);按月订阅为25/月(需至少 5 名成员);按月订阅为 30/人·月,不含税
  • Enterprise 版:企业级定制方案,功能包括增强上下文窗口、单点登录 (SSO)、SCIM、审计日志等,具体定价需联系销售团队

开发者则可通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI调用。

而Claude 4的定价,也与此前保持一致:

Opus 4每百万Token为15美元(输入)/75美元(输出)

Sonnet 4每百万Token为3美元(输入)/15美元(输出)

四、Claude 4:AI编程新王登基

Claude 4 被称为 Anthropic 迄今为止最强大的模型,也是全球最顶尖的编码模型。

针对复杂的编程场景,Claude 4 做了许多优化:

• 跨文件编辑能力:模型能够识别项目结构,在多个文件之间同步修改,减少遗漏。 • 复杂指令执行:更精准地解析多条件、分步骤的请求。 • 长时间任务保持:具备强大的上下文记忆能力,适合执行耗时较长的流程。 • 逻辑完整性增强:在多步推理中,出现跳步或模板化回答的情况大幅减少。

在 SWE-bench 和 Terminal-bench 测试中,Claude 4 分别以 72.5% 和 43.2% 的得分领先,全面碾压了 OpenAI 刚发布的编程智能体 Codex-1 和最强推理模型 o3。

即便是在需要高度专注并执行数千步骤的长时间任务中,Claude 4 也能保持持续稳定的表现,连续工作数小时。 在这里插入图片描述 在这里插入图片描述 Claude 4 的发布极大拓展了 AI 智能体的能力边界,为众多前沿智能体产品提供了强有力的技术支撑:

  • Cursor:Claude 4 在编码能力上已达到业界顶尖水平,尤其在理解复杂代码库方面实现了突破性进展。
  • Replit:面对跨多个文件的复杂更改任务,Claude 4 的精度显著提升,表现出了出色的稳定性。
  • Block:在其「goose」智能体中,Claude 4 是首个在代码编辑和调试过程中,既能提升代码质量,又能保持完整性能和高可靠性的模型。
  • Rakuten:Claude 4 成功完成了一项严苛的开源代码重构任务,在长达 7 小时的独立运行过程中始终保持稳定表现。
  • Cognition:Claude 4 善于处理其他模型难以解决的复杂问题,成功完成了多个先前模型未能完成的关键任务。

在 Claude Sonnet 3.7 已具备行业领先性能的基础上,Claude Sonnet 4 又取得了显著进步:

在 SWE-bench 测试中,Sonnet 4 取得了高达 72.7% 的优异成绩,展现出极强的编码能力。

同时,Sonnet 4 在内部和外部的实际应用中实现了性能与效率的高度平衡,具备更强的可控性和适应性。

五、Anthropic:引爆推理革命

这意味着,Anthropic 正式加入了 2025 年推理模型大战!

2025 年,AI 行业的一大趋势是全面转向推理型模型。这类模型不再只是基于训练数据进行简单的模式匹配,而是在做出反应前,系统地分析问题、模拟类人的思维流程。

自去年 12 月 OpenAI 推出 o 系列模型,正式打响推理大战的第一枪后,谷歌紧随其后发布了 Gemini 2.5 Pro,并引入实验性的“深度思考”功能;接着 DeepSeek-R1 也以其强劲性能和极高性价比迅速占领了市场。

如今,AI 的使用方式已发生深刻变革。

这一次,Anthropic 通过将工具使用深度融合进推理过程,为推理模型大战带来了颠覆性的创新。

与传统先收集信息、再分析判断的流程不同,Claude 4 采用了同步研究与推理的方式,更贴近人类的认知模式。

在推理过程中,Claude 4 可以暂停思考、实时查找信息,并将新获得的数据融入到当前的分析中,带来了更加自然、高效的交互体验。

六、模型改进:不偷懒,记性好

Anthropic 显著减少了模型在完成任务时走捷径或利用漏洞的行为。

在某些 AI 智能体任务中,模型往往容易采取捷径,但这次的两款新模型在此类行为的发生概率上,比 Sonnet 3.7 低了 65%。

在记忆能力方面,Claude 4 也远超所有先前模型。

当开发者授予 Claude 本地文件访问权限时,Claude 4 能够熟练创建并管理用于存储关键信息的“记忆文件”,从而提升其在长时间任务中的感知能力、连贯性以及整体表现。

一个显著的例子是,Claude 4 在玩《宝可梦》时,能够创建并使用“导航指南”来增强游戏体验。

此外,团队为 Claude 4 引入了思考摘要功能,通过一个较小的模型来简化冗长的思考过程。

需要注意的是,这项功能只在约 5% 的情况下启用,因为大多数思考过程本身已经足够简洁、能够完整呈现。 在这里插入图片描述

七、网友实测:简直疯狂

动作迅速的网友们已经开始实际测试。

例如,使用 Claude 4 构建一个 CRM 仪表板仅用了 30 秒,速度之快令人震惊。 在这里插入图片描述 连续 7 小时不间断编程,标志着 AI 大模型能力发展历程中的一个重要分水岭。 在这里插入图片描述 只需一个提示,一次交互,Claude 4 就能构建出一个可运行的浏览器智能体,涵盖 API 和前端。

网友惊叹:太不可思议了,我从未见过这样的场面! 在这里插入图片描述

八、感受

Claude 4 不仅再次刷新了我们对 AI 大模型能力的认知,更让人切身感受到:未来已来,智能体不再是想象中的助手,而是随时可用的“得力伙伴”。 无论是跨文件协同优化、长流程记忆衔接,还是即刻响应与深度思考的无缝切换,都彰显了 Anthropic 对“人机共创”理念的深刻洞察。 现在,就让我们见证 AI 智能如何在更多场景中掀起新一轮生产力飞跃!

有提供免费的授权码可体验~

有提供免费的授权码可体验~

有提供免费的授权码可体验~

机不可失,时不再来!立即使用下面的信息,亲身感受 Claude 4 的非凡能力吧!

体验平台:sass.xiaoxuzhu.cn/

限时免费授权码:77c220c9-77c220da-77c220e4-77c22116-77c2211a

如果过期,私信虚竹哥,获取体验码~

国内可直接使用~ 在这里插入图片描述

我是虚竹哥,目标是带十万人玩转AI。