Claude4 发布:可连续编程7小时,超长上下文!(附一些使用方案)

0 阅读9分钟

Anthropic公司在2025年5月22日正式发布了Claude模型的全新一代产品——Claude Opus 4和Claude Sonnet 4,这两款模型在编程能力高级推理AI代理方面树立了全新标准。这次升级不仅仅是简单的性能提升,而是代表着人工智能向真正的"思考机器"转变的重要里程碑。

随着这两款模型的发布,AI开发领域的竞争正式进入"超级计算力"与"高级认知"并重的新阶段,给所有开发者带来了全新的可能性和挑战。

Rakuten 通过一个要求严格的开源重构模型验证了其功能,该模型独立运行了 7 个小时,并保持了持续的性能。Cognition 指出,Opus 4 擅长解决其他模型无法解决的复杂挑战,能够成功处理先前模型遗漏的关键操作。

新版Claude一些特点

双模型并行,覆盖各类场景

Claude 4采用了双模型战略,Opus 4定位为旗舰顶级模型,而Sonnet 4则作为高性价比选择,两者共同构成了覆盖各类应用场景的完整解决方案。

Opus 4以"世界最佳编码模型"著称,在复杂长时间任务中展现持续卓越性能,能够连续工作数小时且保持高质量输出,这一特性使其特别适合需要长期专注的复杂开发项目。

基准测试:全面领先对手

在权威的软件工程能力评测中,Claude 4系列模型展示了令人印象深刻的表现,在多项关键指标上超越了包括Gemini 2.5 Pro在内的主要竞争对手。

  • Opus 4: SWE-bench成绩达72.5% ,Terminal-bench达43.2%
  • 高计算模式: Opus 4和Sonnet 4分别达到79.4%和80.2% 的成绩

在权威的软件工程能力评测中,Claude 4系列模型展示了令人印象深刻的表现,在多项关键指标上超越了包括Gemini 2.5 Pro在内的主要竞争对手。

  • Opus 4: SWE-bench成绩达72.5% ,Terminal-bench达43.2%
  • 高计算模式: Opus 4和Sonnet 4分别达到79.4%和80.2% 的成绩

思考与行动的无缝结合

Claude 4系列最令人兴奋的创新在于其"扩展思考与工具使用"能力,使模型能够在深度思考过程中灵活调用工具,形成思考-行动-再思考的闭环。

这种能力让AI不再局限于静态知识,而是可以主动获取信息、验证假设并根据新信息调整思路,极大地提升了解决复杂问题的能力和效率。

更值得注意的是,Claude 4还支持并行工具执行,可以同时处理多个任务,这意味着您的AI助手现在能够像真正的团队成员一样,同时推进多条工作线程。

记忆力突破

Claude Opus 4在记忆能力方面实现了革命性突破,当开发者提供本地文件访问权限时,它能够自主创建和维护"记忆文件",存储关键信息并随时间构建知识库。

Claude Opus 4 能够“在《宝可梦》游戏中以智能体方式工作长达24 小时”,而此前模型最长只能玩45 分钟。Anthropic 甚至进行了一个名为“Claude Plays Pokémon”的Twitch 直播,展示了 Claude 3.7 Sonnet 在《宝可梦》游戏中的表现。

这项功能彻底改变了AI助手的使用方式,使其从短暂对话的参与者转变为能够保持长期任务意识的协作伙伴。

在实际测试中,Opus 4展示了令人惊叹的应用案例,例如在玩《宝可梦》游戏时自主创建导航指南,这表明其已具备某种形式的"持续学习"能力,可以在长期任务中积累经验并优化行为。

Claude Code正式面世

随着Claude Code的正式发布,Claude 4的强大能力被无缝集成到开发者的日常工作流程中,覆盖从命令行到集成开发环境的各个环节。

Claude Code允许开发者通过终端直接运行Anthropic模型执行特定任务,现已实现与集成开发环境(IDE)的深度整合,并推出软件开发工具包(SDK),使开发人员能将其与第三方应用程序对接。

Anthropic还发布了针对Microsoft VS Code、JetBrains系列IDE及GitHub的Claude Code扩展程序与连接器。其中GitHub连接器允许开发人员标记Claude Code以响应代码审查者的反馈意见,同时支持尝试修复代码中的错误或实施其他类型的自动化修改。

新推出的VS CodeJetBrains beta扩展让Claude的代码编辑建议直接显示在您的文件中,极大简化了代码审查和协作过程。

除了IDE集成外,Claude Code还提供了可扩展的SDK,允许开发者构建自己的AI代理和应用,同时推出的GitHub集成使得代码审查和修复变得异常简单,您只需在PR上标记Claude Code,它就能响应审阅者反馈、修复CI错误或进行代码修改。

不止于新模型

除新模型之外,Anthropic 还宣布了一系列新能力:

  • 使用工具进行扩展思考(Beta 版):两种新模型都可以在扩展思考过程中使用工具(如网络搜索),允许 Claude 在推理和工具使用之间交替选择,以提升模型输出效果。
  • 新的模型能力:两种模型都可以并行使用工具,更精确地遵循指令。当开发人员授予其访问本地文件的权限时,它们会大幅提升记忆能力,提取和保存关键信息以保持连续性,并随着时间的推移构建隐性知识。
  • 正式发布 Claude Code:Anthropic 扩展了开发人员与 Claude 的协作方式。Claude Code 现在支持通过 GitHub Actions 执行后台任务,并与 VS Code 和 JetBrains 原生集成,可直接在文件中显示编辑内容,从而实现无缝的结对编程。
  • 新的 API 功能:Anthropic API 将发布四项新功能,让开发人员能够构建更强大的 AI 智能体:代码执行工具、MCP 连接器、Files API 以及 Prompt 缓存长达一小时的新功能。

一些使用方式:

千言万语不如你实际体验,这边也分享一些使用方式:

1、Claude

Claude 官网的必然要放在第一位。

免费可用,使用次数(rate limit)对于尝鲜来说绰绰有余,甚至完成一个小任务也够;网页、iOS 和安卓 App 都可以用,历史数据还能云端同步。

然而,免费当然意味着功能上的限制,比如 Claude 4 Sonnet 次数不是很多,上下文长度和输出长度也有限制。此外,对IP要求高,有封号风险,不过近期还好。

使用地址:claude.ai

注意事项:如出现APP unavailable 情况点此解决

2、Salck

大佬通过Claude官网的API在Slack配置的一个应用,加入他的Slack工作区就能直接使用Claude3模型。而且工作区里面还有OpenAI模型可以使用。目前Slack可以在电脑、手机、网页使用,可以说是很方便了。

注意,加入工作区一般需要使用国际邮箱,用微软的outlook邮箱就好了。首次加入需特殊环境(需自行准备) 。加入完进入工作区在频道@Claude 应用即可。

工作区加入链接: h5ma.cn/jxn

3、Poe

Poe 的优势是背靠大厂(北美知乎 Quora),稳定可靠。

可白嫖,每用户每天免费赠送3000积分,每次对话消耗不等的积分,具体依模型而定。

但由于 Poe 几个月前更新了积分消耗机制,和顶级模型对话消耗的积分变多。如果想白嫖就多准备几个账号,换号使用,但是需要海外环境才能使用的喔。

使用地址:poe.com

4、CS站

国内最大的镜像站,目前接入Claude、OpenAI、DeepSeek等模型

主要是以OpenAI为主的平台,但是Claude账号也大概有100多个。主要特点的话,就是国内可以使用。其他就没什么了。(激活码获取:发任意邮件到chatshare@126.com

使用的话需要注册登录,使用激活码订阅完成就能使用全系列模型。不多做介绍,具体看下面网站介绍吧。

使用地址:chatshare.biz

网站介绍:h5ma.cn/chatshare1

5.、Cursor

如果你是开发者,那就极力推荐你使用Cursor,最好的编程工具和最好的编程模型都能使用,直接原地起飞。

传送门:www.cursor.com/cn

6、Trae

字节跳动旗下的 AI 代码编辑工具,类似于 Cursor。

目前支持 macOS 和 Windows 两个客户端,未来会添加对 Linux 的支持。虽然在功能完善程度以及实际体验上比不上 Cursor,但毕竟 Trae 今年 1 月才刚刚正式上线,还很新。

使用地址:www.trae.ai/

7、官网API

入口:www.anthropic.com/api

一次充最低的$5即可,封号如果不给退款,大不了不要了,也损失不了多少。

8、Sider

一款浏览器插件,你可以在Edge浏览器和Chrome浏览器中安装它。

接入官方模型,为用户提供无需科学上网、稳定快速的服务。目前支持OpenAI、Gemini、Claude系列模型等等,可在国内使用。

浏览器插件直接官网下载对应插件就能使用,比较简单就不展开了。

使用地址: sider.ai/invited?c=c…

9、Lmsys

一个海外的模型对比平台,可以无限制使用Claude4系列模型。

进入竞技场后点击DIRCTChat,然后选择Claude4模型就好。

需要注意的是,模型竞技场有些时候会因为没有次数额度下架Claude4模型使用。你可以去试试看,如果没有的该模型选项的话,晚会再进去试试。

使用地址:h5ma.cn/Claude3

10、OpenRouter

一款优秀的大模型API平台,部署了很多优秀的大模型,包括Claude4、Gemma 7B、Gemini、GPT4等,打开官网,选相应方式注册登录即可使用

使用地址:openrouter.ai/