来了,Claude再进化!编程能力超越GPT,还能一键操控电脑!

228 阅读2分钟

不愧是 OpenAI 的最强对手,就在昨天,Anthropic 放出大动作:

→ 推出升级版 Claude 3.5 Sonnet;
→ 首发模型 Claude 3.5 Haiku
→ 推出新功能——computer use(一个可以掌控电脑的 AI)。每一个都很厉害。 图片接下来,我们逐一为大家介绍。

01 Claude 3.5 Sonnet 新版的 Claude 3.5 Sonnet 模型,在跑分测试上,轻松超越了曾经的自己和 GPT-4o。在编程能力上,更是完全碾压其它模型。图片有意思的是,新版本的 Claude 3.5 Sonnet 知识库截止日期仍然是2024年4月。说明 Anthropic 是为其增加了强化学习的合成数据以及“计算机操控”训练。除此之外,最令人惊喜的是,新版本 Claude 3.5 Sonnet 模型已经可以在 Claude 账号上体验了。图片

02 Claude 3.5 Haiku Claude 模型一直分为三个版本,分别是 Opus、Sonnet、Haiku。
这一次,Anthropic 放出的新模型就是——Claude 3.5 Haiku。作为 Claude 3.5 系列速度最快的版本,Haiku 对标的就是 GPT-4o mini 等敏捷系列的模型。图片从跑分情况上来看,Claude 3.5 Haiku 基本也做到了全面领先。

03 computer use computer use(自动操控计算机),这应该是 Anthropic 丢出最令人惊艳的功能。用大白话来说:就是现在你可以指挥 Claude 操控电脑了! 无论是屏幕视觉、鼠标移动,还是点击、交互和文本输入等等都不在话下。这个功能是怎么实现的呢? 在 Anthropic 官方文档中,是这样介绍的:第一步:提供 Claude 操控电脑的工具和 prompt(如下图)。图片将 Anthropic 定义的电脑操控工具添加到 API 请求中,包括使用工具的 prompt。第二步:由 Claude 选择执行操作的工具。Claude 会辨别已有的工具,并评估是否有工具可以用于执行操作。如果有,Claude 就会提交一个工具使用请求。第三步:提取工具输入信息,运行工具并返回结果。第四步:Claude 继续调用工具,直到完成全部任务。这里,Claude 还可以实现“代理循环”——即使是在没有额外输入内容的情况下,它可以重复步骤3和4,直到完成复杂任务。比如,一句话,让电脑 自行搜索最适合的景点

图片

又或者,输入需求,电脑自动为用户提供导航

图片

……据官方介绍:这个功能还在测试中,有时很麻烦且容易出错。我们将提前发布 Computer Use 以征求开发人员的反馈,并预计该功能将随着时间的推移而迅速改进。 目前,想体验这个功能的话,只能通过 Api 使用。*
*最后,说说使用它们 Api 的价格

在正常使用的情况下(Batch 半价): 输入:3/100token输出:3/100万 token 输出:15/100万 token

如果选择提示缓存(此前Claude发布的prompt catching功能,能让输出token价格降到输入token的10%):
输入: 3.75/100token输出:3.75 / 100万 token 输出:0.30 / 100万 token

感兴趣的小伙伴可以去试试,让你的电脑编程「AI 脑」。