不愧是 OpenAI 的最强对手,就在昨天,Anthropic 放出大动作:
→ 推出升级版 Claude 3.5 Sonnet;
→ 首发模型 Claude 3.5 Haiku;
→ 推出新功能——computer use(一个可以掌控电脑的 AI)。每一个都很厉害。
接下来,我们逐一为大家介绍。
01 Claude 3.5 Sonnet
新版的 Claude 3.5 Sonnet 模型,在跑分测试上,轻松超越了曾经的自己和 GPT-4o。在编程能力上,更是完全碾压其它模型。有意思的是,新版本的 Claude 3.5 Sonnet 知识库截止日期仍然是2024年4月。说明 Anthropic 是为其增加了强化学习的合成数据以及“计算机操控”训练。除此之外,最令人惊喜的是,新版本 Claude 3.5 Sonnet 模型已经可以在 Claude 账号上体验了。
02 Claude 3.5 Haiku
Claude 模型一直分为三个版本,分别是 Opus、Sonnet、Haiku。
这一次,Anthropic 放出的新模型就是——Claude 3.5 Haiku。作为 Claude 3.5 系列速度最快的版本,Haiku 对标的就是 GPT-4o mini 等敏捷系列的模型。从跑分情况上来看,Claude 3.5 Haiku 基本也做到了全面领先。
03 computer use
computer use(自动操控计算机),这应该是 Anthropic 丢出最令人惊艳的功能。用大白话来说:就是现在你可以指挥 Claude 操控电脑了! 无论是屏幕视觉、鼠标移动,还是点击、交互和文本输入等等都不在话下。这个功能是怎么实现的呢? 在 Anthropic 官方文档中,是这样介绍的:第一步:提供 Claude 操控电脑的工具和 prompt(如下图)。将 Anthropic 定义的电脑操控工具添加到 API 请求中,包括使用工具的 prompt。第二步:由 Claude 选择执行操作的工具。Claude 会辨别已有的工具,并评估是否有工具可以用于执行操作。如果有,Claude 就会提交一个工具使用请求。第三步:提取工具输入信息,运行工具并返回结果。第四步:Claude 继续调用工具,直到完成全部任务。这里,Claude 还可以实现“代理循环”——即使是在没有额外输入内容的情况下,它可以重复步骤3和4,直到完成复杂任务。比如,一句话,让电脑 自行搜索最适合的景点↓
又或者,输入需求,电脑自动为用户提供导航 ↓
……据官方介绍:这个功能还在测试中,有时很麻烦且容易出错。我们将提前发布 Computer Use 以征求开发人员的反馈,并预计该功能将随着时间的推移而迅速改进。
目前,想体验这个功能的话,只能通过 Api 使用。*
*最后,说说使用它们 Api 的价格:
在正常使用的情况下(Batch 半价): 输入:15/100万 token
如果选择提示缓存(此前Claude发布的prompt catching功能,能让输出token价格降到输入token的10%):
输入: 0.30 / 100万 token
感兴趣的小伙伴可以去试试,让你的电脑编程「AI 脑」。