Claude 3.5 重磅发布:AI 能自主操控电脑了!

734 阅读3分钟

大家好,我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也是一名 AIGC 爱好者,持续分享前沿的「AI工具」和「AI 副业玩法」,期待和大家一起交流~

AI 能自己操控电脑了! 看了 Claude 官方发布的视频,还是挺让人眼前一亮的。

图片

Anthropic 宣布推出了升级版的 Claude 3.5 Sonnet 和全新的 Claude 3.5 Haiku。

图片

在性能、性价比、速度、编程领域的表现等方面,都有了全面的提升。更详细的数据,大家可以移步官网,这里就不做过多介绍了。

图片

因为比起这些,这次发布更大的亮点,当属让 Claude 模仿人类使用电脑这一新功能。

它允许开发者指导 Claude 像人类一样操作电脑,包括看屏幕、移动光标、点击按钮和输入文本等。

可能这么说大家还不太明白,直接看官方的演示例子:

www.anthropic.com/news/3-5-mo…

图片

案例中讲的是:一家设备公司要求填写供应商申请表(下图右侧)。而要填写这张表格的数据,分散在电脑的各个地方。

我们要做的是,让 Claude 先查看电子表格(左图),检查其中是否有该公司的信息。如果没有,则转到客户关系管理系统,尝试在那里找到更多信息来填写表格。

图片

将要求发送给 Claude,Claude 就开始自动为我们工作了!

图片

来看看 Claude 是怎么做的。

首先 Claude 开始截图我们的屏幕,并迅速意识到,该设备公司实际上并不在电子表格中。

所以它做的第一件事就是:跳转到客户关系管理系统,并搜索该公司。(如下图)

这一切全部不需要人为干预,全部由 AI 自动在做。

图片

Claude 通过检索,找到了该设备公司。

然后 Claude 就开始滚动页面,依次寻找填写表单所需的所有信息。并将信息自动填写到右侧的表单中。

Claude 完成填写所有需要的信息后,最终自动提交表单。

图片

在这个过程中,我们不需要做任何事情。 下面这些操作,完全由 Claude 自动完成:

也就是说,查看屏幕、检索电子表格的数据、移动光标、点击鼠标、打开客户关系管理系统、输入文本、滚动屏幕等等,全部由 Claude 自主完成。

这仅仅是举了一个简单的例子。

如果说之前 AI 扮演的角色是我们提出问题,AI 告诉我们怎么做,我们来执行。那现在是,AI 直接自己撸起袖子开始干了!

AI 一年,人间十年。

在未来,AI 能为我们做的事,会越来越多,生产力也将大幅提升。

一些重复性的工作,将会被逐步被代替。同时也意味着,各行各业,将会迎来新的改变机会。

参考链接:

www.anthropic.com/news/3-5-mo…


觉得文章有帮助,请帮忙点赞收藏关注一下呦~

我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也是一名 AIGC 爱好者,欢迎一起交流~