CodeX的use-computer技能初探

0 阅读2分钟

图片

什么是use-computer模式

最近啊,各家AI产品都开始整活了——Cloud Code、Code X、MiniMax、Maxi等可视化端产品,集体上线了一个叫use-computer的功能。简单来说,就是让AI能够代替你操作电脑

它的工作流程是这样的:

  1. 行为预知

    :AI先在自己的知识库里"想象"这个事情应该怎么做

  2. 开始执行

    :按照预设的步骤开始操作

  3. 等待反馈

    :因为UI界面不是实时反馈的,所以会设置等待时间

  4. 截图验证

    :执行完一步后,截图判断当前状态,决定下一步

听起来贼美好是不是?但实际体验下来嘛……

Cloud Code的另类玩法

说到Cloud Code,这玩意儿在国内是被封禁访问的。但如果你想体验它的桌面端程序,有个骚操作——打开开发者模式。模式就是使用第三方API驱动 Claude Desktop App。

具体的操作见网址:claude.com/docs/cowork…
理论上可以启用use-computer设置,但Cloud Code的桌面端我已经放弃了,现在主要使用它的终端程序,有兴趣的可以尝试一下留言反馈。

实际体验:一个字——慢!

我趁机使用了一下code X以及MiniMax的相关功能。
我第一次使用的时候,就简单打开一个编辑器,花了将近一分钟

为什么这么慢?

  • 大模型思考需要时间

  • 每一步操作后要截图判断

  • 等待UI反馈的固定延迟

  • 场景不稳定时还要反复尝试

唯一的好处是啥呢?就是在场景稳定、UI功能固定的前提下,这功能还是有实际使用场景的。

但token消耗嘛……那是相当可观。毕竟全程靠图像来判断行为逻辑。

我的思考

体验完这个技术之后,说实话我暂时没想到什么非用它不可的场景。

不过话说回来,任何技术都有自己的用武之地,就看大家怎么发挥想象力了。

如果想商业化大批量操作,那稳定性问题就大了去了。这也就是为什么现在CLI程序在AI领域更受欢迎的原因——简单、稳定、可控。

啊对,说到慢和不确定性,这不就是在形容我写代码的速度吗

图片


新人不易,欢迎大家强势关注 - 阿丰在长春━(`∀´)ノ亻!

如果是长春本地技术,可通过k9629@qq.com联系我,互通有无,一起成长。