什么是use-computer模式
最近啊,各家AI产品都开始整活了——Cloud Code、Code X、MiniMax、Maxi等可视化端产品,集体上线了一个叫use-computer的功能。简单来说,就是让AI能够代替你操作电脑。
它的工作流程是这样的:
-
行为预知
:AI先在自己的知识库里"想象"这个事情应该怎么做
-
开始执行
:按照预设的步骤开始操作
-
等待反馈
:因为UI界面不是实时反馈的,所以会设置等待时间
-
截图验证
:执行完一步后,截图判断当前状态,决定下一步
听起来贼美好是不是?但实际体验下来嘛……
Cloud Code的另类玩法
说到Cloud Code,这玩意儿在国内是被封禁访问的。但如果你想体验它的桌面端程序,有个骚操作——打开开发者模式。模式就是使用第三方API驱动 Claude Desktop App。
具体的操作见网址:claude.com/docs/cowork…
理论上可以启用use-computer设置,但Cloud Code的桌面端我已经放弃了,现在主要使用它的终端程序,有兴趣的可以尝试一下留言反馈。
实际体验:一个字——慢!
我趁机使用了一下code X以及MiniMax的相关功能。
我第一次使用的时候,就简单打开一个编辑器,花了将近一分钟。
为什么这么慢?
-
大模型思考需要时间
-
每一步操作后要截图判断
-
等待UI反馈的固定延迟
-
场景不稳定时还要反复尝试
唯一的好处是啥呢?就是在场景稳定、UI功能固定的前提下,这功能还是有实际使用场景的。
但token消耗嘛……那是相当可观。毕竟全程靠图像来判断行为逻辑。
我的思考
体验完这个技术之后,说实话我暂时没想到什么非用它不可的场景。
不过话说回来,任何技术都有自己的用武之地,就看大家怎么发挥想象力了。
如果想商业化大批量操作,那稳定性问题就大了去了。这也就是为什么现在CLI程序在AI领域更受欢迎的原因——简单、稳定、可控。
啊对,说到慢和不确定性,这不就是在形容我写代码的速度吗
新人不易,欢迎大家强势关注 - 阿丰在长春━(`∀´)ノ亻!
如果是长春本地技术,可通过k9629@qq.com联系我,互通有无,一起成长。