如何自己实现一个 Manus 呢?

7 阅读1分钟

如何自己实现一个 Manus 呢?

Manus 最有技术难度的就是它的云电脑部分。

也就是 Agent 跑任务的时候,可以用云端电脑的浏览器来浏览网页,远程控制它做各种操作

这个的原理是远程通过 docker 跑个新的容器,里面用 xvfb 做虚拟的图形界面

然后安装 Chromium,它可以在 Xvfb 画界面

用 x11vnc 把这个图形界面通过 VNC 协议传给客户端

最后用 websockify 把 VNC 协议转成 WebSocket 协议

这样就可以 websocket 连接 docker 容器里的 ws 服务拿到屏幕截图了

之后可以让大模型识别这个截图,用 cdp 远程连上 docker 容器里的 Chromium,走 cdp 协议来操作浏览器

这就是 Manus 最核心的云电脑的实现原理

其他的功能都是 Agent 的常见功能。

最近把这个云电脑实现一下,我们 前端转 AI Agent 全栈通关秘籍 第一个项目可以先做这个实现 Manus