今天给大家推荐一个开源项目 AutoGLM-GUI,它为 AutoGLM 穿上了一层现代化的 Web 图形界面,不仅让 AI 操作手机变得可视化,更引入了定时任务、多设备管理、MCP 协议支持等生产力功能,直接将它从一个“实验品”进化为了“生产力工具”。 ✨ 核心痛点与解决方案 原生的 AutoGLM 虽然强大,但存在以下痛点:
- ❌ 无可视化界面:无法实时看到 AI 到底在手机上操作了什么。
- ❌ 部署繁琐:配置环境、依赖容易劝退新手。
- ❌ 难以持久运行:缺乏任务调度和长期后台运行机制。 AutoGLM-GUI 的解决方案:
- ✅ 实时屏幕镜像:集成了 scrcpy,低延迟实时预览手机画面。
- ✅ 对话式交互:像聊天一样指挥手机(“帮我给微信置顶的朋友发个晚安”)。
- ✅ 开箱即用:提供 Windows/macOS/Linux 桌面版安装包,零环境配置。
- ✅ 生产力增强:支持 Docker 部署、Cron 定时任务,实现 7x24 小时无人值守。 🔥 核心特性深度解析
- 🖥️ 现代化 Web 界面与实时操控 项目提供了一个清晰的左右分栏界面。左侧是设备列表和功能菜单,右侧是手机实时投屏。
- 所见即所得:你可以直接在 Web 界面上用鼠标点击、滑动手机屏幕,操作会实时同步到真机。
- 可视化反馈:AI 的每一步操作(点击坐标、输入文本)都会在屏幕上高亮显示,方便调试和监控。
- 🤖 强大的 AI 自动化能力
- 分层代理模式 (Layered Agent):引入了决策模型 + 视觉模型的双层架构。规划层负责拆解复杂任务,执行层负责精准点击,大大提高了复杂任务的成功率。
- Workflow 工作流:你可以预定义常用的任务流,一键快速执行,不用每次都重复输入 Prompt。
- ⏰ 生产力与无人值守 这是 v1.5 版本后的重大升级,让它不仅仅是个玩具:
- Cron 定时任务:支持设置定时规则,例如每天早上 8 点自动签到、定时清理消息等。
- Docker 一键部署:支持 x64 和 ARM64 架构,非常适合部署在服务器或 NAS 上,配合定时任务,打造你的专属“云手机管理员”。
- 🔌 MCP 协议支持 (黑科技) 这可能是开发者最兴奋的功能。AutoGLM-GUI 内置了 MCP (Model Context Protocol) 服务器。 这意味着你可以将它集成到 Claude Desktop、Cursor 或 VS Code 中。
- 场景:你在 Cursor 写代码累了,直接在编辑器里对 AI 说:“帮我点个外卖”,AI 就能通过 MCP 调用 AutoGLM-GUI 操作你的手机完成下单。
- 📱 极致的连接体验
- 无线配对:Android 11+ 设备支持扫码连接,无需数据线,只要在同一 WiFi 下即可控制。
- 多设备并发:支持同时连接和控制多台设备,每台设备的状态和对话历史完全隔离。 🛠️ 如何快速开始? 项目提供了多种安装方式,照顾了不同背景的用户。 方式一:桌面版(推荐小白用户) 直接在 GitHub Release 页面下载对应系统的安装包(exe/dmg/AppImage)。
- 内置了 Python、ADB 等所有依赖,下载即用。
- 启动后只需在设置中填入你的模型 API Key(支持智谱 BigModel、ModelScope 或自建 vLLM)。 方式二:Python 开发者 如果你习惯使用命令行,可以通过 pip 安装: pip install autoglm-gui
启动
autoglm-gui --base-url http://localhost:8080/v1
方式三:Docker 部署(适合服务器/NAS)
docker run -d --network host
-v autoglm_config:/root/.config/autoglm
ghcr.io/suyiiyii/autoglm-gui:main
推荐使用 host 网络模式,以便更方便地发现局域网内的安卓设备。 🧐 总结 AutoGLM-GUI 是目前体验最好的 AutoGLM 可视化方案之一。它不仅降低了使用门槛,还通过 MCP 和定时任务拓展了 AI Agent 的落地场景。 无论你是想做一个自动化的游戏脚本、自动化的社交媒体运营工具,还是单纯想体验一下“贾维斯”帮你玩手机的感觉,这个项目都非常值得一试。 🔗 立即体验:
- GitHub: github.com/suyiiyii/Au…
- 别忘了给作者点个 Star 🌟 支持一下! 本文内容基于 AutoGLM-GUI v1.5+ 版本撰写,具体功能以项目最新文档为准。