让 AI 帮你操作手机,这不是科幻,而是现实。
前言
作为一名移动端开发/测试工程师,你是否遇到过这些痛点:
- 📝 写自动化脚本太繁琐,各种 XPath、ID 定位让人头秃
- 🎮 遇到游戏或自绘界面,传统工具直接躺平
- 🔄 重复性测试工作消耗大量时间
- 📱 Android 和 iOS 要维护两套代码
今天给大家分享一个我开源的项目 —— Mobile MCP AI,让你用自然语言就能控制手机!
一、什么是 Mobile MCP?
简单说,它是一个基于 MCP(Model Context Protocol)协议的移动端自动化工具,能让 Cursor AI 直接控制你的 Android/iOS 手机。
💡 核心理念
你说中文 → Cursor AI 理解 → Mobile MCP 执行 → 手机操作完成
不需要写代码,不需要学习复杂的 API,直接用自然语言:
@MCP 打开微信,点击发现,再点朋友圈
就这么简单!
二、为什么选择 Mobile MCP?
1️⃣ 零门槛上手
一行命令安装:
pip install mobile-mcp-ai
配置 Cursor 后直接用,不需要任何 AI 密钥。
2️⃣ 双平台通吃
- ✅ Android:开箱即用
- ✅ iOS:完整支持(需 macOS)
同一套工具,两个平台都能玩。
3️⃣ 视觉 + 元素双引擎
普通 App:解析元素树,精准定位
@MCP 点击"登录"按钮
游戏/自绘界面:Cursor AI 分析截图,坐标定位
@MCP 截图,然后点击右下角的攻击按钮
两种模式无缝切换,覆盖所有场景!
4️⃣ 一键生成测试脚本
操作完成后,自动生成可复用的 pytest 脚本:
@MCP 把刚才的操作生成测试脚本
再也不用手写繁琐的测试代码了!
三、快速上手
Step 1:安装
pip install mobile-mcp-ai
Step 2:连接设备
Android:
# 开启 USB 调试,连接电脑
adb devices
iOS:
# 需要 macOS + WebDriverAgent
tidevice list
Step 3:配置 Cursor
编辑 ~/.cursor/mcp.json:
{
"mcpServers": {
"mobile-automation": {
"command": "mobile-mcp"
}
}
}
Step 4:开始使用!
在 Cursor 中输入:
@MCP 检查设备连接
看到成功提示就可以开始玩了!
四、实战演示
场景 1:App 自动化测试
@MCP 打开设置,点击 WLAN,截图看看当前页面
AI 会自动:
- 启动设置 App
- 找到并点击 WLAN
- 截图返回给你
场景 2:批量操作
@MCP 打开抖音,向上滑动 10 次
刷视频这种重复操作,交给 AI 就完事了。
场景 3:游戏辅助(仅供学习)
@MCP 截图看看当前游戏界面
@MCP 点击屏幕 (800, 500) 的位置
传统工具搞不定的游戏界面,通过视觉定位轻松解决。
场景 4:生成测试脚本
@MCP 清空操作历史
@MCP 启动计算器,点击 1,点击 +,点击 2,点击 =
@MCP 生成测试脚本,名称:计算器加法测试
自动生成带智能等待、广告处理的 pytest 脚本!
五、工具列表
Mobile MCP 提供了 20+ 个核心工具:
| 类别 | 工具 | 说明 |
|---|---|---|
| 📋 | mobile_list_elements | 列出页面元素 |
| 📸 | mobile_take_screenshot | 截图(支持压缩省 token) |
| 👆 | mobile_click_by_text | 文本点击(推荐!) |
| 👆 | mobile_click_by_id | ID 点击 |
| 👆 | mobile_click_at_coords | 坐标点击(游戏必备) |
| 👆 | mobile_click_by_percent | 百分比点击(跨设备兼容) |
| ⌨️ | mobile_input_text_by_id | 输入文本 |
| 👆 | mobile_swipe | 滑动操作 |
| 🚀 | mobile_launch_app | 启动应用 |
| 📝 | mobile_generate_test_script | 生成测试脚本 |
六、技术亮点
1. 智能压缩截图
截图默认压缩,省 token 省钱:
原图 PNG: 2048KB
压缩后 JPEG (720p): ~80KB
节省: 96%
2. 百分比坐标定位
# 屏幕正中央:(50%, 50%)
# 右下角:(85%, 90%)
@MCP 点击屏幕 50% 50% 的位置
一次录制,多设备回放!
3. 双模式元素定位
先查 XML 树 → 精确匹配 text/id → 坐标兜底
确保任何情况都能点到目标!
七、与同类工具对比
| 特性 | Mobile MCP | Appium | UIAutomator2 |
|---|---|---|---|
| 学习成本 | ⭐ 极低 | ⭐⭐⭐⭐ 高 | ⭐⭐⭐ 中 |
| 自然语言 | ✅ 支持 | ❌ | ❌ |
| 游戏支持 | ✅ 视觉定位 | ⚠️ 有限 | ⚠️ 有限 |
| 脚本生成 | ✅ 自动 | ❌ 手写 | ❌ 手写 |
| AI 驱动 | ✅ Cursor | ❌ | ❌ |
八、适用场景
- 🧪 自动化测试:快速验证 App 功能
- 📱 批量操作:重复性任务自动化
- 🎮 游戏脚本:视觉定位解决自绘界面
- 📊 数据采集:自动化信息收集
- 🔧 开发调试:快速验证 UI 交互
九、开源地址
⭐ Gitee: gitee.com/chang-xinpi…
如果觉得有用,请给个 Star 支持一下!🌟
十、未来计划
- 支持多设备同时操作
- 增加图像对比断言
- 支持更多 IDE(VS Code 等)
- 录制回放增强
写在最后
Mobile MCP 的目标是让移动端自动化变得简单。
不需要学习复杂的 API,不需要写繁琐的定位代码,用自然语言告诉 AI 你想做什么,剩下的交给它。
欢迎大家试用、提 Issue、提 PR!一起让这个工具变得更好用!
如果这篇文章对你有帮助,请点赞 👍 收藏 ⭐ 关注 ➕ 三连支持!
有问题可以评论区交流,或者添加微信一起讨论移动端自动化技术!