绝了!不用写代码,用中文就能控制手机,我开源了一个让 Appium 瑟瑟发抖的 AI 神器

128 阅读4分钟

让 AI 帮你操作手机,这不是科幻,而是现实。

前言

demo_副本.gif 作为一名移动端开发/测试工程师,你是否遇到过这些痛点:

  • 📝 写自动化脚本太繁琐,各种 XPath、ID 定位让人头秃
  • 🎮 遇到游戏或自绘界面,传统工具直接躺平
  • 🔄 重复性测试工作消耗大量时间
  • 📱 Android 和 iOS 要维护两套代码

今天给大家分享一个我开源的项目 —— Mobile MCP AI,让你用自然语言就能控制手机!

一、什么是 Mobile MCP?

简单说,它是一个基于 MCP(Model Context Protocol)协议的移动端自动化工具,能让 Cursor AI 直接控制你的 Android/iOS 手机

💡 核心理念

你说中文 → Cursor AI 理解 → Mobile MCP 执行 → 手机操作完成

不需要写代码,不需要学习复杂的 API,直接用自然语言:

@MCP 打开微信,点击发现,再点朋友圈

就这么简单!

二、为什么选择 Mobile MCP?

1️⃣ 零门槛上手

一行命令安装:

pip install mobile-mcp-ai

配置 Cursor 后直接用,不需要任何 AI 密钥。

2️⃣ 双平台通吃

  • ✅ Android:开箱即用
  • ✅ iOS:完整支持(需 macOS)

同一套工具,两个平台都能玩。

3️⃣ 视觉 + 元素双引擎

普通 App:解析元素树,精准定位

@MCP 点击"登录"按钮

游戏/自绘界面:Cursor AI 分析截图,坐标定位

@MCP 截图,然后点击右下角的攻击按钮

两种模式无缝切换,覆盖所有场景!

4️⃣ 一键生成测试脚本

操作完成后,自动生成可复用的 pytest 脚本:

@MCP 把刚才的操作生成测试脚本

再也不用手写繁琐的测试代码了!

三、快速上手

Step 1:安装

pip install mobile-mcp-ai

Step 2:连接设备

Android:

# 开启 USB 调试,连接电脑
adb devices

iOS:

# 需要 macOS + WebDriverAgent
tidevice list

Step 3:配置 Cursor

编辑 ~/.cursor/mcp.json

{
  "mcpServers": {
    "mobile-automation": {
      "command": "mobile-mcp"
    }
  }
}

Step 4:开始使用!

在 Cursor 中输入:

@MCP 检查设备连接

看到成功提示就可以开始玩了!

四、实战演示

场景 1:App 自动化测试

@MCP 打开设置,点击 WLAN,截图看看当前页面

AI 会自动:

  1. 启动设置 App
  2. 找到并点击 WLAN
  3. 截图返回给你

场景 2:批量操作

@MCP 打开抖音,向上滑动 10

刷视频这种重复操作,交给 AI 就完事了。

场景 3:游戏辅助(仅供学习)

@MCP 截图看看当前游戏界面
@MCP 点击屏幕 (800, 500) 的位置

传统工具搞不定的游戏界面,通过视觉定位轻松解决。

场景 4:生成测试脚本

@MCP 清空操作历史
@MCP 启动计算器,点击 1,点击 +,点击 2,点击 =
@MCP 生成测试脚本,名称:计算器加法测试

自动生成带智能等待、广告处理的 pytest 脚本!

五、工具列表

Mobile MCP 提供了 20+ 个核心工具:

类别工具说明
📋mobile_list_elements列出页面元素
📸mobile_take_screenshot截图(支持压缩省 token)
👆mobile_click_by_text文本点击(推荐!)
👆mobile_click_by_idID 点击
👆mobile_click_at_coords坐标点击(游戏必备)
👆mobile_click_by_percent百分比点击(跨设备兼容)
⌨️mobile_input_text_by_id输入文本
👆mobile_swipe滑动操作
🚀mobile_launch_app启动应用
📝mobile_generate_test_script生成测试脚本

六、技术亮点

1. 智能压缩截图

截图默认压缩,省 token 省钱:

原图 PNG: 2048KB
压缩后 JPEG (720p): ~80KB
节省: 96%

2. 百分比坐标定位

# 屏幕正中央:(50%, 50%)
# 右下角:(85%, 90%)
@MCP 点击屏幕 50% 50% 的位置

一次录制,多设备回放!

3. 双模式元素定位

先查 XML 树 → 精确匹配 text/id → 坐标兜底

确保任何情况都能点到目标!

七、与同类工具对比

特性Mobile MCPAppiumUIAutomator2
学习成本⭐ 极低⭐⭐⭐⭐ 高⭐⭐⭐ 中
自然语言✅ 支持
游戏支持✅ 视觉定位⚠️ 有限⚠️ 有限
脚本生成✅ 自动❌ 手写❌ 手写
AI 驱动✅ Cursor

八、适用场景

  • 🧪 自动化测试:快速验证 App 功能
  • 📱 批量操作:重复性任务自动化
  • 🎮 游戏脚本:视觉定位解决自绘界面
  • 📊 数据采集:自动化信息收集
  • 🔧 开发调试:快速验证 UI 交互

九、开源地址

Gitee: gitee.com/chang-xinpi…

如果觉得有用,请给个 Star 支持一下!🌟

十、未来计划

  • 支持多设备同时操作
  • 增加图像对比断言
  • 支持更多 IDE(VS Code 等)
  • 录制回放增强

写在最后

Mobile MCP 的目标是让移动端自动化变得简单

不需要学习复杂的 API,不需要写繁琐的定位代码,用自然语言告诉 AI 你想做什么,剩下的交给它。

欢迎大家试用、提 Issue、提 PR!一起让这个工具变得更好用!


如果这篇文章对你有帮助,请点赞 👍 收藏 ⭐ 关注 ➕ 三连支持!

有问题可以评论区交流,或者添加微信一起讨论移动端自动化技术!