MCP Server
MCP(Model Context Protocol)Server 是 Playwright 的一个扩展组件,允许多个客户端(如测试脚本、调试工具、自动化服务等)同时连接并共享同一个 Playwright 实例,实现多用户协作、远程调试和高效资源利用。
MCP Server 通过结构化的可访问性快照(accessibility snapshot)与网页交互,避免了传统截图方式的歧义,提升了自动化的确定性和效率。
适用于需要多客户端协作、远程监控、并发测试等场景。
Playwright MCP介绍
Playwright MCP是微软官方推出的浏览器自动化服务器,基于 Playwright 框架。这个MCP能让AI大模型(如Copilot、Claude等)能够通过结构化数据与网页进行交互,实现自动化操作,无需依赖视觉模型或截图识别。
工作原理
Playwright MCP 通过浏览器的可访问性树(Accessibility Tree)获取网页结构信息,AI 可以直接读取和操作页面元素,实现点击、输入、导航等操作。相比传统的截图+坐标方式,结构化交互更高效、稳定且易于理解。
特点
- 快速、轻便 。使用 Playwright 的辅助功能树,而不是基于像素的输入。
- 对 LLM 友好 。无需视觉模型,完全基于结构化数据运行。
- 确定性工具应用程序 。避免了基于屏幕截图orc方法中。
主要功能
- 页面导航、前进/后退
- 元素点击、输入、悬停、拖拽
- 获取页面结构快照
- 截图、保存为 PDF
- 文件上传、下载
- 多标签页管理
- 网络请求、控制台日志获取
- 支持快照模式(结构化数据)和视觉模式(截图+坐标)
应用场景
- AI 助手自动化网页操作(如 Copilot、Claude 等)
- 自动化测试、数据采集、表单填写
- 无需视觉模型即可实现网页交互
- 文件上传下载、批量操作等自动化需求
sequential thinking
这里就不再介绍了,可以直接看这篇文章sequential thinking 效率翻倍。
cursor MCP配置
- 确保已安装 Node.js 18+
- 全局安装或临时运行 MCP 服务器: npm install -g @playwright/mcp # 或者使用下面指令 # npx @playwright/mcp@latest
- 在cursor中安装,可以直接点击安装 Playwright MCP。或者使用以下配置,手动进行安装。安装可以参考Cursor+MCP理论及配置 { "mcpServers": { "sequential-thinking": { "command": "npx", "args": [ "-y", "@modelcontextprotocol/server-sequential-thinking" ] }, "playwright": { "command": "npx @playwright/mcp@latest", "env": {} } } }
- 可选配置:如浏览器类型、端口、模式(快照/视觉)、持久化等,满足不同需求。各位看客可以自己配置哈。自定义配置看这里:官方文档
示例验证
小鱼给cursor的指令:
帮我查找看量子算法,并形成调研报告,注意遵循以下工作流程:
- 先用
sequential-thinking mcp进行思考,制定任务规划 - 然后调用
playwright mcp进行信息查找 - 最后再用
sequential-thinking mcp检查、总结和输出 - 如果方案存在不确定性,采用分支思考方式探索多种解决路径,分支思考请以“分支A/B/C”分别展开,并在后续步骤中可合并或对比。
这里输出的结果小鱼让AI美化处理了,输出成了html+TailWindCSS,效果非常不错。这里只是一个示例,或许你可以在开发中尝试一下,用这个提示词改下就可以用。
Playwright还可以用于自动化测试,这个应该才是Playwright常用的用法,小鱼把Playwright用于搜索网络资源才是大材小用了。
总结
Playwright与Sequential Thinking的结合,是小鱼的一次尝试,没想到如此好用。结合这两个MCP,小鱼使得AI具有了链式思维,实现对目标的多步决策与自动探索,大幅提升了「小鱼本鱼」的开发效率。
此时小鱼还在探索其他好用的MCP,发现了再写文章分享给各位看客。