AI驱动：从运营行为到自动化用例的智能化实践｜得物技术致力于构建一套自动化 + 智能化的 E2E 测试方案，该方案旨在支

一、项目背景

随着交易业务的快速增长，对质量保障工作提出了更高标准与全新要求。为提升研发体验和架构升级，大量后台页面经历从 Vue -> React -> 全栈的迁移过程。业务演进过程中，后台能力持续迭代与优化；团队在交付新能力的同时，同步保障存量链路的稳定与可预期行为。为进一步完善测试用例覆盖范围，高效支撑回归测试与重构验证工作，需通过技术手段升级质量保障模式，为业务与架构迭代提供更充分的质量支撑。

E2E 测试： 即端到端测试，是一种从用户视角出发，模拟真实操作验证应用完整业务流程的自动化测试方法。自动化生成用例： 用线上内部运营操作日志自动生成 E2E 测试用例，快速覆盖核心流程，解决用例缺失问题。智能元素定位： 自动识别重构等场景 UI 变化并调整定位策略，实现维护流程的自动化。平台化管理： 通过数据看板管理用例和执行结果，让 E2E 测试可追踪、可优化，提升测试效率。

基于以上分析，我们致力于构建一套自动化 + 智能化的 E2E 测试方案，该方案旨在支撑快速迭代开发模式，有效应对用例覆盖与重构验证等场景，从而在现有资源条件下，持续为业务快速迭代和技术架构升级提供可靠的质量保障。

二、价值收益

提供基于线上真实运营行为的自动化 E2E 测试能力，能够实际发现页面线上/重构等场景的体验问题。在页面重构等迭代任务中，通过优化回归测试流程与资源分配，有效进一步提升测试支持效率。测试的页面代码覆盖率≥X%；无代码覆盖率场景步骤执行成功率≥X%。

页面代码覆盖率：页面用例在测试过程中运行的代码行数 / 该页面关联的所有代码行数 * 100%步骤执行成功率：页面用例在测试过程中执行成功的步骤数 / 用例总步骤数 * 100%。

三、方案选型

传统 E2E（DOM）

	名词解释	核心差异
传统 E2E	基于 DOM 的测试方案，主要通过操作和验证浏览器中的页面元素，来模拟用户行为的测试方案。	定位方式：依赖 XPath/CSS 选择器。用例生成：手动编写或录制。维护成本：高（DOM 变化需手动更新用例）。

AI E2E

	名词解释	核心差异
AI E2E	指利用人工智能技术，增强传统 E2E 测试的智能化、自适应性和效率的测试方案。	定位方式：视觉识别、语义化分析（如按钮文本、图标）。用例生成：自动生成（基于用户行为日志或需求描述）。维护成本：低（AI 自动适应 UI 变化）。

方案对比

传统 E2E 优势： 贴近真实用户操作：实际触发页面渲染和事件。跨页面流程验证：适合测试多步骤业务场景（如登录→下单）。传统 E2E 劣势： 脆弱性：DOM 结构变化易导致用例失败（需频繁维护定位表达式）。执行速度慢：依赖浏览器渲染和网络请求。

AI E2E 优势： 降低维护成本：减少因 UI 微调导致的用例失败。提升覆盖率：AI 可探索非预期路径（如异常输入）。AI E2E 劣势： 黑盒性：AI 决策过程不透明，调试困难。高成本：需积累足够数据优化模型，复杂视觉处理需要更高性能。

基于上述对比分析，我们选用 AI 驱动的 E2E 测试方案，能够在支持重构场景的同时，显著提升用例生成的自动化水平，从而形成高效可持续的自动化测试解决方案。

四、AI 工具选型

	特征
Midscene	原生 JavaScript + WebExtensions API；开源 AI 驱动 UI 自动化工具；支持 Playwright、Puppeteer 定制行为逻辑；支持 Dom 分析和视觉分析，如 Qwen-vl、Chain-vl。
browser-use	Python + 大语言模型（LLM）+ 浏览器驱动；基于 Playwright；同时支持视觉和非视觉模型；同时支持 DOM 分析和视觉分析。

Midscene优点： 基于 JS 技术栈，前端友好，开发成本较低；支持 Playwright、Puppeteer 定制行为逻辑；公开渠道反馈与迭代节奏相对清晰；支持 DOM 与视觉多模态分析。如上优点对工程化落地更友好。Midscene缺点： 调用视觉/大模型时存在 Token 消耗与成本。

browser-use优点： 支持 Playwright 定制行为逻辑；支持 DOM 与视觉分析，能力面较全。browser-use缺点： 同样存在 Token 消耗与成本；基于 Python 技术栈，有开发语言熟悉成本。

综合评估后采用 Midscene，主要考量：与现有技术栈匹配： 以 JavaScript 为主，便于与前端工程、现有工具链协同，降低接入与维护成本。能力与扩展方式符合需求： 支持 DOM 与视觉等多路径信息输入，并可在需要时用 Puppeteer / Playwright 补充确定性、可编排的自动化逻辑，覆盖模型不稳定或不适用的环节。工程化与定制空间： 定制与扩展路径清晰，便于按业务拆解控制流、做兜底与回归，贴合当前团队的交付方式。