从脚本到平台:我用 Playwright + FastAPI + Streamlit 打造 AI Browser Agent Workflow

3 阅读3分钟

最近我把自己的第二个核心项目,正式升级成了一个 AI Browser Agent Workflow Platform

它已经不再只是一个简单的网页抓取脚本,而是一个具备:

  1. 浏览器自动化采集
  2. 任务生命周期管理
  3. AI 分析结果沉淀
  4. FastAPI 服务化接口
  5. Streamlit 可视化 Dashboard
  6. 历史任务追踪与趋势分析

的一体化 Agent Workflow 平台。

这个项目的核心目标很明确:

把“浏览器自动化 + AI 分析”从一次性脚本,升级成可运行、可观察、可扩展的平台级工程项目。


一、项目最终效果展示

目前整个项目已经完成 Dashboard v3 重构,前后端链路全部跑通。

首页 Dashboard 支持:

  • 核心指标总览
  • 任务运行趋势
  • 分类统计分析
  • 历史任务表格
  • AI 工作区结果查看

01-dashboard-overview.png


二、为什么要从脚本升级成平台

最开始这个项目只是一个简单的 Playwright 自动化抓取器。

初始链路只有:

Playwright → 页面抓取 → JSON 输出

它能跑,但工程上问题很多:

  1. 无法管理多次任务运行
  2. 无法追踪任务状态
  3. 无法沉淀历史结果
  4. 无法对接前端
  5. 缺少产品化展示能力

所以我决定做一次完整的平台化升级。

目标是让它具备:

Browser Agent + Task System + API Service + Dashboard

完整闭环。


三、Dashboard 可视化设计

这一版我重点打磨的是前端 Dashboard 的产品感。

1)首页总览层

通过 Metrics Cards 展示:

  • Total Tasks
  • Success Rate
  • Active Workflows
  • Average Runtime

同时增加趋势图与任务分布。

02-trend-analysis-panel.png


2)分类统计层

为了让任务分析更直观,我增加了分类历史统计面板。

可以快速观察:

  • 任务类型分布
  • 各类任务执行次数
  • 历史分类变化趋势

03-category-history-panel.png

3)任务生命周期层

这是我认为整个项目最核心的工程抽象。

每个任务都有独立生命周期:

created → running → analyzed → completed

同时在 Dashboard 中通过表格展示:

  • task_id
  • status
  • created_at
  • updated_at
  • runtime
  • result_path

04-task-lifecycle-table.png


四、系统架构设计(核心亮点)

整个系统现在已经稳定分为四层:

1)Browser Crawl Layer

基于 Playwright:

  • 页面访问
  • DOM 提取
  • 自动翻页
  • 数据结构化

2)Task Workflow Layer

统一管理:

  • 任务创建
  • 状态更新
  • 结果持久化
  • 历史回溯

3)FastAPI Service Layer

对外提供标准服务接口:

  • /tasks
  • /tasks/run
  • /tasks/{task_id}

4)Dashboard UI Layer

基于 Streamlit 展示实时结果。

05-system-architecture.png


五、FastAPI 服务化设计

为了让整个 Agent Workflow 具备真实工程价值,我把核心能力全部服务化。

Swagger 首页已经可以完整展示接口能力。

支持:

  • 创建任务
  • 运行任务
  • 查询任务
  • 查看历史

06-api-swagger-overview.png


六、核心任务运行接口

项目核心接口是:

POST /tasks/run

通过这个接口触发完整链路:

Browser Crawl → Task Save → AI Analyze → Dashboard Refresh

请求阶段如下:

07-api-task-run-request.png

返回结果如下:

08-api-task-run-response.png

七、项目工程亮点总结

这个项目真正的亮点,不是单点技术,而是完整的工程闭环:

  1. Browser 自动化能力
  2. Task Workflow 抽象
  3. API 服务能力
  4. Dashboard 产品能力
  5. 历史任务分析能力

相比普通 CRUD,它更接近真实 AI Workflow 平台。

非常适合用于:

  • AI 应用工程师
  • Agent 工程师
  • 全栈开发
  • AI SaaS 平台研发
  • Workflow 产品方向

八、下一步升级方向

下一阶段我准备继续往平台方向推进:

  1. PostgreSQL 持久化
  2. Docker Compose 部署
  3. 多 Worker 并发
  4. 用户级项目管理
  5. Prompt Workflow 编排
  6. 多网站模板化任务

目标继续往:

可部署、可复用、可商业化

推进。


九、结语

这个项目让我最大的收获,是第一次真正把:

Playwright 自动化、任务系统、FastAPI 服务、Streamlit Dashboard、AI 分析链路

完整串成一个平台级工程闭环。

从脚本到平台,这一步跨出去之后,AI Browser Agent 的产品化空间才真正打开。