最近我把自己的第二个核心项目,正式升级成了一个 AI Browser Agent Workflow Platform。
它已经不再只是一个简单的网页抓取脚本,而是一个具备:
- 浏览器自动化采集
- 任务生命周期管理
- AI 分析结果沉淀
- FastAPI 服务化接口
- Streamlit 可视化 Dashboard
- 历史任务追踪与趋势分析
的一体化 Agent Workflow 平台。
这个项目的核心目标很明确:
把“浏览器自动化 + AI 分析”从一次性脚本,升级成可运行、可观察、可扩展的平台级工程项目。
一、项目最终效果展示
目前整个项目已经完成 Dashboard v3 重构,前后端链路全部跑通。
首页 Dashboard 支持:
- 核心指标总览
- 任务运行趋势
- 分类统计分析
- 历史任务表格
- AI 工作区结果查看
二、为什么要从脚本升级成平台
最开始这个项目只是一个简单的 Playwright 自动化抓取器。
初始链路只有:
Playwright → 页面抓取 → JSON 输出
它能跑,但工程上问题很多:
- 无法管理多次任务运行
- 无法追踪任务状态
- 无法沉淀历史结果
- 无法对接前端
- 缺少产品化展示能力
所以我决定做一次完整的平台化升级。
目标是让它具备:
Browser Agent + Task System + API Service + Dashboard
完整闭环。
三、Dashboard 可视化设计
这一版我重点打磨的是前端 Dashboard 的产品感。
1)首页总览层
通过 Metrics Cards 展示:
- Total Tasks
- Success Rate
- Active Workflows
- Average Runtime
同时增加趋势图与任务分布。
2)分类统计层
为了让任务分析更直观,我增加了分类历史统计面板。
可以快速观察:
- 任务类型分布
- 各类任务执行次数
- 历史分类变化趋势
3)任务生命周期层
这是我认为整个项目最核心的工程抽象。
每个任务都有独立生命周期:
created → running → analyzed → completed
同时在 Dashboard 中通过表格展示:
- task_id
- status
- created_at
- updated_at
- runtime
- result_path
四、系统架构设计(核心亮点)
整个系统现在已经稳定分为四层:
1)Browser Crawl Layer
基于 Playwright:
- 页面访问
- DOM 提取
- 自动翻页
- 数据结构化
2)Task Workflow Layer
统一管理:
- 任务创建
- 状态更新
- 结果持久化
- 历史回溯
3)FastAPI Service Layer
对外提供标准服务接口:
/tasks/tasks/run/tasks/{task_id}
4)Dashboard UI Layer
基于 Streamlit 展示实时结果。
五、FastAPI 服务化设计
为了让整个 Agent Workflow 具备真实工程价值,我把核心能力全部服务化。
Swagger 首页已经可以完整展示接口能力。
支持:
- 创建任务
- 运行任务
- 查询任务
- 查看历史
六、核心任务运行接口
项目核心接口是:
POST /tasks/run
通过这个接口触发完整链路:
Browser Crawl → Task Save → AI Analyze → Dashboard Refresh
请求阶段如下:
返回结果如下:
七、项目工程亮点总结
这个项目真正的亮点,不是单点技术,而是完整的工程闭环:
- Browser 自动化能力
- Task Workflow 抽象
- API 服务能力
- Dashboard 产品能力
- 历史任务分析能力
相比普通 CRUD,它更接近真实 AI Workflow 平台。
非常适合用于:
- AI 应用工程师
- Agent 工程师
- 全栈开发
- AI SaaS 平台研发
- Workflow 产品方向
八、下一步升级方向
下一阶段我准备继续往平台方向推进:
- PostgreSQL 持久化
- Docker Compose 部署
- 多 Worker 并发
- 用户级项目管理
- Prompt Workflow 编排
- 多网站模板化任务
目标继续往:
可部署、可复用、可商业化
推进。
九、结语
这个项目让我最大的收获,是第一次真正把:
Playwright 自动化、任务系统、FastAPI 服务、Streamlit Dashboard、AI 分析链路
完整串成一个平台级工程闭环。
从脚本到平台,这一步跨出去之后,AI Browser Agent 的产品化空间才真正打开。