一天时间,用Gemini 3 Pro撸了个纯前端工具箱,内含30个功能!可直接预览体验

364 阅读6分钟

前言

如果放在两年前,你要我开发一个包含视频转GIF(FFmpeg)、屏幕录制、音频合成、OCR文字识别、证件照裁剪等30个功能的在线工具箱,并且要求UI精美(玻璃拟态)、全响应式、纯前端本地处理(Local-First),同时适配兼容移动端。我可能会评估至少 2-3 周的工期。

最近时间比较空闲,于是想体验下Gemini3 Pro到底比之前的AI强多少。就在昨天,利用 Gemini 3 Pro,我仅用了 1 天 时间把上面的内容全部开发完毕。

这不是标题党,这就是正在发生的现实。这个名为 PrivacyBox 的项目,从零到上线,30个核心模块,全部代码均在 AI 辅助下飞速完成。

github地址

github pages在线预览

vercel预览

不挂梯子访问的可能会比较慢

今天想复盘的,不是这个项目本身,而是在 AI 介入后,前端开发的逻辑已经完全变了


🛠 项目架构:纯粹与极致

在让 AI 写代码前,我只定下了核心原则,剩下的全部交给它发挥:

  • 核心理念:Serverless & Local-First。所有数据处理(无论是图片压缩还是视频剪辑)必须在浏览器完成,绝不上传服务器,主打隐私安全。
  • 技术栈:Vue 3 + Vite + UnoCSS。
  • UI风格:流光溢彩背景 + 磨砂玻璃 (Glassmorphism) + 独立配色体系。

⚡️ AI 的高光时刻:它不仅仅是写 CRUD

很多人觉得 AI 只能写写简单的表单或布局。但在 PrivacyBox 的开发中,Gemini 3 Pro 展现出的能力让我感到一丝“恐慌”。

它搞定了以下这些纯前端很难处理的“硬骨头”:

1. 硬核多媒体处理(FFmpeg & Web Audio)

  • 🎥 视频转 GIF & 音频提取:AI 直接帮我集成了 ffmpeg.wasm,处理了复杂的跨域隔离(COOP/COEP)配置,并实现了视频裁剪和帧率调整逻辑。
  • 🌊 专注白噪音台:这个功能最让我惊喜。我只说了“用 Web Audio API 生成白噪音”,它直接写出了基于 OscillatorNode 的数学算法,实时生成白/粉/布朗噪音,完全不依赖 MP3 文件,体积极小。

2. 复杂的 Canvas 图形计算

  • 🙈 隐私涂抹卫士:不仅仅是画笔,它结合了 Tesseract.js 做 OCR,实现了“自动识别文字区域并打码”。Canvas 的图层叠加、撤销逻辑,一次成型。
  • 📸 智能证件照裁剪:实现了图片拖拽、缩放、并在 Canvas 上应用标准尺寸蒙版(1寸/2寸),逻辑非常清晰。

3. 正则与数据处理

  • 🧹 文本多功能清洗机:去重、排序、全角转半角、提取邮箱...它写了一个清晰的 Pipeline 处理流,代码的可维护性比我手写的还要高。
  • ⏱️ Cron 表达式编辑器:把反人类的 Cron 语法和中文语义互转,逻辑判断极其繁琐,但 AI 秒出。

(文末附完整功能列表,感受一下这个工作量)


🖼️ 效果预览(部分)

image.png

image.png

image.png

image.png

image.png

整个 UI 系统,从配色到阴影,都是 AI 根据我的一句“流光溢彩背景 + 磨砂玻璃效果”自动生成的 Tailwind/UnoCSS 代码。


🤔 思考:前端程序员的“后 AI 时代”生存指南

在开发过程中,我发现自己从“写代码的人”变成了“代码审查员”和“产品经理”。

1. 以前的门槛是“API 熟练度”,现在的门槛是“想象力”和“Prompt 能力” 以前你会写 Canvas API 算是一个高级技能,现在 AI 几秒钟就能写出来。技术细节的实现成本被无限拉低了。现在的核心竞争力,是你知不知道可以用 Canvas 实现隐私涂抹,知不知道可以用 Web Audio API 生成噪音。

2. 架构设计与 Code Review 能力变得至关重要 Gemini 虽然强大,但偶尔也会瞎编(幻觉)。比如在处理 FFmpeg 的内存释放时,偶尔会漏掉。如果我不懂底层原理,项目上线后浏览器就会崩。AI 能帮你写出 90% 的代码,但剩下的 10% 决定了系统的稳定性。

3. 专注于“痛点”而非“功能” PrivacyBox 之所以有价值,不是因为它有 30 个功能,而是它解决了“用户不敢把私密照片上传到在线网站处理”这个痛点。AI 无法帮你发现痛点,这才是人类不可替代的价值。


📂 附:PrivacyBox 完整功能清单 (1天成果)

来看看这 30 个模块,每一个都切中开发或生活的具体场景:

📸 图片与隐私

  • 隐私涂抹卫士:OCR 自动识别文字并打码,Canvas 纯本地处理。
  • PDF 工具:合并、拆分、图片转 PDF 文件,支持批量操作。
  • 智能证件照裁剪:标准尺寸模板,本地制作证件照。
  • EXIF 隐私抹除:移除照片中的 GPS 和设备信息。
  • 隐私水印卫士:全屏防盗水印,身份证安全处理。
  • Favicon 图标生成:一键生成网站全套图标 (favicon.ico, PWA),支持预览与打包下载。
  • 图片格式转换/压缩/取色/长图拼接:一站式图片处理工厂。

🛠 开发者的瑞士军刀

  • 文本多功能清洗机:文本去重、清洗、提取的 Pipeline 工具。
  • Diff 文本对比:代码/文本差异高亮比对。
  • Cron 表达式编辑器:可视化生成定时任务规则。
  • JSON 格式化 / Base64 转换 / SVG 瘦身 / Excel转换:开发调试必备。

🎥 多媒体黑科技

  • 专注白噪音台:Web Audio 实时算法生成噪音 + 番茄钟。
  • 极简屏幕录制:系统音+麦克风混录,画中画预览。
  • 视频转 GIF / 音频提取 / 音频剪辑:基于 FFmpeg 的硬核处理。
  • 在线提词器:支持镜像翻转,主播神器。

🧰 生活实用工具

  • 文件加密保险箱:AES-256 银行级加密。
  • LED 滚动弹幕:打Call神器。
  • 批量文件重命名:拒绝重复劳动。支持序列编号、正则替换、添加时间戳,一键打包下载。
  • 二维码美化 / 条形码生成 / 强密码生成

结语

PrivacyBox 是一个 Demo,也是一个信号。

它告诉我们:不要再卷 CRUD 了,也不要再以“熟练背诵 API”为荣了。利用好手中的 AI 利器,去创造真正有价值的产品,去解决真实世界的问题。

未来已来,不要被淘汰,而是成为那个驾驭巨浪的人。

另外这篇文章也是用一两句话让它帮我生成的。