01. 一张价值 380 元的“学费单”
先看一张账单,这是我为了开发一个本该很简单的浏览器插件,在短短几周内烧掉的钱:
- 智谱 GLM 模型费: 100 元
- OpenRouter 充值(为了试 Sonnet 4.5): 10 美元(约 72 元)
- 三方中转 API 费用: 25 美元(约 180 元)
- Google 开发者账号注册: 5 美元(约 36 元)
- 总计:约 380 元人民币
你可能会笑: “380块也能叫烧钱?” 但对于用ai以来没有任何收入只有支出的人、只想解决自己痛点的0基础编程小白 来说,这 380 块原本可以是 0。
这 380 块,是我为“伪勤奋”和“工具松鼠症”交的智商税。 今天把这个过程写出来,希望能帮你省下这笔钱。
02. 起源:我只是想偷个懒
做 LensAI 的初衷极其简单: 我是一个重度的 AI 用户(Gemini/Claude/ChatGPT),每次对话Gemini,chatgpt的时候经常出现需要看之前的提问内容时每次都要翻页非常麻烦,ai的回答很长,滚动来滚动去真的烦;然后每天产生大量的对话, 每次想保存精华内容,只能手动一条条复制,或者截图。想整理进 Obsidian 更是麻烦得要死。
我就想要一个按钮:点一下,把网页变成优雅的 PDF,左边带目录,右边是正文。
我也没学过怎么开发 Chrome 插件,但我有 AI 啊。 我想着: “这不就是给 AI 几句提示词的事儿吗?” 然后,噩梦开始了。期初看了一些文章帖子说3分钟ai写一个软件,写一个脚本,觉得我上我也行。。。。于是悲剧开始了
03. 踩坑:陷入“工具模型死循环”
作为典型的“差生文具多”,我没有立刻去死磕代码,而是陷入了工具的选择困难症:
- 反复横跳: 一开始用 VSCode + Claude,报错解决不了,我就换 Google AI Studio;觉得不行,又换 Gemini 网页版;最后又跑回 VSCode 用 RooCode。 每次切换环境,都浪费了大半天时间。
- 迷信模型: 代码跑不通,我不觉得是我 Prompt 写得烂,我觉得是模型不够强。于是我去充值 OpenRouter,非要用 Claude 4.5 Sonnet。结果呢?代码逻辑错了,用再贵的模型也是报错。那 10 美元就是这么打水漂的。
- 盲目 Copy: 面对报错,我只知道无脑复制给 AI。直到陷入死循环,我才学会按 F12 打开 Console,把红色的报错信息结合 DOM 结构喂给 AI,把元素copy给ai,把前端doms发给ai(虽然因为内容太长,直接卡死,消耗了大量token)它才终于看懂了问题。
教训: AI 编程不是魔法,哪些说口喷3分钟一个产品的骗子。如果你不知道怎么 Debug,给你 GPT-100 你也写不出代码。
04. 等待和不断的拒绝审核:谷歌商店的“混合双打”
好不容易把 PDF 导出功能做出来了(虽然一开始导出来全是空白,或者只有提问没有回答 ),终于要上架了。 结果 Google 商店给了我 4 次拒审通知:
- 拒审理由 1:权限滥用。 我在
manifest.json里写了一堆看着很牛但没用到的权限。谷歌的机器人非常冷酷:没用到?拒审。 - 拒审理由 2:代码混淆。 AI说上架要混淆下代码,我就让 AI 帮我做了全量混淆。结果谷歌新规禁止过度混淆代码,必须改回可读性较高的版本。我又不得不重新折腾打包流程。
05. 结果:LensAI 终于来了
在烧了 380 块钱、熬了无数个夜之后,LensAI 终于活了。
它现在长这样: (此处插入产品运行 GIF:展示点击图标 -> 侧边栏目录跳转 -> 一键导出 PDF 的过程) 1.侧边栏导航
2.pdf导出
它没有任何花里胡哨的功能,就是死磕这一点:
- 一键生成带目录的的对话侧边栏,快速查看历史提问内容,点击自动跳转
- 支持按钮跳转提问,上一个问题,下一个问题,到达最后一个问题
- 支持 Gemini / Claude / ChatGPT的PDF导出
06. 写在最后
这款插件现在免费。 我把它放出来,一方面是觉得它确实好用,另一方面是想通过大家的使用,给我一点正向激励,慰藉一下我那 380 块钱的冤枉成本。
如果你也受够了每次网页和ai对话不断的滚动鼠标来回翻找之前的问答,想一次性导出指定的对话内容成pdf文件, 欢迎使用,chrome商店的免费扩展程序搜:
LensAI。 或者点击链接chromewebstore.google.com/detail/lens…
如果你也是新手ai编程的独立开发者,希望我的踩坑记录能让你少走弯路:别换工具了,哪怕用最笨的办法,先把功能跑通才是王道。