去年开始玩 AI 写作,先是在本地搭了一套 Ollama,DeepSeek-coder、Qwen2.5 都跑起来了,日常写个文案、撸点代码完全够用,关键是不花钱。但跑复杂任务的时候,本地模型还是差点意思,生成的内容有时候要改七八轮,耗时比不用模型还长。
后来我开了 DeepSeek 的云端账号,精度确实高,但一个字要花钱,调用一次几厘钱,看着不多,用多了月底账单也心疼。
问题就出在这儿:我每天的工作流是"先用本地模型出个草稿,觉得差不多再用云端模型精修"。听起来合理,但实际操作的时候,每次从本地切到云端都要做一件事——复制粘贴 API 地址,复制粘贴密钥,粘贴到客户端里,点保存。
听起来就几秒钟?但我每天要切十几次。有时候写着写着灵感来了,正到关键的地方,切换模型把密钥填错了,弹个红色错误提示,气得我想把键盘扔了。
最离谱的一次,我一周内填错了三次密钥,每次都要去翻笔记找那个长字符串。第三次的时候我都开始怀疑人生了:明明是来用 AI 提效的,结果被 AI 工具本身折腾得死去活来。
后来有个朋友跟我推荐 New-API,说可以把你那些乱七八糟的模型接口整到一个地址里,客户端只配一次。他给我画了个图:本地模型优先,响应快的先走,本地扛不住自动切到云端,客户端完全不用管。
我当晚就配了,配置项其实就那么几个:本地模型的名字和地址,云端模型的名字和地址,设一个"本地优先,失败自动切换"的策略。然后在写作客户端里把 API 地址和 Token 换成 New-API 给的那个,一行配置,终身受益。
用了大概一周,我专门记了个时间:以前每天切换模型大概要花将近 10 分钟,现在这 10 分钟完全省了。本地模型响应快的时候,客户端自动走本地,我要做的只是"敲字"这一件事;本地模型响应慢或者请求失败的时候,系统自动切到云端,我甚至感知不到切换的发生。
现在我写作的时候根本不用想"该用哪个模型",系统替我选好了。那种感觉就像雇了个助理帮我分配任务,我知道她会把事情安排得妥妥帖帖,不需要我操心。
三个月下来,密钥填错这种事再也没发生过。
具体操作可以参考New-API 整合多模型接口 + 精细化管控,本地 AI 模型秒变全网可用!cpolar 内网穿透实验室第 793 个成功挑战 - 掘金这篇文章