我被AI大模型切换折腾了三个月去年开始玩 AI 写作，先是在本地搭了一套 Ollama，DeepSeek-coder、Q

我被模型切换折腾了三个月.png

去年开始玩 AI 写作，先是在本地搭了一套 Ollama，DeepSeek-coder、Qwen2.5 都跑起来了，日常写个文案、撸点代码完全够用，关键是不花钱。但跑复杂任务的时候，本地模型还是差点意思，生成的内容有时候要改七八轮，耗时比不用模型还长。

后来我开了 DeepSeek 的云端账号，精度确实高，但一个字要花钱，调用一次几厘钱，看着不多，用多了月底账单也心疼。

问题就出在这儿：我每天的工作流是"先用本地模型出个草稿，觉得差不多再用云端模型精修"。听起来合理，但实际操作的时候，每次从本地切到云端都要做一件事——复制粘贴 API 地址，复制粘贴密钥，粘贴到客户端里，点保存。

听起来就几秒钟？但我每天要切十几次。有时候写着写着灵感来了，正到关键的地方，切换模型把密钥填错了，弹个红色错误提示，气得我想把键盘扔了。

最离谱的一次，我一周内填错了三次密钥，每次都要去翻笔记找那个长字符串。第三次的时候我都开始怀疑人生了：明明是来用 AI 提效的，结果被 AI 工具本身折腾得死去活来。

后来有个朋友跟我推荐 New-API，说可以把你那些乱七八糟的模型接口整到一个地址里，客户端只配一次。他给我画了个图：本地模型优先，响应快的先走，本地扛不住自动切到云端，客户端完全不用管。

我当晚就配了，配置项其实就那么几个：本地模型的名字和地址，云端模型的名字和地址，设一个"本地优先，失败自动切换"的策略。然后在写作客户端里把 API 地址和 Token 换成 New-API 给的那个，一行配置，终身受益。

用了大概一周，我专门记了个时间：以前每天切换模型大概要花将近 10 分钟，现在这 10 分钟完全省了。本地模型响应快的时候，客户端自动走本地，我要做的只是"敲字"这一件事；本地模型响应慢或者请求失败的时候，系统自动切到云端，我甚至感知不到切换的发生。

现在我写作的时候根本不用想"该用哪个模型"，系统替我选好了。那种感觉就像雇了个助理帮我分配任务，我知道她会把事情安排得妥妥帖帖，不需要我操心。

三个月下来，密钥填错这种事再也没发生过。