Token自由,我是这样实现的
Opus 4.6 走 API,100 万 token 大概 7 起。GPT-5.4,更贵。
正常用一天,token 费轻松破 $5。一个月下来小几百块,还没算 IDE 订阅。
但我现在每天高强度用这些模型写代码、做内容,token 费用是 0。
不是省着用,是真的不花钱。
核心思路:免费配额叠满,自动轮换
AI 行业有个现象:几乎每家都在送免费额度拉用户。Google 送、Amazon 送、Meta 的模型直接开源免费跑。
问题不是"有没有免费的",而是"分散在十几个地方,怎么统一用起来"。
我的方案分两步:第一步领配额,第二步串起来。
第一步:把免费配额领满
Google AI Pro(首月免费,最值得领)
Google One AI Pro 首月 $0,包含:
- Gemini 3.1 Pro(High/Low 双档)
- Claude Opus 4.6(Thinking)
- Claude Sonnet 4.6(Thinking)
- GPT-OSS 120B
- 1000$ 月度 AI Credits
- Antigravity 编辑器完整权限
领取方法:进 Google One 官网 → 找到 AI Pro 方案 → 绑 PayPal 或信用卡 → 首月 $0 开通。
到期前取消就行,不取消自动续费 $19.99/月。
一个 Gmail 账号就能领。 配额每 5 小时刷新,日常开发完全够用。
而且 Google One AI Pro 支持家庭组共享——一个主账号最多拉 5 个成员,所有人共享 Pro 权益。也就是说,你和朋友每人一个 Google 账号,都能拿到 Gemini 3.1 Pro 和 Opus 4.6 的额度。
Kiro(免费 Claude Sonnet)
Amazon 出的 AI IDE,注册即送 Claude Sonnet 4.5 配额,每月约 500 次 AI 交互,不花钱。
去 kiro.dev 注册,装客户端就行。代码补全不消耗次数,主要是 Chat 和 Agent 操作计数。
Codex(免费 GPT-5.4)
OpenAI 的 AI 编程助手,目前限时免费,包含 GPT-5.4、GPT-5.3、GPT-5.2 等 7 个模型,安装即用。促销结束后可能需要付费,趁现在赶紧薅。
Groq / Cerebras / SambaNova(免费 API)
这三家提供免费 API Key:
| Provider | 免费额度 | 主力模型 |
|---|---|---|
| Groq | 14,400 次/天 | Llama 70B, Kimi K2 |
| Cerebras | 100 万 token/天 | Qwen 235B |
| SambaNova | 200K token/天 | DeepSeek V3.2 |
去官网注册,拿 API Key,30 秒搞定。
Gemini API(Google AI Studio)
用 Google 账号登录 AI Studio,免费用 Gemini 2.5 Pro,100 万上下文窗口。
全部领完,你手上就有:Opus 4.6 + Sonnet 4.6 + GPT-5.4 + Gemini 3.1 Pro + Llama 70B + DeepSeek V3.2 + Qwen 235B。
API 费用:$0。
第二步:用 OpenRelay 串起来
配额领了一堆,分散在七八个地方,每个只能在自己的工具里用。
这是我做 OpenRelay 的原因。
OpenRelay 跑在你本地,做一件事:把所有配额统一成一个 API 端点 http://localhost:18765,任何支持 OpenAI/Anthropic API 的工具都能直接调用。
装好之后,打开 http://localhost:18765 的 Web 面板,它会自动扫描你机器上已有的 AI 订阅和工具——Claude Code、Kiro、Antigravity、VS Code Copilot——全部自动发现,不用手动配置。
API Key 类的(Groq、Cerebras、SambaNova),在面板里添加一次就行。
关键功能:自动轮换。
你可以把多个 Provider 组成一个模型组:
"sonnet-group" = Kiro (Sonnet 4.5) + Claude Code (Sonnet 4.6) + Anthropic API
Kiro 的配额用完了,自动切到 Claude Code 的配额。Claude Code 也用完了,切到 Anthropic API。你感知不到切换,请求永远有响应。
同样的逻辑适用于所有模型:
"fast-group" = Groq (Llama 70B) + Cerebras (Qwen 235B) + SambaNova (DeepSeek V3.2)
三家免费额度加起来,够你从早用到晚。哪家额度耗尽,自动跳下一家。
实际效果
我现在的日常配置:
- 重度推理:Opus 4.6(Google AI Pro 配额)→ Claude Code 配额 → Anthropic API(备用)
- 日常编码:Sonnet 4.5(Kiro)→ Sonnet 4.6(Claude Code)
- 快速问答:Groq (Llama 70B) → Cerebras → SambaNova
接入 Claude Code:
# macOS / Linux
export ANTHROPIC_BASE_URL=http://localhost:18765
export ANTHROPIC_API_KEY=unused
# Windows
$env:ANTHROPIC_BASE_URL="http://localhost:18765"
$env:ANTHROPIC_API_KEY="unused"
接入 Cursor:面板里一键开启 RPC 代理,Cursor 无感切换到你的配额池。
所有请求直连 AI 后端,不经过任何中转服务器,Key 不离开你的电脑。
配额叠加的逻辑
OpenRelay 对 API 类 Provider(Groq、Cerebras、Gemini API 等)支持添加多个 API Key。比如你有两个 Groq 账号,两个 Key 都可以加进来,额度叠加,自动轮换。
桌面应用类的(Kiro、Antigravity、Codex),OpenRelay 自动发现你本机已登录的实例。你登了哪些工具,它就用哪些配额。
怎么注册、有几个号,OpenRelay 不管也不问——它只负责把你已有的配额统一管理和自动切换。你有多少配额来源,它就帮你串多少。
说几个注意的
- Google AI Pro 记得到期取消,不然自动扣 $19.99
- 免费额度有日限,Groq 14400 次、Cerebras 100 万 token,重度用可能不够——所以要多个 Provider 轮换兜底
- 需要稳定网络环境,Google 和 Anthropic 对异常 IP 会封号
- OpenRelay 是开源项目,代码在 GitHub 上可以审计
最后
Token 自由不是一个模型的事,是把散落在各处的免费配额串成一条链。
单个 Provider 的免费额度确实有限,但叠在一起,加上自动轮换,日常开发够用了。
GitHub 地址:github.com/romgX/openrelay
有用的话给个 Star。