Token自由,我是这样实现的

2 阅读3分钟

Token自由,我是这样实现的

Opus 4.6 走 API,100 万 token 大概 15Gemini3.1Pro15。Gemini 3.1 Pro,7 起。GPT-5.4,更贵。

正常用一天,token 费轻松破 $5。一个月下来小几百块,还没算 IDE 订阅。

但我现在每天高强度用这些模型写代码、做内容,token 费用是 0。

不是省着用,是真的不花钱。

核心思路:免费配额叠满,自动轮换

AI 行业有个现象:几乎每家都在送免费额度拉用户。Google 送、Amazon 送、Meta 的模型直接开源免费跑。

问题不是"有没有免费的",而是"分散在十几个地方,怎么统一用起来"。

我的方案分两步:第一步领配额,第二步串起来。

第一步:把免费配额领满

Google AI Pro(首月免费,最值得领)

Google One AI Pro 首月 $0,包含:

  • Gemini 3.1 Pro(High/Low 双档)
  • Claude Opus 4.6(Thinking)
  • Claude Sonnet 4.6(Thinking)
  • GPT-OSS 120B
  • 1000$ 月度 AI Credits
  • Antigravity 编辑器完整权限

领取方法:进 Google One 官网 → 找到 AI Pro 方案 → 绑 PayPal 或信用卡 → 首月 $0 开通。

到期前取消就行,不取消自动续费 $19.99/月。

一个 Gmail 账号就能领。 配额每 5 小时刷新,日常开发完全够用。

而且 Google One AI Pro 支持家庭组共享——一个主账号最多拉 5 个成员,所有人共享 Pro 权益。也就是说,你和朋友每人一个 Google 账号,都能拿到 Gemini 3.1 Pro 和 Opus 4.6 的额度。

Kiro(免费 Claude Sonnet)

Amazon 出的 AI IDE,注册即送 Claude Sonnet 4.5 配额,每月约 500 次 AI 交互,不花钱。

去 kiro.dev 注册,装客户端就行。代码补全不消耗次数,主要是 Chat 和 Agent 操作计数。

Codex(免费 GPT-5.4)

OpenAI 的 AI 编程助手,目前限时免费,包含 GPT-5.4、GPT-5.3、GPT-5.2 等 7 个模型,安装即用。促销结束后可能需要付费,趁现在赶紧薅。

Groq / Cerebras / SambaNova(免费 API)

这三家提供免费 API Key:

Provider免费额度主力模型
Groq14,400 次/天Llama 70B, Kimi K2
Cerebras100 万 token/天Qwen 235B
SambaNova200K token/天DeepSeek V3.2

去官网注册,拿 API Key,30 秒搞定。

Gemini API(Google AI Studio)

用 Google 账号登录 AI Studio,免费用 Gemini 2.5 Pro,100 万上下文窗口。

全部领完,你手上就有:Opus 4.6 + Sonnet 4.6 + GPT-5.4 + Gemini 3.1 Pro + Llama 70B + DeepSeek V3.2 + Qwen 235B。

API 费用:$0。

第二步:用 OpenRelay 串起来

配额领了一堆,分散在七八个地方,每个只能在自己的工具里用。

这是我做 OpenRelay 的原因。

OpenRelay 跑在你本地,做一件事:把所有配额统一成一个 API 端点 http://localhost:18765,任何支持 OpenAI/Anthropic API 的工具都能直接调用。

装好之后,打开 http://localhost:18765 的 Web 面板,它会自动扫描你机器上已有的 AI 订阅和工具——Claude Code、Kiro、Antigravity、VS Code Copilot——全部自动发现,不用手动配置。

API Key 类的(Groq、Cerebras、SambaNova),在面板里添加一次就行。

关键功能:自动轮换。

你可以把多个 Provider 组成一个模型组:

"sonnet-group" = Kiro (Sonnet 4.5) + Claude Code (Sonnet 4.6) + Anthropic API

Kiro 的配额用完了,自动切到 Claude Code 的配额。Claude Code 也用完了,切到 Anthropic API。你感知不到切换,请求永远有响应。

同样的逻辑适用于所有模型:

"fast-group" = Groq (Llama 70B) + Cerebras (Qwen 235B) + SambaNova (DeepSeek V3.2)

三家免费额度加起来,够你从早用到晚。哪家额度耗尽,自动跳下一家。

实际效果

我现在的日常配置:

  • 重度推理:Opus 4.6(Google AI Pro 配额)→ Claude Code 配额 → Anthropic API(备用)
  • 日常编码:Sonnet 4.5(Kiro)→ Sonnet 4.6(Claude Code)
  • 快速问答:Groq (Llama 70B) → Cerebras → SambaNova

接入 Claude Code:

# macOS / Linux
export ANTHROPIC_BASE_URL=http://localhost:18765
export ANTHROPIC_API_KEY=unused
# Windows
$env:ANTHROPIC_BASE_URL="http://localhost:18765"
$env:ANTHROPIC_API_KEY="unused"

接入 Cursor:面板里一键开启 RPC 代理,Cursor 无感切换到你的配额池。

所有请求直连 AI 后端,不经过任何中转服务器,Key 不离开你的电脑。

配额叠加的逻辑

OpenRelay 对 API 类 Provider(Groq、Cerebras、Gemini API 等)支持添加多个 API Key。比如你有两个 Groq 账号,两个 Key 都可以加进来,额度叠加,自动轮换。

桌面应用类的(Kiro、Antigravity、Codex),OpenRelay 自动发现你本机已登录的实例。你登了哪些工具,它就用哪些配额。

怎么注册、有几个号,OpenRelay 不管也不问——它只负责把你已有的配额统一管理和自动切换。你有多少配额来源,它就帮你串多少。

说几个注意的

  1. Google AI Pro 记得到期取消,不然自动扣 $19.99
  2. 免费额度有日限,Groq 14400 次、Cerebras 100 万 token,重度用可能不够——所以要多个 Provider 轮换兜底
  3. 需要稳定网络环境,Google 和 Anthropic 对异常 IP 会封号
  4. OpenRelay 是开源项目,代码在 GitHub 上可以审计

最后

Token 自由不是一个模型的事,是把散落在各处的免费配额串成一条链。

单个 Provider 的免费额度确实有限,但叠在一起,加上自动轮换,日常开发够用了。

GitHub 地址:github.com/romgX/openrelay

有用的话给个 Star。