零成本接入 GLM-5.1！Modal 平台免费不限量 API 对接 Claude Code起因：Claude Code

JeecgBoot AI专题研究 | Modal 平台 GLM-5.1 免费不限 Token 接入 Claude Code

起因：Claude Code 限流太烦

周五下午赶重构任务，Claude Code 连续弹 429 Too Many Requests，Coding Plan 在高压场景下扛不住。

刷 Twitter 看到 Modal 宣布一件事：把智谱 GLM-5.1 挂到自家 GPU 集群，免费开放 API 端点，只按 QPS 限速，Token 总量不封顶。半小时跑通 Claude Code 接入，就有了这篇笔记。

Modal 把 GLM-5.1 桥接到 Claude Code：零成本、不限 Token、绕开 429 限流

一、为什么这对组合香

不限 Token 总量，只限 QPS（单账号 3-5 QPS）—— 一个人挂一整天够用
OpenAI 协议兼容 —— 绝大多数 AI 编码工具能直接接
零信用卡零额度 —— 注册完直接拿 Key

对重度用户就是天然的"主力卡 + 备胎卡"。

二、拿 Key（1 分钟）

打开 modal.com，走 GitHub / Google OAuth 注册（邮箱注册要人工审核）
进 modal.com/glm-5-endpo…
左侧点 Create token，起个名字，Key 只弹一次，立刻存好；同时记下 Example usage 里的 baseUrl 和模型 ID

端点：https://api.us-west-2.modal.direct/v1/chat/completions 模型 ID：glm-5-endpoint

三、接到 Claude Code

Claude Code 走 Anthropic 协议，Modal 走 OpenAI 协议，中间需要一个协议转换网关。Modal 官方已经写好了：modal-jazz。

git clone https://github.com/modal-projects/modal-jazz.git
cd modal-jazz/frontends/claude
pip install -r requirements.txt
export MODAL_API_KEY="你的 key"
python app.py   # 监听 127.0.0.1:8000

然后给 Claude Code 配环境变量：

export ANTHROPIC_BASE_URL="http://127.0.0.1:8000"
export ANTHROPIC_AUTH_TOKEN="任意字符串"
export ANTHROPIC_MODEL="glm-5-endpoint"

重启终端跑一次 claude，Modal 控制台能看到请求就是通了。更深的用法（MCP、tool use、cache_control）参考 Claude Code LLM Gateway 文档。

四、OpenClaw / OpenCode

这俩本身就走 OpenAI 协议，不用网关中转，改配置文件就行：

{
  "llm_backend": {
    "url": "https://api.us-west-2.modal.direct/v1",
    "api_key": "你的 Modal Key",
    "model": "glm-5-endpoint"
  }
}

参考仓库：modal-jazz/frontends/openclaw · modal-jazz/frontends/opencode

五、两天用下来的几个体感

首 Token 延迟 500-800ms，比 Claude Sonnet 略慢但可接受
CRUD、SQL、单测没问题；跨文件大重构偶尔漏调用点
上下文别超 64k，后段准确率会掉
单机单 Agent 最稳，并发多了会触发限速
us-west-2 节点偶尔 502，等十分钟或切回 Claude

小结

主力继续用 Claude Code 原厂，但被限流卡住时，Modal + GLM-5.1 + modal-jazz 是当前性价比最高的应急通道，五分钟配完，不限 Token，免费。

AI 编码工具用到生产级别的人都懂一个道理：永远给自己准备一条 B 路线。

本文为 JeecgBoot AI 专题研究系列文章。