零成本接入 GLM-5.1!Modal 平台免费不限量 API 对接 Claude Code

0 阅读2分钟

JeecgBoot AI专题研究 | Modal 平台 GLM-5.1 免费不限 Token 接入 Claude Code


起因:Claude Code 限流太烦

周五下午赶重构任务,Claude Code 连续弹 429 Too Many Requests,Coding Plan 在高压场景下扛不住。

刷 Twitter 看到 Modal 宣布一件事:把智谱 GLM-5.1 挂到自家 GPU 集群,免费开放 API 端点,只按 QPS 限速,Token 总量不封顶。半小时跑通 Claude Code 接入,就有了这篇笔记。

Modal 把 GLM-5.1 桥接到 Claude Code:零成本、不限 Token、绕开 429 限流

一、为什么这对组合香

  • 不限 Token 总量,只限 QPS(单账号 3-5 QPS)—— 一个人挂一整天够用
  • OpenAI 协议兼容 —— 绝大多数 AI 编码工具能直接接
  • 零信用卡零额度 —— 注册完直接拿 Key

对重度用户就是天然的"主力卡 + 备胎卡"。

二、拿 Key(1 分钟)

  1. 打开 modal.com,走 GitHub / Google OAuth 注册(邮箱注册要人工审核)
  2. modal.com/glm-5-endpo…
  3. 左侧点 Create token,起个名字,Key 只弹一次,立刻存好;同时记下 Example usage 里的 baseUrl 和模型 ID

端点:https://api.us-west-2.modal.direct/v1/chat/completions 模型 ID:glm-5-endpoint

三、接到 Claude Code

Claude Code 走 Anthropic 协议,Modal 走 OpenAI 协议,中间需要一个协议转换网关。Modal 官方已经写好了:modal-jazz

git clone https://github.com/modal-projects/modal-jazz.git
cd modal-jazz/frontends/claude
pip install -r requirements.txt
export MODAL_API_KEY="你的 key"
python app.py   # 监听 127.0.0.1:8000

然后给 Claude Code 配环境变量:

export ANTHROPIC_BASE_URL="http://127.0.0.1:8000"
export ANTHROPIC_AUTH_TOKEN="任意字符串"
export ANTHROPIC_MODEL="glm-5-endpoint"

重启终端跑一次 claude,Modal 控制台能看到请求就是通了。更深的用法(MCP、tool use、cache_control)参考 Claude Code LLM Gateway 文档

四、OpenClaw / OpenCode

这俩本身就走 OpenAI 协议,不用网关中转,改配置文件就行:

{
  "llm_backend": {
    "url": "https://api.us-west-2.modal.direct/v1",
    "api_key": "你的 Modal Key",
    "model": "glm-5-endpoint"
  }
}

参考仓库:modal-jazz/frontends/openclaw · modal-jazz/frontends/opencode

五、两天用下来的几个体感

  • 首 Token 延迟 500-800ms,比 Claude Sonnet 略慢但可接受
  • CRUD、SQL、单测没问题;跨文件大重构偶尔漏调用点
  • 上下文别超 64k,后段准确率会掉
  • 单机单 Agent 最稳,并发多了会触发限速
  • us-west-2 节点偶尔 502,等十分钟或切回 Claude

小结

主力继续用 Claude Code 原厂,但被限流卡住时,Modal + GLM-5.1 + modal-jazz 是当前性价比最高的应急通道,五分钟配完,不限 Token,免费。

AI 编码工具用到生产级别的人都懂一个道理:永远给自己准备一条 B 路线


本文为 JeecgBoot AI 专题研究系列文章。