2026 全球 AI 免费 API 额度攻略:25 个平台,能领的全在这了
Claude 20 刀/月,GPT 20 刀/月,一个月光订阅小一千。但很多平台其实白送额度,只是你不知道去哪领。
我把能找到的全注册了一遍,按国外和国内分开,每个平台标清楚:有什么模型、给多少量、质量怎么样、要不要梯子、怎么注册。
一、国外平台(需梯子)
1. Cerebras — 每天 100 万 token
| 维度 | 详情 |
|---|---|
| 模型 | Llama 3.3 70B、Qwen3 235B、GPT-OSS 120B、GLM-4.7 |
| 免费额度 | 每天 100 万 tokens(30 RPM,60K TPM) |
| 质量 | ⭐⭐⭐⭐ Qwen3 235B 接近一线闭源水平 |
| 速度 | ⭐⭐⭐⭐⭐ 约 2000 tok/s,全网最快 |
| 需要梯子 | ✅ |
| 需要信用卡 | ❌ |
怎么领:
- 打开 cloud.cerebras.ai
- 邮箱注册
- Dashboard → API Keys → Generate
- 接口兼容 OpenAI 格式:
https://api.cerebras.ai/v1
2. Groq — 速度之王
| 维度 | 详情 |
|---|---|
| 模型 | Llama 4 Scout/Maverick、Llama 3.3 70B、DeepSeek R1 Distill 70B、Qwen3 32B、Whisper v3(语音) |
| 免费额度 | 按模型分:小模型(8B) 约 14,400 次/天,大模型(70B) 约 1,000 次/天 |
| 质量 | ⭐⭐⭐⭐ Llama 4 Maverick 是目前最强开源 MoE |
| 速度 | ⭐⭐⭐⭐⭐ 750 tok/s |
| 需要梯子 | ✅ |
| 需要信用卡 | ❌ |
怎么领:
- 打开 console.groq.com
- Google/GitHub 账号登录
- API Keys → Create API Key
- 接口:
https://api.groq.com/openai/v1
3. SambaNova — 405B 免费用
| 维度 | 详情 |
|---|---|
| 模型 | Llama 3.1 405B/70B/8B、DeepSeek-R1、Qwen3 235B |
| 免费额度 | 每天 200K tokens;405B 限 10 RPM |
| 质量 | ⭐⭐⭐⭐⭐ 405B 是开源最强,R1 推理能力顶级 |
| 速度 | ⭐⭐⭐⭐ DeepSeek-R1 约 200 tok/s |
| 需要梯子 | ✅ |
| 需要信用卡 | ❌(不绑卡即 Free Tier) |
怎么领:
- 打开 cloud.sambanova.ai
- 注册,拿 API Key
- 接口:
https://api.sambanova.ai/v1
4. Google Gemini — 上下文之王
| 维度 | 详情 |
|---|---|
| 模型 | Gemini 3.1 Pro(最新)、Gemini 2.5 Flash/Pro、Gemini 2.0 Flash |
| 免费额度 | 3.1 Pro: 约 5 RPM / 100 次/天;Flash: 250 次/天;Flash-Lite: 1000 次/天 |
| 质量 | ⭐⭐⭐⭐⭐ 3.1 Pro 推理能力顶级(ARC-AGI-2 得分 77.1%) |
| 速度 | ⭐⭐⭐ 偏慢 |
| 需要梯子 | ✅ |
| 需要信用卡 | ❌ |
| 杀手锏 | 100 万 token 上下文 |
怎么领:
- 打开 ai.google.dev
- Google 账号登录
- Get API Key → Create
- 接口:
https://generativelanguage.googleapis.com/v1beta/openai
⚠️ Gemini 3 Pro Preview 已于 2026-03-09 下线,请使用
gemini-3.1-pro或gemini-2.5-flash
5. Mistral — 月 10 亿 token
| 维度 | 详情 |
|---|---|
| 模型 | Mistral Large、Codestral(最强开源代码模型之一)、Small 3.1、Pixtral、Devstral |
| 免费额度 | Experiment 层:每月 10 亿 tokens,限速 2 RPM |
| 质量 | ⭐⭐⭐⭐ Codestral 代码能力极强 |
| 速度 | ⭐⭐ 受 2 RPM 限制 |
| 需要梯子 | ✅ |
| 需要信用卡 | ❌ |
怎么领:
- 打开 console.mistral.ai
- 注册,选 Experiment 计划(免费)
- 接口:
https://api.mistral.ai/v1
6. OpenRouter — 29 个免费模型
| 维度 | 详情 |
|---|---|
| 模型 | Llama 4 Maverick:free、Qwen3 Coder:free、DeepSeek V3:free、R1:free、Gemma 3 27B:free、GPT-OSS 120B:free 等 |
| 免费额度 | 每天 50 次(充 $10 提升到 1000 次/天);20 RPM |
| 质量 | 取决于选哪个模型 |
| 需要梯子 | ✅ |
| 需要信用卡 | ❌ |
怎么领:
- 打开 openrouter.ai
- 注册 → Keys → Create
- 模型名加
:free后缀 - 接口:
https://openrouter.ai/api/v1
7. xAI Grok — 送 150
| 维度 | 详情 |
|---|---|
| 模型 | Grok-3、Grok-3-Mini、Grok-2 |
| 免费额度 | 新注册送 $25;开启数据共享后每月 $150 额度 |
| 质量 | ⭐⭐⭐⭐⭐ Grok-3 是目前最强闭源模型之一 |
| 需要梯子 | ✅ |
| 需要信用卡 | ❌ |
怎么领:
- 打开 console.x.ai
- X/Twitter 账号登录
- 接口:
https://api.x.ai/v1
⚠️ $150/月需同意数据用于训练
8. GitHub Models — GPT-4o 免费用
| 维度 | 详情 |
|---|---|
| 模型 | GPT-4o、GPT-4o-mini、o3-mini、Llama 3.1 405B、Mistral Large、DeepSeek-R1 |
| 免费额度 | 每天 50 次请求 |
| 需要梯子 | ✅ |
| 需要信用卡 | ❌(需 GitHub 账号) |
怎么领:
- 打开 github.com/marketplace…
- 登录 GitHub 账号即可
- 接口:
https://models.inference.ai.azure.com,用 GitHub Token 认证
9. NVIDIA NIM — 送 1000 credits
| 维度 | 详情 |
|---|---|
| 模型 | Llama 4 Scout、Qwen3 235B、DeepSeek-R1、Kimi K2.5 等 |
| 免费额度 | 新注册送 1000 inference credits,40 RPM |
| 需要梯子 | ✅ |
| 需要信用卡 | ❌ |
怎么领:
- 打开 build.nvidia.com
- 注册 NVIDIA 开发者账号
- 接口:
https://integrate.api.nvidia.com/v1
10-12. 其他国外平台
| 平台 | 免费额度 | 模型 | 注册 |
|---|---|---|---|
| Cohere | 每月 1000 次 | Command R+、Embed、Rerank | dashboard.cohere.com |
| Fireworks | 送 $1 + Developer 免费配额 | Qwen3、DeepSeek V3 等 | fireworks.ai |
| Together AI | 送 $100(需充 $5) | 200+ 模型 | api.together.xyz |
| Cloudflare Workers AI | 每天 10,000 Neurons | 多种开源模型 | dash.cloudflare.com |
| HuggingFace | 免费推理 API(数百次/小时) | 数千个社区模型 | huggingface.co |
二、国内平台(不需要梯子)
13. 火山引擎(豆包)— 每天 200 万 token
| 维度 | 详情 |
|---|---|
| 模型 | 豆包 2.0 Pro/Lite/Code、DeepSeek V3/R1 |
| 免费额度 | 新用户送 50 万 token;每天 200 万 token 免费(每日刷新,持续可用) |
| 质量 | ⭐⭐⭐⭐ 豆包 2.0 Pro 综合能力强 |
| 速度 | ⭐⭐⭐⭐ |
| 需要信用卡 | ❌ |
| 需要实名 | ✅ |
怎么领:
- 打开 volcengine.com/product/dou…
- 注册火山引擎账号 + 实名
- 开通大模型服务,创建 API Key
- 接口:
https://ark.cn-beijing.volces.com/api/v3
这是国内日额度最大的免费平台,没有之一。
14. 阿里通义千问(百炼)
| 维度 | 详情 |
|---|---|
| 模型 | Qwen 3.5(397B,最新)、Qwen3 235B、DeepSeek V3/R1、Kimi K2.5、GLM 等 |
| 免费额度 | 新用户送 100 万 token(90 天);每个模型首次开通各送额度 |
| 质量 | ⭐⭐⭐⭐⭐ Qwen 3.5 是国产最强开源 |
| 速度 | ⭐⭐⭐⭐ |
| 需要实名 | ✅(阿里云账号) |
怎么领:
- 打开 百炼平台
- 阿里云账号登录
- 模型广场 → 选模型 → 创建 API Key
- 接口兼容 OpenAI 格式:
https://dashscope.aliyuncs.com/compatible-mode/v1
Qwen CLI 每天免费 2000 次请求,直接终端用。
15. 硅基流动 — 送 2000 万 token
| 维度 | 详情 |
|---|---|
| 模型 | Qwen2.5 72B/7B、DeepSeek R1 Distill、GLM-4.1V、图片/语音/视频模型 |
| 免费额度 | 注册送 2000 万 token(约 14 元);邀请好友再送 2000 万;Qwen2.5-7B 等小模型永久免费 |
| 质量 | ⭐⭐⭐⭐(72B 好,7B 日常够用) |
| 速度 | ⭐⭐⭐⭐ |
| 需要实名 | ❌(手机号即可) |
怎么领:
- 打开 siliconflow.cn
- 手机号注册,2000 万 token 自动到账
- 接口:
https://api.siliconflow.cn/v1
16. 智谱 GLM — GLM-5 来了
| 维度 | 详情 |
|---|---|
| 模型 | GLM-5(745B MoE,2026-02 发布,MIT 开源)、GLM-4.7-Flash(免费)、CogView-3(免费生图) |
| 免费额度 | 新用户送 2000 万 token;GLM-4-Flash / GLM-4.7-Flash 永久免费不限量 |
| 质量 | ⭐⭐⭐⭐ GLM-5 接近一线闭源,Flash 中文好 |
| 速度 | ⭐⭐⭐⭐ |
| 需要实名 | ✅ |
怎么领:
- 打开 open.bigmodel.cn
- 手机号注册 + 实名(多送额度)
- 接口:
https://open.bigmodel.cn/api/paas/v4
17. DeepSeek
| 维度 | 详情 |
|---|---|
| 模型 | DeepSeek V3.2(最新,对标 GPT-5)、DeepSeek-R1(推理最强) |
| 免费额度 | 新注册送 10 元(约 500 万 token);网页/APP 端免费 |
| 质量 | ⭐⭐⭐⭐⭐ V3.2 综合顶级,R1 推理碾压 |
| 速度 | ⭐⭐⭐⭐ |
| 需要实名 | ✅ |
怎么领:
- 打开 platform.deepseek.com
- 手机号注册,10 元自动到账
- 接口:
https://api.deepseek.com/v1
用完赠送额度后极便宜:缓存命中 0.2 元/百万 token(约 OpenAI 的 3%)
18. 百度文心
| 维度 | 详情 |
|---|---|
| 模型 | ERNIE 5.0(2.4 万亿参数,最新)、ERNIE-Speed-8K/128K(免费)、ERNIE-Lite(免费) |
| 免费额度 | ERNIE-Speed/Lite 永久免费不限量(TPM 限 30 万) |
| 质量 | ⭐⭐⭐ Speed 够用,Lite 一般 |
| 需要实名 | ✅ |
怎么领:
- 打开 百度智能云
- 注册 + 实名 → 创建应用 → 获取 Key
19. 月之暗面 Kimi
| 维度 | 详情 |
|---|---|
| 模型 | Kimi K2.5(万亿参数,256K 上下文,开源) |
| 免费额度 | 新用户送约 15 元代金券;网页/APP 免费 |
| 质量 | ⭐⭐⭐⭐⭐ K2.5 综合实力顶级 |
| 需要实名 | ✅ |
怎么领:
- 打开 platform.moonshot.cn
- 注册拿 Key
- 接口:
https://api.moonshot.ai/v1
20. 腾讯混元
| 维度 | 详情 |
|---|---|
| 模型 | 混元 HY 2.0、混元-Lite(免费)、混元-Turbos |
| 免费额度 | 首次开通送 100 万 token(1 年有效);混元-Lite 永久免费(256K 上下文) |
| 需要实名 | ✅(腾讯云) |
怎么领:
- 打开 腾讯混元
- 腾讯云账号登录 + 实名
- 接口:
https://api.hunyuan.cloud.tencent.com/v1
⚠️ HY 2.0 系列已暂停免费额度,混元-Lite 仍永久免费
21-24. 其他国内平台
| 平台 | 免费额度 | 代表模型 | 注册 |
|---|---|---|---|
| 讯飞星火 | 每模型送 20 万 token;Spark Lite 永久免费 | Spark 3.5 Max | xinghuo.xfyun.cn |
| MiniMax | 注册送额度;M2 API 限时免费 | MiniMax M2.5 | minimaxi.com |
| 联通云 | Coding Plan 免费 1 个月(1.2 万名额) | GLM-5/Kimi-K2.5/Qwen3.5 | cucloud.cn |
| 魔搭社区 | 每天 2000 次免费 API(单模型 500 次) | 数千个开源模型 | modelscope.cn |
| 百川 | 注册送 80 元 | Baichuan4 系列 | baichuan-ai.com |
三、总结对比
日额度排行(长期免费)
| 排名 | 平台 | 日额度 | 需梯子 |
|---|---|---|---|
| 1 | 火山引擎 | 200 万 token/天 | ❌ |
| 2 | Cerebras | 100 万 token/天 | ✅ |
| 3 | Groq | ~14,000 次/天 | ✅ |
| 4 | 魔搭 | 2,000 次/天 | ❌ |
| 5 | Gemini | 100-1,000 次/天 | ✅ |
永久免费模型(不限量)
| 平台 | 模型 | 需梯子 |
|---|---|---|
| 智谱 | GLM-4-Flash / GLM-4.7-Flash | ❌ |
| 百度 | ERNIE-Speed / ERNIE-Lite | ❌ |
| 腾讯 | 混元-Lite(256K 上下文) | ❌ |
| 讯飞 | Spark Lite | ❌ |
| 硅基流动 | Qwen2.5-7B 等小模型 | ❌ |
一次性赠送排行
| 平台 | 赠送量 | 需梯子 |
|---|---|---|
| 硅基流动 | 2000 万 token | ❌ |
| 智谱 | 2000 万 token | ❌ |
| 阿里百炼 | 100 万 token(90天) | ❌ |
| 腾讯混元 | 100 万 token(1年) | ❌ |
| xAI | $25 credits | ✅ |
四、领完怎么用?
所有平台都兼容 OpenAI SDK 格式,Python 代码一行不用改,只换 base_url 和 api_key:
from openai import OpenAI
# 换成任意平台
client = OpenAI(
base_url="https://api.cerebras.ai/v1", # 改这里
api_key="你的key" # 改这里
)
response = client.chat.completions.create(
model="llama-3.3-70b", # 改成对应模型名
messages=[{"role": "user", "content": "你好"}]
)
多平台额度叠加
全注册一遍,一天免费 token 加起来超过 300 万(火山 200 万 + Cerebras 100 万 + 其他)。
手动切太麻烦?用本地聚合工具把所有 API 合并成一个端点,一个用完自动切下一个。比如 OpenRelay 支持 29 个 Provider 自动轮转,一行命令安装。
这是 API 篇。IDE 篇见下一篇。
有遗漏的平台欢迎评论区补充,我会持续更新。