【答疑解惑】关于免费和包月限量，你想知道的一切：一文搞懂各大模型的最新会员限额【长期更新】【答疑解惑】关于免费和包月限量

原创长文，首发于 L 站欢迎转载，请保留作者和原文链接因为各模型包月限量经常变动，如有不符，感谢留言更正

什么是限量？

大模型是生意

毛利 = 包月价格 - 用户月总用量 ×API 成本

月总用量 = ①单位时间次数限制 × 时间 × ②上下文窗口 × 平均浪费率 (重置时间越短浪费率越高)

因此控制你的总用量，尽量增加毛利，主要取决于对下面两个要素进行限量

①单位时间次数限制

②上下文窗口 = 最大输入 + 最大思考长度 + 最大最终输出。这个限量是很多人都没意识到的尤其是最大思考长度，直接影响智力水平

限量重置时间是怎样计算的？

Ⓐ从最后一次重置之后，第一次用的时间起 ×× 小时：常见，GPT 等这有个小技巧，比如 gpt 高级语音是 24 小时重置，你如果打算晚上 20 点用来练口语，就要第二天 20 点重置，但如果你早上 8 点一下语音然后退出，就可以第二天早上 8 点重置，相当于提前了 12 个小时。其他模型同理

Ⓑ每天固定时间重置：常见，例如某中转站是每天早上 8 点重置

Ⓒ从第一次用起 ×× 小时内最后一个整点：比较少见，例如 Claude 是 4~5 小时整点

Ⓓ每月付款日重置

为什么很多模型的限量不透明？

OpenAI 带头，各大公司故意搞限量不透明，就是对限量不做任何官方说明

Ⓐ因为加入新模型，老模型可能缩减或下架，如果明示限量就是一种商业承诺，不明示就是不承诺，增减限量官方说的算

Ⓑ应对竞争对手的政策，随时可能调整限量

Ⓒ服务器紧张时，官方有权利降低限量，但一般不会这样做

Ⓓ以后可能用缩减限量作为降智的一种手段（现在并没有用到）

为什么 Chat 的上下文窗口和最大输出通常远少于 API？

因为 Chat 是包月的，上下文越多，官方越亏。API 是你自己花钱，上下文越多，官方赚的越多

在商言商，包月这种收费方式就决定了，绝大部分的 Chat 版，不管免费还是收费，上下文，最大思考，最大输出都不太可能是满血版，只有 $200 这种会员或者 Enterprise 版本，才会给与 API 一样的满血版上下文长度。

如果你的工作特别在乎上下文长度和最大输出，比如整本书翻译，要么用 API，要么用会员，或者来自200 会员的逆向

限量的浪费率问题

所有包月都存在严重浪费，实际上这些包月服务，可能 80% 的限量，都是被浪费掉的，官方赚的就是这个浪费沉淀的钱。如果你能每天把限量基本都用光了，按照 API 计价，价值肯定是包月月费的好几倍，官方铁定是亏的。

①重置时间间隔短，很容易造成浪费。间隔越短，浪费率越高浪费率：2 小时重置 (grok) > 3 小时 (4o@小时天高级语音20，多数 Chat@周20) > 一个月 (Deep research)

②节省心理，造成 "劣币驱逐良币" 比如 gpt $20 会员里，一般的问题尽量用 4o，不舍得用有限量的推理模型。对话优先用标准语音，不舍得用高级语音。结果重置时间到了，攒了一堆推理模型，高级语音没用掉，在 deadline 前胡乱问一些问题都来不及消耗掉有跟我一样的人吗？

模型官网的限量

GPT 限量

250304 更新 OpenAI 的限量是最复杂，最不透明的，而且经常调整

另外有佬友说，$200 的 o1pro 并不是真的无限，大概每天能用 100 多次，再多就容易触发降智

佬友 LostMyHead 说，和30team 会员，4.5 限量是每周 50 次

不同的会员，上下文和最大输出也不同

大多数人可能不知道，官方也很少提及（有故意误导嫌疑），ChatGPT 相同模型不同会员的上下文窗口，最大思维链，最大输出都是差距巨大的

$200 会员：官方说所有模型都是 128kt 上下文，最大输出根据各模型我实测 Deep research 最终输出 66k+（不含思维链）金主说 4o 实测 30k 金主说 4.5 实测输入 25k，输出 2k（可能是 preview 版特意控制了输出，正式版应该 16k）

$20 会员：所有模型都是 32k 上下文，最大输出不确定

免费会员：所有模型都是 8k 上下文，最大输出 4k

API：4o/4omini/4.5 是 128k 上下文，16k 输出。但 4.5-preview 实测 2k 输出 o1/o3-mini 是 200k 上下文，100k 总输出（含推理），16k 最终输出

Grok3 限量

250303 更新

免费会员：给的限量挺多的，而且深度搜索和推理都有 x.com/i/grok 与 Grok.com 的限量是分开计算的，就是一个 google 账号可以同时登录两个网站

**x.com 的 premium $8 会员**：一般如果想买会员，$ 8 就足够了，只是没有语音功能，grok 的语音虽然没有审查，但听不懂也不会说中文，现在并不实用

grok.com 的 SuperGrok 会员，的会员40：限量相同，只比 $8 多一点，性价比低

买会员网页买就行，不要在 appstore 里买，贵很多（和50），因为有苹果税

普通搜索：上下文 16k，思考 4k，最终输出 4k，20 来源

深度搜索：50 来源

推理：上下文 100k，思考 + 最终输出 26k

API 版：还未上线，上下文 1m（现在开放 128k），最大输出不确定

显示剩余限量插件：chromewebstore.google.com/detail/grok…

Claude 限量

免费会员：3.7 每 4~5 小时整点重置，10 条左右，取决于长度取消了 3.5 和 haiku，没有 thinking 上下文 32k，最大输出 8k。

$20 会员：每 5 小时 3050 次，有 3.7 和 thinking 除了次数，也考虑 token 消耗所以经常重开新提问，可以显著减少 token 消耗（上下文清零）上下文，最大输出暂不清楚 thinking 不能调，推测是 1632k（不确定）

API：上下文 200k，最大输出（含思维链）128k

显示剩余限量插件：chromewebstore.google.com/detail/clau… Claude 的限量计算很复杂，根据佬友花白的留言，可以装这个 Chrome 扩展显

Gemini 限量

Gemini 免费会员：无限量，有 2.0flash，2.0flash thinking，App 版有语音有一个月 $20 会员试用

Gemini$20 会员：无限量，有 2.0pro 和 1.5 pro deep research

AIStudio 免费：2.0flash-thinking-exp/2.0flash/lite：1500 次 / 天 2.0pro-exp：50 次 / 天 1.5pro：50 次 / 天，32k / 分 embedding-03-07：100 次 / 天，新的嵌入模型，3072 维有语音 + 屏幕识别，只能听中文不能讲中文，貌似不限量上下文：同 API

AIStudio Tier1：要设置结算卡，填写税务信息等

NotebookLM 免费会员：限量多

NotebookLM $20 会员：限量是免费 5 倍，可以与播客男女主播对话

API：flash 上下文 1m，输出 8k pro 上下文 2m，输出 8k flash thinkign 上下文 1m，思考 40k，最终输出 26k

Microsoft Copilot（不是 Github Copilot）

免费会员：貌似无限语音，无限 o3-mini o3mini 在 copilot.microsoft.com 里有，在 edge 浏览器右上角点 copilot 里面没有有一个月 $20 会员试用

$20 会员：

Deepseek 限量

免费会员：没有次数限制貌似邮件注册用户限制联网，手机注册用户可以联网上下文不确定，最终输出 4k

没有收费会员

API：上下文 128k，思考 24k，最终输出 8k

豆包

免费会员：没有次数限制，没有语音限制普通上下文不确定，最大输出 4k 推理：上下文 / 最大输出 4 不确定

没有收费会员

API：上下文 256k，最大输出 12k

第三方应用的限量

Perplexity 限量

免费会员：无限普通搜索（10 来源）每天 3 次高级搜索（20 来源），推理或深度研究（几分钟）

$20 会员：每天 300 次高级搜索，10 次 4.5

秘塔限量

免费会员：每天 100 次普通搜索（20 来源），研究次数不确定（100 来源）

¥39 会员：每天 500 次普通搜索，50 次研究

Genspark 限量

免费会员：无限普通搜索每天 5 次高级模型：4o/o1/o3mh/3.7t/3.7/r1 每天 1 次深度研究：266 + 来源，10~20 分钟没有深度搜索功能

$25 会员：无限高级模型 (o1/4o/3.7/flux/ideogram/recraft/dalle)

Felo 限量

免费会员：无限普通搜索每天 5 次专业搜索 (80 + 来源，r1/o3m/4o/3.7) 每天 3 次文件分析 2k 输出

$20 会员：每天 300 次专业搜索 (加 o3m-high) 深度研究（即将上线）

Poe 限量

免费会员：每天送 3000 积分 $10 会员**：每天 1w 积分 **$ 20 会员：每月 100w 积分积分消耗根据不同模型有两种方式，一种是按次消耗，另一种是按次 + xx 积分 /kt

You 限量

免费会员：3 次高级模型或研究（4o/1.5pro/2.0flash/4omini）

$20 会员：佬友 xinxinzi 说每周 500 次高级模型，4.5/o3mh/o1/3.7/3.7thinking/r1，64k 上下文有深度研究

$30 会员：200k 上下文

minimax.io

是海螺的海外版，很少有人提到，但确实比较少见的，完全免费不限量，又支持搜索被墙网站的 r1 第三方 免费会员：只有 r1 和 minimax-text-01，貌似不限量没有收费版

Lmarena direct chat 限量

只有免费版，没有收费版，买 API 的资金来自于个人，大学和公司捐赠有大多数模型，有 3.7，3.7thinking-32k，o3m，3opus，grok3，但没有 4.5，o3mh，o1 上下文限制严重，以 3.7 为例，输入限 8k，输出默认 2k，最大设置 4k 有时会有一些未上市的模型，以代号的形式出现

OpenRouter Chat room 或 API 限量

免费会员：可以用里面免费模型，例如 r1:free，2.0pro-exp，2.0flash-thinking 等，免费模型一般有单位时间限量但是不管收费还是免费模型，联网都要单独收费，$0.004 / 次方法：在 Chat room 勾选联网图标，或 API 手动填模型名后加:online，例如 anthropic/claude-3.7-sonnet:online

因为使用 API，官方 API 上下文和最大输出是多少，OpenRouter 的就是多少，不会截断

#编程 IDE 的限量

Cursor 限量

免费会员：14 天会员试用使用期后每月 2000 次自动补完（Cursor Tab）自己添加 API Key 不收钱

$20 会员：每月 500 次高级快速提问 (包括 3.7/r1/ds3/4o）慢速提问次数不限（排队长度取决于系统繁忙程度）特级模型 4.5/o1/opus 要买积分对换低级模型不限量：4omini/2.0flash

241208：Cursor Chat/Composer 上下文限制 40k，Ctrl+k 限 10k，Agent60~120k 参考 3.7API 上下文是 200k，就是 Cursor 只用到了 claude 上下文上限的 20% 或 5%

某种角度来说，上下文限制，限制了包月 IDE 的性能，导致对 codebase 的视野受限这可能也是有些人要用 Cline/Roo code+API 的原因之一，可以尽量用满大模型 API 的上下文极限来源：Cursor – Models

Windsurf 限量

免费会员：无限自动补完 5 次高级模型（4o/3.7/r1/o3m）

** $15 会员**：每月 500 次高级模型超出购买$ 10=300 次

$50 会员：不限次高级模型

Github copilot

免费会员：每月 2000 次不全，50 次高级提问（3.7/2.0flash/o3mini) 30 天会员试用

$10 会员：1.5pro/o1 241206：4o 是 64k 上下文，VSC Insider 会员 128k 来源：Copilot Chat now has a 64k context window with OpenAI GPT-4o - GitHub Changelog 学生可以免费

Trae

国际版免费会员：3.7/3.5/4o，3.7 经常排队

国内板免费会员：r1/ds3

暂时没有收费会员

Tavily 联网 API

CherryStudio 联网用，每月 1000 次免费如果不够，可以多注册几个 Tavily 账号，获得多个 API Key，也就麻烦一次，以后只要保存好 API Key 就行，各账号可能永远也不用再登录 Tavily 了

中转站限量

以 OpenAI 的模型为例，不同中转站逆向，即便不被降智，中转站不参水，不故意截断上下文和输出，根据来源是 Cursor 等第三方 / 官方免费 / 官方官方200 会员，性能也是有差距的，首选只做 $200 会员的逆向 [/quote]

原文地址：【答疑解惑】关于免费和包月限量，你想知道的一切：一文搞懂各大模型的最新会员限额【长期更新】 - 搞七捻三 - LINUX DO