原创长文,首发于 L 站 欢迎转载,请保留作者和原文链接 因为各模型包月限量经常变动,如有不符,感谢留言更正
什么是限量?
大模型是生意
毛利 = 包月价格 - 用户月总用量 ×API 成本
月总用量 = ①单位时间次数限制 × 时间 × ②上下文窗口 × 平均浪费率 (重置时间越短浪费率越高)
因此控制你的总用量,尽量增加毛利,主要取决于对下面两个要素进行限量
①单位时间次数限制
②上下文窗口 = 最大输入 + 最大思考长度 + 最大最终输出。这个限量是很多人都没意识到的 尤其是最大思考长度,直接影响智力水平
限量重置时间是怎样计算的?
Ⓐ从最后一次重置之后,第一次用的时间起 ×× 小时:常见,GPT 等 这有个小技巧,比如 gpt 高级语音是 24 小时重置,你如果打算晚上 20 点用来练口语,就要第二天 20 点重置,但如果你早上 8 点一下语音然后退出,就可以第二天早上 8 点重置,相当于提前了 12 个小时。 其他模型同理
Ⓑ每天固定时间重置:常见,例如某中转站是每天早上 8 点重置
Ⓒ从第一次用起 ×× 小时内最后一个整点:比较少见,例如 Claude 是 4~5 小时整点
Ⓓ每月付款日重置
为什么很多模型的限量不透明?
OpenAI 带头,各大公司故意搞限量不透明,就是对限量不做任何官方说明
Ⓐ因为加入新模型,老模型可能缩减或下架,如果明示限量就是一种商业承诺,不明示就是不承诺,增减限量官方说的算
Ⓑ应对竞争对手的政策,随时可能调整限量
Ⓒ服务器紧张时,官方有权利降低限量,但一般不会这样做
Ⓓ以后可能用缩减限量作为降智的一种手段(现在并没有用到)
为什么 Chat 的上下文窗口和最大输出通常远少于 API?
因为 Chat 是包月的,上下文越多,官方越亏。API 是你自己花钱,上下文越多,官方赚的越多
在商言商,包月这种收费方式就决定了,绝大部分的 Chat 版,不管免费还是收费,上下文,最大思考,最大输出都不太可能是满血版,只有 $200 这种会员或者 Enterprise 版本,才会给与 API 一样的满血版上下文长度。
如果你的工作特别在乎上下文长度和最大输出,比如整本书翻译,要么用 API,要么用 会员,或者来自200 会员的逆向
限量的浪费率问题
所有包月都存在严重浪费, 实际上这些包月服务,可能 80% 的限量,都是被浪费掉的,官方赚的就是这个浪费沉淀的钱。 如果你能每天把限量基本都用光了,按照 API 计价,价值肯定是包月月费的好几倍,官方铁定是亏的。
①重置时间间隔短,很容易造成浪费。间隔越短,浪费率越高 浪费率:2 小时重置 (grok) > 3 小时 (4o@小时天高级语音20,多数 Chat@周20) > 一个月 (Deep research)
②节省心理,造成 "劣币驱逐良币" 比如 gpt $20 会员里,一般的问题尽量用 4o,不舍得用有限量的推理模型。对话优先用标准语音,不舍得用高级语音。结果重置时间到了,攒了一堆推理模型,高级语音没用掉,在 deadline 前胡乱问一些问题都来不及消耗掉 有跟我一样的人吗?
模型官网的限量
GPT 限量
250304 更新 OpenAI 的限量是最复杂,最不透明的,而且经常调整
另外有佬友说,$200 的 o1pro 并不是真的无限,大概每天能用 100 多次,再多就容易触发降智
佬友 LostMyHead 说,和30team 会员,4.5 限量是每周 50 次
不同的会员,上下文和最大输出也不同
大多数人可能不知道,官方也很少提及(有故意误导嫌疑),ChatGPT 相同模型不同会员的上下文窗口,最大思维链,最大输出都是差距巨大的
$200 会员:官方说所有模型都是 128kt 上下文,最大输出根据各模型 我实测 Deep research 最终输出 66k+(不含思维链) 金主说 4o 实测 30k 金主说 4.5 实测输入 25k,输出 2k(可能是 preview 版特意控制了输出,正式版应该 16k)
$20 会员:所有模型都是 32k 上下文,最大输出不确定
免费会员:所有模型都是 8k 上下文,最大输出 4k
API:4o/4omini/4.5 是 128k 上下文,16k 输出。但 4.5-preview 实测 2k 输出 o1/o3-mini 是 200k 上下文,100k 总输出(含推理),16k 最终输出
Grok3 限量
250303 更新
免费会员:给的限量挺多的,而且深度搜索和推理都有 x.com/i/grok 与 Grok.com 的限量是分开计算的,就是一个 google 账号可以同时登录两个网站
**x.com 的 premium8 就足够了,只是没有语音功能,grok 的语音虽然没有审查,但听不懂也不会说中文,现在并不实用
grok.com 的 SuperGrok 会员 ,的会员40:限量相同,只比 $8 多一点,性价比低
买会员网页买就行,不要在 appstore 里买,贵很多(和50),因为有苹果税
普通搜索:上下文 16k,思考 4k,最终输出 4k,20 来源
深度搜索:50 来源
推理:上下文 100k,思考 + 最终输出 26k
API 版:还未上线,上下文 1m(现在开放 128k),最大输出不确定
显示剩余限量插件:chromewebstore.google.com/detail/grok…
Claude 限量
免费会员:3.7 每 4~5 小时整点重置,10 条左右,取决于长度 取消了 3.5 和 haiku,没有 thinking 上下文 32k,最大输出 8k。
$20 会员:每 5 小时 3050 次,有 3.7 和 thinking 除了次数,也考虑 token 消耗 所以经常重开新提问,可以显著减少 token 消耗(上下文清零) 上下文,最大输出暂不清楚 thinking 不能调,推测是 1632k(不确定)
API:上下文 200k,最大输出(含思维链)128k
显示剩余限量插件:chromewebstore.google.com/detail/clau… Claude 的限量计算很复杂,根据佬友花白的留言,可以装这个 Chrome 扩展显
Gemini 限量
Gemini 免费会员:无限量,有 2.0flash,2.0flash thinking,App 版有语音 有一个月 $20 会员试用
Gemini$20 会员:无限量,有 2.0pro 和 1.5 pro deep research
AIStudio 免费:2.0flash-thinking-exp/2.0flash/lite:1500 次 / 天 2.0pro-exp:50 次 / 天 1.5pro:50 次 / 天,32k / 分 embedding-03-07:100 次 / 天,新的嵌入模型,3072 维 有语音 + 屏幕识别,只能听中文不能讲中文,貌似不限量 上下文:同 API
AIStudio Tier1:要设置结算卡,填写税务信息等
NotebookLM 免费会员:限量多
NotebookLM $20 会员:限量是免费 5 倍,可以与播客男女主播对话
API:flash 上下文 1m,输出 8k pro 上下文 2m,输出 8k flash thinkign 上下文 1m,思考 40k,最终输出 26k
Microsoft Copilot(不是 Github Copilot)
免费会员:貌似无限语音,无限 o3-mini o3mini 在 copilot.microsoft.com 里有,在 edge 浏览器右上角点 copilot 里面没有 有一个月 $20 会员试用
$20 会员:
Deepseek 限量
免费会员:没有次数限制 貌似邮件注册用户限制联网,手机注册用户可以联网 上下文不确定,最终输出 4k
没有收费会员
API:上下文 128k,思考 24k,最终输出 8k
豆包
免费会员:没有次数限制,没有语音限制 普通上下文不确定,最大输出 4k 推理:上下文 / 最大输出 4 不确定
没有收费会员
API:上下文 256k,最大输出 12k
第三方应用的限量
Perplexity 限量
免费会员:无限普通搜索(10 来源) 每天 3 次高级搜索(20 来源),推理或深度研究(几分钟)
$20 会员:每天 300 次高级搜索,10 次 4.5
秘塔限量
免费会员:每天 100 次普通搜索(20 来源),研究次数不确定(100 来源)
¥39 会员:每天 500 次普通搜索,50 次研究
Genspark 限量
免费会员:无限普通搜索 每天 5 次高级模型:4o/o1/o3mh/3.7t/3.7/r1 每天 1 次深度研究:266 + 来源,10~20 分钟 没有深度搜索功能
$25 会员:无限高级模型 (o1/4o/3.7/flux/ideogram/recraft/dalle)
Felo 限量
免费会员:无限普通搜索 每天 5 次专业搜索 (80 + 来源,r1/o3m/4o/3.7) 每天 3 次文件分析 2k 输出
$20 会员:每天 300 次专业搜索 (加 o3m-high) 深度研究(即将上线)
Poe 限量
免费会员:每天送 3000 积分 20 会员:每月 100w 积分 积分消耗根据不同模型有两种方式,一种是按次消耗,另一种是按次 + xx 积分 /kt
You 限量
免费会员:3 次高级模型或研究(4o/1.5pro/2.0flash/4omini)
$20 会员:佬友 xinxinzi 说每周 500 次高级模型,4.5/o3mh/o1/3.7/3.7thinking/r1,64k 上下文 有深度研究
$30 会员:200k 上下文
minimax.io
是海螺的海外版,很少有人提到,但确实比较少见的,完全免费不限量,又支持搜索被墙网站的 r1 第三方 免费会员:只有 r1 和 minimax-text-01,貌似不限量 没有收费版
Lmarena direct chat 限量
只有免费版,没有收费版,买 API 的资金来自于个人,大学和公司捐赠 有大多数模型,有 3.7,3.7thinking-32k,o3m,3opus,grok3,但没有 4.5,o3mh,o1 上下文限制严重,以 3.7 为例,输入限 8k,输出默认 2k,最大设置 4k 有时会有一些未上市的模型,以代号的形式出现
OpenRouter Chat room 或 API 限量
免费会员:可以用里面免费模型,例如 r1:free,2.0pro-exp,2.0flash-thinking 等,免费模型一般有单位时间限量 但是不管收费还是免费模型,联网都要单独收费,$0.004 / 次 方法:在 Chat room 勾选联网图标,或 API 手动填模型名后加:online,例如 anthropic/claude-3.7-sonnet:online
因为使用 API,官方 API 上下文和最大输出是多少,OpenRouter 的就是多少,不会截断
#编程 IDE 的限量
Cursor 限量
免费会员:14 天会员试用 使用期后每月 2000 次自动补完(Cursor Tab) 自己添加 API Key 不收钱
$20 会员:每月 500 次高级快速提问 (包括 3.7/r1/ds3/4o) 慢速提问次数不限(排队长度取决于系统繁忙程度) 特级模型 4.5/o1/opus 要买积分对换 低级模型不限量:4omini/2.0flash
241208:Cursor Chat/Composer 上下文限制 40k,Ctrl+k 限 10k,Agent60~120k 参考 3.7API 上下文是 200k,就是 Cursor 只用到了 claude 上下文上限的 20% 或 5%
某种角度来说,上下文限制,限制了包月 IDE 的性能,导致对 codebase 的视野受限 这可能也是有些人要用 Cline/Roo code+API 的原因之一,可以尽量用满大模型 API 的上下文极限 来源:Cursor – Models
Windsurf 限量
免费会员:无限自动补完 5 次高级模型(4o/3.7/r1/o3m)
**10=300 次
$50 会员:不限次高级模型
Github copilot
免费会员:每月 2000 次不全,50 次高级提问(3.7/2.0flash/o3mini) 30 天会员试用
$10 会员:1.5pro/o1 241206:4o 是 64k 上下文,VSC Insider 会员 128k 来源:Copilot Chat now has a 64k context window with OpenAI GPT-4o - GitHub Changelog 学生可以免费
Trae
国际版免费会员:3.7/3.5/4o,3.7 经常排队
国内板免费会员:r1/ds3
暂时没有收费会员
Tavily 联网 API
CherryStudio 联网用,每月 1000 次免费 如果不够,可以多注册几个 Tavily 账号,获得多个 API Key,也就麻烦一次,以后只要保存好 API Key 就行,各账号可能永远也不用再登录 Tavily 了
中转站限量
以 OpenAI 的模型为例,不同中转站逆向,即便不被降智,中转站不参水,不故意截断上下文和输出,根据来源是 Cursor 等第三方 / 官方免费 / 官方 官方200 会员,性能也是有差距的,首选只做 $200 会员的逆向 [/quote]
原文地址:【答疑解惑】关于免费和包月限量,你想知道的一切:一文搞懂各大模型的最新会员限额【长期更新】 - 搞七捻三 - LINUX DO