这两年,大模型最大的变化,不是“谁最强”。
而是:已经没有一个模型,能把所有事都做成第一。
- 你写代码,可能会先想到 Claude。
- 你做日常办公和综合问答,很多人会选 ChatGPT。
- 你要多模态、生态和搜索联动,Gemini 变得越来越强。
- 你要低成本大规模调用,DeepSeek 和 Kimi 的性价比很有竞争力。
- 你想试试更强的长上下文和 agent 能力,Grok 也在快速追。
所以今天这篇,不聊“神话”,只聊三件事:
第一,现在主流、而且确实好用的大模型有哪些; 第二,它们分别适合什么场景; 第三,普通用户和开发者,分别要花多少钱。
先说结论:
如果你是普通用户,够用的选择其实就 3 类:
- ChatGPT:综合能力最稳,适合“默认主力”。
- Claude:代码、长文档、写作整理,依然非常强。
- Kimi / DeepSeek:中文场景、性价比、长文本和国内可用性,优势很明显。
如果你是开发者,选型逻辑更简单:
- 要最稳的通用能力:OpenAI GPT-5.4 / GPT-5.4 mini
- 要代码和 agent:Claude Sonnet 4.6
- 要便宜:DeepSeek-V3.2
- 要长上下文和 Google 生态:Gemini 3.1 Pro Preview
- 要高速、多工具、多代理探索:Grok 4.20 / xAI 工具体系
一、现在“好用”的大模型,主要就这几家
1. ChatGPT / OpenAI:最像“全能型选手”
OpenAI 现在的产品层次已经很清楚了。
在 API 侧,官方目前重点给出的是 GPT-5.4、GPT-5.4 mini、GPT-5.4 nano,其中 GPT-5.4 被定义为“面向专业工作的最强模型”,mini 更偏向编码、计算机使用和子代理,nano 则主打高吞吐、低成本。
在 ChatGPT 订阅侧,OpenAI 官方写得也很直接: ChatGPT 有 Free、Go、Plus、Business、Enterprise 等层级,付费套餐按月/按用户收费;Business 和 Enterprise 面向团队与企业,个人套餐价格会根据地区展示。OpenAI 还明确写到,免费版对所有人开放,Go 也已经在全球更多国家推出。
一句话评价就是:
你不知道先选谁,先用 ChatGPT,大概率不会错。
它的优点不是某一项绝对碾压,而是综合能力、产品完成度、生态、插件/工具链、语音/图像/搜索/数据分析整合得最成熟。
2. Claude / Anthropic:写代码、读文档,还是第一梯队
Anthropic 这条线,最大的优势一直很稳定: 代码、长文档理解、严谨写作、agent 化执行。
从官方页面看,Anthropic 现在重点模型包括 Claude Sonnet 4.6、Opus 4.6、Haiku 4.5。其中:
- Sonnet 4.6:更像主力工作模型,能力和成本平衡最好。
- Opus 4.6:更贵,但定位是更强的 frontier intelligence。
- Haiku 4.5:更便宜、更快,适合轻量任务和高并发。
如果你的工作是:
- 大量改代码
- 看 PR
- 读技术文档
- 整理复杂材料
- 让模型一步步拆任务
那 Claude 依然是非常稳的选择。
3. Gemini / Google:多模态和生态协同,越来越值得重视
很多人以前对 Gemini 的印象是:“能用,但不一定是首选。”
但现在这个印象得改。
Google 官方当前 API 定价页给出的重点模型之一是 Gemini 3.1 Pro Preview,而且 Google 把它定义成面向多模态理解、agent 能力和编码的先进模型。免费层、付费层、企业层也区分得很明确。
Gemini 这一家的真正优势,不只是模型本身,而是:
- 和 Google Search 的联动
- 和 Google AI Studio / Vertex AI 的衔接
- 和 Google 生态的天然整合能力
所以如果你本来就重度使用 Google 体系,Gemini 的顺手程度会很高。
4. DeepSeek:API 性价比,直到今天仍然非常能打
如果只看“花多少钱,拿到多大能力”,DeepSeek 还是绕不过去。
官方文档显示,当前 deepseek-chat 和 deepseek-reasoner 对应的是 DeepSeek-V3.2,128K 上下文;价格非常激进:
缓存命中输入 0.2 元 / 1M tokens,缓存未命中输入 2 元 / 1M tokens,输出 3 元 / 1M tokens。
这个价格放在今天看,依旧很能打。
所以 DeepSeek 的定位很清楚:
不是最全能,但很适合“预算敏感、调用量大、中文任务多”的团队。
尤其是客服、知识库问答、批量摘要、结构化抽取、内容加工这类场景,DeepSeek 的投入产出比很高。
5. Kimi / Moonshot:国内开发者值得重点看
Kimi 这半年最大的变化,是它不再只是“长文本产品”。
官方文档现在主推 kimi-k2.5,支持 256K 上下文、多模态理解和 Tool Calling;同时还有 K2 系列和更早的 Moonshot-v1 系列。
定价上,kimi-k2.5 现在是:
- 输入(缓存命中)¥0.70 / 1M tokens
- 输入(缓存未命中)¥4.00 / 1M tokens
- 输出 ¥21.00 / 1M tokens
这意味着什么?
意味着 Kimi 现在已经从“适合看长文件”,升级成了“能做 agent、能做视觉、能做代码、还能兼顾中文体验”的综合型国内选手。 对很多国内团队来说,它会是一个很务实的选择。
6. Grok / xAI:适合想玩 agent 和超长上下文的人
xAI 这条线现在的关键词,不只是 Grok,而是 工具调用体系。
官方文档显示,Grok 4.20 是当前旗舰模型之一,支持推理,给出 2,000,000 context window;同时,xAI 对 Web Search、X Search、Code Execution、File Search 等工具也有单独计费。比如:
- Web Search:$5 / 1k calls
- X Search:$5 / 1k calls
- Code Execution:$5 / 1k calls
这说明 xAI 在往一个很明确的方向走:
不是单纯卖一个聊天模型,而是在卖“模型 + 工具 + agent”这一整套能力。
如果你是开发者,尤其是想做自动检索、自动执行、多工具串联,这家值得关注。
二、最关键的问题:它们怎么收费?
这里我把收费方式分成两类讲。
第一类:普通用户订阅制
这个最好理解,就是你每个月交一个会员费。
ChatGPT
OpenAI 官方明确写了,ChatGPT 有 Free、Go、Plus、Business、Enterprise 等档位;其中 Business 是每用户每月收费,Enterprise 需要联系销售,个人档价格以 ChatGPT 页面和地区展示为准。官方 FAQ 也明确说,免费版对所有人开放,Go、Plus、Business、Enterprise 都是按用户/月计费。
Claude
Anthropic 官方站点目前明确展示了 Max plan、Team plan、Enterprise plan 等产品线;不同计划的核心区别是可用额度、协作能力和企业能力。Anthropic 此前也明确发布过 Max 计划,主打更高使用上限。
Grok
xAI 官方首页显示,Grok 提供 SuperGrok 订阅,并新推出了 SuperGrok Heavy,主打更高限额和更强访问能力。
Kimi / DeepSeek
这两家更常见的付费方式,还是围绕 API 和增值能力,而不是像 ChatGPT 那样把个人订阅体系做得最强势、最全球化。Kimi 官网强调的是产品体验和开放平台;DeepSeek 公开文档重点也是 API 计费。
所以,普通用户的付费逻辑很简单:
- 想要最稳:买 ChatGPT
- 想要代码和长文档:买 Claude
- 想先用国内产品、追求中文和性价比:先看 Kimi / DeepSeek
- 想尝鲜 agent 和超长上下文:可以试 Grok
第二类:开发者按量计费
这个就是 API 模式。 你不用买“会员”,你是按 tokens、调用次数、工具使用量付费。
我把几家最值得看的价格,直接列出来。
OpenAI API
- GPT-5.4:输入 15.00 / 1M
- GPT-5.4 mini:输入 4.50 / 1M
- GPT-5.4 nano:输入 1.25 / 1M
Claude API
- Claude Sonnet 4.6:输入 15 / 1M
- Claude Opus 4.6:输入 25 / 1M
- Claude Haiku 4.5:输入 5 / 1M
Gemini API
- Gemini 3.1 Pro Preview(标准): 输入 12 / 1M; 超过 200k prompt token 时,输入 18 / 1M。
- Google Search grounding 超出免费额度后:$14 / 1,000 search queries。
DeepSeek API
- DeepSeek-V3.2 / deepseek-chat / deepseek-reasoner: 缓存命中输入 0.2 元 / 1M,缓存未命中输入 2 元 / 1M,输出 3 元 / 1M。
Kimi API
- kimi-k2.5: 缓存命中输入 0.70 元 / 1M,缓存未命中输入 4 元 / 1M,输出 21 元 / 1M。
xAI API / 工具
- xAI 当前公开页重点强调的是模型 + 工具计费;工具调用例如: Web Search 5 / 1k calls,Code Execution $5 / 1k calls。
三、别只看价格,关键是“你拿它干什么”
很多人一看到大模型价格表,第一反应是:
“DeepSeek 这么便宜,那是不是就该无脑选它?”
不是。
因为大模型不是买白菜。 最贵的,不一定最适合你;最便宜的,也不一定总成本最低。
举个简单例子:
一个模型单价便宜,但它经常答偏、返工率高、工具调用差,那你的人力成本和流程成本,最后可能更高。 反过来,一个模型贵一点,但它能一次做对、还能自动调用工具、把复杂流程跑通,最后总成本反而更低。 这也是为什么 OpenAI、Anthropic、Google 这些厂商,不只在卷 token 价格,更在卷“可落地能力”。
所以,真正实用的选型方式,不是问:
“谁最强?”
而是问:
“我最常见的那 3 个任务,谁做得最好?”
四、如果你现在要选,我给你一个最省事的建议
1. 你是普通上班族
直接从这三个里选:
- ChatGPT:当主力助手
- Claude:处理代码、长文档、复杂写作
- Kimi:中文长文本、国内使用体验、日常办公补位
2. 你是内容创作者
优先顺序我会这么排:
- 想要综合稳定:ChatGPT
- 想要更强的长文整理和风格改写:Claude
- 想要中文语境更接地气:Kimi / DeepSeek
3. 你是开发者
- 要全能:OpenAI GPT-5.4 / mini
- 要代码和 agent:Claude Sonnet 4.6
- 要低成本:DeepSeek
- 要 Google 生态:Gemini
- 要工具化和超长上下文:Grok
4. 你是公司负责人
不要只看模型分数。 重点看四件事:
- 数据能不能控
- 团队能不能协作
- 成本能不能预测
- 业务流程能不能真的接进去
这也是为什么 OpenAI、Google、Anthropic 都在把企业版、安全、管理员控制台、批量计费、合规能力单独拎出来卖。
五、最后一句判断
2026 年的大模型市场,已经不是“谁会替代谁”的问题了。
更现实的答案是:
你大概率会同时用 2 到 4 个模型。
一个做主力问答, 一个做代码, 一个做低成本批处理, 再加一个做搜索、图像或 agent。
未来的竞争,不只是模型参数有多大。
而是谁更像一个真正能干活的数字员工。
谁的价格,不只是便宜;
而是便宜到能让你真的大规模用起来。
这才是今天看大模型,最值得关注的事。
END
写在最后:
最近私信问我面试题的小伙伴实在太多了,一个个回有点回不过来。
我花了两个周末,把星球里大家公认最容易挂的 AI/Go/Java 面试坑点 整理成了一份 PDF 文档。里面不光有题,还有解题思路和避坑指南。
想要的同学,直接关注并私信我 【面试】,我统一发给大家。
wangzhongyang.com 也欢迎大家直接访问我的官网,里面有AI / Go / Java 的资料,免费学习!