五一假期第三天,AI圈并没休息。
GPT-5.5庆功宴的消息在X上刷屏了。奥特曼公开邀请马斯克参加,马斯克没明确说去不去,但作家Andrew Curran替他表了个态:“他会像睡美人里的女巫一样不请自来,并施下强大的诅咒。”奥特曼倒很佛系:“他如果想来的话可以来,世界需要更多的爱。”
一场庆功宴能成新闻,说明GPT-5.5确实让OpenAI站到了一个舒服的位置上。但今天的AI圈不是一个模型在狂欢。
GPT-5.5:能打,但不再独占风头
GPT-5.5发布一周了,开发者社区的反馈已经稳定下来。好的方面:Terminal-Bench 2.0拿了82.7%,在相同编码任务上token消耗比5.4节省约20-30%,agent自主性显著提高,给含糊任务能自己拆步骤、调工具、检查结果。OpenAI已经在筹备把GPT-5.5-Cyber定向推给网络安全防护人员,下一个垂直版本准备进入安全战场了。
但开发者的默认心态已经从“GPT能不能打”变成了“我的项目里GPT最适合干什么”——一个更冷静的阶段。
Claude:从数据安全到国家安全
Anthropic这边动作也不小。5月1日,Claude Security补丁挖掘智能体上线公测,基于Opus 4.7,不需要自定义agent就能干活,直接拉通GitHub至Jira,批量周期性扫描。
更有意思的是,IDC最新发布的报告中估计,全球AI在国家安全领域的支出将从2025年的530亿美元跃升至2026年的1560亿美元,而其中Anthropic正与Palantir竞争国防部JHSE现代化合同。Claude没有和GPT-5.5在参数榜上硬刚,而是在开发者没太留意的赛道上默默拿下了关键位置——安全与合规。
Gemini:把办公小功能做成了差异化卖点
谷歌这一轮的姿态是“卷细节”。最新Gemini直接把文件生成塞进了对话框,支持Word、Excel、PDF、Google Docs等格式一键导出,手写笔记也能自动整理成规范文件。Gemini的“笔记本”功能也已上线,支持按项目分类对话记录并同步NotebookLM,权限分层做得非常细。
这些小功能看上去不炫,但恰好打中了每天高频使用AI处理文档、整理信息的办公用户。
Grok 4.3:价格战最狠的搅局者
Grok 4.3 API于5月1日正式开放,输入1.25美元/百万token,输出2.50美元/百万token,比Grok 4.20便宜了六成。这个价格直接对标Claude Opus 4.7的十分之一、GPT-5.5的四分之一。高难度推理还不是Grok 4.3的对位领域,但指令执行、客服交互和实时语音检索已经有了自己的长板。xAI同步上线了语音克隆API,2分钟自定义声音、28种语言覆盖。
对于预算有限但需要跑大量常规任务的开发者来说,Grok 4.3是目前性价比最激进的选择。
五一期间的工具管理小贴士
四个模型,四种路线,没有通吃方案。真正的提效靠的是给不同的任务选不同的主力,并且在切换工具时不卡在会员管理上。
我的习惯很简单:主力长期订,低频按月开。ChatGPT、Claude、Gemini、Grok这些会员充值和续费,统一在 gpt68、com站点 上搞定,不需要反复折腾海外信用卡和地址验证,用哪个开哪个,项目结束就不再续。整体开销比全订年费少了将近一半。
你五一假期主要在测哪个模型?降价后的Grok 4.3值得一冲吗?欢迎评论区聊聊。