年前这两周,我隔几个小时就忍不住刷一下手机。
不是刷短视频。是看又有谁发模型了。
5号看一眼,Claude和GPT都更新了。11号看一眼,智谱官宣了。14号再看一眼,好家伙,字节三连发。
说实话,看到第三四个的时候,我已经从兴奋变成无语了。
不是模型不好。是这也太卷了。今天大年三十了,我寻思着总算能消停会儿了吧。
全都学会了
还记得去年吧?
2025年春节前,DeepSeek放出了R1。等大家过完年回来一看,变天了。
一战封神,硅谷破防,英伟达单日蒸发近6000亿美元。
今年呢?所有人都学聪明了。
字节、阿里、智谱、MiniMax、月之暗面、讯飞……你叫得上名字的,全挤到春节来发了。
摩根大通的研报说这是**"中国AI行业史上最密集的旗舰模型发布潮"**。
但你猜怎么着?
去年偷袭成功的DeepSeek,今年反而缺席了。
36氪有个标题我觉得说得好——"DeepSeek不发V4,六小龙不敢过年"。
大家都怕再被偷家。结果今年DeepSeek不出手了,其他人全冲了上去。
挺讽刺的。
我注意到的几件事
这波模型我没有每个都追。
有些一看就是赶档期的——换个版本号,改个名字,其实底层没大变化。这种我直接跳过。
但有几个确实让我多看了两眼。
第一个是智谱的骚操作。
GLM-5没开发布会。先注册了个马甲叫"Pony Alpha",悄悄挂到OpenRouter上,免费给人用。
马年嘛,Pony,小马驹。挺会玩的。
然后全网开始猜——这到底是谁家的模型?有人测tokenizer,有人分析输出风格。
最绝的是什么?有人直接改了system prompt问它"你是谁"。
它回答了:"I'm GLM"。
得,瞒不住了。
从匿名上线到官宣,就5天。知乎帖子几千条回复,X上一堆人在猜。0块钱推广费,几千万曝光。
这营销水平,我是真服。
第二个是字节的三连发。
Seedance 2.0视频生成、Seedream 5.0图像生成、豆包2.0语言模型,10号到14号一口气全上了。
我对字节的态度一直是——产品做得快,但模型层面之前真不算顶尖。
豆包2.0出来之后,我改了一半的看法。后面细说。
第三个是DeepSeek的沉默。
全网等V4,没来。用户吐槽"变冷淡了""回复质量下降了"。
但它悄悄把上下文窗口从128K拉到了1M。一百万tokens,没官宣,直接上了。
别人开发布会,它改个版本号就完事了。
这很DeepSeek。但说实话我挺担心的——用户的耐心是有限的,你不说话,别人就替你说了。
我自己试了一圈
光看发布信息没意义。年前这几天我挨个打开试了试,说说真实感受。
豆包2.0 Pro
这个让我最意外。
打开豆包App,选"专家模式"就行。免费。
我拿它写了段Python脚本做数据清洗。以前1.0经常逻辑不对,要改好几轮。
2.0一次就对了。
API输入价格3.2元/百万tokens,GPT-5.2要12块多。输出更夸张,16块对人家100块。
说实话我不太愿意承认,但**国产模型在日常任务上,真的够用了。**至少豆包这个版本是这样。
Seedance 2.0
也在豆包App里,免费。
我拿它生成了一段新年祝福的短视频发了家族群。我妈问我哪儿找的素材。
以前可灵是王者。现在呢?Seedance起码能跟它掰掰手腕了。动作比之前流畅多了。
但有个问题——真人素材这块翻车了。生成太逼真,有人拿别人照片随便生成视频,字节赶紧限制了真人上传功能。
GLM-5
智谱官网就能体验。
代码能力确实进步大。
但要说跟Claude Opus比,还是有差距。尤其复杂的多文件项目,Claude理解全局的能力还是强一截。
不过GLM-5免费啊。日常写个脚本、改个bug,够了。
Claude Opus 4.6
我自己的主力没变,还是Claude。
Opus 4.6最大的感觉不是"更聪明了",而是**"更稳了"**。
之前用Claude Code跑长任务,经常跑到一半开始绕圈。4.6这个毛病好多了,能一口气干更久。
但说真的,如果你不是重度用户,4.5和4.6的区别没那么大。
DeepSeek 1M上下文
这个我是真觉得可惜——明明是个很厉害的更新,结果因为没官宣,很多人都不知道。
我试着把一个完整的前端项目喂进去让它分析。以前只能喂几个核心文件,现在整个仓库一次性塞进去,它还真能理解整体架构。
这种体验以前只有Gemini能给。
卷到最后
从兴奋变成无语,再从无语变成平静。
这是我年前这两周的心理曲线。
去年DeepSeek偷袭,所有人震惊。今年所有人都学会了偷袭,结果呢?
当所有人都选择偷袭,就不存在偷袭了。
你今天发的SOTA,下周就被人超了。
抢时间?抢流量?
到最后大家会发现——模型之间的差距越来越小。用户根本记不住你是2月10号发的还是2月14号发的。
记住的只有一件事:我打开你的App,好不好用。
对我们来说呢?
选择多了,价格低了,能力强了。这当然是好事。
但我也有个判断:2026年,模型本身可能不再是壁垒了。 真正拉开差距的,是谁能把模型变成普通人用得上的东西。
趁过年有空,挑两三个打开试试。
不用全试。找到一个顺手的,用起来。比关注谁又发了什么模型有用多了。
最后说一句
我是 Evan,每天追全球 AI 动态,用说人话的方式写出来。
如果上面的内容对你有帮助,真诚地希望你能点个关注。
这对我真的很重要。
对了,我每天还做一份AI雷达日报。
全网扫描 7000+ 条信息,AI 过滤筛选,精选率不到 1%。只留最值得看的。
每天自动生成,第一时间发到群里,没广告,就图个信息互通。
想进?公众号发送「加群」两个字。