去年DeepSeek偷袭春节今年所有人都学会了年前这两周，我隔几个小时就忍不住刷一下手机。不是刷短视频。是看又有谁发模

年前这两周，我隔几个小时就忍不住刷一下手机。

不是刷短视频。是看又有谁发模型了。

5号看一眼，Claude和GPT都更新了。11号看一眼，智谱官宣了。14号再看一眼，好家伙，字节三连发。

说实话，看到第三四个的时候，我已经从兴奋变成无语了。

不是模型不好。是这也太卷了。今天大年三十了，我寻思着总算能消停会儿了吧。

春节模型大战

全都学会了

还记得去年吧？

2025年春节前，DeepSeek放出了R1。等大家过完年回来一看，变天了。

一战封神，硅谷破防，英伟达单日蒸发近6000亿美元。

今年呢？所有人都学聪明了。

字节、阿里、智谱、MiniMax、月之暗面、讯飞……你叫得上名字的，全挤到春节来发了。

摩根大通的研报说这是**"中国AI行业史上最密集的旗舰模型发布潮"**。

模型发布潮

但你猜怎么着？

去年偷袭成功的DeepSeek，今年反而缺席了。

36氪有个标题我觉得说得好——"DeepSeek不发V4，六小龙不敢过年"。

大家都怕再被偷家。结果今年DeepSeek不出手了，其他人全冲了上去。

挺讽刺的。

我注意到的几件事

这波模型我没有每个都追。

有些一看就是赶档期的——换个版本号，改个名字，其实底层没大变化。这种我直接跳过。

但有几个确实让我多看了两眼。

第一个是智谱的骚操作。

GLM-5没开发布会。先注册了个马甲叫"Pony Alpha"，悄悄挂到OpenRouter上，免费给人用。

马年嘛，Pony，小马驹。挺会玩的。

然后全网开始猜——这到底是谁家的模型？有人测tokenizer，有人分析输出风格。

最绝的是什么？有人直接改了system prompt问它"你是谁"。

它回答了："I'm GLM"。

得，瞒不住了。

Pony Alpha

从匿名上线到官宣，就5天。知乎帖子几千条回复，X上一堆人在猜。0块钱推广费，几千万曝光。

这营销水平，我是真服。

第二个是字节的三连发。

Seedance 2.0视频生成、Seedream 5.0图像生成、豆包2.0语言模型，10号到14号一口气全上了。

我对字节的态度一直是——产品做得快，但模型层面之前真不算顶尖。

豆包2.0出来之后，我改了一半的看法。后面细说。

字节三连发

第三个是DeepSeek的沉默。

全网等V4，没来。用户吐槽"变冷淡了""回复质量下降了"。

但它悄悄把上下文窗口从128K拉到了1M。一百万tokens，没官宣，直接上了。

别人开发布会，它改个版本号就完事了。

这很DeepSeek。但说实话我挺担心的——用户的耐心是有限的，你不说话，别人就替你说了。

DeepSeek沉默

我自己试了一圈

光看发布信息没意义。年前这几天我挨个打开试了试，说说真实感受。

豆包2.0 Pro

这个让我最意外。

打开豆包App，选"专家模式"就行。免费。

我拿它写了段Python脚本做数据清洗。以前1.0经常逻辑不对，要改好几轮。

2.0一次就对了。

API输入价格3.2元/百万tokens，GPT-5.2要12块多。输出更夸张，16块对人家100块。

说实话我不太愿意承认，但**国产模型在日常任务上，真的够用了。**至少豆包这个版本是这样。

豆包2.0实测

Seedance 2.0

也在豆包App里，免费。

我拿它生成了一段新年祝福的短视频发了家族群。我妈问我哪儿找的素材。

以前可灵是王者。现在呢？Seedance起码能跟它掰掰手腕了。动作比之前流畅多了。

但有个问题——真人素材这块翻车了。生成太逼真，有人拿别人照片随便生成视频，字节赶紧限制了真人上传功能。

Seedance效果

GLM-5

智谱官网就能体验。

代码能力确实进步大。

但要说跟Claude Opus比，还是有差距。尤其复杂的多文件项目，Claude理解全局的能力还是强一截。

不过GLM-5免费啊。日常写个脚本、改个bug，够了。

Claude Opus 4.6

我自己的主力没变，还是Claude。

Opus 4.6最大的感觉不是"更聪明了"，而是**"更稳了"**。

之前用Claude Code跑长任务，经常跑到一半开始绕圈。4.6这个毛病好多了，能一口气干更久。

但说真的，如果你不是重度用户，4.5和4.6的区别没那么大。

DeepSeek 1M上下文

这个我是真觉得可惜——明明是个很厉害的更新，结果因为没官宣，很多人都不知道。

我试着把一个完整的前端项目喂进去让它分析。以前只能喂几个核心文件，现在整个仓库一次性塞进去，它还真能理解整体架构。

这种体验以前只有Gemini能给。

卷到最后

从兴奋变成无语，再从无语变成平静。

这是我年前这两周的心理曲线。

去年DeepSeek偷袭，所有人震惊。今年所有人都学会了偷袭，结果呢？

当所有人都选择偷袭，就不存在偷袭了。

你今天发的SOTA，下周就被人超了。

抢时间？抢流量？

到最后大家会发现——模型之间的差距越来越小。用户根本记不住你是2月10号发的还是2月14号发的。

记住的只有一件事：我打开你的App，好不好用。

AI竞赛

对我们来说呢？

选择多了，价格低了，能力强了。这当然是好事。

但我也有个判断：2026年，模型本身可能不再是壁垒了。 真正拉开差距的，是谁能把模型变成普通人用得上的东西。

趁过年有空，挑两三个打开试试。

不用全试。找到一个顺手的，用起来。比关注谁又发了什么模型有用多了。

最后说一句

我是 Evan，每天追全球 AI 动态，用说人话的方式写出来。

如果上面的内容对你有帮助，真诚地希望你能点个关注。

这对我真的很重要。

对了，我每天还做一份AI雷达日报。

全网扫描 7000+ 条信息，AI 过滤筛选，精选率不到 1%。只留最值得看的。

每天自动生成，第一时间发到群里，没广告，就图个信息互通。

AI雷达日报

想进？公众号发送「加群」两个字。