去年DeepSeek偷袭春节今年所有人都学会了

0 阅读6分钟

年前这两周,我隔几个小时就忍不住刷一下手机。

不是刷短视频。是看又有谁发模型了。

5号看一眼,Claude和GPT都更新了。11号看一眼,智谱官宣了。14号再看一眼,好家伙,字节三连发。

说实话,看到第三四个的时候,我已经从兴奋变成无语了。

不是模型不好。是这也太卷了。今天大年三十了,我寻思着总算能消停会儿了吧。

春节模型大战

全都学会了

还记得去年吧?

2025年春节前,DeepSeek放出了R1。等大家过完年回来一看,变天了。

一战封神,硅谷破防,英伟达单日蒸发近6000亿美元。

今年呢?所有人都学聪明了。

字节、阿里、智谱、MiniMax、月之暗面、讯飞……你叫得上名字的,全挤到春节来发了。

摩根大通的研报说这是**"中国AI行业史上最密集的旗舰模型发布潮"**。

模型发布潮

但你猜怎么着?

去年偷袭成功的DeepSeek,今年反而缺席了。

36氪有个标题我觉得说得好——"DeepSeek不发V4,六小龙不敢过年"

大家都怕再被偷家。结果今年DeepSeek不出手了,其他人全冲了上去。

挺讽刺的。

我注意到的几件事

这波模型我没有每个都追。

有些一看就是赶档期的——换个版本号,改个名字,其实底层没大变化。这种我直接跳过。

但有几个确实让我多看了两眼。

第一个是智谱的骚操作。

GLM-5没开发布会。先注册了个马甲叫"Pony Alpha",悄悄挂到OpenRouter上,免费给人用。

马年嘛,Pony,小马驹。挺会玩的。

然后全网开始猜——这到底是谁家的模型?有人测tokenizer,有人分析输出风格。

最绝的是什么?有人直接改了system prompt问它"你是谁"。

它回答了:"I'm GLM"。

得,瞒不住了。

Pony Alpha

从匿名上线到官宣,就5天。知乎帖子几千条回复,X上一堆人在猜。0块钱推广费,几千万曝光。

这营销水平,我是真服。

第二个是字节的三连发。

Seedance 2.0视频生成、Seedream 5.0图像生成、豆包2.0语言模型,10号到14号一口气全上了。

我对字节的态度一直是——产品做得快,但模型层面之前真不算顶尖。

豆包2.0出来之后,我改了一半的看法。后面细说。

字节三连发

第三个是DeepSeek的沉默。

全网等V4,没来。用户吐槽"变冷淡了""回复质量下降了"。

但它悄悄把上下文窗口从128K拉到了1M。一百万tokens,没官宣,直接上了。

别人开发布会,它改个版本号就完事了。

这很DeepSeek。但说实话我挺担心的——用户的耐心是有限的,你不说话,别人就替你说了。

DeepSeek沉默

我自己试了一圈

光看发布信息没意义。年前这几天我挨个打开试了试,说说真实感受。

豆包2.0 Pro

这个让我最意外。

打开豆包App,选"专家模式"就行。免费。

我拿它写了段Python脚本做数据清洗。以前1.0经常逻辑不对,要改好几轮。

2.0一次就对了。

API输入价格3.2元/百万tokens,GPT-5.2要12块多。输出更夸张,16块对人家100块。

说实话我不太愿意承认,但**国产模型在日常任务上,真的够用了。**至少豆包这个版本是这样。

豆包2.0实测

Seedance 2.0

也在豆包App里,免费。

我拿它生成了一段新年祝福的短视频发了家族群。我妈问我哪儿找的素材。

以前可灵是王者。现在呢?Seedance起码能跟它掰掰手腕了。动作比之前流畅多了。

但有个问题——真人素材这块翻车了。生成太逼真,有人拿别人照片随便生成视频,字节赶紧限制了真人上传功能。

Seedance效果

GLM-5

智谱官网就能体验。

代码能力确实进步大。

但要说跟Claude Opus比,还是有差距。尤其复杂的多文件项目,Claude理解全局的能力还是强一截。

不过GLM-5免费啊。日常写个脚本、改个bug,够了。

Claude Opus 4.6

我自己的主力没变,还是Claude。

Opus 4.6最大的感觉不是"更聪明了",而是**"更稳了"**。

之前用Claude Code跑长任务,经常跑到一半开始绕圈。4.6这个毛病好多了,能一口气干更久。

但说真的,如果你不是重度用户,4.5和4.6的区别没那么大。

DeepSeek 1M上下文

这个我是真觉得可惜——明明是个很厉害的更新,结果因为没官宣,很多人都不知道。

我试着把一个完整的前端项目喂进去让它分析。以前只能喂几个核心文件,现在整个仓库一次性塞进去,它还真能理解整体架构。

这种体验以前只有Gemini能给。

卷到最后

从兴奋变成无语,再从无语变成平静。

这是我年前这两周的心理曲线。

去年DeepSeek偷袭,所有人震惊。今年所有人都学会了偷袭,结果呢?

当所有人都选择偷袭,就不存在偷袭了。

你今天发的SOTA,下周就被人超了。

抢时间?抢流量?

到最后大家会发现——模型之间的差距越来越小。用户根本记不住你是2月10号发的还是2月14号发的。

记住的只有一件事:我打开你的App,好不好用。

AI竞赛

对我们来说呢?

选择多了,价格低了,能力强了。这当然是好事。

但我也有个判断:2026年,模型本身可能不再是壁垒了。 真正拉开差距的,是谁能把模型变成普通人用得上的东西。

趁过年有空,挑两三个打开试试。

不用全试。找到一个顺手的,用起来。比关注谁又发了什么模型有用多了。

最后说一句

我是 Evan,每天追全球 AI 动态,用说人话的方式写出来。

如果上面的内容对你有帮助,真诚地希望你能点个关注

这对我真的很重要。


对了,我每天还做一份AI雷达日报

全网扫描 7000+ 条信息,AI 过滤筛选,精选率不到 1%。只留最值得看的。

每天自动生成,第一时间发到群里,没广告,就图个信息互通。

AI雷达日报

想进?公众号发送「加群」两个字。