百度开源“文心4.5系列”大模型,一口气开源10款模型,卷哭友商?

279 阅读4分钟

6月30日,一个本来以为只是个普普通通上班🐟的日子,却被百度整得热热闹闹。

原来,百度兑现了之前2月份立下的flag,正式宣布:文心大模型4.5系列,开源了!并且一口气开源了10款模型。

说实话,我最开始用的大模型,就是百度的“搜索AI小伙伴”,后面出了“文心一言”,我也用了一段时间。再后来出了更多好用的模型,百度也就慢慢淡出了我的视野。

没想到百度这段时间也是没闲着,搁这憋大招呢。

(下面是我的收藏夹截图)

模型有哪些?全家桶直接安排!

百度这次放出的,是一个模型“十连包”,包括:

  • 参数量从 0.3B稠密模型,到 **47B激活参数的混合专家(MoE)**模型;
  • 还有视觉+文本混合的多模态模型,不光能“读文”,还能“看图说话”。

这一整套模型,不只是丢个权重文件完事,而是预训练权重 + 推理代码双全,还同步上线了 API 服务,想撸代码的撸代码,想调 API 的调 API,门槛也是基本拉到了地板。

真开源,还是“假开源”?

如果你和我一样,常年混迹大模型圈子,那你肯定知道,开源的并不一定都是好模型,毕竟谁家还没个开源的大模型呢?做做样子谁不会?

所以开源的重点是 开得诚不诚,源得深不深。百度这次开源文心 4.5 系列,至少做到以下几点:

  • 模型种类多:MoE、多模态、稠密模型,通通安排;
  • 技术够深:引入了自研的多模态混合专家架构,SOTA 基准测试成绩也摆出来了;
  • 协议够松:Apache 2.0,放心用,能商用;
  • 工具够全:搭配开源部署工具 FastDeploy 和开发套件 ERNIEKit,给开发者提供一整套“管饱”的工具链。

和友商比,怎么样?

接下来是你最关心的:那和别的模型比,开源的文心 4.5 到底怎么样?

来,掏出数据说话。

文心4.5预训练模型在主流基准测试中的表现

文心4.5-300B-A47B模型在主流基准测试中的表现

文心多模态后训练模型(支持思考、关闭思考)在多个多模态基准测试中达到SOTA水平

从数据中,可以看出,在文本任务方面:

  • 文心4.5的主力选手,在多个基准测试中超越了 DeepSeek-V3、Qwen3、GPT4.1 等同量级模型
  • 在推理、编程、事实准确性上表现尤为优秀,指令遵循能力也很能打。

在多模态任务方面:

  • 文心4.5-VL多模态模型和视觉界的卷王 Qwen2.5-VL-32B 正面对线,不输甚至持平
  • 视觉常识、多模态推理测试成绩上,比 OpenAI o1 还强一丢丢
  • 还能“关掉思考模式”再测试,支持思考/不思考双形态评估

总结下来就是:无论读图识字,还是写代码答题,文心4.5 确实都做的挺不错的

听说罗永浩带货的数字人,就是用百度文心大模型生成的,不知道这次开源的内容里,是否也可以生成罗永浩同款数字人?有懂的朋友可以在评论区给大家分享一下。

这波开源,真香!

百度文心4.5系列这波开源,也算是国内大模型领域又一次重量级出击。前有 阿里千问、DeepSeek,现有百度文心,在开源模型这一块,国内确实做到了全球顶尖,很有实力了。

如果你是下面这些人群,那百度文心4.5系列真的非常推荐你去试试:

  • 想做中文大模型项目的工程师
  • 想搭建多模态问答系统的开发者
  • 想薅开源羊毛、白嫖一波商用许可的企业用户

对了,我刚去 HuggingFace 上看了百度的模型,刚发布没多久呢,老新鲜了,赶紧冲就完事了!HuggingFace链接:huggingface.co/baidu/model…

也可以到飞桨AI Studio官方社区,在线体验:aistudio.baidu.com/overview