春节没顾上追新模型？17款新品一文速览春节光顾着拜年，没跟上AI圈的“模型春晚”？文心5.0、Qwen3.5、GLM-5

最近回老家过年，陪陪爸妈，走亲访友，处理各种杂事，节奏比上班还满。

偶尔刷到消息，感觉大模型发布跟“下饺子”似的，但实在抽不出时间细看。

今天终于清闲下来，那就好好补补课，仔细梳理一下。

概览

发布日期	内容
2026年1月22日	文心大模型5.0 正式版
2026年1月26日	Qwen3-Max-Thinking 旗舰推理模型
2026年1月27日	K2.5 开源多模态代理大模型
2026年1月27日	DeepSeek-OCR 2 视觉理解大模型
2026年2月3日	Qwen3-Coder-Next 开源编程智能体大模型
2026年2月3日	MiniCPM-o 4.5 开源全双工全模态大模型
2026年2月5日	Claude Opus 4.6 旗舰通用大模型
2026年2月5日	GPT-5.3-Codex 编程专用大模型
2026年2月5日	可灵AI 3.0 系列视频/图像生成模型
2026 年2月10日	Seedream 5.0 Preview 预览版图像生成大模型
2026年2月11日	GLM-5 旗舰通用大模型
2026年2月7日开始内测，2026年2月12日正式上线	Seedance 2.0 视频生成大模型
2026年2月12日	M2.5 全系列智能体专用大模型
2026年2月14日	豆包大模型2.0全系列模型
2026年2月16日（除夕）	通义千问 Qwen3.5-Plus 开源旗舰大模型
2026年2月17日（正月初一）	Claude Sonnet 4.6 高性价比通用大模型
2026年2月19日（正月初三）	Gemini 3.1 Pro 旗舰通用大模型

文心大模型5.0 正式版

厂商：百度

发布时间：2026年1月22日

简介：百度发布并上线的原生全模态基座模型，面向文本、图像、音频、视频等多模态统一理解与生成。

特点：

原生全模态统一建模：支持文本、图像、音频、视频等多种信息的输入与输出
2.4万亿参数规模，采用超大规模混合专家结构，激活参数比例低于3%，提升推理效率
已在文心App、文心一言官网开放体验，企业与开发者可通过百度千帆平台调用

Qwen3-Max-Thinking 旗舰推理模型

厂商：阿里巴巴

发布时间：2026年1月26日

简介：阿里通义千问旗舰级深度思考推理模型，为当时阿里规模最大、能力最强的千问系列产品，主打复杂推理、数学计算、代码编程等硬核场景。

特点：

总参数量超1万亿，预训练数据量36T Tokens，经大规模强化学习完成性能跃升
主打复杂推理/数学/代码等硬核场景，斩获AIME 25、HMMT 25数学竞赛国内首个双满分
综合性能媲美GPT-5.2、Gemini 3 Pro，为同期最接近国际顶尖水平的国产大模型之一

K2.5 开源多模态代理大模型

厂商：月之暗面

发布时间：2026年1月27日

简介：全球首个支持自引导智能体群的开源多模态MoE大模型，2026年开年国产开源模型标杆产品。

特点：

Agent Swarm智能体集群架构，可调度100个子智能体并行协同，任务延迟最高降低4.5倍，BrowseComp评测达78.4%
MoE架构总参数量1万亿，推理仅激活320亿参数，完成15T图文混合token联合预训练
模型及配套软件开源免费，无需额外OCR即可直接解析电路图、手写公式等复杂视觉内容

DeepSeek-OCR 2 视觉理解大模型

厂商：深度求索（DeepSeek）

发布时间：2026年1月27日

简介：新一代工业级视觉文档理解大模型，突破传统OCR瓶颈，实现复杂图文内容的类人级理解与解析。

特点：

搭载视觉因果流核心技术，可精准识别解析多栏财务报表、手写公式、复杂电路图、古籍文献等内容
支持多语言、多版式、低清晰度文档全场景适配，理解准确率较上一代提升47%
无需微调即可直接落地工业级场景

Qwen3-Coder-Next 开源编程智能体大模型

厂商：阿里巴巴

发布时间：2026年2月3日

简介：面向编码智能体与本地开发工作流设计的开源权重代码模型，强调强工具调用与可执行任务学习。

特点：

基于Qwen3-Next-80B-A3B-Base的混合注意力+MoE架构，显著降低推理成本
通过大规模可验证/可执行编码任务、环境交互与强化学习进行Agent化训练，强化编程与工具调用能力
同步公开技术报告与开源仓库，支持开发者本地与私有化部署

MiniCPM-o 4.5 开源全双工全模态大模型

厂商：面壁智能（OpenBMB）

发布时间：2026年2月3日

简介：端侧友好的全模态大模型系列最新版本，支持图像/视频/文本/音频输入与文本/语音输出的端到端交互。

特点：

全双工多模态流式交互：可同时“看、听、说”，输入流与输出流互不阻塞
主打端侧部署与低延迟交互体验，强调高能效比与实时对话能力
模型与相关资源已开源，支持开发者在本地环境快速体验与部署

Claude Opus 4.6 旗舰通用大模型

厂商：Anthropic

发布时间：2026年2月5日

简介：Claude系列旗舰迭代通用大模型，为当时Anthropic最先进的通用大模型，主打长上下文理解、复杂推理、智能体协作、专业编程能力升级。

特点：

100万token上下文窗口：可处理超长文档、超大规模代码库等长上下文任务
新增自适应思考机制与Agent Teams多智能体协作，强化长链路任务规划与并行执行能力
强化办公与工程化落地：Excel深度集成、PowerPoint集成预览；API定价与前代Opus 4.5保持一致并全面上线

GPT-5.3-Codex 编程专用大模型

厂商：OpenAI

发布时间：2026 年 2 月 5 日

简介：OpenAI 正式发布的新一代智能体编程专用大模型，被官方定义为 “迄今为止能力最强的智能体编程模型”，融合 GPT-5.2-Codex 前沿编程性能与 GPT-5.2 卓越的推理及专业知识能力，为 OpenAI 百亿算力合作项目核心落地成果，面向 ChatGPT Pro、Enterprise 用户开放研究预览，专用 API 通道将于 2026 年 2 月下旬上线。

特点：

性能与推理效率升级：较 GPT-5.2-Codex 运行速度提升 25%，依托 Cerebras 晶圆级芯片算力优化，推理输出超 1000 Token/秒
超长上下文与记忆：原生支持 40 万 tokens 上下文，配备完美记忆机制，最大输出 128K tokens，覆盖重构、多语言开发与漏洞排查等场景
智能体开发全流程：在 SWE-Bench Pro、Terminal-Bench 2.0、OSWorld 等基准刷新纪录，可自主完成配置-调试-部署-运维全生命周期，适配 50+ 编程语言

可灵AI 3.0 系列视频/图像生成模型

厂商：快手

发布时间：2026年2月5日

简介：可灵AI正式全球上线3.0系列模型，形成视频生成、图像生成与编辑的一体化创作链路，面向会员逐步开放并计划全量上线。

特点：

All-in-One多模态输入输出一体化：在单一模型内完成理解、生成与编辑的连续流程
叙事与可控性增强：引入智能分镜与自定义镜头控制，支持最长15秒连续生成
端到端音画能力强化：原生音画同出，多语种与多口音口型同步，提升影视级可用性

Seedream 5.0 Preview 预览版图像生成大模型

厂商：字节跳动

发布时间：2026 年 2 月 10 日

简介：字节跳动豆包旗下 Seedream 系列新一代前瞻预览版图像生成大模型，国内首款集成实时检索增强生成能力的商用视觉大模型，面向大众内容创作、商业设计、短视频生产全场景适配，已在字节全系创作工具开启灰度体验。

特点：

实时联网检索增强生成：动态获取热点资讯与产品信息，缓解训练数据滞后问题，强化中文语境与本土元素表达
多步推理与空间建模：支持多主体排布、复杂场景构建与多图风格一致，提升指令遵循与细节还原
高清输出与精细编辑：原生 2K 直出、AI 增强至 4K，支持笔刷局部重绘与跨图特征迁移，已接入剪映/CapCut/小云雀并开放限时免费体验

GLM-5 旗舰通用大模型

厂商：智谱AI

发布时间：2026年2月11日

简介：智谱AI发布并开源的新一代旗舰通用大模型，GLM系列跨代升级产品，覆盖对话、编程、智能体、多模态全场景，位列全球权威榜单开源模型第一。

特点：

总参数7440亿（40B活跃参数），预训练数据28.5万亿tokens，支持202K超长上下文窗口
Artificial Analysis榜单位列全球第四、开源模型第一，面向通用+Agent场景全面升级
模型完全开源免费，完成国产芯片全适配，支持商用与二次开发

Seedance 2.0 视频生成大模型

厂商：字节跳动

发布时间：2026年2月7日开始内测，2026年2月12日正式上线

简介：豆包旗下新一代专业级视频生成大模型，面向大众内容创作与专业影视制作双场景，实现视频生成能力代际突破。

特点：

导演级多镜头叙事、原生音画同步、跨镜头角色一致性三大核心能力升级
支持长时长、高叙事性视频生成，精准匹配脚本创作意图
深度应用于2026年央视春晚节目制作环节

M2.5 全系列智能体专用大模型

厂商：MiniMax

发布时间：2026年2月12日

简介：为智能体场景原生设计的全系列大模型，主打极致推理速度与普惠化成本，面向企业级办公自动化、多轮交互Agent场景深度优化。

特点：

支持100tps以上超高推理输出速度，输入价格低至约0.3美元/百万token，降低Agent规模化部署成本
同步推出专用编程版本，深度适配办公自动化、企业级流程开发、多轮对话交互场景

豆包大模型2.0全系列模型

厂商：字节跳动

发布时间：2026年2月14日

简介：豆包系列首次跨代升级旗舰产品，覆盖通用、编程、轻量化场景的全系列模型家族，面向消费级与企业级全场景适配。

特点：

全系列家族：Pro、Lite、Mini三款通用Agent模型+专属Code版，面向不同规模与场景分层供给
多模态理解与视觉/空间推理能力强化，在数学奥赛、编程竞赛等测试中成绩突出
Code版深度适配字节TRAE AI编程环境，火山引擎同步开放全系列API服务

通义千问 Qwen3.5-Plus 开源旗舰大模型

厂商：阿里巴巴

发布时间：2026年2月16日（除夕）

简介：阿里通义千问除夕夜发布并开源的新一代旗舰大模型，千问系列架构级革新产品，连续第三年除夕夜发布重磅模型更新。

特点：

MoE混合专家架构：总参数3970亿，推理仅激活170亿参数，性能全面超越此前万亿参数的Qwen3-Max
性价比与吞吐提升：部署显存占用降低60%，最大推理吞吐量提升至19倍，API价格每百万Token低至0.8元
原生支持201种语言并开源免费，开放全球商用与二次开发权限，关键基准测试得分高于多款国际顶级闭源模型

Claude Sonnet 4.6 高性价比通用大模型

厂商：Anthropic

发布时间：2026年2月17日（正月初一）

简介：Claude系列高性价比通用大模型迭代版，聚焦编码、智能体与专业办公任务的规模化落地，同步升级长上下文能力。

特点：

1M token上下文窗口：在API端以beta形式提供，用于超长文档与大代码库任务
产品端默认升级：Free与Pro用户在claude.ai与Claude Cowork默认使用Sonnet 4.6
定价保持不变：与Sonnet 4.5一致，输入3美元/百万token、输出15美元/百万token起

Gemini 3.1 Pro 旗舰通用大模型

厂商：谷歌DeepMind

发布时间：2026年2月19日（正月初三）

简介：Gemini 3系列核心迭代旗舰通用大模型，为Gemini 3 Deep Think 科研推理模式的能力普惠化版本，主打科研级能力规模化落地，覆盖消费、开发、企业全场景，为同期性能最强的通用大模型之一。

特点：

长上下文与长输出：MoE混合专家架构，最高支持100万token输入上下文、6.4万token超长输出
推理能力大幅提升：ARC-AGI-2基准测试得分77.1%，新增三级可调节推理深度，兼顾速度与精度
科研与工程落地强化：科研学术评测领先，多项编程/智能体基准测试登顶，幻觉率下降38个百分点且API定价保持一致

终于梳理完了，希望也能让你在开始上班前跟上整体的节奏，心里不再那么慌~

还没过初五，给大家拜个晚年~