春节没顾上追新模型?17款新品一文速览

28 阅读13分钟

最近回老家过年,陪陪爸妈,走亲访友,处理各种杂事,节奏比上班还满。

偶尔刷到消息,感觉大模型发布跟“下饺子”似的,但实在抽不出时间细看。

今天终于清闲下来,那就好好补补课,仔细梳理一下。

概览

发布日期内容
2026年1月22日文心大模型5.0 正式版
2026年1月26日Qwen3-Max-Thinking 旗舰推理模型
2026年1月27日K2.5 开源多模态代理大模型
2026年1月27日DeepSeek-OCR 2 视觉理解大模型
2026年2月3日Qwen3-Coder-Next 开源编程智能体大模型
2026年2月3日MiniCPM-o 4.5 开源全双工全模态大模型
2026年2月5日Claude Opus 4.6 旗舰通用大模型
2026年2月5日GPT-5.3-Codex 编程专用大模型
2026年2月5日可灵AI 3.0 系列视频/图像生成模型
2026 年2月10日Seedream 5.0 Preview 预览版图像生成大模型
2026年2月11日GLM-5 旗舰通用大模型
2026年2月7日开始内测,2026年2月12日正式上线Seedance 2.0 视频生成大模型
2026年2月12日M2.5 全系列智能体专用大模型
2026年2月14日豆包大模型2.0全系列模型
2026年2月16日(除夕)通义千问 Qwen3.5-Plus 开源旗舰大模型
2026年2月17日(正月初一)Claude Sonnet 4.6 高性价比通用大模型
2026年2月19日(正月初三)Gemini 3.1 Pro 旗舰通用大模型

文心大模型5.0 正式版

厂商:百度

发布时间:2026年1月22日

简介:百度发布并上线的原生全模态基座模型,面向文本、图像、音频、视频等多模态统一理解与生成。

特点

  1. 原生全模态统一建模:支持文本、图像、音频、视频等多种信息的输入与输出
  2. 2.4万亿参数规模,采用超大规模混合专家结构,激活参数比例低于3%,提升推理效率
  3. 已在文心App、文心一言官网开放体验,企业与开发者可通过百度千帆平台调用

Qwen3-Max-Thinking 旗舰推理模型

厂商:阿里巴巴

发布时间:2026年1月26日

简介:阿里通义千问旗舰级深度思考推理模型,为当时阿里规模最大、能力最强的千问系列产品,主打复杂推理、数学计算、代码编程等硬核场景。

特点

  1. 总参数量超1万亿,预训练数据量36T Tokens,经大规模强化学习完成性能跃升
  2. 主打复杂推理/数学/代码等硬核场景,斩获AIME 25、HMMT 25数学竞赛国内首个双满分
  3. 综合性能媲美GPT-5.2、Gemini 3 Pro,为同期最接近国际顶尖水平的国产大模型之一

K2.5 开源多模态代理大模型

厂商:月之暗面

发布时间:2026年1月27日

简介:全球首个支持自引导智能体群的开源多模态MoE大模型,2026年开年国产开源模型标杆产品。

特点

  1. Agent Swarm智能体集群架构,可调度100个子智能体并行协同,任务延迟最高降低4.5倍,BrowseComp评测达78.4%
  2. MoE架构总参数量1万亿,推理仅激活320亿参数,完成15T图文混合token联合预训练
  3. 模型及配套软件开源免费,无需额外OCR即可直接解析电路图、手写公式等复杂视觉内容

DeepSeek-OCR 2 视觉理解大模型

厂商:深度求索(DeepSeek)

发布时间:2026年1月27日

简介:新一代工业级视觉文档理解大模型,突破传统OCR瓶颈,实现复杂图文内容的类人级理解与解析。

特点

  1. 搭载视觉因果流核心技术,可精准识别解析多栏财务报表、手写公式、复杂电路图、古籍文献等内容
  2. 支持多语言、多版式、低清晰度文档全场景适配,理解准确率较上一代提升47%
  3. 无需微调即可直接落地工业级场景

Qwen3-Coder-Next 开源编程智能体大模型

厂商:阿里巴巴

发布时间:2026年2月3日

简介:面向编码智能体与本地开发工作流设计的开源权重代码模型,强调强工具调用与可执行任务学习。

特点

  1. 基于Qwen3-Next-80B-A3B-Base的混合注意力+MoE架构,显著降低推理成本
  2. 通过大规模可验证/可执行编码任务、环境交互与强化学习进行Agent化训练,强化编程与工具调用能力
  3. 同步公开技术报告与开源仓库,支持开发者本地与私有化部署

MiniCPM-o 4.5 开源全双工全模态大模型

厂商:面壁智能(OpenBMB)

发布时间:2026年2月3日

简介:端侧友好的全模态大模型系列最新版本,支持图像/视频/文本/音频输入与文本/语音输出的端到端交互。

特点

  1. 全双工多模态流式交互:可同时“看、听、说”,输入流与输出流互不阻塞
  2. 主打端侧部署与低延迟交互体验,强调高能效比与实时对话能力
  3. 模型与相关资源已开源,支持开发者在本地环境快速体验与部署

Claude Opus 4.6 旗舰通用大模型

厂商:Anthropic

发布时间:2026年2月5日

简介:Claude系列旗舰迭代通用大模型,为当时Anthropic最先进的通用大模型,主打长上下文理解、复杂推理、智能体协作、专业编程能力升级。

特点

  1. 100万token上下文窗口:可处理超长文档、超大规模代码库等长上下文任务
  2. 新增自适应思考机制与Agent Teams多智能体协作,强化长链路任务规划与并行执行能力
  3. 强化办公与工程化落地:Excel深度集成、PowerPoint集成预览;API定价与前代Opus 4.5保持一致并全面上线

GPT-5.3-Codex 编程专用大模型

厂商:OpenAI

发布时间:2026 年 2 月 5 日

简介:OpenAI 正式发布的新一代智能体编程专用大模型,被官方定义为 “迄今为止能力最强的智能体编程模型”,融合 GPT-5.2-Codex 前沿编程性能与 GPT-5.2 卓越的推理及专业知识能力,为 OpenAI 百亿算力合作项目核心落地成果,面向 ChatGPT Pro、Enterprise 用户开放研究预览,专用 API 通道将于 2026 年 2 月下旬上线。

特点

  1. 性能与推理效率升级:较 GPT-5.2-Codex 运行速度提升 25%,依托 Cerebras 晶圆级芯片算力优化,推理输出超 1000 Token/秒
  2. 超长上下文与记忆:原生支持 40 万 tokens 上下文,配备完美记忆机制,最大输出 128K tokens,覆盖重构、多语言开发与漏洞排查等场景
  3. 智能体开发全流程:在 SWE-Bench Pro、Terminal-Bench 2.0、OSWorld 等基准刷新纪录,可自主完成配置-调试-部署-运维全生命周期,适配 50+ 编程语言

可灵AI 3.0 系列视频/图像生成模型

厂商:快手

发布时间:2026年2月5日

简介:可灵AI正式全球上线3.0系列模型,形成视频生成、图像生成与编辑的一体化创作链路,面向会员逐步开放并计划全量上线。

特点

  1. All-in-One多模态输入输出一体化:在单一模型内完成理解、生成与编辑的连续流程
  2. 叙事与可控性增强:引入智能分镜与自定义镜头控制,支持最长15秒连续生成
  3. 端到端音画能力强化:原生音画同出,多语种与多口音口型同步,提升影视级可用性

Seedream 5.0 Preview 预览版图像生成大模型

厂商:字节跳动

发布时间:2026 年 2 月 10 日

简介:字节跳动豆包旗下 Seedream 系列新一代前瞻预览版图像生成大模型,国内首款集成实时检索增强生成能力的商用视觉大模型,面向大众内容创作、商业设计、短视频生产全场景适配,已在字节全系创作工具开启灰度体验。

特点

  1. 实时联网检索增强生成:动态获取热点资讯与产品信息,缓解训练数据滞后问题,强化中文语境与本土元素表达
  2. 多步推理与空间建模:支持多主体排布、复杂场景构建与多图风格一致,提升指令遵循与细节还原
  3. 高清输出与精细编辑:原生 2K 直出、AI 增强至 4K,支持笔刷局部重绘与跨图特征迁移,已接入剪映/CapCut/小云雀并开放限时免费体验

GLM-5 旗舰通用大模型

厂商:智谱AI

发布时间:2026年2月11日

简介:智谱AI发布并开源的新一代旗舰通用大模型,GLM系列跨代升级产品,覆盖对话、编程、智能体、多模态全场景,位列全球权威榜单开源模型第一。

特点

  1. 总参数7440亿(40B活跃参数),预训练数据28.5万亿tokens,支持202K超长上下文窗口
  2. Artificial Analysis榜单位列全球第四、开源模型第一,面向通用+Agent场景全面升级
  3. 模型完全开源免费,完成国产芯片全适配,支持商用与二次开发

Seedance 2.0 视频生成大模型

厂商:字节跳动

发布时间:2026年2月7日开始内测,2026年2月12日正式上线

简介:豆包旗下新一代专业级视频生成大模型,面向大众内容创作与专业影视制作双场景,实现视频生成能力代际突破。

特点

  1. 导演级多镜头叙事、原生音画同步、跨镜头角色一致性三大核心能力升级
  2. 支持长时长、高叙事性视频生成,精准匹配脚本创作意图
  3. 深度应用于2026年央视春晚节目制作环节

M2.5 全系列智能体专用大模型

厂商:MiniMax

发布时间:2026年2月12日

简介:为智能体场景原生设计的全系列大模型,主打极致推理速度与普惠化成本,面向企业级办公自动化、多轮交互Agent场景深度优化。

特点

  1. 支持100tps以上超高推理输出速度,输入价格低至约0.3美元/百万token,降低Agent规模化部署成本
  2. 同步推出专用编程版本,深度适配办公自动化、企业级流程开发、多轮对话交互场景

豆包大模型2.0全系列模型

厂商:字节跳动

发布时间:2026年2月14日

简介:豆包系列首次跨代升级旗舰产品,覆盖通用、编程、轻量化场景的全系列模型家族,面向消费级与企业级全场景适配。

特点

  1. 全系列家族:Pro、Lite、Mini三款通用Agent模型+专属Code版,面向不同规模与场景分层供给
  2. 多模态理解与视觉/空间推理能力强化,在数学奥赛、编程竞赛等测试中成绩突出
  3. Code版深度适配字节TRAE AI编程环境,火山引擎同步开放全系列API服务

通义千问 Qwen3.5-Plus 开源旗舰大模型

厂商:阿里巴巴

发布时间:2026年2月16日(除夕)

简介:阿里通义千问除夕夜发布并开源的新一代旗舰大模型,千问系列架构级革新产品,连续第三年除夕夜发布重磅模型更新。

特点

  1. MoE混合专家架构:总参数3970亿,推理仅激活170亿参数,性能全面超越此前万亿参数的Qwen3-Max
  2. 性价比与吞吐提升:部署显存占用降低60%,最大推理吞吐量提升至19倍,API价格每百万Token低至0.8元
  3. 原生支持201种语言并开源免费,开放全球商用与二次开发权限,关键基准测试得分高于多款国际顶级闭源模型

Claude Sonnet 4.6 高性价比通用大模型

厂商:Anthropic

发布时间:2026年2月17日(正月初一)

简介:Claude系列高性价比通用大模型迭代版,聚焦编码、智能体与专业办公任务的规模化落地,同步升级长上下文能力。

特点

  1. 1M token上下文窗口:在API端以beta形式提供,用于超长文档与大代码库任务
  2. 产品端默认升级:Free与Pro用户在claude.ai与Claude Cowork默认使用Sonnet 4.6
  3. 定价保持不变:与Sonnet 4.5一致,输入3美元/百万token、输出15美元/百万token起

Gemini 3.1 Pro 旗舰通用大模型

厂商:谷歌DeepMind

发布时间:2026年2月19日(正月初三)

简介:Gemini 3系列核心迭代旗舰通用大模型,为Gemini 3 Deep Think 科研推理模式的能力普惠化版本,主打科研级能力规模化落地,覆盖消费、开发、企业全场景,为同期性能最强的通用大模型之一。

特点

  1. 长上下文与长输出:MoE混合专家架构,最高支持100万token输入上下文、6.4万token超长输出
  2. 推理能力大幅提升:ARC-AGI-2基准测试得分77.1%,新增三级可调节推理深度,兼顾速度与精度
  3. 科研与工程落地强化:科研学术评测领先,多项编程/智能体基准测试登顶,幻觉率下降38个百分点且API定价保持一致

终于梳理完了,希望也能让你在开始上班前跟上整体的节奏,心里不再那么慌~

还没过初五,给大家拜个晚年~