大模型主要公司与产品时间线
目录
- 一、海外代表公司及产品
- 二、中国代表公司及产品概览
- 三、各家模型版本详表(按公司)
- 四、技术路线与开源/闭源速览
- 五、信息更正与 2025–2026 动态速览
- 六、其他值得关注的生态
- 七、关键能力横向对比与跑分榜单
- 免责声明
本文按时间线与公司梳理大模型应用、主要公司与产品。
一、海外代表公司及产品
OpenAI(美国)
| 产品/模型 | 时间 | 说明 |
|---|
| Codex | 2021 起 | 专为编程设计,GitHub Copilot 技术基础。 |
| ChatGPT | 2022.11 | 基于 GPT-3.5 的对话式 AI,多轮对话、写作、编程;大模型「出圈」标志。 |
| GPT-4 系列 | 2023 起 | 多模态、插件与 GPTs,演变为 AI 应用平台。 |
Anthropic(美国)
| 产品/模型 | 时间 | 说明 |
|---|
| Claude 系列 | 2023 起 | 长文本与安全对齐,企业文档分析、代码审查等。 |
| Claude Code | 2025.02 起 | 终端 AI 编程助手,多语言、自动改代码与测试。 |
| Claude Sonnet 4.5 | 2025.09 | 复杂推理与自主编程,OSWorld 等测试表现突出。 |
| Claude Agent SDK | 2025.10 | 构建金融、个人助理等自主智能体。 |
| Claude Cowork | 2026 起 | 对话式创建定制插件,融入 HR、运营、设计等流程。 |
二、中国代表公司及产品概览
| 公司 | 产品/品牌 | 时间 | 说明 |
|---|
| 百度 | 文心一言 (ERNIE Bot) | 2023.03 | 多语言、多模态,金融、政务、教育等。 |
| 阿里巴巴 | 通义千问 / 千问 | 2023.09 | 超大规模语言模型,多轮对话、创作、推理;后开源 72B/32B 等;2026.03 品牌统一为「千问」。 |
| 字节跳动 | 豆包 | 2023 下半年 | 轻量、响应快,结合抖音/头条生态;豆包 2.0 支持全模态与长链路 Agent。 |
| 科大讯飞 | 星火认知大模型 | 2023 起 | 中文理解与教育场景,星火 App、教育机器人等。 |
| 商汤科技 | 商量 SenseNova | 2023 起 | 视觉+文本多模态,智慧城市、自动驾驶、医疗影像等。 |
| MiniMax | abab / MiniMax 大模型 | 2023 起 | 对话与轻量部署,内容生成、智能客服;M2.5 等面向 Agent 与编程。 |
| 智谱 AI | ChatGLM / GLM 系列 | 2023 起 | 中文优化、开源多,科研、教育、企业服务。 |
| 昆仑万维 | 天工 Skywork | 2023 起 | 多语言、开放 API,内容创作、办公自动化。 |
| 百川智能 | 百川大模型 | 2023 起 | 中文通用,搜索增强、知识问答。 |
| 深度求索 | DeepSeek 系列 | 2024.12 起 | VL2/V3 等开源,政务、医疗、金融等;增长迅速。 |
三、各家模型版本详表(按公司)
OpenAI
| 时间 | 模型/产品 | 版本/代号 | 说明 |
|---|
| 2022-11 | ChatGPT | GPT-3.5 | 对话式 AI,引爆大模型热潮。 |
| 2023-03 | GPT-4 | GPT-4 | 多模态大模型。 |
| 2023-03 | GPT-4 Turbo | gpt-4-1106-preview 等 | 成本与上下文优化。 |
| 2023-09 | DALL·E 3 | - | 文生图,深度集成 ChatGPT。 |
| 2024-02 | Sora | - | 文生视频。 |
| 2024-05 | GPT-4o | gpt-4o | 原生多模态,音视频实时交互。 |
| 2024-07 | GPT-4o mini | gpt-4o-mini | 轻量、低成本。 |
| 2024-09 | o1 | o1-preview / o1 | 推理模型,「先思考再回答」。 |
| 2024-12 | o3 | - | 面向 STEM 与复杂推理。 |
注:截至当前,OpenAI 官方旗舰仍以 GPT-4o / GPT-4o-mini 及 o 系列为主;GPT-5 等名称为媒体或社区说法,以官网发布为准。
Anthropic
| 时间 | 模型/产品 | 版本/代号 | 说明 |
|---|
| 2023-03 | Claude | Claude 1.0 | 安全与对话。 |
| 2024-03 | Claude 3 | Opus / Sonnet / Haiku | 系列化,Opus 最强、Haiku 最快。 |
| 2024-06 | Claude 3.5 | Claude 3.5 Sonnet | 推理与长文本增强。 |
| 2025-02 | Claude 3.7 | Claude 3.7 Sonnet | 「扩展思维」模式。 |
| 2025 起 | Claude 4.x | Claude 4.0 / 4.1 等 | 新一代系列。 |
阿里巴巴(通义千问 / 千问)
| 时间 | 模型/产品 | 版本/代号 | 说明 |
|---|
| 2023-04 | 通义千问 | Qwen1 | 开源 7B–72B。 |
| 2024-06 | 通义千问 | Qwen2 | 代码能力提升,多编程语言。 |
| 2024 | 通义千问 | Qwen2.5 | 性能与资源均衡。 |
| 2025-04 | 通义千问 | Qwen3 | 旗舰,MoE,256K 上下文。 |
| 2025-12 | 通义千问 | Qwen3-VL / Qwen3-Omni | 视觉-语言;全模态(文本/图像/音频/视频)。 |
| 2026-03 | 千问 | 品牌统一 | AI 核心品牌统一为「千问」。 |
字节跳动(豆包)
| 时间 | 模型/产品 | 版本/代号 | 说明 |
|---|
| 2024-05 | 豆包 | 豆包 1.0 | 多模态,依托抖音生态。 |
| 2025 | 豆包 | 豆包 1.5 | 语音与内容生成优化。 |
| 2026-02 | 豆包 | 豆包 2.0 (Seed 2.0) | 全模态感知与长链路 Agent。 |
百度(文心一言)
| 时间 | 模型/产品 | 版本/代号 | 说明 |
|---|
| 2023-03 | 文心一言 | ERNIE Bot 1.0 | 基于文心大模型对话。 |
| 2024 | 文心一言 | ERNIE Bot 4.0 | 逻辑推理与代码增强。 |
| 2025 | 文心一言 | ERNIE Bot 4.5 / 5.0 | 多模态与行业应用。 |
深度求索(DeepSeek)
| 时间 | 模型/产品 | 版本/代号 | 说明 |
|---|
| 2024 | DeepSeek | DeepSeek-V2 / V2.5 | MoE,高性价比。 |
| 2024-12 | DeepSeek | DeepSeek-V3 | 超大 MoE,671B 总参数。 |
| 2025-01 | DeepSeek | DeepSeek-R1 | 推理专用,数学与代码。 |
| 2026-02/03 | DeepSeek | DeepSeek-V4 | 长上下文、多模态等(以官方发布为准)。 |
注:V3.2、R1-0528 等多为社区或媒体称呼,正式版本以官网为准。
智谱 AI(GLM)
| 时间 | 模型/产品 | 版本/代号 | 说明 |
|---|
| 2023 | ChatGLM | ChatGLM2 / 3 | 开源对话,长文本。 |
| 2024-06 | 智谱大模型 | GLM-4 | 旗舰,128K 上下文。 |
| 2024 | 智谱大模型 | GLM-4.5 / 4.6 | 推理与多模态。 |
| 2025 | 智谱大模型 | GLM-5、GLM-4 Plus、CogView4、CogVideoX 等 | 对话、多模态、图文/视频生成。 |
其他中国厂商(选列)
| 公司 | 模型/产品 | 版本/说明 |
|---|
| 百川智能 | 百川大模型 | Baichuan 1/2/3/4,Baichuan-M2(医疗),Baichuan4-Finance。 |
| MiniMax | 海螺AI、MiniMax-01 | 视频生成;线性注意力、长文本。 |
| 昆仑万维 | 天工 Skywork | Skywork-MoE、Skywork-OR1-32B、Skywork-R1V3-38B。 |
| 零一万物 | Yi 系列 | Yi 1.5/1.6/Large,Yi-Vision,Yi-Coder。 |
| 上海 AI Lab | InternLM | InternLM2.5,InternLM-Math,InternVL-Chat。 |
其他国际主流(选列)
| 公司 | 模型/产品 | 版本/说明 |
|---|
| Google | Gemini | Gemini 1.5 Pro(百万级上下文)、2.0、2.5。 |
| Meta | Llama | Llama 2/3、3.1(含 405B)、3.2、3.3。 |
| IBM | Granite | Granite 3.2、Granite Vision。 |
| xAI | Grok | Grok-1.5/2/3 及 mini 等。 |
四、技术路线与开源/闭源速览
4.1 技术路线与特色(选列)
| 公司/产品 | 架构/路线特点 | 典型能力侧重 |
|---|
| OpenAI | 密集 Transformer、o 系列推理模型 | 多模态、实时交互、推理与代码 |
| Anthropic | 宪法 AI、混合推理(快/扩展思维) | 长文本、安全对齐、编程与智能体 |
| Google | Gemini、多模态与搜索整合 | 百万级上下文、多模态、生态整合 |
| Meta | LLaMA 系列,开源可商用 | 开源基座、多规模、多模态版本 |
| 阿里 千问 | Qwen 系列,MoE(Qwen3) | 长上下文、代码、开源与多模态 |
| 深度求索 | DeepSeek-V/R 系列,MoE | 高性价比、推理(R1)、数学与代码 |
| 智谱 | GLM 系列,CogView/CogVideo | 中文、多模态、图文/视频生成 |
| 字节 豆包 | 多模态、Seed 系列 | 全模态、抖音/飞书生态、Agent |
| 百度 文心 | ERNIE,多模态 | 搜索与文库整合、行业应用 |
| 月之暗面 Kimi | 长上下文、Agent | 超长文本、长文档阅读、推理 |
4.2 开源与闭源速查(概览)
| 类型 | 代表产品/系列 | 说明 |
|---|
| 闭源 / API 为主 | ChatGPT(GPT-4o)、Claude、Gemini、文心、豆包、Kimi | 能力强、迭代快;依赖厂商 API 与合规。 |
| 开源可商用 | LLaMA、Qwen、DeepSeek、GLM、Yi、InternLM、百川、混元图像 | 可私有化部署、微调;社区与生态活跃。 |
| 开源 + 闭源双线 | 千问(开源 Qwen + 闭源服务)、智谱(开源 GLM + 闭源) | 兼顾开放与商业产品。 |
4.3 应用场景速览
| 场景 | 典型产品/方向 |
|---|
| 通用对话与写作 | ChatGPT、Claude、千问、文心、豆包、Kimi |
| 编程与代码 | Claude Code、GitHub Copilot、DeepSeek-R1、Qwen、GLM |
| 办公与效率 | Copilot、飞书/豆包、通义、WPS AI、钉钉 |
| 教育 | 星火、文心、Kimi(长文档)、各类作业辅导与口语 |
| 政务与 ToG | 文心、通义、DeepSeek、华为盘古、360 智脑 |
| 金融与合规 | 千问、文心、百川金融、Claude、企业版模型 |
| 多模态创作 | DALL·E、Sora、可灵、混元图像、CogView、海螺AI |
| 终端与硬件 | 小爱、蓝心、OPPO 等手机/车机;千问 AI 眼镜 |
五、信息更正与 2025–2026 动态速览
信息更正
- GPT-5 系列:截至当前,OpenAI 未正式发布 GPT-5、5.1 等;旗舰仍为 GPT-4o / GPT-4o-mini 及 o 系列。
- DeepSeek:V3.2、R1-0528 等多为非官方版本号,官方里程碑以 DeepSeek-V3、DeepSeek-R1 等为准。
2025–2026 关键动态(选列)
| 时间 | 公司/机构 | 模型/产品 | 关键信息 |
|---|
| 2025-01 | 深度求索 | DeepSeek R1 | 推理专用,数学与代码,性价比高。 |
| 2025-02 | 智谱 AI | GLM-5 | 新一代旗舰,复杂任务与视频生成。 |
| 2025-02 | 字节跳动 | 豆包 2.0 | 多模态与长视频理解。 |
| 2025-02 | 快手 | 可灵 3.0 | 图/文生视频、智能编辑。 |
| 2025-02 | 腾讯 | 混元图像 3.0 | 开源图生图,图片编辑、风格变换、老照片修复等。 |
| 2025-03 | 阿里巴巴 | 千问 AI 眼镜 | 首款 AI 硬件,点外卖、订酒店等。 |
| 2025-09–11 | 蚂蚁集团 | 百灵大模型 | Ring-1T、Ling-1T 等开源与多模态。 |
| 2026-02 | 蚂蚁集团 | 百灵 Ming-Flash-Omni 2.0、Ring-2.5-1T、企业版 | 全模态、万亿参数思考模型、企业场景。 |
| 2026-02/03 | 深度求索 | DeepSeek V4 | 长上下文、多模态(以官方为准)。 |
| 2026-03 | 阿里巴巴 | 千问 | 品牌统一为「千问」。 |
六、其他值得关注的生态
| 公司/体系 | 产品/定位 | 说明 |
|---|
| 华为云 | 盘古大模型 | NLP、CV、科学计算,分层解耦,工业、金融等。 |
| 科大讯飞 | 星火认知大模型 | 中文与教育,AI 学伴、口语陪练、智能客服等。 |
| 京东 | 言犀大模型 | 智能客服与导购,零售、物流。 |
| 360 | 360 智脑 | 通用问答与搜索增强,安全分析、内容审核、API。 |
| 月之暗面 | Kimi | 超长文本与多轮对话,长文档阅读,科研、法律等。 |
| 腾讯 | 混元大模型 | 通用与多模态,含混元图像等;应用于内部产品与开放能力。 |
| 小米 / vivo / OPPO | 小爱大模型、蓝心大模型等 | 终端侧大模型,手机、家居等本地化体验。 |
七、关键能力横向对比与跑分榜单
关键能力横向对比(简要)
下表为公开评测与报道中的典型表现,供参考;具体以各榜单与官网为准。
| 模型(公司) | 代码生成 | 数学推理 | 多模态 |
|---|
| Claude Opus 4.x (Anthropic) | SWE-bench 等领先,多文件与复杂工程 | ARC-AGI 等推理突出 | 长上下文、文档/代码库、多模态 |
| GPT-4o / o 系列 (OpenAI) | SWE-bench 第一梯队 | AIME 等稳健 | 文本/图像/音频/视频,实时交互 |
| DeepSeek V3/R1 (深度求索) | 性价比高,接近前沿 | AIME、高考数学等顶尖 | 当前以文本为主 |
| Qwen 3.x (阿里) | SWE-bench 国产第一梯队 | AIME 顶尖 | 长上下文、Qwen-VL 图文 |
| GLM-5 (智谱) | SWE-bench 国产顶尖 | AIME 优秀 | 200K 上下文,多模态增强 |
| Kimi K2.x (月之暗面) | 长文档代码理解强 | AIME 等竞赛领先 | 超长文本与 Agent |
| 豆包 2.0 (字节) | 工程能力快速追赶 | 高考数学等优秀 | 文/图/视频,抖音/飞书集成 |
| 文心 5 (百度) | 公开编程基准较少 | 公开数学专项较少 | 与搜索、文库等深度整合 |
主流跑分榜单与评测网站
免责声明
本文整理自公开报道与评测信息,时间与版本以各公司官网与正式发布为准。能力对比与榜单会随评测更新而变化,请以各站点最新数据为准。
参考资料:公开报道、各公司官网与评测站点整理。