大模型主要公司与产品时间线

全栈开发小黑黑

2026-03-08 1,267 阅读11分钟

大模型主要公司与产品时间线

目录

一、海外代表公司及产品
二、中国代表公司及产品概览
三、各家模型版本详表（按公司）
四、技术路线与开源/闭源速览
五、信息更正与 2025–2026 动态速览
六、其他值得关注的生态
七、关键能力横向对比与跑分榜单
免责声明

本文按时间线与公司梳理大模型应用、主要公司与产品。

一、海外代表公司及产品

OpenAI（美国）

产品/模型	时间	说明
Codex	2021 起	专为编程设计，GitHub Copilot 技术基础。
ChatGPT	2022.11	基于 GPT-3.5 的对话式 AI，多轮对话、写作、编程；大模型「出圈」标志。
GPT-4 系列	2023 起	多模态、插件与 GPTs，演变为 AI 应用平台。

Anthropic（美国）

产品/模型	时间	说明
Claude 系列	2023 起	长文本与安全对齐，企业文档分析、代码审查等。
Claude Code	2025.02 起	终端 AI 编程助手，多语言、自动改代码与测试。
Claude Sonnet 4.5	2025.09	复杂推理与自主编程，OSWorld 等测试表现突出。
Claude Agent SDK	2025.10	构建金融、个人助理等自主智能体。
Claude Cowork	2026 起	对话式创建定制插件，融入 HR、运营、设计等流程。

二、中国代表公司及产品概览

公司	产品/品牌	时间	说明
百度	文心一言 (ERNIE Bot)	2023.03	多语言、多模态，金融、政务、教育等。
阿里巴巴	通义千问 / 千问	2023.09	超大规模语言模型，多轮对话、创作、推理；后开源 72B/32B 等；2026.03 品牌统一为「千问」。
字节跳动	豆包	2023 下半年	轻量、响应快，结合抖音/头条生态；豆包 2.0 支持全模态与长链路 Agent。
科大讯飞	星火认知大模型	2023 起	中文理解与教育场景，星火 App、教育机器人等。
商汤科技	商量 SenseNova	2023 起	视觉+文本多模态，智慧城市、自动驾驶、医疗影像等。
MiniMax	abab / MiniMax 大模型	2023 起	对话与轻量部署，内容生成、智能客服；M2.5 等面向 Agent 与编程。
智谱 AI	ChatGLM / GLM 系列	2023 起	中文优化、开源多，科研、教育、企业服务。
昆仑万维	天工 Skywork	2023 起	多语言、开放 API，内容创作、办公自动化。
百川智能	百川大模型	2023 起	中文通用，搜索增强、知识问答。
深度求索	DeepSeek 系列	2024.12 起	VL2/V3 等开源，政务、医疗、金融等；增长迅速。

三、各家模型版本详表（按公司）

OpenAI

时间	模型/产品	版本/代号	说明
2022-11	ChatGPT	GPT-3.5	对话式 AI，引爆大模型热潮。
2023-03	GPT-4	GPT-4	多模态大模型。
2023-03	GPT-4 Turbo	gpt-4-1106-preview 等	成本与上下文优化。
2023-09	DALL·E 3	-	文生图，深度集成 ChatGPT。
2024-02	Sora	-	文生视频。
2024-05	GPT-4o	gpt-4o	原生多模态，音视频实时交互。
2024-07	GPT-4o mini	gpt-4o-mini	轻量、低成本。
2024-09	o1	o1-preview / o1	推理模型，「先思考再回答」。
2024-12	o3	-	面向 STEM 与复杂推理。

注：截至当前，OpenAI 官方旗舰仍以 GPT-4o / GPT-4o-mini 及 o 系列为主；GPT-5 等名称为媒体或社区说法，以官网发布为准。

Anthropic

时间	模型/产品	版本/代号	说明
2023-03	Claude	Claude 1.0	安全与对话。
2024-03	Claude 3	Opus / Sonnet / Haiku	系列化，Opus 最强、Haiku 最快。
2024-06	Claude 3.5	Claude 3.5 Sonnet	推理与长文本增强。
2025-02	Claude 3.7	Claude 3.7 Sonnet	「扩展思维」模式。
2025 起	Claude 4.x	Claude 4.0 / 4.1 等	新一代系列。

阿里巴巴（通义千问 / 千问）

时间	模型/产品	版本/代号	说明
2023-04	通义千问	Qwen1	开源 7B–72B。
2024-06	通义千问	Qwen2	代码能力提升，多编程语言。
2024	通义千问	Qwen2.5	性能与资源均衡。
2025-04	通义千问	Qwen3	旗舰，MoE，256K 上下文。
2025-12	通义千问	Qwen3-VL / Qwen3-Omni	视觉-语言；全模态（文本/图像/音频/视频）。
2026-03	千问	品牌统一	AI 核心品牌统一为「千问」。

字节跳动（豆包）

时间	模型/产品	版本/代号	说明
2024-05	豆包	豆包 1.0	多模态，依托抖音生态。
2025	豆包	豆包 1.5	语音与内容生成优化。
2026-02	豆包	豆包 2.0 (Seed 2.0)	全模态感知与长链路 Agent。

百度（文心一言）

时间	模型/产品	版本/代号	说明
2023-03	文心一言	ERNIE Bot 1.0	基于文心大模型对话。
2024	文心一言	ERNIE Bot 4.0	逻辑推理与代码增强。
2025	文心一言	ERNIE Bot 4.5 / 5.0	多模态与行业应用。

深度求索（DeepSeek）

时间	模型/产品	版本/代号	说明
2024	DeepSeek	DeepSeek-V2 / V2.5	MoE，高性价比。
2024-12	DeepSeek	DeepSeek-V3	超大 MoE，671B 总参数。
2025-01	DeepSeek	DeepSeek-R1	推理专用，数学与代码。
2026-02/03	DeepSeek	DeepSeek-V4	长上下文、多模态等（以官方发布为准）。

注：V3.2、R1-0528 等多为社区或媒体称呼，正式版本以官网为准。

智谱 AI（GLM）

时间	模型/产品	版本/代号	说明
2023	ChatGLM	ChatGLM2 / 3	开源对话，长文本。
2024-06	智谱大模型	GLM-4	旗舰，128K 上下文。
2024	智谱大模型	GLM-4.5 / 4.6	推理与多模态。
2025	智谱大模型	GLM-5、GLM-4 Plus、CogView4、CogVideoX 等	对话、多模态、图文/视频生成。

其他中国厂商（选列）

公司	模型/产品	版本/说明
百川智能	百川大模型	Baichuan 1/2/3/4，Baichuan-M2（医疗），Baichuan4-Finance。
MiniMax	海螺AI、MiniMax-01	视频生成；线性注意力、长文本。
昆仑万维	天工 Skywork	Skywork-MoE、Skywork-OR1-32B、Skywork-R1V3-38B。
零一万物	Yi 系列	Yi 1.5/1.6/Large，Yi-Vision，Yi-Coder。
上海 AI Lab	InternLM	InternLM2.5，InternLM-Math，InternVL-Chat。

其他国际主流（选列）

公司	模型/产品	版本/说明
Google	Gemini	Gemini 1.5 Pro（百万级上下文）、2.0、2.5。
Meta	Llama	Llama 2/3、3.1（含 405B）、3.2、3.3。
IBM	Granite	Granite 3.2、Granite Vision。
xAI	Grok	Grok-1.5/2/3 及 mini 等。

四、技术路线与开源/闭源速览

4.1 技术路线与特色（选列）

公司/产品	架构/路线特点	典型能力侧重
OpenAI	密集 Transformer、o 系列推理模型	多模态、实时交互、推理与代码
Anthropic	宪法 AI、混合推理（快/扩展思维）	长文本、安全对齐、编程与智能体
Google	Gemini、多模态与搜索整合	百万级上下文、多模态、生态整合
Meta	LLaMA 系列，开源可商用	开源基座、多规模、多模态版本
阿里千问	Qwen 系列，MoE（Qwen3）	长上下文、代码、开源与多模态
深度求索	DeepSeek-V/R 系列，MoE	高性价比、推理（R1）、数学与代码
智谱	GLM 系列，CogView/CogVideo	中文、多模态、图文/视频生成
字节豆包	多模态、Seed 系列	全模态、抖音/飞书生态、Agent
百度文心	ERNIE，多模态	搜索与文库整合、行业应用
月之暗面 Kimi	长上下文、Agent	超长文本、长文档阅读、推理

4.2 开源与闭源速查（概览）

类型	代表产品/系列	说明
闭源 / API 为主	ChatGPT(GPT-4o)、Claude、Gemini、文心、豆包、Kimi	能力强、迭代快；依赖厂商 API 与合规。
开源可商用	LLaMA、Qwen、DeepSeek、GLM、Yi、InternLM、百川、混元图像	可私有化部署、微调；社区与生态活跃。
开源 + 闭源双线	千问（开源 Qwen + 闭源服务）、智谱（开源 GLM + 闭源）	兼顾开放与商业产品。

4.3 应用场景速览

场景	典型产品/方向
通用对话与写作	ChatGPT、Claude、千问、文心、豆包、Kimi
编程与代码	Claude Code、GitHub Copilot、DeepSeek-R1、Qwen、GLM
办公与效率	Copilot、飞书/豆包、通义、WPS AI、钉钉
教育	星火、文心、Kimi（长文档）、各类作业辅导与口语
政务与 ToG	文心、通义、DeepSeek、华为盘古、360 智脑
金融与合规	千问、文心、百川金融、Claude、企业版模型
多模态创作	DALL·E、Sora、可灵、混元图像、CogView、海螺AI
终端与硬件	小爱、蓝心、OPPO 等手机/车机；千问 AI 眼镜

五、信息更正与 2025–2026 动态速览

信息更正

GPT-5 系列：截至当前，OpenAI 未正式发布 GPT-5、5.1 等；旗舰仍为 GPT-4o / GPT-4o-mini 及 o 系列。
DeepSeek：V3.2、R1-0528 等多为非官方版本号，官方里程碑以 DeepSeek-V3、DeepSeek-R1 等为准。

2025–2026 关键动态（选列）

时间	公司/机构	模型/产品	关键信息
2025-01	深度求索	DeepSeek R1	推理专用，数学与代码，性价比高。
2025-02	智谱 AI	GLM-5	新一代旗舰，复杂任务与视频生成。
2025-02	字节跳动	豆包 2.0	多模态与长视频理解。
2025-02	快手	可灵 3.0	图/文生视频、智能编辑。
2025-02	腾讯	混元图像 3.0	开源图生图，图片编辑、风格变换、老照片修复等。
2025-03	阿里巴巴	千问 AI 眼镜	首款 AI 硬件，点外卖、订酒店等。
2025-09–11	蚂蚁集团	百灵大模型	Ring-1T、Ling-1T 等开源与多模态。
2026-02	蚂蚁集团	百灵 Ming-Flash-Omni 2.0、Ring-2.5-1T、企业版	全模态、万亿参数思考模型、企业场景。
2026-02/03	深度求索	DeepSeek V4	长上下文、多模态（以官方为准）。
2026-03	阿里巴巴	千问	品牌统一为「千问」。

六、其他值得关注的生态

公司/体系	产品/定位	说明
华为云	盘古大模型	NLP、CV、科学计算，分层解耦，工业、金融等。
科大讯飞	星火认知大模型	中文与教育，AI 学伴、口语陪练、智能客服等。
京东	言犀大模型	智能客服与导购，零售、物流。
360	360 智脑	通用问答与搜索增强，安全分析、内容审核、API。
月之暗面	Kimi	超长文本与多轮对话，长文档阅读，科研、法律等。
腾讯	混元大模型	通用与多模态，含混元图像等；应用于内部产品与开放能力。
小米 / vivo / OPPO	小爱大模型、蓝心大模型等	终端侧大模型，手机、家居等本地化体验。

七、关键能力横向对比与跑分榜单

关键能力横向对比（简要）

下表为公开评测与报道中的典型表现，供参考；具体以各榜单与官网为准。

模型（公司）	代码生成	数学推理	多模态
Claude Opus 4.x (Anthropic)	SWE-bench 等领先，多文件与复杂工程	ARC-AGI 等推理突出	长上下文、文档/代码库、多模态
GPT-4o / o 系列 (OpenAI)	SWE-bench 第一梯队	AIME 等稳健	文本/图像/音频/视频，实时交互
DeepSeek V3/R1 (深度求索)	性价比高，接近前沿	AIME、高考数学等顶尖	当前以文本为主
Qwen 3.x (阿里)	SWE-bench 国产第一梯队	AIME 顶尖	长上下文、Qwen-VL 图文
GLM-5 (智谱)	SWE-bench 国产顶尖	AIME 优秀	200K 上下文，多模态增强
Kimi K2.x (月之暗面)	长文档代码理解强	AIME 等竞赛领先	超长文本与 Agent
豆包 2.0 (字节)	工程能力快速追赶	高考数学等优秀	文/图/视频，抖音/飞书集成
文心 5 (百度)	公开编程基准较少	公开数学专项较少	与搜索、文库等深度整合

主流跑分榜单与评测网站

类型	名称	网址/说明
综合/对战	Chatbot Arena (LMSys)	chat.lmsys.org；用户对战 Elo 排名。
综合/多维	Artificial Analysis	artificialanalysis.ai；速度、价格、准确率等。
开源	Hugging Face Open LLM Leaderboard	huggingface.co/spaces/Hugg… 等。
API 热度	OpenRouter Rankings	openrouter.ai/rankings；按调…
中文/国内	AI 工具集 - 大模型评测	ai-bot.cn；国内外模型评测汇总。
中文/国内	AIGC 大模型排行榜	aigc.izzi.cn；多场景综合排行。
专项	SWE-bench	真实 GitHub 项目 Bug 修复能力。
专项	AIME / MATH	数学竞赛与数学基准。
专项	OSWorld / AgentBench	操作系统操作与智能体任务。

免责声明

本文整理自公开报道与评测信息，时间与版本以各公司官网与正式发布为准。能力对比与榜单会随评测更新而变化，请以各站点最新数据为准。

参考资料：公开报道、各公司官网与评测站点整理。