大模型主要公司与产品时间线

0 阅读11分钟

大模型主要公司与产品时间线

目录

  1. 一、海外代表公司及产品
  2. 二、中国代表公司及产品概览
  3. 三、各家模型版本详表(按公司)
  4. 四、技术路线与开源/闭源速览
  5. 五、信息更正与 2025–2026 动态速览
  6. 六、其他值得关注的生态
  7. 七、关键能力横向对比与跑分榜单
  8. 免责声明

本文按时间线公司梳理大模型应用、主要公司与产品。


一、海外代表公司及产品

OpenAI(美国)

产品/模型时间说明
Codex2021 起专为编程设计,GitHub Copilot 技术基础。
ChatGPT2022.11基于 GPT-3.5 的对话式 AI,多轮对话、写作、编程;大模型「出圈」标志。
GPT-4 系列2023 起多模态、插件与 GPTs,演变为 AI 应用平台。

Anthropic(美国)

产品/模型时间说明
Claude 系列2023 起长文本与安全对齐,企业文档分析、代码审查等。
Claude Code2025.02 起终端 AI 编程助手,多语言、自动改代码与测试。
Claude Sonnet 4.52025.09复杂推理与自主编程,OSWorld 等测试表现突出。
Claude Agent SDK2025.10构建金融、个人助理等自主智能体。
Claude Cowork2026 起对话式创建定制插件,融入 HR、运营、设计等流程。

二、中国代表公司及产品概览

公司产品/品牌时间说明
百度文心一言 (ERNIE Bot)2023.03多语言、多模态,金融、政务、教育等。
阿里巴巴通义千问 / 千问2023.09超大规模语言模型,多轮对话、创作、推理;后开源 72B/32B 等;2026.03 品牌统一为「千问」。
字节跳动豆包2023 下半年轻量、响应快,结合抖音/头条生态;豆包 2.0 支持全模态与长链路 Agent。
科大讯飞星火认知大模型2023 起中文理解与教育场景,星火 App、教育机器人等。
商汤科技商量 SenseNova2023 起视觉+文本多模态,智慧城市、自动驾驶、医疗影像等。
MiniMaxabab / MiniMax 大模型2023 起对话与轻量部署,内容生成、智能客服;M2.5 等面向 Agent 与编程。
智谱 AIChatGLM / GLM 系列2023 起中文优化、开源多,科研、教育、企业服务。
昆仑万维天工 Skywork2023 起多语言、开放 API,内容创作、办公自动化。
百川智能百川大模型2023 起中文通用,搜索增强、知识问答。
深度求索DeepSeek 系列2024.12 起VL2/V3 等开源,政务、医疗、金融等;增长迅速。

三、各家模型版本详表(按公司)

OpenAI

时间模型/产品版本/代号说明
2022-11ChatGPTGPT-3.5对话式 AI,引爆大模型热潮。
2023-03GPT-4GPT-4多模态大模型。
2023-03GPT-4 Turbogpt-4-1106-preview 等成本与上下文优化。
2023-09DALL·E 3-文生图,深度集成 ChatGPT。
2024-02Sora-文生视频。
2024-05GPT-4ogpt-4o原生多模态,音视频实时交互。
2024-07GPT-4o minigpt-4o-mini轻量、低成本。
2024-09o1o1-preview / o1推理模型,「先思考再回答」。
2024-12o3-面向 STEM 与复杂推理。

注:截至当前,OpenAI 官方旗舰仍以 GPT-4o / GPT-4o-mini 及 o 系列为主;GPT-5 等名称为媒体或社区说法,以官网发布为准。

Anthropic

时间模型/产品版本/代号说明
2023-03ClaudeClaude 1.0安全与对话。
2024-03Claude 3Opus / Sonnet / Haiku系列化,Opus 最强、Haiku 最快。
2024-06Claude 3.5Claude 3.5 Sonnet推理与长文本增强。
2025-02Claude 3.7Claude 3.7 Sonnet「扩展思维」模式。
2025 起Claude 4.xClaude 4.0 / 4.1 等新一代系列。

阿里巴巴(通义千问 / 千问)

时间模型/产品版本/代号说明
2023-04通义千问Qwen1开源 7B–72B。
2024-06通义千问Qwen2代码能力提升,多编程语言。
2024通义千问Qwen2.5性能与资源均衡。
2025-04通义千问Qwen3旗舰,MoE,256K 上下文。
2025-12通义千问Qwen3-VL / Qwen3-Omni视觉-语言;全模态(文本/图像/音频/视频)。
2026-03千问品牌统一AI 核心品牌统一为「千问」。

字节跳动(豆包)

时间模型/产品版本/代号说明
2024-05豆包豆包 1.0多模态,依托抖音生态。
2025豆包豆包 1.5语音与内容生成优化。
2026-02豆包豆包 2.0 (Seed 2.0)全模态感知与长链路 Agent。

百度(文心一言)

时间模型/产品版本/代号说明
2023-03文心一言ERNIE Bot 1.0基于文心大模型对话。
2024文心一言ERNIE Bot 4.0逻辑推理与代码增强。
2025文心一言ERNIE Bot 4.5 / 5.0多模态与行业应用。

深度求索(DeepSeek)

时间模型/产品版本/代号说明
2024DeepSeekDeepSeek-V2 / V2.5MoE,高性价比。
2024-12DeepSeekDeepSeek-V3超大 MoE,671B 总参数。
2025-01DeepSeekDeepSeek-R1推理专用,数学与代码。
2026-02/03DeepSeekDeepSeek-V4长上下文、多模态等(以官方发布为准)。

注:V3.2、R1-0528 等多为社区或媒体称呼,正式版本以官网为准。

智谱 AI(GLM)

时间模型/产品版本/代号说明
2023ChatGLMChatGLM2 / 3开源对话,长文本。
2024-06智谱大模型GLM-4旗舰,128K 上下文。
2024智谱大模型GLM-4.5 / 4.6推理与多模态。
2025智谱大模型GLM-5、GLM-4 Plus、CogView4、CogVideoX 等对话、多模态、图文/视频生成。

其他中国厂商(选列)

公司模型/产品版本/说明
百川智能百川大模型Baichuan 1/2/3/4,Baichuan-M2(医疗),Baichuan4-Finance。
MiniMax海螺AI、MiniMax-01视频生成;线性注意力、长文本。
昆仑万维天工 SkyworkSkywork-MoE、Skywork-OR1-32B、Skywork-R1V3-38B。
零一万物Yi 系列Yi 1.5/1.6/Large,Yi-Vision,Yi-Coder。
上海 AI LabInternLMInternLM2.5,InternLM-Math,InternVL-Chat。

其他国际主流(选列)

公司模型/产品版本/说明
GoogleGeminiGemini 1.5 Pro(百万级上下文)、2.0、2.5。
MetaLlamaLlama 2/3、3.1(含 405B)、3.2、3.3。
IBMGraniteGranite 3.2、Granite Vision。
xAIGrokGrok-1.5/2/3 及 mini 等。

四、技术路线与开源/闭源速览

4.1 技术路线与特色(选列)

公司/产品架构/路线特点典型能力侧重
OpenAI密集 Transformer、o 系列推理模型多模态、实时交互、推理与代码
Anthropic宪法 AI、混合推理(快/扩展思维)长文本、安全对齐、编程与智能体
GoogleGemini、多模态与搜索整合百万级上下文、多模态、生态整合
MetaLLaMA 系列,开源可商用开源基座、多规模、多模态版本
阿里 千问Qwen 系列,MoE(Qwen3)长上下文、代码、开源与多模态
深度求索DeepSeek-V/R 系列,MoE高性价比、推理(R1)、数学与代码
智谱GLM 系列,CogView/CogVideo中文、多模态、图文/视频生成
字节 豆包多模态、Seed 系列全模态、抖音/飞书生态、Agent
百度 文心ERNIE,多模态搜索与文库整合、行业应用
月之暗面 Kimi长上下文、Agent超长文本、长文档阅读、推理

4.2 开源与闭源速查(概览)

类型代表产品/系列说明
闭源 / API 为主ChatGPT(GPT-4o)、Claude、Gemini、文心、豆包、Kimi能力强、迭代快;依赖厂商 API 与合规。
开源可商用LLaMA、Qwen、DeepSeek、GLM、Yi、InternLM、百川、混元图像可私有化部署、微调;社区与生态活跃。
开源 + 闭源双线千问(开源 Qwen + 闭源服务)、智谱(开源 GLM + 闭源)兼顾开放与商业产品。

4.3 应用场景速览

场景典型产品/方向
通用对话与写作ChatGPT、Claude、千问、文心、豆包、Kimi
编程与代码Claude Code、GitHub Copilot、DeepSeek-R1、Qwen、GLM
办公与效率Copilot、飞书/豆包、通义、WPS AI、钉钉
教育星火、文心、Kimi(长文档)、各类作业辅导与口语
政务与 ToG文心、通义、DeepSeek、华为盘古、360 智脑
金融与合规千问、文心、百川金融、Claude、企业版模型
多模态创作DALL·E、Sora、可灵、混元图像、CogView、海螺AI
终端与硬件小爱、蓝心、OPPO 等手机/车机;千问 AI 眼镜

五、信息更正与 2025–2026 动态速览

信息更正

  • GPT-5 系列:截至当前,OpenAI 未正式发布 GPT-5、5.1 等;旗舰仍为 GPT-4o / GPT-4o-mini 及 o 系列。
  • DeepSeek:V3.2、R1-0528 等多为非官方版本号,官方里程碑以 DeepSeek-V3、DeepSeek-R1 等为准。

2025–2026 关键动态(选列)

时间公司/机构模型/产品关键信息
2025-01深度求索DeepSeek R1推理专用,数学与代码,性价比高。
2025-02智谱 AIGLM-5新一代旗舰,复杂任务与视频生成。
2025-02字节跳动豆包 2.0多模态与长视频理解。
2025-02快手可灵 3.0图/文生视频、智能编辑。
2025-02腾讯混元图像 3.0开源图生图,图片编辑、风格变换、老照片修复等。
2025-03阿里巴巴千问 AI 眼镜首款 AI 硬件,点外卖、订酒店等。
2025-09–11蚂蚁集团百灵大模型Ring-1T、Ling-1T 等开源与多模态。
2026-02蚂蚁集团百灵 Ming-Flash-Omni 2.0、Ring-2.5-1T、企业版全模态、万亿参数思考模型、企业场景。
2026-02/03深度求索DeepSeek V4长上下文、多模态(以官方为准)。
2026-03阿里巴巴千问品牌统一为「千问」。

六、其他值得关注的生态

公司/体系产品/定位说明
华为云盘古大模型NLP、CV、科学计算,分层解耦,工业、金融等。
科大讯飞星火认知大模型中文与教育,AI 学伴、口语陪练、智能客服等。
京东言犀大模型智能客服与导购,零售、物流。
360360 智脑通用问答与搜索增强,安全分析、内容审核、API。
月之暗面Kimi超长文本与多轮对话,长文档阅读,科研、法律等。
腾讯混元大模型通用与多模态,含混元图像等;应用于内部产品与开放能力。
小米 / vivo / OPPO小爱大模型、蓝心大模型等终端侧大模型,手机、家居等本地化体验。

七、关键能力横向对比与跑分榜单

关键能力横向对比(简要)

下表为公开评测与报道中的典型表现,供参考;具体以各榜单与官网为准。

模型(公司)代码生成数学推理多模态
Claude Opus 4.x (Anthropic)SWE-bench 等领先,多文件与复杂工程ARC-AGI 等推理突出长上下文、文档/代码库、多模态
GPT-4o / o 系列 (OpenAI)SWE-bench 第一梯队AIME 等稳健文本/图像/音频/视频,实时交互
DeepSeek V3/R1 (深度求索)性价比高,接近前沿AIME、高考数学等顶尖当前以文本为主
Qwen 3.x (阿里)SWE-bench 国产第一梯队AIME 顶尖长上下文、Qwen-VL 图文
GLM-5 (智谱)SWE-bench 国产顶尖AIME 优秀200K 上下文,多模态增强
Kimi K2.x (月之暗面)长文档代码理解强AIME 等竞赛领先超长文本与 Agent
豆包 2.0 (字节)工程能力快速追赶高考数学等优秀文/图/视频,抖音/飞书集成
文心 5 (百度)公开编程基准较少公开数学专项较少与搜索、文库等深度整合

主流跑分榜单与评测网站

类型名称网址/说明
综合/对战Chatbot Arena (LMSys)chat.lmsys.org;用户对战 Elo 排名。
综合/多维Artificial Analysisartificialanalysis.ai;速度、价格、准确率等。
开源Hugging Face Open LLM Leaderboardhuggingface.co/spaces/Hugg… 等。
API 热度OpenRouter Rankingsopenrouter.ai/rankings;按调…
中文/国内AI 工具集 - 大模型评测ai-bot.cn;国内外模型评测汇总。
中文/国内AIGC 大模型排行榜aigc.izzi.cn;多场景综合排行。
专项SWE-bench真实 GitHub 项目 Bug 修复能力。
专项AIME / MATH数学竞赛与数学基准。
专项OSWorld / AgentBench操作系统操作与智能体任务。

免责声明

本文整理自公开报道与评测信息,时间与版本以各公司官网与正式发布为准。能力对比与榜单会随评测更新而变化,请以各站点最新数据为准。


参考资料:公开报道、各公司官网与评测站点整理。