大模型发展简史

2026-03-18 132 阅读3分钟

2022 年底：生成式对话进入大众视野

2022 年 11 月 — ChatGPT 发布
以「能连续对话、写代码、做摘要」的体验迅速破圈，把 LLM 从「圈内技术」变成「全民话题」，并带动资本与监管讨论。

2023 年：多模态雏形、闭源标杆、开源与「百模」

2023 年初 — 搜索与办公场景绑定
微软把对话能力接入 Bing / Edge，Google 推出 Bard（后演进为 Gemini 品牌），「对话 + 检索/生产力」成为产品主战场之一。
2023 年 3 月 — GPT-4
在复杂推理、长上下文、多任务上明显上台阶，成为很长一段时间里的闭源能力标杆，并推动 API 生态与插件/Agent 构想。
2023 年 — Meta LLaMA 及后续开源浪潮
权重外流与社区复现带动开源微调生态（Alpaca、Vicuna 等）爆发，「可私有化部署的小模型」成为企业与研究者的选项。
2023 年 — 国内「百模大战」
多家厂商密集发布中文大模型与行业方案，算力、数据合规、应用落地成为并行议题。
2023 年内 — 长上下文与「工具使用」
各路线竞争更长上下文、函数调用 / Agent、RAG（检索增强）成为企业落地的标准组合。

2024 年：多模态成熟、开源追赶、视频生成、推理专项

2024 年上半年 — 多模态成为标配
主流产品普遍支持图文（及更多模态）输入输出，「纯文本模型」在 C 端体验上逐渐不够看。
2024 年 — GPT-4o 等「原生多模态、低延迟交互」
强调语音/实时感，对话产品从「打字」向「更接近自然交互」演进。
2024 年 — 开源权重持续追赶
Llama 3 等提升开源上限，企业可在效果与成本间做更多权衡。
2024 年 — Sora 等视频生成引发讨论
把生成式 AI 的想象空间扩到视频，同时放大版权、深度伪造等治理压力。
2024 年下半年 — 「推理模型」成为新卖点
以 OpenAI o1 为代表，强调链式思考、数学/代码/逻辑等任务上的提升，行业开始区分「快答模型」与「慢想模型」。

2025 年前后：成本与开源冲击、Agent 与端侧

2025 年初 — DeepSeek 等高性价比路线受关注
以更低训练/推理成本、强开源或开放权重搅动全球市场对算力与商业闭环的预期（常被概括为「性价比与可及性」冲击）。
贯穿近年的方向（仍在加速）
- Agent / 多步任务自动化（调用工具、浏览器、代码执行环境）
- 端侧与小模型（手机、PC 本地推理）
- 合成数据、后训练与对齐的持续迭代
- 全球监管与版权、安全框架逐步具体化

小结：可以怎么理解这条时间线

2022 末：ChatGPT = 需求被点燃。
2023：闭源天花板（GPT-4）+ 开源生态（LLaMA 系）+ 中美产品化竞赛。
2024：多模态与实时交互 + 视频生成 + 推理专项（o1 类）。
2025 起：成本与开源/开放权重重塑竞争，同时 Agent 与端侧把「模型」推向「系统」。