2022 年底:生成式对话进入大众视野
- 2022 年 11 月 — ChatGPT 发布
以「能连续对话、写代码、做摘要」的体验迅速破圈,把 LLM 从「圈内技术」变成「全民话题」,并带动资本与监管讨论。
2023 年:多模态雏形、闭源标杆、开源与「百模」
- 2023 年初 — 搜索与办公场景绑定
微软把对话能力接入 Bing / Edge,Google 推出 Bard(后演进为 Gemini 品牌),「对话 + 检索/生产力」成为产品主战场之一。 - 2023 年 3 月 — GPT-4
在 复杂推理、长上下文、多任务 上明显上台阶,成为很长一段时间里的闭源能力标杆,并推动 API 生态与插件/Agent 构想。 - 2023 年 — Meta LLaMA 及后续开源浪潮
权重外流与社区复现带动 开源微调生态(Alpaca、Vicuna 等)爆发,「可私有化部署的小模型」成为企业与研究者的选项。 - 2023 年 — 国内「百模大战」
多家厂商密集发布中文大模型与行业方案,算力、数据合规、应用落地成为并行议题。 - 2023 年内 — 长上下文与「工具使用」
各路线竞争 更长上下文、函数调用 / Agent、RAG(检索增强) 成为企业落地的标准组合。
2024 年:多模态成熟、开源追赶、视频生成、推理专项
- 2024 年上半年 — 多模态成为标配
主流产品普遍支持 图文(及更多模态)输入输出,「纯文本模型」在 C 端体验上逐渐不够看。 - 2024 年 — GPT-4o 等「原生多模态、低延迟交互」
强调 语音/实时感,对话产品从「打字」向「更接近自然交互」演进。 - 2024 年 — 开源权重持续追赶
Llama 3 等提升开源上限,企业可在效果与成本间做更多权衡。 - 2024 年 — Sora 等视频生成引发讨论
把生成式 AI 的想象空间扩到 视频,同时放大版权、深度伪造等治理压力。 - 2024 年下半年 — 「推理模型」成为新卖点
以 OpenAI o1 为代表,强调 链式思考、数学/代码/逻辑 等任务上的提升,行业开始区分 「快答模型」 与 「慢想模型」。
2025 年前后:成本与开源冲击、Agent 与端侧
-
2025 年初 — DeepSeek 等高性价比路线受关注
以 更低训练/推理成本、强开源或开放权重 搅动全球市场对算力与商业闭环的预期(常被概括为「性价比与可及性」冲击)。 -
贯穿近年的方向(仍在加速)
- Agent / 多步任务自动化(调用工具、浏览器、代码执行环境)
- 端侧与小模型(手机、PC 本地推理)
- 合成数据、后训练与对齐 的持续迭代
- 全球监管与版权、安全 框架逐步具体化
小结:可以怎么理解这条时间线
- 2022 末:ChatGPT = 需求被点燃。
- 2023:闭源天花板(GPT-4)+ 开源生态(LLaMA 系)+ 中美产品化竞赛。
- 2024:多模态与实时交互 + 视频生成 + 推理专项(o1 类)。
- 2025 起:成本与开源/开放权重重塑竞争,同时 Agent 与端侧 把「模型」推向「系统」。