大模型的演变国内大模型呈多元格局，巨头引领、垂直专精、科研支撑、创业突破，覆盖多场景，按需求选型可解锁高效智能体验。

第一次工业革命：蒸汽时代

第二次工业革命：电器时代

第三次工业革命：互联网时代

第四工业革命：人工智能时代- Ai时代

AI（Artificial Intelligence）：人工智能

是计算机的一个学科，旨在让计算机模拟人的智能去思考解决问题，是一个学科范畴

ML（Machine Learning）：机器学习

是AI的一个子集，核心是不需要人为去进行显示编程， 通过算法自行学习、改进、识别模式作出预测和决策；机器学习领域下有多个分支，比如监督学习、无监督学习、强化学习，他们三个数据机器学习的三大基本范式，代表了机器学习最基本的三种学习方式,每种方式都有自己的特点和适用场景。

比如显示编程图片内有红色就是玫瑰，有黄色就是向日葵，这样就是明显的可以判断了

机器学习是通过大量的图片去训练，自己识别模式，总结规律，然后对没见过的图片进行预测和判断是什么花，这种就属于机器学习

监督学习

机器学习会接受有标签的标签训练数据，标签就是期望的输出值，所以每个训练数据点既包括输入特征也包括期望的输出值，算法的目标是学习输入和输出的映射关系，从而在给定新的输入特征后，能够准确预测出相应的输出值；

经典的监督学习任务 包括分类和回归，就是把数据划分为不同的类别，回归就是据值进行预测

比如拿一堆猫猫狗狗的照片去做监督学习，然后给一张没有见过的图片，让机器判断是猫还是狗，这就是分类

拿一堆房子的特征数据（面积、地段、户型等）和相应的房价去进行训练。然后给出一个没见过的房子，让模型根据房子特征预测房价，这就是回归

无监督学习

和监督学习的区别就是学习的数据没有标签，所以算法的任务是自主发现数据里面的规律或模式，经典的无监督学习任务包括聚类，即对数据进行分组，比如拿一堆新闻文章，让模型根据主题或内容特征，自动把相似文章进行组织

强化学习

让模型在环境里采取行动，获得结果反馈，从反馈里学习，从而能在给定情况下采取最佳行动来最大化奖励或最小化损失

比如训狗，小狗在不断的训练过程中，通过某种动作可以获得奖励，某种动作会获得惩罚，通过动作和奖惩不断的建立关系，小狗的动作会逐渐接近训练师的期望，强化学习方式类似训狗；强化学习应用很多，比如下围棋，通过下每一步得到的反馈奖惩

DL (Deep Learning)：深度学习

不属于机器学习的三个方式的任意一种，深度学习是机器学习的一种方法，深度学习作为机器学习的一个重要分支,结合了监督学习、无监督学习和强化学习的特点,核心在于使用人工神经网络模仿人脑处理信息方式，通过层次化的方法提取和表示数据的特征；神经网络是许多基本的计算和存储单元组成，这些单元被称为神经元，这些神经元通过层层连接来处理数据，并且深度学习通常有很多层，因此称为深度学习

比如要让机器识别小猫图片，在深度学习中，数据首先传递到一个输入层，就像人类的眼睛看到图片一样，然后数据通过多个隐藏层，每一层都会对数据进行一些复杂的数学运算，来帮助计算机来理解图片中的特征，例如小猫的耳朵眼睛等等，最后计算机会输出一个答案，表明这是不是一个小猫的答案。

神经网络可以应用与监督学习，无监督学习，强化学习，所以深度学习不属于机器学习的分支

AIGC（AI Generated Content）：生成式AI

生成式AI是深度学习的应用，它利用神经网络来识别现有内容的模式和结构学习生成新的内容，内容形式可以是文本，图片、音视频等等，即AIGC

生成式AI生成的内容就是AIGC，但国内对生成式AI并不是很明显区分AIGC，AI GC也就指代生成式AI

LLM （Large Language Model）：大语言模型

也是深度学习的一种应用，专门用于自然语言处理任务；大语言模型的大字突出参数规模很大，可能有十亿，万亿等；而且训练过程中也需要海量文本数据集，所以能更好的理解自然语言，以及生成高质量的文本

不是所有的生成式AI都是大语言模型，而所有的大语言模型是否都是生成式AI也存在争议；生成图像的扩散模型就不是大语言模型，他并不输出文本；

因为有一些大语言模型由于其架构特点，不适合进行文本生成。谷歌的bert模型就是一个例子，他的参数和训练数据很大，属于大语言模型，应用方面Bert在理解上下文的能力很强，因此被应用在搜索上，用来提高谷歌搜索的排名和信息摘要的准确性；他也被用于情感分析、文本分类等任务；但Bert不擅长文本生成，特别是连贯的长文本生成，所以有些人认为此类模型不属于生成式AI。

Chat GPT发布

百模大战

一、通用型大模型供应商（全领域覆盖）

1. 互联网巨头（全栈布局）

百度：文心一言(ERNIE Bot)

核心优势：知识增强（融合百度搜索和知识图谱），中文理解与内容创作强，适合营销文案和教育场景
技术特点：ERNIE 4.5/5.0架构，长文本处理能力达128K+，多模态支持
生态依托：百度搜索、文库、网盘、小度智能设备

阿里巴巴：通义千问(Qwen)

核心优势：开源最彻底（全系列0.5B-72B），性价比高，代码能力强，企业级部署友好
技术特点：Qwen2.5/3系列，支持128K上下文，多模态Qwen-VL
生态依托：阿里云、钉钉、淘宝、天猫、菜鸟等全栈业务

字节跳动：豆包大模型(Doubao)

核心优势：科学推理能力突出（70分国际水平），实时交互和低幻觉，用户体验佳
技术特点：Doubao-1.5-Pro，支持多模态，端侧优化
生态依托：抖音、今日头条、火山引擎

腾讯：混元大模型(Hunyuan)

核心优势：全模态能力强，Agent任务表现优异(70.09分)，长文本处理
技术特点：Hunyuan-Turbo系列，上下文长度达128K+，模型开源策略
生态依托：微信、QQ、腾讯云、游戏和内容平台

华为：盘古大模型(Pangu)

核心优势：政企场景安全可靠，分布式训练效率高
技术特点：基于昇腾AI的大规模MoE架构，支持千亿参数
生态依托：华为云、鸿蒙系统、企业级解决方案

2. 垂直技术领军企业

科大讯飞：星火大模型(SparkDesk)

核心优势：语音交互和自然语言理解领先，教育办公领域落地深
技术特点：星火3.0+，多模态支持，低延迟响应
生态依托：讯飞听见、智能办公本、教育信息化产品

商汤科技：日日新(SenseNova)大模型

核心优势：计算机视觉和多模态融合顶尖，安防和自动驾驶应用强
技术特点：SenseNova V6，视觉-语言-音频多模态统一建模
生态依托：SenseCore AI基础设施，智慧城市解决方案

智谱AI：智谱清言(GLM)

核心优势：知识图谱增强，学术科研场景适配，长文本处理
技术特点：GLM-4.5系列，128K上下文，逻辑推理强
生态依托：清华大学背景，科研机构合作网络

深度求索：DeepSeek

核心优势：代码能力国内第一(接近GPT-4)，数学推理和长文本处理强
技术特点：DeepSeek-V3，128K上下文，代码专用DeepSeek-Coder
生态依托：开发者社区，VS Code插件，企业定制服务

月之暗面：Kimi

核心优势：超长文本处理(200万汉字上下文)，学术文献分析无敌
技术特点：Moonshot架构，"大海捞针"式信息精准提取
应用场景：论文分析、法律文书、财报解读等超长文档处理

二、垂直领域大模型供应商（专业赛道）

1. 医疗健康领域

医联：MedGPT（临床决策支持，病历分析）
扁鹊健康：BianQue（医学影像诊断，AI辅助治疗）
京东健康：智能问诊系统（整合京东医疗资源）
朗玛信息：AI健康助手（慢性病管理，健康监测）
卓世科技：医疗对话机器人（导诊，预约，随访）

2. 金融服务领域

中关村科金：金融风控大模型（违约预测，欺诈检测）
东方财富：财经大模型（市场预测，投资分析）
爱信诺：信诺GPT（税务，财务报表智能分析）
DISCFinLLM：金融咨询大模型（针对银行、保险、证券）

3. 教育领域

好未来：MathGPT（数学教育，解题辅导）
网易有道：教育大模型（语言学习，智能批改）
作业帮：学习辅导大模型（全科作业解析，知识点讲解）

4. 法律领域

智谱AI：LaWGPT（法律文书生成，案例检索）
律知：Lychee（法律咨询，合同审查）
法大大：智能法务助手（电子合同管理，法律风险预警）

5. 工业制造领域

华为云：盘古工业大模型（设备预测性维护，质量控制）
凌云光：LUSTER（智能制造，视觉检测）
树根互联：根智大模型（工业数据分析，生产优化）

6. 政务领域

蜜度：政务大模型（公文处理，舆情分析）
中国电信：九天政务大模型（智慧城市，公共服务）
中国移动：政务通大模型（政务信息检索，便民服务）

三、科研机构与高校自研大模型

中科院自动化所：紫东太初（全球首个图文音三模态大模型，手语教学，法律咨询）
上海AI实验室：书生系列（书生·浦语、书生·多模态，开源社区活跃）
清华大学：ChatGLM（与智谱AI合作，双语对话优化，高效参数化）
复旦大学：MOSS（轻量级开源模型，适合学术研究）
东南大学：问道（伦理治理大模型，风险评估，伦理决策推演）
上海交大：书生（代码生成，逻辑推理）

四、新兴创业公司大模型（技术新锐）

1. 通用能力型

百川智能：百川大模型（全场景"深度思考者"，医疗增强版M2）
零一万物：Yi系列（ToB领域革新者，场景化模型全覆盖）
MiniMax：ABAB系列（对话流畅度高，多轮交互自然）
360：360智脑（安全可信大模型，病毒分析，网络安全）
昆仑万维：天工AI（国内首个AI搜索，双千亿参数）

2. 技术专长型

智谱AI：GLM-4-Plus（知识图谱增强，推理能力强）
DeepSeek：DeepSeek-V3（代码能力领先，推理精准）
月之暗面：Kimi（超长文本处理之王）
智谱AI：GLM-4-Plus（知识增强，学术科研首选）
商汤：商量SenseChat（多模态融合，视觉理解强）

五、选型参考

通用场景首选：通义千问、豆包、文心一言（综合能力均衡）

代码开发：DeepSeek（国内第一）、通义千问（CodeQwen）

学术研究：Kimi（超长文本）、智谱清言（知识严谨）

内容创作：文心一言（中文语感）、豆包（创意表达）

垂直领域：优先选择专业赛道头部企业（如医疗选医联/扁鹊，金融选中关村科金）

开源需求：通义千问（最全面）、智谱GLM（部分开源）、DeepSeek（基础模型开源）

总结

国内大模型已形成"巨头引领、专精突破、科研支撑、创业活跃"的多元格局。通用领域百度、阿里、字节、腾讯、华为五强并立；垂直赛道医疗、金融、教育等领域各有专攻；科研机构提供技术源头；创业公司在细分技术上实现突破。选择时应结合应用场景、预算和技术需求综合考量，关注模型的持续迭代能力和生态完整性。

大模型的演变