第一次工业革命:蒸汽时代
第二次工业革命:电器时代
第三次工业革命:互联网时代
第四工业革命:人工智能时代- Ai时代
AI(Artificial Intelligence):人工智能
是计算机的一个学科,旨在让计算机模拟人的智能去思考解决问题,是一个学科范畴
ML(Machine Learning):机器学习
是AI的一个子集, 核心是不需要人为去进行显示编程, 通过算法自行学习、改进、识别模式作出预测和决策;机器学习领域下有多个分支,比如监督学习、无监督学习、强化学习,他们三个数据机器学习的三大基本范式,代表了机器学习最基本的三种学习方式,每种方式都有自己的特点和适用场景。
比如显示编程 图片内有红色就是玫瑰,有黄色就是向日葵,这样就是明显的可以判断了
机器学习是通过大量的图片去训练,自己识别模式,总结规律,然后对没见过的图片进行预测和判断 是什么花,这种就属于机器学习
监督学习
机器学习会接受有标签的标签训练数据,标签就是期望的输出值,所以每个训练数据点既包括输入特征也包括期望的输出值,算法的目标是学习输入和输出的映射关系,从而在给定新的输入特征后,能够准确预测出相应的输出值 ;
经典的监督学习任务 包括 分类和回归,就是把数据划分为不同的类别, 回归就是据值进行预测
比如拿一堆猫猫狗狗的照片去做监督学习,然后给一张没有见过的图片,让机器判断是猫还是狗,这就是分类
拿一堆房子的特征数据(面积、地段、户型等)和相应的房价去进行训练。然后给出一个没见过的房子,让模型根据房子特征预测房价,这就是回归
无监督学习
和监督学习的区别就是学习的数据没有标签, 所以算法的任务是自主发现数据里面的规律或模式 ,经典的无监督学习任务包括聚类,即对数据进行分组,比如拿一堆新闻文章,让模型根据主题或内容特征,自动把相似文章进行组织
强化学习
让模型在环境里采取行动 ,获得结果反馈 ,从反馈里学习 ,从而能在给定情况下采取最佳行动 来最大化奖励或最小化损失
比如训狗,小狗在不断的训练过程中,通过某种动作可以获得奖励,某种动作会获得惩罚,通过动作和奖惩不断的建立关系 ,小狗的动作会逐渐接近训练师的期望,强化学习方式类似训狗 ;强化学习应用很多,比如下围棋,通过下每一步得到的反馈奖惩
DL (Deep Learning):深度学习
不属于机器学习的三个方式的任意一种,深度学习是机器学习的一种方法,深度学习作为机器学习的一个重要分支,结合了监督学习、无监督学习和强化学习的特点,核心在于使用人工神经网络 模仿人脑处理信息方式 ,通过层次化的方法提取和表示数据的特征;神经网络是许多基本的计算和存储单元组成,这些单元被称为神经元,这些神经元通过层层连接来处理数据,并且深度学习通常有很多层,因此称为深度学习
比如要让机器识别小猫图片,在深度学习中,数据首先传递到一个输入层 ,就像人类的眼睛看到图片一样,然后数据通过多个隐藏层,每一层都会对数据进行一些复杂的数学运算,来帮助计算机来理解图片中的特征 ,例如小猫的耳朵眼睛等等,最后计算机会输出一个答案, 表明这是不是一个小猫的答案 。
神经网络可以应用与 监督学习,无监督学习,强化学习,所以深度学习不属于机器学习的分支
AIGC(AI Generated Content):生成式AI
生成式AI是深度学习的应用,它利用神经网络来识别现有内容的模式和结构学习生成新的内容,内容形式可以是文本,图片、音视频等等,即AIGC
生成式AI生成的内容就是AIGC,但国内对生成式AI并不是很明显区分AIGC,AI GC也就指代 生成式AI
LLM (Large Language Model):大语言模型
也是深度学习的一种应用,专门用于自然语言处理任务;大语言模型的大字突出参数规模很大,可能有十亿,万亿等 ;而且训练过程中也需要海量文本数据集,所以能更好的理解自然语言 ,以及生成高质量的文本
不是所有的生成式AI都是大语言模型,而所有的大语言模型是否都是生成式AI也存在争议 ;生成图像的扩散模型就不是大语言模型,他并不输出文本 ;
因为有一些大语言模型由于其架构特点,不适合进行文本生成。谷歌的bert模型就是一个例子, 他的参数和训练数据很大,属于大语言模型,应用方面Bert在理解上下文的能力很强,因此被应用在搜索上 ,用来提高谷歌搜索的排名和信息摘要的准确性;他也被用于情感分析、文本分类等任务;但Bert不擅长文本生成,特别是连贯的长文本生成 ,所以有些人认为此类模型不属于生成式AI。
Chat GPT发布
百模大战
一、通用型大模型供应商(全领域覆盖)
1. 互联网巨头(全栈布局)
百度:文心一言(ERNIE Bot)
- 核心优势:知识增强(融合百度搜索和知识图谱),中文理解与内容创作强,适合营销文案和教育场景
- 技术特点:ERNIE 4.5/5.0架构,长文本处理能力达128K+,多模态支持
- 生态依托:百度搜索、文库、网盘、小度智能设备
阿里巴巴:通义千问(Qwen)
- 核心优势:开源最彻底(全系列0.5B-72B),性价比高,代码能力强,企业级部署友好
- 技术特点:Qwen2.5/3系列,支持128K上下文,多模态Qwen-VL
- 生态依托:阿里云、钉钉、淘宝、天猫、菜鸟等全栈业务
字节跳动:豆包大模型(Doubao)
- 核心优势:科学推理能力突出(70分国际水平),实时交互和低幻觉,用户体验佳
- 技术特点:Doubao-1.5-Pro,支持多模态,端侧优化
- 生态依托:抖音、今日头条、火山引擎
腾讯:混元大模型(Hunyuan)
- 核心优势:全模态能力强,Agent任务表现优异(70.09分),长文本处理
- 技术特点:Hunyuan-Turbo系列,上下文长度达128K+,模型开源策略
- 生态依托:微信、QQ、腾讯云、游戏和内容平台
华为:盘古大模型(Pangu)
- 核心优势:政企场景安全可靠,分布式训练效率高
- 技术特点:基于昇腾AI的大规模MoE架构,支持千亿参数
- 生态依托:华为云、鸿蒙系统、企业级解决方案
2. 垂直技术领军企业
科大讯飞:星火大模型(SparkDesk)
- 核心优势:语音交互和自然语言理解领先,教育办公领域落地深
- 技术特点:星火3.0+,多模态支持,低延迟响应
- 生态依托:讯飞听见、智能办公本、教育信息化产品
商汤科技:日日新(SenseNova)大模型
- 核心优势:计算机视觉和多模态融合顶尖,安防和自动驾驶应用强
- 技术特点:SenseNova V6,视觉-语言-音频多模态统一建模
- 生态依托:SenseCore AI基础设施,智慧城市解决方案
智谱AI:智谱清言(GLM)
- 核心优势:知识图谱增强,学术科研场景适配,长文本处理
- 技术特点:GLM-4.5系列,128K上下文,逻辑推理强
- 生态依托:清华大学背景,科研机构合作网络
深度求索:DeepSeek
- 核心优势:代码能力国内第一(接近GPT-4),数学推理和长文本处理强
- 技术特点:DeepSeek-V3,128K上下文,代码专用DeepSeek-Coder
- 生态依托:开发者社区,VS Code插件,企业定制服务
月之暗面:Kimi
- 核心优势:超长文本处理(200万汉字上下文),学术文献分析无敌
- 技术特点:Moonshot架构,"大海捞针"式信息精准提取
- 应用场景:论文分析、法律文书、财报解读等超长文档处理
二、垂直领域大模型供应商(专业赛道)
1. 医疗健康领域
- 医联:MedGPT(临床决策支持,病历分析)
- 扁鹊健康:BianQue(医学影像诊断,AI辅助治疗)
- 京东健康:智能问诊系统(整合京东医疗资源)
- 朗玛信息:AI健康助手(慢性病管理,健康监测)
- 卓世科技:医疗对话机器人(导诊,预约,随访)
2. 金融服务领域
- 中关村科金:金融风控大模型(违约预测,欺诈检测)
- 东方财富:财经大模型(市场预测,投资分析)
- 爱信诺:信诺GPT(税务,财务报表智能分析)
- DISCFinLLM:金融咨询大模型(针对银行、保险、证券)
3. 教育领域
- 好未来:MathGPT(数学教育,解题辅导)
- 网易有道:教育大模型(语言学习,智能批改)
- 作业帮:学习辅导大模型(全科作业解析,知识点讲解)
4. 法律领域
- 智谱AI:LaWGPT(法律文书生成,案例检索)
- 律知:Lychee(法律咨询,合同审查)
- 法大大:智能法务助手(电子合同管理,法律风险预警)
5. 工业制造领域
- 华为云:盘古工业大模型(设备预测性维护,质量控制)
- 凌云光:LUSTER(智能制造,视觉检测)
- 树根互联:根智大模型(工业数据分析,生产优化)
6. 政务领域
- 蜜度:政务大模型(公文处理,舆情分析)
- 中国电信:九天政务大模型(智慧城市,公共服务)
- 中国移动:政务通大模型(政务信息检索,便民服务)
三、科研机构与高校自研大模型
- 中科院自动化所:紫东太初(全球首个图文音三模态大模型,手语教学,法律咨询)
- 上海AI实验室:书生系列(书生·浦语、书生·多模态,开源社区活跃)
- 清华大学:ChatGLM(与智谱AI合作,双语对话优化,高效参数化)
- 复旦大学:MOSS(轻量级开源模型,适合学术研究)
- 东南大学:问道(伦理治理大模型,风险评估,伦理决策推演)
- 上海交大:书生(代码生成,逻辑推理)
四、新兴创业公司大模型(技术新锐)
1. 通用能力型
- 百川智能:百川大模型(全场景"深度思考者",医疗增强版M2)
- 零一万物:Yi系列(ToB领域革新者,场景化模型全覆盖)
- MiniMax:ABAB系列(对话流畅度高,多轮交互自然)
- 360:360智脑(安全可信大模型,病毒分析,网络安全)
- 昆仑万维:天工AI(国内首个AI搜索,双千亿参数)
2. 技术专长型
- 智谱AI:GLM-4-Plus(知识图谱增强,推理能力强)
- DeepSeek:DeepSeek-V3(代码能力领先,推理精准)
- 月之暗面:Kimi(超长文本处理之王)
- 智谱AI:GLM-4-Plus(知识增强,学术科研首选)
- 商汤:商量SenseChat(多模态融合,视觉理解强)
五、选型参考
通用场景首选:通义千问、豆包、文心一言(综合能力均衡)
代码开发:DeepSeek(国内第一)、通义千问(CodeQwen)
学术研究:Kimi(超长文本)、智谱清言(知识严谨)
内容创作:文心一言(中文语感)、豆包(创意表达)
垂直领域:优先选择专业赛道头部企业(如医疗选医联/扁鹊,金融选中关村科金)
开源需求:通义千问(最全面)、智谱GLM(部分开源)、DeepSeek(基础模型开源)
总结
国内大模型已形成"巨头引领、专精突破、科研支撑、创业活跃"的多元格局。通用领域百度、阿里、字节、腾讯、华为五强并立;垂直赛道医疗、金融、教育等领域各有专攻;科研机构提供技术源头;创业公司在细分技术上实现突破。选择时应结合应用场景、预算和技术需求综合考量,关注模型的持续迭代能力和生态完整性。