一、基础能力(机器学习)
机器学习的三大主流范式构成了人工智能的基础能力:
- 监督学习:通过“输入-标签”对进行训练,学习从数据到答案的映射
- 无监督学习:从无标注数据中发现隐藏模式或结构
- 强化学习:通过与环境的交互,基于奖励信号学习决策策略
这些是AI系统获取知识的基本方法。
二、核心技术(深度学习)
在经典机器学习基础上,深度学习提供了更强大的工具:
- 卷积神经网络(CNN) :擅长处理网格状数据(如图像),通过局部连接和权值共享提取空间特征
- Transformer:基于自注意力机制,擅长捕捉序列数据中的长距离依赖关系,已成为自然语言处理乃至多模态任务的基石
这两者属于模型架构层面,是实现高级功能的“引擎”。
三、生成式人工智能
- 大语言模型:基于Transformer架构、在海量数据上预训练的超大规模模型,具备了强大的语言理解与生成能力,是当前生成式人工智能的核心
- 生成式人工智能:以大语言模型等为基础,能够生成文本、图像、代码等全新内容,代表了从“分析”到“创造”的能力跃迁
四、交互方式 —— 多模态融合
- 单模态输入:系统处理文字、语音、图像等单一形式的信息
- 多模态学习:融合文字、语音、图像等多种模态信息进行联合理解与生成,使AI能更全面、更接近人类感知地处理现实世界问题
简单来说,技术演进路径可以概括为:
机器学习范式(监督/无监督/强化)→ 深度学习架构(CNN/Transformer)→ 大规模预训练模型(大语言模型)→ 生成式能力涌现 → 多模态融合交互