一. 大模型前置知识和概念前置知识学习大模型技术需要掌握的基础知识包括数学（线性代数、微积分、概率论与统计、优化理论）

前置知识

机器学习是一种通过数据训练模型，使计算机能够从数据中学习规律并做出预测或决策的技术。它的核心思想是让机器通过经验（数据）改进性能，而不是依赖明确的编程指令。

机器学习的关键特点：

机器学习的类型：

什么是深度学习

深度学习的算法致力于模拟人类大脑的工作方式，其灵感来源于神经生物学，通过对大量数据的学习，自动提取出数据的高层次特征和模式，从而实现图像识别，语音识别，自然语言处理等任务。按照架构的不同，可以分成三种：CNNs（卷积神经网络）、RNNs（循环神经网络）、Transformer网络

大模型的演变史

整体上分三个阶段：预训练（通用能力）、SFT监督微调（专业）、RLHF（人类反馈的强化学习）

局部截取_20250206_141749.png

局部截取_20250206_142311.png

局部截取_20250206_142732.png

有以下四个特点参数量大、适应性强、广泛的数据集、资源消耗也大

局部截取_20250206_143231.png