1️⃣ 模型是什么
模型是对现实问题的数学抽象,描述输入到输出的映射关系。
👉 本质:函数 f(x) → y
2️⃣ 什么是神经网络
由多层神经元组成,通过加权+激活函数学习数据规律。
👉 本质:多层非线性函数组合
3️⃣ 神经网络 vs 机器学习
- 机器学习:更大范畴(决策树、SVM等)
- 神经网络:其中一种(深度学习核心)
👉 关系:神经网络 ⊂ 机器学习 ⊂ AI
4️⃣ 常见损失函数
衡量预测误差:
- 回归:MSE、MAE
- 分类:交叉熵
👉 目标:最小化损失
5️⃣ 线性 vs 非线性
- 线性:表达能力有限
- 非线性:能拟合复杂关系
👉 关键:激活函数提供非线性
6️⃣ 梯度下降(核心优化)
θ=θ−η∇J(θ) 沿着损失函数下降最快方向更新参数。
7️⃣ 常见激活函数
- Sigmoid:0~1
- Tanh:-1~1
- ReLU:max(0, x)(最常用)
👉 作用:引入非线性
8️⃣ 学习率
控制参数更新步长:
- 大:震荡
- 小:收敛慢
👉 本质:收敛速度控制
9️⃣ 偏导数
∂f∂x\frac{\partial f}{\partial x}∂x∂f
表示多变量函数对某一变量的变化率。
👉 用于计算梯度,更新参数
🔟 训练集 vs 测试集
- 训练集:用于训练模型
- 测试集:用于评估模型泛化能力
👉 关键:测试集不能参与训练
1️⃣1️⃣ 过拟合
模型在训练集表现很好,但在测试集表现差。
👉 原因:
- 模型过复杂
- 数据过少
👉 解决:
- 正则化(L1/L2)
- Dropout
- 增加数据