神经网络是什么

苏三的开发日记

2026-04-16 2 阅读1分钟

1️⃣ 模型是什么

模型是对现实问题的数学抽象，描述输入到输出的映射关系。
👉 本质：函数 f(x) → y

2️⃣ 什么是神经网络

由多层神经元组成，通过加权+激活函数学习数据规律。
👉 本质：多层非线性函数组合

3️⃣ 神经网络 vs 机器学习

机器学习：更大范畴（决策树、SVM等）
神经网络：其中一种（深度学习核心）

👉 关系：神经网络 ⊂ 机器学习 ⊂ AI

4️⃣ 常见损失函数

衡量预测误差：

回归：MSE、MAE
分类：交叉熵

👉 目标：最小化损失

5️⃣ 线性 vs 非线性

线性：表达能力有限
非线性：能拟合复杂关系

👉 关键：激活函数提供非线性

6️⃣ 梯度下降（核心优化）

θ=θ−η∇J(θ) 沿着损失函数下降最快方向更新参数。

7️⃣ 常见激活函数

Sigmoid：0~1
Tanh：-1~1
ReLU：max(0, x)（最常用）

👉 作用：引入非线性

8️⃣ 学习率

控制参数更新步长：

大：震荡
小：收敛慢

👉 本质：收敛速度控制

9️⃣ 偏导数

∂f∂x\frac{\partial f}{\partial x}∂x∂f
表示多变量函数对某一变量的变化率。
👉 用于计算梯度，更新参数

🔟 训练集 vs 测试集

训练集：用于训练模型
测试集：用于评估模型泛化能力

👉 关键：测试集不能参与训练

1️⃣1️⃣ 过拟合

模型在训练集表现很好，但在测试集表现差。

👉 原因：

模型过复杂
数据过少

👉 解决：

正则化（L1/L2）
Dropout
增加数据