神经网络是什么

2 阅读1分钟

1️⃣ 模型是什么

模型是对现实问题的数学抽象,描述输入到输出的映射关系。
👉 本质:函数 f(x) → y


2️⃣ 什么是神经网络

由多层神经元组成,通过加权+激活函数学习数据规律。
👉 本质:多层非线性函数组合


3️⃣ 神经网络 vs 机器学习

  • 机器学习:更大范畴(决策树、SVM等)
  • 神经网络:其中一种(深度学习核心)

👉 关系:神经网络 ⊂ 机器学习 ⊂ AI


4️⃣ 常见损失函数

衡量预测误差:

  • 回归:MSE、MAE
  • 分类:交叉熵

👉 目标:最小化损失


5️⃣ 线性 vs 非线性

  • 线性:表达能力有限
  • 非线性:能拟合复杂关系

👉 关键:激活函数提供非线性


6️⃣ 梯度下降(核心优化)

θ=θ−η∇J(θ) 沿着损失函数下降最快方向更新参数。


7️⃣ 常见激活函数

  • Sigmoid:0~1
  • Tanh:-1~1
  • ReLU:max(0, x)(最常用)

👉 作用:引入非线性


8️⃣ 学习率

控制参数更新步长:

  • 大:震荡
  • 小:收敛慢

👉 本质:收敛速度控制


9️⃣ 偏导数

∂f∂x\frac{\partial f}{\partial x}∂x∂f​
表示多变量函数对某一变量的变化率。
👉 用于计算梯度,更新参数


🔟 训练集 vs 测试集

  • 训练集:用于训练模型
  • 测试集:用于评估模型泛化能力

👉 关键:测试集不能参与训练


1️⃣1️⃣ 过拟合

模型在训练集表现很好,但在测试集表现差。

👉 原因:

  • 模型过复杂
  • 数据过少

👉 解决:

  • 正则化(L1/L2)
  • Dropout
  • 增加数据