反向传播

73 阅读1分钟

那么,反向传播到底“优化”了什么?

它优化的不是次数,而是每次迭代的“效率”和“方向性”

没有反向传播的“学习”是怎样的?那就好比:

  • 随机猜测:厨师长对后厨喊:“菜不行!你们随便改点东西!”然后厨师A随机多加点糖,小工B随机少加点醋……完全靠运气。
  • 暴力搜索:尝试所有可能的盐、糖、醋的组合。这在小问题上还行,但对于神经网络动辄百万的参数,这需要宇宙寿命那么长的时间才能试完。

反向传播的强大之处在于:
它像一个GPS导航,在每次迭代后都告诉你:“为了到达目的地(减少误差),你下一个路口应该精确地向左转30度(权重W1需要减少0.01),然后直行50米(权重W2需要增加0.005)。”

它提供了明确、高效、可计算的优化方向。虽然路途(迭代次数)可能依然漫长,但你能确保每一步都是在朝着目标前进,而不是在原地打转或走向相反方向。

  • 核心价值:反向传播的价值不在于减少步骤数量,而在于为每一步提供了确切的、高效的优化方向,使得训练复杂神经网络成为可能。没有它,深度学习就不会存在。
  • 核心思想:反向传播本身不决定步骤数量,但它决定了每一步的效率和质量

image.png

根据每个参数的梯度(权重,对结果的影响比重),然后结合学习率,根据最终输出值的误差对比,求出下一次的该参数的新参数值。

image.png