开启掘金成长之旅！这是我参与「掘金日新计划 · 12 月更文挑战」的第8天，点击查看活动详情

对于机器学习或者是说对于深度学习来讲，矩阵计算其实是讲矩阵怎么求导数

因为你的所有的优化模型的求解都是通过求导数来进行的

首先回忆一下高中数学啊，标量的导数。

标量导数

图片.png

导数的意义

导数的含义是是切线的斜率

图片.png

函数不可微怎么办（亚倒数）

当不一定存在导数的话会怎么办？就是说我们将函数拓展到不可微的情况下，怎么办？这举个简单的例子，Y是X的绝对值。

图片.png

图片.png

接下来就要将啊导数扩展到向量，通常叫梯度的多一点

这里画了一张图，向量导数最关键的是要清楚形状

图片.png

图片.png

梯度一定指向你那个值变化的最大的一方向，这是所有的机器学习求解的一个核心思想

常见的例子

图片.png

假设Y是一个列向量，列向量关于标量的导数，它也是一个列向量，和y是标量X是向量刚好相反

图片.png

Y是一个向量，X是一个向量，因为Y是一个向量，所以先把它拆解成一个列的向量，然后每一列的那一个元素，第二个元素就是Y的第二个元素，关于X的一个导数，它是一个横向量，最后就变成一个矩阵

图片.png

常见的例子

图片.png