一、[LINEAR-> ACTIVATION]转发函数

比如我有一个多层的神经网络，结构是输入层->隐藏层->隐藏层->···->隐藏层->输出层。

在每一层中，我会首先计算Z = np.dot(W,A) + b，这叫做【linear_forward】

然后再计算A = relu(Z) 或者 A = sigmoid(Z)，这叫做【linear_activation_forward】

合并起来就是这一层的计算方法，所以每一层的计算都有两个步骤，先是计算Z，再计算A，你也可以参照下图：

二、步骤：

1.初始化网络参数

2.前向传播

2.1 计算一层的中线性求和的部分

2.2 计算激活函数的部分（ReLU使用L-1次，Sigmod使用1次）

2.3 结合线性求和与激活函数

3.计算误差

4.反向传播

4.1 线性部分的反向传播公式

4.2 激活函数部分的反向传播公式

4.3 结合线性部分与激活函数的反向传播公式

5.更新参数

请注意，对于每个前向函数，都有一个相应的后向函数。这就是为什么在我们的转发模块的每一步都会在cache中存储一些值，cache的值对计算梯度很有用，在反向传播模块中，我们将使用cache来计算梯度。现在我们正式开始分别构建两层神经网络和多层神经网络。代码见D:\app\pyCharm\pyCharm\pycharmproject\homework\WUEnda\Four

三、代码详解：

1.初始化参数

输入层节点3，隐藏层节点2，输出层节点1

L=2即两层的神经网络：w1w2/b1b2

多层神经网络：initialize_parameters_deep(layers_dims)， layers_dims - 包含我们网络中每个图层的节点数量的列表

2.前向传播函数

前向传播有以下三个步骤：

1.LINEAR

2.LINEAR - >ACTIVATION，其中激活函数将会使用ReLU或Sigmoid。

3.[LINEAR - > RELU] ×（L-1） - > LINEAR - > SIGMOID（整个模型）

线性正向传播模块（向量化所有示例）使用如下公式进行计算：

1.线性部分【LINEAR】

利用输入的A、W、b来计算 Z = np.dot(W, A) + b，并输出Z和Cache

2.线性激活部分【LINEAR - >ACTIVATION】计算如下：

为了更方便，我们将把两个功能（线性和激活）分组为一个功能（LINEAR-> ACTIVATION）。因此，我们将实现一个执行LINEAR前进步骤，然后执行ACTIVATION前进步骤的功能。我们来看看这激活函数的数学实现吧~

我们为了实现LINEAR->ACTIVATION这个步骤，使用的公式是：

A^{[l]} = g(Z^{[l]}) = g(W^{[l]}A^{[l-1]} +b^{[l]})

其中，函数g会是sigmoid() 或者是 relu()，当然，sigmoid()只在输出层使用。

代码：我们调用上面的那两个函数来实现它，为了在实现L层神经网络时更加方便，我们需要一个函数来复制前一个函数（带有RELU的linear_activation_forward）L-1次，然后用一个带有SIGMOID的linear_activation_forward跟踪它，我们来看一下它的结构是怎样的：

[LINEAR -> RELU] $\times$ (L-1) -> LINEAR -> SIGMOID* model