神经网络中的激活函数本文已参与「新人创作礼」活动，一起开启掘金创作之路。 $tanh(z)=\frac{e^z-e^{-

本文已参与「新人创作礼」活动，一起开启掘金创作之路。

$tanh(z)=\frac{e^z-e^{-z}}{e^z+e^{-z}}$ 效果严格地比 $sigmoid$ 函数好，因为该函数的对称中心在 $(0,0)$ ，具有将数据归一化为0均值的效果。当然，二分类的输出层的激活函数还是一般用 $sigmoid(z)$ ，因为 $sigmod$ 函数能将输出值映射到 $0\sim1$ 之间（概率值）
$Relu(z)=max(0,z)$ 出现后，神经网络默认都用 $Relu$ 函数（rectified linear）来作为激活函数。此时一般默认 $z>0$
$leaky(z)=max(0.01z,z)$ 可以避免 $z<0$ 时斜率为零的情况输出层有时也用线性激活函数（房价预测）

0. Linear Activate Function

也叫identity activate Function，即对原始输出不做任何变换

1. Sigmoid activation function

图1.1 激活函数-sigmoid \begin{align*} a&=g(z) \\ &=\frac{1}{1+e^{-z}}\\ \tag{1-1} \end{align*} \begin{align*} g'(z)&=\frac{d}{dz}g(z)\\ &=\frac{e^{-z}}{1+e^{-z}}\\ &=\frac{1}{1+e^{-z}}\left(1-\frac{1}{1+e^{-z}}\right)\\ &=g(z)\left(1-g(z)\right)\\ &=a(1-a)\\ \tag{1-2} \end{align*} ## 2. Tanh activation function