为什么在神经网络中，需要激活函数？

----为了拟合更加复杂的数据分布

通常而言，我们所要拟合的数据分布都是非常复杂的，是非线性的，而神经网络中计算大多是线性计算，线性叠加所具有的的泛化能力有限，而非线性的激活函数无疑可以增大模型的泛化能力。

各激活函数公式，图像以及导数图像

名称	激活函数	导数
sigmoid	$f(x)=\frac{1}{1+e^{-x}}$	$f'(x)=f(x)(1-f(x))$
tanh	$f(x)=\frac{e^{2x}-1}{e^{2x}+1}$	$f(x)=1-(f(x))^2$
ReLU	$f(x)=max(0,x)$	$f(x)=sgn(x)$
LeakyReLU	$f(x)=max(0.01x,x)$	$f(x)=\left\{ \begin{array}\\0.01,&x<0\\1,&x>0\end{array} \right.$