对神经网络的简单理解（未完）通过写博客的方式深化记忆，同时一定程度上锻炼结构性的语言能力，欢迎交流和指正。（图片均来自于

目前通过学习《深度学习的数学》这本书，开始掌握了对神经网络的理解。（图片均来自于书本）

神经网络的基本单元——神经元

输入： $x1,x2,x3...$

权重：形如 $w1,w2,w3...$

偏置：神经元的感受能力（就像神经元的脾气一样，脾气大，b小；脾气小，b大）

输出：y

激活函数：a(z)

微信图片_20260329101838_98_2.jpg 神经元的数学公式

$y=a(w1·x1+w2·x2+w3·x3...+wn·xn+b)(b<0)$

由公式可得y受到不同激活函数，权重和偏置的影响，会得到不同的输出

将神经元的工作拆分后得到两步：

1.加权输入 $z=w1·x1+w2·x2+w3·x3...+wn·xn+b$

2.激活函数后的输出 $y=a(z)$

后面对神经元的所有操作简化为1和2指代

神经元在进行网状结合后就形成了神经单元

由于获取的数据大小跨度很大，比如不同传感器获得的数据与在学习时的理论数据（显然理论学习的过程中是简化的），输出y的结果如果不经过处理所得到的结果是完全无法想象的。

一个10多个数量级的数，一个0.00000...1，如果考试手算想想都可怕

所以要经过处理。0和1是计算机的常见数字，计算起来也简单，所以我们希望y的输出是在0~1之间的结果。（当然有深层原因，我也不知道）

这里着重考虑一个方面，引入激活函数来控制范围，显然九年义务教育告诉我们任意的y都可以由此映射到0~1之间。

数学表达

\left\{\begin{matrix} y=0,z<0 \\ y=b,z≥0 \end{matrix}\right.

(因为加权输入的结果用z表示，x指代的是原始输入）

图像:

(不会显示，不写了）

数学表达

y=\frac{1}{1+e^{-z}}

图像：

按层来划分（图为全连接层）

微信图片_20260329104021_100_2.jpg 基本特征：

1.输入层的每个神经元都会指向隐藏层的所有神经元（一对多）（这是全连接层的特征）

2.输入层的神经元不处理数据，从读取到输出的过程中数据是不变的。

输入层的神经元不需要操作1和操作2，直接进行读取和输出，所以没有输入的箭头

3.数据的处理主要发生在隐藏层，输出层也会进行操作1和2