本章内容
希望各位读者们多多指点,共同进步
图像是如何制作的?
我将更详细地解释 NN 中的运动。为此,首先,让我们看看输入到 NN 的图像会发生什么。
为了清晰起见,考虑简单的图像。
这是数字“0”的手写图像。图像由 28×28 像素组成。每个像素都有从白色到黑色的颜色,当它们聚集在一起时,就会创建一个图像。
这些颜色在计算机中以数字形式表示。白色用“1”表示,黑色用“0”表示,随着变浅逐渐接近“1”,随着变深接近“0”。当你收集这些数字时,你会得到一个单一的图像。
这一次,让我们考虑一个更简单的图像。
上图是一个图像,其中 0、1、2、3、4、5、6、7、8、9 写在 8×8 的空间中。如果这个数字用数字表示,它将是从“0.0”到“1.0”的数字集合。为了便于说明,字符部分为“0.9”,背景为“0.1”。
让我们把这张图片放到NN中。
到目前为止的总结
- 图像颜色在计算机中以数字形式表示
- “1.0”代表白色,“0.0”代表黑色
- 收集数字以创建图像
⚠️ 在实践中,白色 = 255 等,但为了便于说明,白色 = 1.0
神经网络输入输出
考虑将图像输入到神经网络时的运动。这一次,为了简单起见,我们将使它成为一个没有中间层的 NN。
假设输入有 64 个神经元,输出有 10 个神经元。
输入层的 64 个神经元代表一个“8×8 图像”。图像的 64 个像素数字进入输入层的 64 个神经元。图像中的数字是一一输入的。
输出层的 10 个神经元代表“10 个数字 0 1 2 3 4 5 6 7 8 9”。这 10 个神经元接收 NN 计算的“结果”。所有神经元都包含结果值。
这10个神经元中,数值最大的神经元就是判别结果。例如,假设您得到了上面显示的结果。对于这个结果,我们使用激活函数之一的“Softmax 函数”,以便更容易理解值的大小。
然后我们看到,具有最大值的神经元是具有’5’值的神经元。
这意味着NN已经决定 “输入图像是5!” 这意味着NN已经决定输入的图像是5。
它说:“我做了计算,但这个图像是5。”
我们要创建的人工智能是一个神经网络,它可以确定图像中写入的数字 0 到 9 中的哪一个。例如,输入“3”的图像将导致“第 3 个输出神经元”中的最高值,输入“7”的图像将导致“第 7 个输出神经元”中的最高值,等等。目标是创建一个可以进行此类预测(计算)的神经网络。
到目前为止的总结
- 输入层的 64 个神经元代表一个“8×8 图像”
- 输出层的 10 个神经元代表“10 个数字 0 1 2 3 4 5 6 7 8 9”
- 在输出层的神经元中,数值最大的神经元就是判别结果。
在文章中讲述了图像和神经网络的出入输出,希望多多指教