文献阅读 - 使用verilog在fpga搭建cnn

2022-08-03 484 阅读1分钟

浮点数IEEE745标准

32位的浮点数：单精度

最高位为S，数符S表示浮点数的符号，1表示负数。

E为阶码

M为尾数

介绍

硬件描述语言为： verilog

数据性质为： IEEE745标准的浮点数，并具有半精度和全精度变体的实现。

网络由五层实现。第一部分是处理卷积的部分，这个包含负责卷积和平均池化。另一部分是网络的全连接部分。这个部分包含全连接层，它们之间有激活层。网络的目标是识别一系列手写数字图像，并能够将这些数字分类为10个十进制数字中的一个。

逻辑设计

卷积的实现采用的是逐元素乘法和累加。

fp16 - fp32的转换器。

加速运算。

设计浮点加法器和浮点乘法器

CNN加速器

1 并行计算。极高的并行度。

每个模块对大量数据队列执行并行计算。

2 tanh 以及softmax激活函数中e^x 通过泰勒展开计算，使用函数的泰勒近似实现。

3 softmax激活层，采用10个产生的值，并通过一系列计算产生我们神经网络的最终分类。涉及指数除法的函数的近似值。