FPGA实现卷积神经网络使用定点数来代替浮点数,提高硬件效率。在保证硬件资源的有效使用,确保网路的准确率,采用8/16位定点的方式进行实现。
卷积参数量化为int8,偏置量化为int16.
参数量化
分析网络参数的取值范围,确定定点数据采用的位宽,确保其不会溢出。
2^(w-p+1) >max(Dmax X 2^p,Dmin X 2^p)
W为量化位宽,P为量化位宽,D表示量化前的浮点数。
16位定点数
输入图片剪切
640x320 隔点取样。 32x32. 每隔10行,5列采样像素点实现降采样目的。
或最大池化