LeNet-5 模型详解 - CNN鼻祖

853 阅读1分钟

引言

LeNet-5是LeCun在1998年提出的一个开创性的卷积神经网络架构。作为深度学习历史上的重要里程碑,它为现代计算机视觉的发展奠定了基础。本文将深入剖析LeNet-5的网络结构,工作原理。

模型结构

LeNet-5,5其实就是5层,包含了3层conv,2层fc。LeNet结构非常简单,但是涵盖了CNN所有基本元素,卷积、池化、全连接。 image.png

1、观察模型代码(没找到论文原始代码,手撸一个作为回顾)
1)LeNet最初是为了解决手写数字识别问题,minist输入为单通道28x28图像
2)前向过程中,先将minist的输入pad到32x32
3)非线性由tanh引入 image.png

2、跑下Minist
1)3个epoch就到99的精度了

image.png

3、算下参数量(近似)
1x6x5x5+6x16x5x5+16x120x5x5+120x84+84x10=61470
60k的参数就能满足常规手写体数字识别的需求

总结

1、LeNet首次系统地将卷积和池化操作结合使用,为现代CNN架构奠定了基础
2、在美国邮政编码识别中落地,证明了深度学习在实际问题中的可行性