面向嵌入式的CV&深度学习-VGG网络

256 阅读1分钟

感谢北京大学公开课,本文为个人学习笔记,后续会整理成系统体系。

1 网络结构

  • VGG-16 2 2 3 3 3
  • VGG-19 2 2 3 4 4 image.png

2 VGG网络示意图

image.png

3 VGG-16网路结构实现

  • 注意池化层卷积核使用了(2,2),步长使用了(2,2),可以实现输入图像维度降为一半
  • vgg-block内的卷积层都是同结构的意味着输入和输出的尺寸一样,且卷积层可以堆叠复用,其中的实现是通过统一的size为3×3的kernel size + stride1 + padding(same)实现。
  • maxpool层将前一层(vgg-block层)的特征缩减一半 使得尺寸缩减的很规整,从224-112-56-28-14-7。其中是通过pool size2 + stride2实现深度较深,参数量够大较深的网络层数使得训练得到的模型分类效果优秀,但是较大的参数对训练和模型保存提出了更大的资源要求。 较小的filter size/kernel size 这里全局的kernel size都为3×3,相比以前的网络模型来说,尺寸足够小 image.png image.png

4 代码

  • keras默认Strdes步长为1 image.png 1648435606(1).png