VGG全称是Visual Geometry Group(视觉几何组)

587 阅读1分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第1天,点击查看活动详情

一、背景介绍 VGG全称是Visual Geometry Group(视觉几何组),因为是由Oxford的Visual Geometry Group提出的。AlexNet问世之后,很多学者通过改进AlexNet的网络结构来提高自己的准确率,主要有两个方向:小卷积核和多尺度。而VGG的作者们则选择了另外一个方向,即加深网络深度。

二、网络架构 卷积网络的输入是224 * 224的RGB图像,整个网络的组成是非常格式化的,基本上都用的是3 * 3的卷积核以及 2 * 2的max pooling,少部分网络加入了1 * 1的卷积核。因为想要体现出“上下左右中”的概念,3*3的卷积核已经是最小的尺寸了。

 vgg16 是哪16层

13+3 全连接

去除池化层

 输入层: 224 * 224 * 3
Conv-64: 224 * 224 * 64
Conv-64: 224 * 224 * 64
Pool2: 112 * 112 * 64 //MAX POOL
Conv-128: 112 * 112 * 128
Conv-128: 112 * 112 * 128
Pool2: 56 * 56 * 128
Conv3-256: 56 * 56 * 256
Conv3-256: 56 * 56 * 256
Conv3-256: 56 * 56 * 256
Pool2: 28 * 28 * 256
Conv3-512: 28 * 28 * 512
Conv3-512: 28 * 28 * 512
Conv3-512: 28 * 28 * 512
Pool2: 14 * 14 * 512
Conv3-512: 14 * 14 * 512
Conv3-512: 14 * 14 * 512
Conv3-512: 14 * 14 * 512
Pool2: 7 * 7 * 512
FC: 1 * 1 * 4096 //DROPOUT
FC: 1 * 1 * 4096
FC: 1 * 1 * 4096
SOFTMAX:*

VGG相比于Alex-net:参数更多 层次更深 但所需的迭代次数更少(更小的滤波器)

1*1卷积核:

  1. 网络更深;降低维度
  2. 增加更多的非线性变换
  3. 可以设置更大的步长,能在降低维度的时候尽可能的保留信息
    4.(取代FC层)

VGG16与VGG19性能基本接近,所以常用VGG16.

对比实验的六组网络

alt