
感受眼就是特征图上的一个点对应原始图像的区域大小。感受眼是相对原图来说的,第二层卷积对应第一层卷积是3*3大小,对应到原图则是5*5大小。所以第二层卷积得到的特征图中的每个点的感受眼是5*5的。层数越多,那么后面感受眼的范围就会越大。感受眼的大小意味着特征点对应着原始图像的大小。

使用堆叠三个小的卷积还是使用一个大的卷积呢?权重参数越多意味着模型训练难道更大,发生过拟合的严重性也就越高。上图计算可得3个小的卷积比一个大的卷积所需要的权重参数更小。而且使用3个小的卷积 它的非线性更强,因为每个卷积后面都带有一个RELU。

左边网络叫深度残差网络,效果会更好,使用更少的参数 表达更强的非线性。

进过Pooling层后特征的表达效果会有所降低,所以我们要使用翻倍的filter个数来加以弥补,这是个比较通用的做法。