面向嵌入式的CV&深度学习-ResNet网络

290 阅读1分钟

1 ResNet网络网络结构

  • 按照步长计算公式,此处是因为最后一个卷积再卷就到图片外面了,舍弃最后一个卷积,所以执行向下取整,得到112*112 image.png image.png image.png image.png image.png

2 下采样方法

  • ResNet使用两种残差单元,如下图所示。左图对应的是浅层网络,而右图对应的是深层网络。对于短路连接,当输入和输出维度一致时,可以直接将输入加到输出上
  • 但是当维度不一致时(对应的是维度增加一倍),这就不能直接相加。有两种策略:
    • (1)采用zero-padding增加维度,此时一般要先做一个downsamp,可以采用strde=2的pooling,这样不会增加参数;
    • (2)采用新的映射(projection shortcut),一般采用1x1的卷积,这样会增加参数,也会增加计算量。短路连接除了直接使用恒等映射,当然都可以采用projection shortcut。 image.png

image.png image.png image.png 参考文献 www.zhihu.com/search?type…