神经网络——卷积神经网络

543 阅读2分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第4天,点击查看活动详情

  • 人类视觉和卷积神经网络关系

    • 卷积神经网络来源于人类眼睛的一个很重要的功能:局部感受野
    • 左边的图是人类的眼睛,在看半开的门的情况下,我们的眼睛会获取这个区域的图片到大脑去进行处理,可以发现我们的视网膜上的某些具体细胞是负责某一块区域的处理,所以可以定义为局部感受野,所以说我们获取的信息是由一些图片的信息综合而来的,这就是卷积神经网络一个最初的灵感来源
    • 这个是卷积神经网络的一个流程图,一般我们的图片input进来之后,会经过一系列的卷积神经网络来提取它的特征,提取完它的特征,我们会把它的high feature送到分类器中,然后输出分类结果
    • 卷积神经网络是黑盒算法
  • 卷积神经网络的应用

    • 图片的分类与检索:搜图
    • 目标检测:自动驾驶、医疗影像
    • 图像(语义)分割
  • 卷积运算过程

    • 数学上的卷积定义
      • 物理:卷积可代表某种系统对某个物理量或输入的调制或污染
      • 图像:卷积对输入的局部特征的提取
    • RGB图像在数学上的表示
    • 灰度图像在数学上的表示
      • image (3).png
    • 卷积运算
      • image (2).png
    • 概念总结:
      • 输入(input):可以是图片,也可以是前一层的输出(feature map)
      • 卷积核(kernel/filter):模型待优化的参数
      • 特征映射(feature map):时输入信号特征的映射
      • 填充(padding):未来保留输入边界特征,一般时0值填充
      • 步长(stride):保留相邻区域特征的相关性
  • 用池化进行采样

    • 图像:上采样细腻边缘,增大图片尺寸;下采样减小尺寸,减少计算量
    • MaxPooling: 最大值池化
    • AvgPooling: 平均值池化
    • AdaptivePooling 自适应
      1. 提特征 2. 提高模型的非线性表达 3. 减少特征尺寸
  • 卷积运算过程

    • 空洞卷积(Dilated Convolution)
    • 分组卷积(Group Convolution)
    • 转置卷积(Transpose Convolution)
  • 利用残差搭建更深的网络

    • 太深的神经网络有什么问题?
      • 梯度弥散/爆炸
      • 网络退化
    • 残差连接
  • Vgg介绍及实现

    • Vgg的优点
      • 结构简单,并能保持好的准确率和速度
      • 其他基于卷积架构网络变换的设计来源
      • 可以单独作为特征抽取器或者预训练模型使用
      • image (3).png
  • 图片的数据增广

    • image (2).png
    • 原始 旋转 模糊 对比度 远近 随机明暗度 透视变换