携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第4天,点击查看活动详情
-
人类视觉和卷积神经网络关系
- 卷积神经网络来源于人类眼睛的一个很重要的功能:局部感受野
- 左边的图是人类的眼睛,在看半开的门的情况下,我们的眼睛会获取这个区域的图片到大脑去进行处理,可以发现我们的视网膜上的某些具体细胞是负责某一块区域的处理,所以可以定义为局部感受野,所以说我们获取的信息是由一些图片的信息综合而来的,这就是卷积神经网络一个最初的灵感来源
- 这个是卷积神经网络的一个流程图,一般我们的图片input进来之后,会经过一系列的卷积神经网络来提取它的特征,提取完它的特征,我们会把它的high feature送到分类器中,然后输出分类结果
- 卷积神经网络是黑盒算法
-
卷积神经网络的应用
- 图片的分类与检索:搜图
- 目标检测:自动驾驶、医疗影像
- 图像(语义)分割
-
卷积运算过程
-
数学上的卷积定义
-
- 物理:卷积可代表某种系统对某个物理量或输入的调制或污染
- 图像:卷积对输入的局部特征的提取
-
-
RGB图像在数学上的表示
-
灰度图像在数学上的表示
-
卷积运算
-
概念总结:
- 输入(input):可以是图片,也可以是前一层的输出(feature map)
- 卷积核(kernel/filter):模型待优化的参数
- 特征映射(feature map):时输入信号特征的映射
- 填充(padding):未来保留输入边界特征,一般时0值填充
- 步长(stride):保留相邻区域特征的相关性
-
-
用池化进行采样
- 图像:上采样细腻边缘,增大图片尺寸;下采样减小尺寸,减少计算量
- MaxPooling: 最大值池化
- AvgPooling: 平均值池化
- AdaptivePooling 自适应
-
- 提特征 2. 提高模型的非线性表达 3. 减少特征尺寸
-
卷积运算过程
-
空洞卷积(Dilated Convolution)
-
分组卷积(Group Convolution)
-
转置卷积(Transpose Convolution)
-
-
利用残差搭建更深的网络
-
太深的神经网络有什么问题?
- 梯度弥散/爆炸
- 网络退化
-
残差连接
-
-
Vgg介绍及实现
-
Vgg的优点
- 结构简单,并能保持好的准确率和速度
- 其他基于卷积架构网络变换的设计来源
- 可以单独作为特征抽取器或者预训练模型使用
-
-
-
图片的数据增广
- 原始 旋转 模糊 对比度 远近 随机明暗度 透视变换