深度学习笔记——卷积神经网络CNN卷积神经网络 (CNN) 是一种专门用于处理图像、视频等数据的深度学习模型，主要用于计

大家好，这里是好评笔记，本文为试读，查看全文请移步公主号：Goodnote。本文详细介绍面试过程中可能遇到的卷积神经网络CNN知识点。

@[toc]

卷积神经网络 (CNN) 是一种专门用于处理图像、视频等数据的深度学习模型，主要用于计算机视觉任务，例如图像分类、目标检测和图像生成。CNN 通过卷积操作减少输入数据的尺寸，提取出重要特征，同时保留其空间结构 ，尤其在处理高维数据时非常有效。

主要组件

输入层用于接收原始数据，例如图像（二维或三维张量）。对于图像，通常是像素值。

卷积层是 CNN 的核心组件，负责通过卷积核 (filter) 提取输入数据的局部特征 。通过扫描输入的局部区域，卷积层可以识别特定的模式（例如边缘、角等）。卷积操作通常会产生一组特征图。

归一化使训练过程更加稳定和高效。BN 层将激活值标准化为均值为 0、标准差为 1 的分布，然后通过可学习的缩放和平移参数恢复数据分布。防止梯度消失和梯度爆炸问题。加速训练，允许使用更大的学习率。在一定程度上起到正则化作用，减少过拟合。

参考【归一化部分】：深度学习——优化算法、激活函数、归一化、正则化

常见的激活函数是ReLU 及其变体（如 Leaky ReLU、PReLU 和 ELU）。其他函数如 Swish 也逐渐流行（SD模型组件中GSC中的S指的就是Swish）。Sigmoid 和 Tanh 因梯度消失问题较严重，不适合深层 CNN 网络，因此使用较少。

池化层用于缩减数据的尺寸，同时保留主要特征。最大池化（Max Pooling）是最常用的方式，它通过取每个区域内的最大值来减少数据量。这有助于减小计算量，并增强模型的平移不变性。

全连接层是CNN 的特征整合部分，将高维特征压缩并组合，最终生成一个用于输出处理的向量，连接到输出层。通常在 CNN 的最后几层用于将提取到的特征映射到最终的分类或回归结果。

输出层的作用是生成最终的预测结果。

详细全文请移步公主号：Goodnote。