持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第18天，点击查看活动详情

什么是通道注意力机制

注意力机制的思想来源于人的视觉，人的眼睛在看到一副图片时，通常不会同时关注图像的每一个像素，而是先将视线放在图像主体位置，而对其他位置给予更少的视线。同样，在计算机视觉任务中，并不是需要对图像的每一个区域施加完全一样的处理，就像我们人类在看图像时对每个区域投放的视线不完全相同，这种不同区域的不同视线就是注意力机制。
通道注意力简单理解就是对输入特征图的不同通道给予不同的权重，权重高的通道被给予更多处理。
下面介绍几种常见的通道注意力机制

SE注意力机制

全称：Squeeze-Excitation Attention

因为通道注意力只能建立通道直接的关系，而忽略了通道内的空间信息，因此卷积块注意力模块在通道注意力模块后串行接入一个空间注意力模块，从而计算位置信息。

优点：先使用通道注意力获取通道关系，再使用卷积计算空间注意力来利用位置信息
缺点：卷积只能捕获局部关系，无法建模长距离依赖

刚开始接触深度学习的时候不理解1*1卷积的作用，觉得这种卷积核是毫无用处、多此一举的，但是在看的论文模型中总是出现，并且可以用来降维，此前一直不理解，今天就打算深究这个问题。