题目:Attention U-Net:learning where to look for the pancereas
github:github.com/ozan-oktay/…
论文核心:AGS attention gates for image analysis
遗留问题:看完之后,仍然不知道怎么做的,没看太懂
摘要:提出了一种应用于医学影像的attention gate的模型self-attention gating模块,它会自动学习区分目标的外形和尺寸。这种有attention gate的模型在训练时会学会抑制不相关的区域,注重有用的显著特征,这点对一个具体的任务来说很有效。
前言:级联框架提取感兴趣区域ROI并对该特定ROI进行密集的预测,但是,这种方法导致过多和冗余地使用计算资源和模型参数。例如,级联中的所有模型都会重复提取相似的低级特征。
为了解决这个问题,文章提出了attention gates(AGS)的方法,有以下几个优势:
1、提出基于网格的AG,会使注意力系数更能凸显局部区域的特征。带AG的CNN可以直接端到端学习,无需额外的监督标准(传统的Attention需要额外的监督标准?)
2、在推理时会自动关注有显著特征的区域
3、不会引入大量的参数和计算量。AG通过抑制无关区域中特征的激活来提高模型灵敏度和准确性,以进行密集的标签预测。这样,可以在维持高准确率的同时消除使用外部器官定位模型的必要性。这里针对将分割分为两步的方法,即检测+分割,先确定待分割的器官、组织的ROI,再进行小区域的分割。
4、首次在医学图像的CNN中使用soft attention, 该模块可以替代分类任务中的hard attention和器官定位任务中的定位模块。
5、将U-Net改进为attention u-net,增加了模型对前景像素的敏感度,并设计实验证明了这种改进是通用的。
相关工作:
CT胰腺分割:主要有statistical shape models, multi-atlas techniques和cascaded multi-state CNN models三种方法。在CNN里,会使用初始粗粒度的模型(如U-Net或回归森林)来获取ROI,然后使用裁剪后的ROI通过第二个模型进行细分,还有利用2D-FCN和递归神经网络(RNN)模型的组合来利用相邻轴向切片之间的依赖性。
具体方法
FCN(fully convolutional network)全卷积网络