一、赛事背景 脑PET全称为脑部正电子发射计算机断层显像(brain positron emission tomography PET),是反映脑部病变的基因、分子、代谢及功能状态的显像。它是利用正电子核素标记葡萄糖等人体代谢物作为显像剂,通过病灶对显像剂的摄取来反映其代谢变化,从而为临床提供疾病的生物代谢信息,为脑癫痫病、脑肿瘤、帕金森病、阿尔茨海默综合征等提供了有效的检测手段。可利用脑PET图像检测出轻度认知障碍病灶,并提前介入治疗,从而延缓发病,对后续患者康复治疗有着积极的意义。因此本赛题以轻度认知障碍为例对脑PET图像进行分析与疾病预测。
二、赛事任务 为研究基于脑PET图像的疾病预测,本次大赛提供了海量脑PET数据集作为脑PET图像检测数据库的训练样本,参赛者需根据提供的样本构建模型,对轻度认知障碍进行分析和预测。
脑PET图像检测数据库,记录了老年人受试志愿者的脑PET影像资料,其中包括确诊为轻度认知障碍(MCI)患者的脑部影像数据和健康人(NC)的脑部影像数据。
被试者按医学诊断分为两类:
NC:健康
MCI:轻度认知障碍
赛事链接在:这里
目标:跑更高的分
主要有以下几种方式来使模型预测的更准确:
1. 预训练模型
*ResNet(Residual Network)是一个非常重要的深度学习架构,它在2015年由Kaiming He等人提出,并在ImageNet图像分类竞赛中获得了优异的成绩。ResNet解决了深度神经网络中出现的梯度消失和梯度爆炸等问题,使得训练非常深的神经网络变得可能。
2. 数据增强
数据增强是在训练深度学习模型时常用的一种技术,通过对原始数据进行各种变换和扩充,生成更多、更多样化的训练样本,从而提升模型的性能和泛化能力。数据增强的目标是增加模型对不同变化、角度和噪声的鲁棒性,使其更好地应对现实世界中的各种情况。
以下是一些常见的数据增强技术:
- 随机翻转(Random Flip):对图像进行水平或垂直方向的翻转,以扩充数据集。对于图像分类等任务,通常使用水平翻转,而对于语义分割等任务,垂直翻转也可能有用。
- 随机旋转(Random Rotation):对图像进行随机角度的旋转,增加模型对旋转变换的适应能力。
- 随机裁剪(Random Crop):在图像中随机选取一个区域作为新的样本,这可以帮助模型学习对不同尺寸和位置的物体的识别。
- 颜色变换(Color Jittering):调整图像的亮度、对比度、饱和度和色调,以模拟不同光照条件下的图像。
- 添加噪声(Adding Noise):在图像中添加随机噪声,例如高斯噪声,以提高模型对噪声的鲁棒性。
- 缩放和尺度变换(Scale and Size Augmentation):调整图像的尺寸,使模型能够处理不同大小的物体。
- 透视变换(Perspective Transformation):对图像进行透视变换,模拟不同视角下的图像。
- 随机遮挡(Random Occlusion):在图像中随机添加遮挡物,以让模型学习处理部分信息丢失的情况。
- 自适应平均池化(Adaptive Average Pooling):将不同大小的输入图像转换为相同大小,有助于模型处理变化的图像尺寸。
- 混合数据(Mixup and CutMix):将不同样本的特征进行混合,生成新的样本,以增加数据集的多样性。
详情阅读albumentations库的文档。
3.模型交叉验证
交叉验证(Cross-Validation,简称CV)是一种在机器学习中用于评估模型性能和选择参数的技术。它的目标是充分利用有限的数据,减少因数据分布不均匀或随机性带来的评估误差。交叉验证将数据分成多个子集(折叠),然后多次训练和测试模型,以获取更准确的性能评估。
4.测试集增强
测试集增强(Test-time Augmentation,简称TTA)是一种在模型推理阶段(测试阶段)应用数据增强技术的方法。通常,在模型训练阶段使用数据增强是为了提升模型的鲁棒性和泛化能力,但是在真实应用中,对于单个样本的预测,模型可能会因为不同的变换产生不同的预测结果。为了减少这种不确定性,可以在预测时对同一个样本应用多种不同的数据增强方式,然后将预测结果进行集成,最终得到一个更稳定的预测。
总结
这次通过文档和群友的聊天,分数有了上升,我也学到了很多,对深度学习的兴趣也更深了,非常感谢DataWhale 给我这次学习的机会!