DataWhale CV方向任务三的学习笔记一、赛事背景脑PET全称为脑部正电子发射计算机断层显像(brain po

一、赛事背景 脑PET全称为脑部正电子发射计算机断层显像(brain positron emission tomography PET)，是反映脑部病变的基因、分子、代谢及功能状态的显像。它是利用正电子核素标记葡萄糖等人体代谢物作为显像剂，通过病灶对显像剂的摄取来反映其代谢变化，从而为临床提供疾病的生物代谢信息，为脑癫痫病、脑肿瘤、帕金森病、阿尔茨海默综合征等提供了有效的检测手段。可利用脑PET图像检测出轻度认知障碍病灶，并提前介入治疗，从而延缓发病，对后续患者康复治疗有着积极的意义。因此本赛题以轻度认知障碍为例对脑PET图像进行分析与疾病预测。

二、赛事任务 为研究基于脑PET图像的疾病预测，本次大赛提供了海量脑PET数据集作为脑PET图像检测数据库的训练样本，参赛者需根据提供的样本构建模型，对轻度认知障碍进行分析和预测。

脑PET图像检测数据库，记录了老年人受试志愿者的脑PET影像资料，其中包括确诊为轻度认知障碍（MCI）患者的脑部影像数据和健康人（NC）的脑部影像数据。

被试者按医学诊断分为两类：

NC：健康

MCI：轻度认知障碍

赛事链接在：这里

目标：跑更高的分

主要有以下几种方式来使模型预测的更准确：

1. 预训练模型

*ResNet（Residual Network）是一个非常重要的深度学习架构，它在2015年由Kaiming He等人提出，并在ImageNet图像分类竞赛中获得了优异的成绩。ResNet解决了深度神经网络中出现的梯度消失和梯度爆炸等问题，使得训练非常深的神经网络变得可能。

2. 数据增强

数据增强是在训练深度学习模型时常用的一种技术，通过对原始数据进行各种变换和扩充，生成更多、更多样化的训练样本，从而提升模型的性能和泛化能力。数据增强的目标是增加模型对不同变化、角度和噪声的鲁棒性，使其更好地应对现实世界中的各种情况。

以下是一些常见的数据增强技术：

随机翻转（Random Flip）：对图像进行水平或垂直方向的翻转，以扩充数据集。对于图像分类等任务，通常使用水平翻转，而对于语义分割等任务，垂直翻转也可能有用。
随机旋转（Random Rotation）：对图像进行随机角度的旋转，增加模型对旋转变换的适应能力。
随机裁剪（Random Crop）：在图像中随机选取一个区域作为新的样本，这可以帮助模型学习对不同尺寸和位置的物体的识别。
颜色变换（Color Jittering）：调整图像的亮度、对比度、饱和度和色调，以模拟不同光照条件下的图像。
添加噪声（Adding Noise）：在图像中添加随机噪声，例如高斯噪声，以提高模型对噪声的鲁棒性。
缩放和尺度变换（Scale and Size Augmentation）：调整图像的尺寸，使模型能够处理不同大小的物体。
透视变换（Perspective Transformation）：对图像进行透视变换，模拟不同视角下的图像。
随机遮挡（Random Occlusion）：在图像中随机添加遮挡物，以让模型学习处理部分信息丢失的情况。
自适应平均池化（Adaptive Average Pooling）：将不同大小的输入图像转换为相同大小，有助于模型处理变化的图像尺寸。
混合数据（Mixup and CutMix）：将不同样本的特征进行混合，生成新的样本，以增加数据集的多样性。

详情阅读albumentations库的文档。

3.模型交叉验证

交叉验证（Cross-Validation，简称CV）是一种在机器学习中用于评估模型性能和选择参数的技术。它的目标是充分利用有限的数据，减少因数据分布不均匀或随机性带来的评估误差。交叉验证将数据分成多个子集（折叠），然后多次训练和测试模型，以获取更准确的性能评估。

4.测试集增强

测试集增强（Test-time Augmentation，简称TTA）是一种在模型推理阶段（测试阶段）应用数据增强技术的方法。通常，在模型训练阶段使用数据增强是为了提升模型的鲁棒性和泛化能力，但是在真实应用中，对于单个样本的预测，模型可能会因为不同的变换产生不同的预测结果。为了减少这种不确定性，可以在预测时对同一个样本应用多种不同的数据增强方式，然后将预测结果进行集成，最终得到一个更稳定的预测。

总结

这次通过文档和群友的聊天，分数有了上升，我也学到了很多，对深度学习的兴趣也更深了，非常感谢DataWhale 给我这次学习的机会！

DataWhale CV方向 任务三的学习笔记

目标：跑更高的分

1. 预训练模型

2. 数据增强

3.模型交叉验证

4.测试集增强

总结

DataWhale CV方向任务三的学习笔记