基于CT深度学习、放射组学及外周血免疫特征的多模态数据融合在肺癌临床诊断中的应用

0 阅读5分钟

《eBioMedicine》中科院1区丨IF10.8



一、核心科学问题

针对现有肺癌筛查手段(如低剂量CT)在有症状患者群体中假阳性率高、特异性不足的问题,本研究探讨能否通过融合CT影像学的深度学习特征、放射组学特征与外周血免疫谱特征,构建多模态预测模型,以提高对有临床症状患者肺癌诊断的准确性、敏感性和特异性。

二、研究思路

1、前瞻性队列构建与数据采集

招募因疑似肺癌症状转诊至二级医疗机构的患者(N=344),排除病灶不可见或非肺癌病例后,最终纳入170例患者(肺癌组79例,非肺癌组91例)。同步采集患者的胸部CT影像及外周血样本。

2、多模态特征提取

针对CT影像,分别采用CT纹理分析(CTTA)提取放射组学特征,利用深度学习自编码器(DLA)提取潜在影像特征;针对外周血样本,采用流式细胞术分析免疫细胞亚群,并利用斑点印迹法分析外泌体蛋白成分。

3、预测模型构建与验证

采用贝叶斯多变量回归(BMR)方法,分别基于单一模态特征构建风险评分模型(Signature)。随后,通过早期融合(特征层面)和晚期融合(模型层面)策略,整合影像学与免疫学数据,构建多模态联合诊断模型。

4、模型性能评估与特征解析

将数据集随机划分为训练集(3/4)和测试集(1/4),重复8次独立运行以评估模型的稳健性。利用受试者工作特征曲线下面积(AUC)、敏感度和特异性作为评价指标,并对模型筛选出的关键生物学特征(如特定免疫细胞亚群)进行机制层面的解释。

三、研究结果

1、患者基线特征分析

肺癌组与非肺癌组在年龄、性别、吸烟状况等基线特征上无显著统计学差异(p>0.05);肺癌组中I期患者占比29.1%,表明该队列适用于早期肺癌诊断模型的开发验证(Table 1)。

2、CT影像模型性能比较

深度学习自编码器(DLA)模型在训练集(AUC 0.72-0.77)和测试集(AUC 0.56-0.71)中的表现均优于传统CT纹理分析(CTTA),且DLA提取的特征与肿瘤大小、边缘毛刺及胸膜牵拉等形态学特征具有明确的语义关联(Fig. 2)。

 通过重复数据拆分通过BMR生成风险,并比较CT纹理分析与深度学习自编码器 通过重复数据拆分通过BMR生成风险,并比较CT纹理分析与深度学习自编码器

3、外周血免疫模型效能

流式细胞术构建的免疫特征模型显著优于外泌体蛋白模型(AUC 0.66-0.70 vs 0.50-0.60);高水平的cDC2细胞与良性病变相关,而KIR3DL1+ CD8+ T细胞的显著上调则是预测肺癌的最强独立危险因素(Fig. 3)。

通过外周血样进行基础代谢率(BMR)风险产生,比较流式细胞术与血浆外质体点分析 通过外周血样进行基础代谢率(BMR)风险产生,比较流式细胞术与血浆外质体点分析

4、影像与免疫特征联合模型

将免疫特征与DLA特征进行早期融合构建的模型表现最佳,训练集AUC提升至0.77-0.83,测试集AUC为0.68-0.81;在联合模型中,KIR3DL1+ CD8+ T细胞仍保持最高的权重系数,证实了免疫特征在多模态诊断中的核心价值(Fig. 4)。

结合CT图像分析与流式细胞术结合的基础代谢率风险生成,比较深度学习与纹理分析 结合CT图像分析与流式细胞术结合的基础代谢率风险生成,比较深度学习与纹理分析

5、融合策略对比分析

对比早期、中期及晚期融合策略,发现特征层面的早期融合效果最为稳健(AUC ~0.81);相较于Elastic Net算法,本研究采用的贝叶斯回归方法有效避免了过拟合问题,在测试集上保持了更高的一致性(Fig. 5)。

 融合模型的风险特征生成 融合模型的风险特征生成

6、分期诊断敏感性与特异性

最终融合模型在全队列中的总体敏感度为72%,特异性为77%;在I期肺癌中敏感度仍维持在76-78%的高水平,表明该模型在有症状但处于疾病早期的患者中具有显著的临床应用潜力(Fig. 6)。

四、结论及创新点

本研究首次证实,将CT深度学习特征与外周血特定免疫表型(特别是KIR3DL1+ CD8+ T细胞)相结合,能显著提升有症状患者的肺癌诊断效能。

创新点:

  1. 新型生物标志物: 发现KIR3DL1+ CD8+ T细胞是肺癌特异性的强预测因子,其上调可能与肿瘤免疫逃逸机制相关。

  2. “白盒”AI模型: 采用贝叶斯回归构建了可解释性强的多模态融合模型,克服了传统深度学习“黑箱”的局限,明确了影像特征与免疫特征的互补性。

  3. 临床适用性: 在极具挑战性的“有症状”患者队列中实现了高特异性诊断,有望作为现有LDCT筛查流程的重要补充,减少不必要的活检。

五、数据来源及样本情况

  • 数据来源: 英国Lister Hospital (East and North Hertfordshire NHS Trust) 的前瞻性临床研究队列 (NCT04629079)。

  • 样本情况: 共招募344名疑似肺癌患者,最终纳入分析170例。其中肺癌患者79例(涵盖I-IV期),非肺癌对照组91例。数据集随机划分为训练集(N=128)和测试集(N=42),并进行了8次随机交叉验证。


第124卷|
2026年2月 第124卷| 2026年2月