GCNPath:通路引导图卷积网络的药物反应预测

1 阅读2分钟

GCNPath:通过通路引导的图卷积网络探究药物反应预测

摘要

药物反应预测,考虑到影响治疗敏感性或耐药性的癌症类型的不同生物学特征,对于抗癌药物选择和发现至关重要。尽管已经开发了许多用于药物反应预测的深度学习模型,但尚未研究这些模型在应用于未用于训练的全组学数据集时是否能保持可靠的预测能力,而这对于实际应用至关重要。此外,它们尚未通过系统的基准测试进行严格检验,以探究模型架构与性能之间的关系。提出了一种新模型GCNPath,该模型利用了图卷积网络架构和基于通路的基因表达数据降维方法,此前已有研究证明这些方法可以提高药物反应预测模型的性能。在利用多个细胞组学平台的综合基准测试中,与包括预测未知药物和克服各种RNA数据集批次效应能力在内的最先进模型相比,GCNPath显示出稳健且具有竞争力的性能。这项研究证明了通路级图卷积网络模型在药物反应预测中的有效性,并为开发具有更强适应性和实际应用可用性的药物反应预测模型提供了方向。

数据可用性

细胞系TPM数据获取自某中心细胞模型护照数据库和CCLE DepMap数据库。细胞系微阵列数据来自某机构药物敏感性基因组学数据库。蛋白质相互作用和基因调控网络数据分别获取自某机构STRING和RegNetwork数据库。BIOCARTA通路信息下载自某机构分子特征数据库。

某机构药物化合物标识符通过某机构标识符交换服务和webchem R包获取,对应的SMILES表示来自某机构。药物敏感性数据以及细胞系和药物注释信息来源于某机构药物敏感性基因组学数据库。来自某机构数据库的药物敏感性数据使用其Web资源客户端Python包下载。

癌症基因组图谱临床和TPM数据以及标准化药物名称分别使用TCGABiolinks R包和某机构GDISC获取。小细胞肺癌临床数据和TPM数据来自某论文的补充表格。研究中使用的所有原始数据均可公开获取。预处理步骤在GitHub仓库中完整指定并可复现。图表背后的数值数据以补充数据文件形式存储在Zenodo仓库中。

代码可用性

GCNPath模型和数据处理步骤的源代码可在 github.com/MinhoLee-DG… 获取。FINISHED