Complete Graph-based approach with Multi-task learning for predicting Synergistic drug combinations
刘琴团队 同济大学 2023-6-1
A: 协同用药预测(drug synergy prediction)
基本假设:药物联合治疗比单一治疗有明显的优势
研究问题:临床治疗中往往将多种药物联合使用,因此,有必要进行协同用药预测(drug synergy prediction),考察不同的药物组合在特定细胞系上的协同分数(synergy score)。
研究动机:由于组合空间难以通过实验遍历,基于计算方法识别新的协同药物组合已成为预筛选的有力工具
- 模型(鲁棒性):大多数基于深度学习的方法的预测效果是不稳定的,即使改变药物的输入顺序,也会给出不一致的预测。
- 数据(稀疏性):实验数据不足,限制了现有模型的泛化能力
B: 药物反应/敏感度预测(drug response prediction)
药物反应预测(drug response prediction)旨在预测不同细胞系对药物的敏感性,常通过半抑制浓度IC50来度量和进行回归预测。
文章思路 (A+B)
CGMS采用多任务学习框架,即同时预测 B 单个药物在细胞系上的敏感性(本文中通过相对抑制率RI来度量)和 A 两种药物的组合在细胞系上的协同分数(本文中通过Loewe分数来度量);
输入药物d1,药物d2和细胞系c组成的三元组,输出协同分数的回归预测。
数据集
| 数据集 | 来源 | 字段 | 内容 |
|---|---|---|---|
| 药物协同作用数据集 | DrugComb数据库 | 药物 | 药敏信息 |
| 细胞系 | Cancer Cell Line Encyclopedia(CCLE)提供的RNA-Seq transcript permillion(TPM)基因表达数据 | 药物 | 药敏信息 |
药物:接着利用分子指纹图谱和SMILES描述符构建药物特征向量
细胞系:筛选出基因表达水平差异最大的基因,保留了可能携带更多信息的5001个基因
具体方法 CGMS
CGMS是一种完全基于图的多任务学习的抗癌协同药物联合预测方法。在本文中,建立了一个异构完全图来描述药物组合与细胞系之间的相互作用。构建的图包含细胞系和药物类型的节点。有四种可能的元路径。药物-细胞系和细胞系-药物路径用于模拟单一药物对细胞系的治疗效果,细胞系-细胞系路径反映了疗效既取决于药物又取决于细胞系。药物通路反映了药物之间由于化学结构等因素的相互作用。自环的存在有助于在不忘记节点本身信息的情况下提取药物和细胞系特征。然后,CGMS可以生成与序无关的全图嵌入来表示药物组合和细胞系,以供后期预测。
如图1A所示,对于构建的图,使用三层异构图注意网络(HAN) 生成全图嵌入,HAN第三层将细胞系节点嵌入输出。
如图1B所示,HAN层遵循分层注意力结构:从节点级注意力到语义级注意力。
为了增强模型的泛化能力,采用多任务学习来训练模型。所选择的训练任务包括药物组合的协同评分预测和单一药物的敏感性评分预测,两者都使用均方误差(MSE)作为损失函数。
DOI
Bioinformatics|基于图的多任务学习方法预测药物协同作用 (qq.com)
Wang et al. A complete graph-based approach with multi-task learning for predicting synergistic drug combinations. Bioinformatics. 2023