使用 3D 卷积神经网络检测蛋白质-肽结合位点,以启动肽药物发现

250 阅读5分钟

编辑 | 萝卜皮

肽,可自然介导或调节约 40% 的细胞生理过程,具有开发为靶向「蛋白质-蛋白质」相互作用的药物的应用前景。将肽开发为药物,有两大优势:它们可以穿透细胞膜进入细胞,可以顺利到达治疗的目标位置;另外,它们具有低毒性、高亲和力和高特异性等特点。

俄罗斯 Skoltech 大学的研究人员提出了一个高效的神经网络模型,该模型可利用蛋白质结构的数据,预测「蛋白结构的哪些部分」会与「肽分子」相互作用。这有助于开发基于多肽的药物。多肽类药物可以以无毒的方式针对性地影响细胞内的蛋白质-蛋白质相互作用,调节广泛的细胞过程。

该研究以「Protein−Peptide Binding Site Detection Using 3D Convolutional Neural Networks」为题,于2021年7月22日发布在《Journal of Chemical Information and Modeling》杂志。

简介

肽和基于肽的分子代表了一种有前景的治疗方式,靶向细胞内「蛋白质 - 蛋白质」相互作用,可能结合生物制剂和小分子药物的有益特性。

「蛋白质 - 肽复合物」在「蛋白质 - 蛋白质」和「蛋白质 - 小分子复合物」方面占据独特的相互作用界面。蛋白质-肽结合位点识别类似于图像对象检测,该领域已被计算机视觉技术彻底改变。

研究人员利用 3D 卷积神经网络的强大功能,提出了一种名为 BiteNetPp 的「蛋白质-肽结合位点」检测方法。该方法采用基于张量的空间蛋白质结构表示,将其反馈给 3D 卷积神经网络,从而产生输入结构中结合「热点」的概率分数和坐标。

图示:BiteNetPp工作流的说明。(来源:论文)

该团队使用「域适应技术」来微调在「蛋白质-小分子复合物」上进行「蛋白质-肽」结构训练的模型。BiteNetPp 在独立基准测试中始终优于现有的最先进方法。分析单个蛋白质结构所需时间不到一秒钟,因此 BiteNetPp 适用于蛋白质-肽结合位点的大规模分析。

图示:在 TR1154 集和 BNPp956 上训练的 BiteNetPp 模型的交叉验证性能指标(未微调)。(来源:论文)

图示:APresidues(红色)、ROC AUC(蓝色)和 MCC(绿色)在 TS125 基准上的性能指标,用于最先进的方法和 BiteNetPp 模型。(来源:论文)

该方法在广泛使用的 TS125 基准测试中优于当前最先进的方法,并且在 MCC 和 ROC AUC 方面,分别达到了 0.49 和 0.91 的里程碑。

图示:BiteNetPp 在 BNPp4556 精选的 4556 种蛋白质结构数据集中的蛋白质家族中表现最为突出。(来源:论文)

讨论

为了设计基于肽的药物,药理学家需要知道任何给定蛋白质靶点的所谓结合点。即,蛋白质上可以与肽结合的位点。这类位点发现得越多,药物设计的机会就越多。

研究人员可以通过实验识别结合位点,例如,使用 X 射线晶体学,通过研究结晶蛋白质如何衍射 X 射线来揭示结晶蛋白质的 3D 结构。但这对于一长串分子来说是非常昂贵的,而计算方法提供了一种更快、更便宜的替代方案。其中一些利用了机器学习技术,随着关于蛋白质-肽复合物结构的更多数据的积累,这些方法变得更加强大,并提供更好的结合位点预测。

图示:TS125 假阳性和假阴性预测的一些示例。(来源:论文)

Petr Popov 评论了绑定站点检测作为图像识别的方法,该方法最初在该团队的早期论文中介绍并延续到该研究中:「就像可以训练神经网络识别普通的行人或骑自行车的人一样 在 2D 照片中,我们将结合位点检测视为在图像中发现特定类型的对象。不同之处在于我们使用 3D 原子结构数据作为我们的输入,因此该模型对『像素』进行操作形成『像素的三维模拟』。」

新提出的模型实际上建立在前一篇论文中模型的基础上。「这称为域适应。BiteNetPp 是第一个在最初接受蛋白质-小分子数据培训后,便立刻在蛋白质肽数据集上进行微调的模型,」Petr Popov 解释道。「你可以想象这是一个「为了确定骑自行车的人倾向于在街上停留的地方」的训练模型;你要从行人倾向于停在哪里的数据开始——然后才将你的领域扩展到骑自行车的人。该模型预计骑自行车的人的「绑定点」可能与吸引行人的「绑定点」有一些相似之处,比如,冰淇淋摊、红绿灯之类的东西。」

结语

该模型的创建者通过比较 BiteNetPp 与各类方法,对已知的蛋白质-肽结合位点的预测,证明了 BiteNetPp 始终优于现有的最先进方法。重要的是,新模型分析单个蛋白质结构所需的时间不到一秒钟,非常适合大规模研究。基于肽的药物可能靶向数以千计的「蛋白质-蛋白质」相互作用;因此计算方法必须足够快,以便在药理学背景下进行筛选。

论文链接:pubs.acs.org/doi/10.1021…

BiteNetPp 获取地址:sites.skoltech.ru/imolecule/t…

相关报道:phys.org/news/2021-0…