编辑 | 萝卜皮
蛋白质-蛋白质相互作用(PPI)是众多生物途径中的关键要素,也是越来越多的药物发现项目(包括针对传染病)的主题。在 PPI 目标上设计药物仍然是一项艰巨的任务,需要付出大量努力才能将给定的相互作用确定为合格的目标。
为此,除了明确需要确定 PPI 在疾病相关途径中的作用及其作为治疗靶点的实验特征外,预测它们与其他蛋白质伙伴结合或受未来药物调节的能力至关重要。
巴黎大学巴斯德学院的研究人员提出了 InDeep,这是一种用于预测蛋白质内功能结合位点的工具,该位点可以承载蛋白质表位或未来的药物。利用对 PPI 数据集的深度学习,该工具可以在实验结构或沿分子动力学轨迹上进行增强的功能结合位点预测。
InDeep 的基准测试表明,在评估 PPI 目标以及常规目标时,该工具优于最先进的可配体结合位点预测器。这为通过识别 PPI 界面处或附近的相关结合口袋来协助 PPI 上的药物设计项目提供了新的机会。
该研究以「InDeep: 3D fully convolutional neural networks to assist in silico drug design on protein–protein interactions」为题,于 2022 年 3 月 1 日刊载在《Bioinformatics》。
蛋白质-蛋白质相互作用作为治疗靶点
蛋白质-蛋白质相互作用 (PPI) 是众多生物途径中的核心要素。它们作为治疗靶点代表了越来越多的兴趣,越来越多的已发表研究描述了使用小分子成功调节 PPI。然而,识别 PPI 上的化学探针或药物仍然是一项艰巨的任务。与更传统的药物发现目标相反,PPI 尚未进化为结合小分子。因此,必须根据具体情况来证明它们的配体性。
事实上,并非所有 PPI 都可以设计小分子在界面正位结合以防止蛋白质相互作用。鉴于它们的数量和结构的异质性,因此拥有强大的工具来有效评估将 PPI 作为目标以补充不可避免的生物学评估的可行性至关重要。
在使用小分子设计 PPI 的正构抑制剂 (iPPI) 的情况下,可以设想像表位模拟物这样的策略。这成功地对抗 B 细胞淋巴瘤 2 (Bcl-2) 家族,以对抗慢性淋巴细胞性白血病。这导致了 Venetoclax 的开发,该药物于 2016 年被 FDA 批准为第一个正构 PPI 药物。
IPPI 的设计意味着评估界面内的两个互补特征:(i)了解界面上的表位结合和热点残基的存在,这些残基执行大部分相互作用的结合能;(ii)这些热点周围存在一个可连接的结合位点,可以承载一个小分子。
预测和分析表位结合位点
一些计算机工具可以预测 PPI 中的热点残基,但它们需要复合物的结构和已识别蛋白质伙伴的先验知识。为了预测蛋白质相互作用,一些工具直接使用序列信息或进化数据。然而,利用蛋白质的结构已显示出显着提高界面区域预测的性能。
此外,即使在不同的二级结构和不同的全局蛋白质折叠中,原子的结构基序和局部排列也可以高度保守。这些局部基序被假设为伙伴绑定的关键元素。这促使使用卷积策略来编码有关绑定站点的此类本地信息。
其中一些方法侧重于预测蛋白质上的相互作用补丁:即确定哪些残基参与相互作用。一些方法还将伙伴作为输入来预测交互补丁,被视为特定于伙伴的预测。
在这种情况下,预测可以更细粒度并且还提供接触预测:哪个残基与哪个残基相互作用。所有这些工具都通过预测残基水平信息来注释序列。
然而,不仅了解哪些残基参与结合,而且了解哪些类型的伙伴残基以及它们在蛋白质表面附近的结合位置,对于了解表位结合的机制或模拟这些表位的未来药物的设计是非常可取的。
预测 PPI 中的可配体结合位点预测 PPI 中的可配体结合位点
现在有大量工具可用于预测结合位点和结合位点配体能力。人们可以引用以前有效的基于几何的方法,如 Fpocket、VolSite 和 mkgridXf,基于片段的方法,如 FTMap,以及使用深度学习的更近期和更强大的方法,如 DeepSite、P2rank、Kalasanty、DeepSurf 或 OctSurf,Kalasanty 是该领域的参考。
这些方法已经证明了它们识别常规药物靶标上可配体结合位点的预测能力。尽管 FTMap 是第一个提出 PPI 配体性问题但没有真正提供配体性评分的方法,但上述方法都不是针对 PPI 的配体性的。尽管如此,PPI 的界面在历史上被描述为相当平坦、大且没有深绑定口袋。
因此,在 PPI 的情况下,预测一种特定形式的配体能力是最合理的。使用机器学习和 PPI 特定的数据集,可以期望解决 PPI 配体的特异性。
沿 MD 轨迹捕捉全息相似性
已知 PPI 会根据其结合状态进行重要的构象变化:apo、带配体的全息或蛋白质伴侣。这些构象变化影响界面结合袋的形状和结合能力。
因此,在分析表位和可配体结合位点时,将这些构象变化考虑在内是最重要的,因为这些会影响与伴侣的结合。这代表了在尝试识别化学探针时的一项重大挑战,在没有伴侣结合的情况下,使用虚拟筛选或设计表位模拟物等计算机方法。
实际上,在整体对接的情况下,在虚拟筛选之前对所谓的全息样构象进行采样和识别是此类方法的关键。以前的工作已经解决了使用甲醇溶剂进行 MD 模拟的类似全息的采样挑战。使用比水极性小的溶剂有利于打开瞬时疏水袋,从而改善对接结果。
目前科学家已经开发了其他方法,来应用几何或深度学习方法监测分子动力学(MD)轨迹的配体能力,尽管这些方法都不是 PPI 特有的。此外,没有任何方法可用于监测沿 MD 轨迹的交互性补丁和表位结合位点。
图示:InDeep 架构的可视化表示。
巴黎大学的团队在最新版本的 iPPI-DB 基础上引入了 InDeep,这是一种针对蛋白质界面的基于结构的药物设计的统一预测工具。InDeep 利用 iPPI-DB 结构数据来训练依赖于具有 3D 全卷积 U-Net 架构的神经网络的预测模型。它是一个统一的多任务预测工具,它使用蛋白质的 3D 结构来预测 iPPI 的配体结合和表位结合的所谓交互性补丁。
研究人员表明,该工具在检测与蛋白质伴侣相互作用的残基方面具有竞争力。通过使用原子型通道信号来预测假定伴侣在空间中的定位,从而超越了这种序列预测,这有助于理解这种蛋白质相互作用是如何发生的。观察到的结合位点有 70% 存在于他们的预测之中,35% 存在于前三个预测中。
图示:在 Chen 基准上对 InDeep 和 Kalasanty 进行 DCC 评估。
图示:(左)Bcl-2 的 InDeep 交互性补丁预测;(右)在 Bcl-2 表面上进行的配位性预测。
此外,InDeep 明显优于 iPPI 结合位点的结合口袋检测技术,甚至是常规目标。结合对新解决的结构的这两个预测,可以研究可能破坏给定 PPI 的配体的结合位点。鉴于这样一个检测到的结合位点,该工具还能够沿着 MD 轨迹跟踪配体能力或相互作用分数,这为精细的配体能力评估以及虚拟筛选或解开表位结合倾向构象的构象选择打开了大门。InDeep 集成在 PyMol 插件中,以便于预测的可视化。
图示:沿 Bcl-2 的 MD 轨迹的深度预测(红色和橙色)。
尽管取得了一些有希望的结果,但 iPPI 的治疗用途仍然是少数。研究人员希望这个专用工具可以帮助增强它们的使用,并在这一工作线之后激发其他方法的开发。InDeep 使用 3D-FC U-Net,因为类似网格的预测可以实现蛋白质伙伴或未来药物的实际定位和分析。然而,与许多其他方法一样,这种方法对旋转很敏感,可能的扩展是使用等变网络来烘焙网络中的旋转不变性。
未来的发展还包括该工具的实际药物发现项目使用以及网络服务器的实施,以便更容易地访问预测。