近年来,利用生成式深度学习方法在新功能蛋白质设计方面取得了显著进展。目前包括 RFdiffusion(RFD1)和 BindCraft 在内的大多数方法,均采用氨基酸残基水平的蛋白质表示,已能够成功设计蛋白质单体、组装体以及蛋白质-蛋白质相互作用体系,但其分辨率仍不足以精确设计与非蛋白质组分(如小分子配体与核酸)发生特异性侧链相互作用的结构。
RFdiffusion2(RFD2)虽然在这一局限上有所克服,但其扩散过程仍局限于残基层面,难以进一步拓展至与非蛋白质组分形成额外的侧链相互作用。现有研究表明原子级扩散过程可用于生成蛋白质主链,并可扩展至侧链建模,但这些尝试仍未实现与非蛋白质组分间相互作用的有效建模。
基于此,诺奖得主 David Baker 团队推出了 RFdiffusion3(RFD3),能够在配体、核酸及其他非蛋白质原子组成的结构中生成蛋白质三维构象。 由于该模型对所有聚合物原子均进行显式建模,因此能够更简便、更高效地处理诸如酶设计等任务中的复杂原子级约束条件。RFD3 原生的全原子架构还大大简化了原子级约束的规范,提供了对氢键、配体接触及核酸相互作用的精确控制。
不同于 AlphaFold3(AF3)依赖计算密集的 Pairformer 模块从输入序列中提取距离等信息,研究团队将信息提取模块设计得更为轻量,使得 RFD3 将 Pairformer 的层数从 48 层大幅缩减至仅 2 层,从而显著降低计算开销,最终模型仅包含 1.68 亿可训练参数。 研究团队通过设计并实验表征 DNA 结合蛋白与半胱氨酸水解酶,展示了 RFD3 的广泛适用性,其能够基于任意非蛋白质原子环境快速生成受复杂原子级约束引导的蛋白质结构,将进一步拓展蛋白质设计所能实现的功能范围。
「RFdiffusion3:蛋白质设计模型」已上线 OpenBayes 公共教程板块, 快来开启你的创作之旅吧!
教程链接:
Demo 运行
01
Demo 运行阶段
1.登录 OpenBayes.com,在「公共教程」页面,选择「RFdiffusion3:蛋白质设计模型」教程。
2.页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
3.选择「NVIDIA GeForce RTX 5090」以及「PyTorch」镜像,按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。新用户使用下方邀请链接注册,可获得 4 小时 RTX 5090 + 5 小时 CPU 的免费时长!
小贝总专属邀请链接(直接复制到浏览器打开):
4.等待分配资源,当状态变为「运行中」后,点击「打开工作空间」进入 Jupyter Workspace。
02
效果演示
页面跳转后,点击左侧 README 页面,进入后点击上方「运行」。
稍等片刻后,下滑显示 RFD3 进行的结构预测结果。
教程链接: