自2020年以来,AlphaFold加速了科学发展的步伐,并推动了全球范围内的生物学发现浪潮——这一成就已获得诺贝尔奖认可。
五年前,AlphaFold 2解决了蛋白质结构预测问题,开启了生物学研究的新途径,并首次有力证明了人工智能可以成为推动科学的强大工具。
蛋白质是驱动活细胞内每个过程的复杂微观机器。它们由独特的长链氨基酸组成,精确折叠成很大程度上决定其功能的3D结构——了解这种形状对于药物发现和认识疾病至关重要。如果蛋白质错误折叠,它可能丧失功能并导致疾病,如阿尔茨海默症和帕金森症。几十年来,确定这些结构是一项艰巨的任务,通常需要耗时一年或更长时间进行昂贵、艰苦的实验工作。
在2020年的CASP 14(蛋白质结构预测关键评估)竞赛中,AlphaFold 2仅根据氨基酸序列就以惊人的准确度预测了蛋白质结构——这一成就被广泛誉为解决了生物学中这个存在50年的重大挑战。但这一突破真正、持久的影响发生在我们将AlphaFold交到研究社区手中之后。
全球发现引擎
2021年,我们与EMBL-EBI合作推出了AlphaFold蛋白质数据库,这是AlphaFold成为全球采用的科学工具的一个转折点。一年后,我们发布了AlphaFold 2对超过2亿种蛋白质结构的预测,实现了实验方法需要数亿年才能完成的工作。
免费提供的AlphaFold蛋白质数据库以前所未有的规模加速了科学发展。它已被190多个国家的超过300万研究人员使用,其中包括来自低收入和中等收入国家的超过100万用户。超过30%与AlphaFold相关的研究专注于更好地理解疾病,造福人类福祉。这项工作的深远科学和社会价值在2024年获得了诺贝尔化学奖的认可。
现实世界的变革
AlphaFold已成为科学家应对一些世界上最紧迫问题的标准工具,从保护到心脏健康。
培育更健康、更强壮的蜜蜂
欧洲的科学家使用AlphaFold来理解蜜蜂体内一种关键的免疫蛋白质——卵黄蛋白原(Vg)。这些结构见解现正被应用于濒危蜜蜂种群的保护工作,并指导开发人工智能辅助育种计划,以培育更健康、更具韧性的传粉者。
揭示导致心脏病的关键蛋白质
由“坏胆固醇”(低密度脂蛋白)引起的动脉粥样硬化是全球死亡的主要原因。几十年来,低密度脂蛋白核心蛋白质——载脂蛋白B100(apoB100)的结构一直难以捉摸。AlphaFold 2最终帮助揭示了其复杂的笼状结构。这份期待已久的蓝图为药物研究人员提供了设计新型预防性心脏疗法所需的原子级细节。
革新研究
AlphaFold也在改变科学研究——扩大可及性、加速时间线并大幅降低成本。
扩大可及性
土耳其本科生阿尔珀和塔内尔·卡拉戈尔在疫情期间使用在线AlphaFold教程自学了结构生物学——此前没有任何培训。他们现已发表了15篇研究论文。
提高发现速度
苏黎世大学和塞恩斯伯里实验室的分子与细胞植物生理学教授西里尔·齐普菲尔见证了研究时间线的大幅缩短。他们使用AlphaFold与比较基因组学相结合,以更好地理解植物如何感知环境变化,为培育更具韧性的作物铺平了道路。
AlphaFold已被超过35,000篇论文引用,超过200,000篇论文在其方法论中融入了AlphaFold 2的元素。它也在提高所产生工作的质量。
创新增长实验室进行的一项关于AlphaFold 2影响的独立分析表明,使用AlphaFold 2的研究人员提交的新型实验蛋白质结构数量增加了40%以上。这些蛋白质结构更可能与已知结构不同,鼓励了对科学未知领域的探索。此外,与AlphaFold 2相关的研究被临床文章引用的可能性是其两倍,并且比结构生物学领域的典型作品更有可能被专利引用。
数字生物学的新时代
AlphaFold影响最令人兴奋的例子之一是Isomorphic Labs——一家成立于2021年的人工智能药物发现公司,当时这个突破性模型被证明足够强大,可以应用于合理的药物设计。Isomorphic Labs随后开发了一个统一的药物设计引擎,以极大地改变其设计新药的方式并加快科学发现,其雄心是有朝一日解决所有疾病。
我们与Isomorphic Labs共同开发了AlphaFold 3,它提供了对细胞前所未有的观察,我们预计这将推动药物发现过程的变革,并迎来“数字生物学”时代。
该模型旨在预测所有生命分子的结构和相互作用——不仅是蛋白质,还包括DNA、RNA和配体(构成大多数药物的小分子)。它还可以生成整个分子复合物的联合3D结构,从而全面观察潜在药物分子如何与其靶蛋白结合,或蛋白质如何与遗传物质相互作用。
AlphaFold服务器正在赋能全球的非商业研究人员利用这项技术,加速他们制定和测试新假设的能力。迄今为止,它已为全球数千名研究人员完成了超过800万次折叠——即结构和相互作用的预测。
人工智能用于科学的未来
受AlphaFold的启发,我们已经开发了新一代模型来解决整个生物学领域的问题。AlphaMissense和AlphaGenome使用人工智能来评估导致疾病的基因突变。我们的AlphaProteo模型可以设计新颖、高强度的蛋白质结合剂,靶向多种分子——包括与癌症和糖尿病相关的分子。这些模型正在加深我们对复杂疾病的理解,并最终推动新疗法的开发。
生物学是我们的第一个前沿领域,但我们将AlphaFold视为人工智能如何加速整个科学进入数字速度的模板。从聚变和地球科学到整个科学发现,我们正在追求下一个类似AlphaFold的突破。我们期待继续与全球科学界合作,赋能各地的研究人员应对人类面临的最大挑战。