OpenAI 首席科学家 Nature 爆料：AI 自主发现新科学！世界模型和 RL 是关键近日，《自然》杂志独家专访了

【新智元导读】近日，《自然》杂志独家专访了 OpenAI 首席科学家 Jakub Pachocki，他揭示了推理模型、强化学习如何赋予 AI 自主发现科学的能力，并分享了 AI 如何在五年内重塑科学研究与经济格局的雄心。

ChatGPT 推出后，迅速震惊了全球。

自那以后，OpenAI 一直站在 AI 技术发展的最前沿。

去年 9 月，他们推出 o 系列模型，再次引领 AI 推理的浪潮。

到今天，推理模型已成主流。

最新、最强的模型，比如 o3、Gemini 2.5 Pro、DeepSeek-R1，都是推理模型。

这些模型可以通过思维链（CoT），一步一步地「思考」来解决问题。比如，帮助研究人员润色文章、编写代码、回顾文献，甚至是提出假设。

可以说，OpenAI 的迅速崛起极大推动了这次的 AI 革命。

在这其中，有个人一直在 OpenAI 扮演着关键角色。虽然很少有人听说过他。

这就是 OpenAI 的首席科学家 Jakub Pachocki。

2024 年以来，Jakub Pachocki 一直是 OpenAI 的首席科学家

Pachocki 在 2017 年从学术界加入到 OpenAI。在此之前，他是一名理论计算机科学家和竞技程序员。

现在，Pachocki 领导一项最先进的 AI 系统开发，这些系统旨在解决科学、数学和编程中的复杂任务。

就在昨天，《自然》杂志对 Pachocki 做了一次专访，探讨了 AI 能否做出独立研究、通用人工智能（AGI），及公司即将推出的开源模型等热门话题。

文章地址：www.nature.com/articles/d4…

以下是采访精彩对话。

推理模型有多重要？

现在，你能和一个 AI 对话，但它还只是个需要不断被引导的助手。

我（Pachocki，下同）觉得接下来这种情况会有很大改变。

我们已经看到，像 OpenAI 的 Deep Research 这种 AI 工具，可以在没有人监督的情况下持续工作 10 到 20 分钟，给出一份有用的结果。

但是，目前用于解决这些需求的计算量还不大。

强化学习有多重要？

第一阶段的 ChatGPT 版本涉及一个无监督的预训练阶段。在这个阶段，模型会吞下海量的数据，并构建出某种「世界模型」。

然后，我们通过使用人类反馈的强化学习，训练出一个有用的 AI 助手。

最近在推理模型上的进展，可以看作是更加重视强化学习的结果。

这样，我们就不只是在提取知识，还使模型能够找到自己的思考方式。

一个问题是，我们是否应该继续将这些学习阶段分开来考虑。

推理模型不是在真空中学习如何思考的，它们根植于一个预训练模型。

我的很多关注点在于如何将模型的不同阶段、方法结合起来，理解它们之间的相互作用。

模型真的会思考吗？

首先，我们需要清楚，AI 的运行方式与人脑不同。

预训练的模型学到了一些关于世界的知识，但它并没有真正理解它是如何学会这些事情的，也搞不清它学习这些事情的时间顺序。

但我坚信我们有充分的证据表明模型能够发现新科学。

我会说这是一种「推理」，但这并不意味着它跟人类的推理方式一样。

在探索 AI 推理能力的同时，OpenAI 也在考虑如何通过开源模型推动科学进步。

奥特曼说的新开源模型

对于这个问题，我特别兴奋。尤其是能给研究人员提供一个开源的模型权重（他们可以下载并进一步训练）。

随着这些模型变得越来越强大，我们越来越有责任去理解在不同的方式下部署它们会如何影响大家。

我觉得要发布顶尖的前沿模型并开源权重会很困难，因为有安全方面的顾虑。

我想我们（OpenAI）发布的模型得比现有的开源模型更好。

AGI 的定义是什么？何时达到？

我对 AGI 的定义及时间预期都发生了很大的变化。

刚进研究生院时，我觉得 AGI 的一个里程碑是能精通围棋，得花上几十年的时间。

结果，2016 年这个目标就实现了。这对我来说简直是震撼世界的时刻。

2017 年加入 OpenAI 时，我还是公司里对 AGI 最大的质疑者之一，但新的突破接踵而来。

在图灵测试上，我们已经取得了很多的进展。数学和问题的解决能力也进步很快，我觉得最难的基准测试也会很快被突破。

所以，我现在思考的下一个重大里程碑——是 AI 能产生实实在在、可量化的经济影响，特别是能够创造全新的科学研究。

这对我来说是最接近我心目中 AGI 的感觉。我们现在正聚焦于此，我预计在 5 年内会有非常大的进展。今年，人工智能可能还不会解决主要的科学问题，但几乎可以自主地编写有价值的软件。

据报道，微软和 OpenAI 已同意使用经济指标来衡量 AGI 的进展，具体目标是实现 1000 亿美元的投资回报。这种方式与 Pachocki 定义的 AGI 相匹配。

Pachocki 的愿景表明，AI 不仅将成为科学研究的助手，更可能在未来五年内重塑全球经济与创新格局。

参考资料：