OpenAI 首席科学家 Nature 爆料:AI 自主发现新科学!世界模型和 RL 是关键

179 阅读5分钟

【新智元导读】近日,《自然》杂志独家专访了 OpenAI 首席科学家 Jakub Pachocki,他揭示了推理模型、强化学习如何赋予 AI 自主发现科学的能力,并分享了 AI 如何在五年内重塑科学研究与经济格局的雄心。

ChatGPT 推出后,迅速震惊了全球。

自那以后,OpenAI 一直站在 AI 技术发展的最前沿。

去年 9 月,他们推出 o 系列模型,再次引领 AI 推理的浪潮。

到今天,推理模型已成主流。

最新、最强的模型,比如 o3、Gemini 2.5 Pro、DeepSeek-R1,都是推理模型。

这些模型可以通过思维链(CoT),一步一步地「思考」来解决问题。比如,帮助研究人员润色文章、编写代码、回顾文献,甚至是提出假设。

可以说,OpenAI 的迅速崛起极大推动了这次的 AI 革命。

在这其中,有个人一直在 OpenAI 扮演着关键角色。虽然很少有人听说过他。

这就是 OpenAI 的首席科学家 Jakub Pachocki。

2024 年以来,Jakub Pachocki 一直是 OpenAI 的首席科学家

Pachocki 在 2017 年从学术界加入到 OpenAI。在此之前,他是一名理论计算机科学家和竞技程序员。

现在,Pachocki 领导一项最先进的 AI 系统开发,这些系统旨在解决科学、数学和编程中的复杂任务。

就在昨天,《自然》杂志对 Pachocki 做了一次专访,探讨了 AI 能否做出独立研究、通用人工智能(AGI),及公司即将推出的开源模型等热门话题。

文章地址:www.nature.com/articles/d4…

以下是采访精彩对话。

推理模型有多重要?

现在,你能和一个 AI 对话,但它还只是个需要不断被引导的助手。

我(Pachocki,下同)觉得接下来这种情况会有很大改变。

我们已经看到,像 OpenAI 的 Deep Research 这种 AI 工具,可以在没有人监督的情况下持续工作 10 到 20 分钟,给出一份有用的结果。

但是,目前用于解决这些需求的计算量还不大。

强化学习有多重要?

第一阶段的 ChatGPT 版本涉及一个无监督的预训练阶段。在这个阶段,模型会吞下海量的数据,并构建出某种「世界模型」。

然后,我们通过使用人类反馈的强化学习,训练出一个有用的 AI 助手。

最近在推理模型上的进展,可以看作是更加重视强化学习的结果。

这样,我们就不只是在提取知识,还使模型能够找到自己的思考方式。

一个问题是,我们是否应该继续将这些学习阶段分开来考虑。

推理模型不是在真空中学习如何思考的,它们根植于一个预训练模型。

我的很多关注点在于如何将模型的不同阶段、方法结合起来,理解它们之间的相互作用。

模型真的会思考吗?

首先,我们需要清楚,AI 的运行方式与人脑不同。

预训练的模型学到了一些关于世界的知识,但它并没有真正理解它是如何学会这些事情的,也搞不清它学习这些事情的时间顺序。

但我坚信我们有充分的证据表明模型能够发现新科学

我会说这是一种「推理」,但这并不意味着它跟人类的推理方式一样。

在探索 AI 推理能力的同时,OpenAI 也在考虑如何通过开源模型推动科学进步。

奥特曼说的新开源模型

对于这个问题,我特别兴奋。尤其是能给研究人员提供一个开源的模型权重(他们可以下载并进一步训练)。

随着这些模型变得越来越强大,我们越来越有责任去理解在不同的方式下部署它们会如何影响大家。

我觉得要发布顶尖的前沿模型并开源权重会很困难,因为有安全方面的顾虑。

我想我们(OpenAI)发布的模型得比现有的开源模型更好。

AGI 的定义是什么?何时达到?

我对 AGI 的定义及时间预期都发生了很大的变化。

刚进研究生院时,我觉得 AGI 的一个里程碑是能精通围棋,得花上几十年的时间。

结果,2016 年这个目标就实现了。这对我来说简直是震撼世界的时刻。

2017 年加入 OpenAI 时,我还是公司里对 AGI 最大的质疑者之一,但新的突破接踵而来。

在图灵测试上,我们已经取得了很多的进展。数学和问题的解决能力也进步很快,我觉得最难的基准测试也会很快被突破。

所以,我现在思考的下一个重大里程碑——是 AI 能产生实实在在、可量化的经济影响,特别是能够创造全新的科学研究。

这对我来说是最接近我心目中 AGI 的感觉。我们现在正聚焦于此,我预计在 5 年内会有非常大的进展。今年,人工智能可能还不会解决主要的科学问题,但几乎可以自主地编写有价值的软件。

据报道,微软和 OpenAI 已同意使用经济指标来衡量 AGI 的进展,具体目标是实现 1000 亿美元的投资回报。这种方式与 Pachocki 定义的 AGI 相匹配。

Pachocki 的愿景表明,AI 不仅将成为科学研究的助手,更可能在未来五年内重塑全球经济与创新格局。

参考资料:

www.nature.com/articles/d4…