本文由叮当好记(readlecture.cn))转录总结。ReadLecture专注于音、视频图文转录、总结和翻译,2小时视频,5分钟阅读,加速内容学习与传播。
视频来源
youtube: www.youtube.com/watch?v=iBf…
思维导图
AI思维导图助手:readlecture.cn
总结
一句话总结
OpenAI 推出了更智能、更快速的 AI 模型 O1,以及 ChatGPT Pro,为高级用户提供无限访问和先进功能。
要点
- O1 在编码性能方面比 GPT-4.0 有显著提升。
- ChatGPT Pro 提供对模型的无限访问和高级功能,如 O1 Pro 模式。
- O1 Pro 模式允许使用额外的计算能力来解决最困难的问题。
- O1 现在支持多模态输入,可以处理图像和文本。
- O1 更快、更可靠,减少了 34% 的主要错误,思考速度提高了 50%。
- ChatGPT Pro 面向那些推动 AI 能力极限的高级用户。
深入问答
-
O1 相比之前的模型有哪些关键改进?
- O1 更快、更智能,并支持多模态输入,使其更通用和高效。
-
ChatGPT Pro 的主要功能是什么?
- ChatGPT Pro 提供对模型的无限访问和高级功能,如 O1 Pro 模式。
-
O1 Pro 模式如何增强问题解决能力?
- O1 Pro 模式允许模型使用额外的计算能力来更深入地思考挑战性问题。
-
O1 的多模态输入能力有何重要性?
- 它使模型能够通过图像和文本进行推理,扩展了其应用范围。
-
ChatGPT Pro 的目标受众是谁?
- 需要高级功能和无限访问权限以推动 AI 能力极限的高级用户。
关键词标签
- O1
- ChatGPT Pro ChatGPT 专业版
- 多模态输入
- AI 模型
- 高级用户
目标受众
-
科技爱好者
- 对 AI 技术的最新进展感兴趣。
-
开发者
- 需要高级工具和功能用于他们的项目。
-
研究人员
- 从事需要高计算能力的复杂问题研究。
-
企业家
- 利用 AI 进行创新业务解决方案。
-
教育工作者
- 探索 AI 能力用于教育目的。
术语解释
- O1:OpenAI 的最新 AI 模型,是 GPT-4.0 的升级版,以其速度和智能著称。
- ChatGPT Pro:提供对 AI 模型无限访问和高级功能的优质服务。
- 多模态输入:AI 模型处理和推理图像和文本的能力。
- O1 Pro 模式:ChatGPT Pro 中的一个功能,允许模型使用额外的计算能力来解决挑战性问题。
- 辐射热传递:通过电磁波进行的热传递过程,与空间冷却场景相关。
内容回顾
本文由叮当好记(readlecture.cn))转录总结。ReadLecture专注于音、视频图文转录、总结和翻译,2小时视频,5分钟阅读,加速内容学习与传播
萨姆·奥尔特曼: 大家好,欢迎来到OpenAI的12天特别活动。 我们将尝试一些据我们所知,迄今为止没有科技公司做过的事情:在接下来的12个工作日里,我们每天都会发布或演示一些我们新开发的东西。我们相信从今天开始,我们为大家准备了一些非常棒的内容。我们希望你们会非常喜欢。我们会尽量让这些演示既有趣又快速,不会占用太多时间,但这也是向大家展示我们一直在努力的方向,以及我们为大家准备的一点节日礼物。
所以我们将直接进入第一天的内容。 今天,我们实际上有两个东西要发布。第一个是O1的完整版本。我们一直在非常努力地工作。我们听取了你们的反馈。你们喜欢O1预览版,但你们希望它更智能、更快,能够处理多模态任务,并且在指令跟随方面做得更好,等等。所以我们在这方面投入了很多工作。对于科学家、工程师、程序员来说,我们认为他们会非常喜欢这个新模型。
我想快速向大家展示一下它的表现。 所以你可以看到从GPT-4.0到O1预览版在数学、竞争性编程、GPQA、钻石等方面的提升,你可以看到O1是一个相当大的进步。它在许多其他方面也做得更好,但我们特别关注的是原始智能。特别是在人们大量使用模型的编程性能方面。
所以在一分钟内,这些同事将演示一些关于O1的内容。 他们将展示它在速度、处理难题、多模态方面的表现。但首先,我想简单谈谈我们今天发布的第二件事。很多人,尤其是ChatGPT的资深用户,现在真的非常依赖它,他们希望获得比每月20美元更多的计算资源。
所以我们推出了一个新的层级,ChatGPT Pro。 Pro版拥有对我们模型的无限访问权限,以及像高级语音模式这样的功能。它还有一个新功能叫做O1 Pro模式。所以O1现在是世界上最聪明的模型,除了在Pro模式下使用的O1。对于人们遇到的难题,O1 Pro模式让你能做得更好一点。所以你可以看到在竞争性数学、GPQA钻石等方面的提升。这些提升可能看起来很小,但在你真正推动这些模型极限的复杂工作流程中,它们是非常显著的。
我再向大家展示一下Pro模式的一个特点。 人们真的非常希望得到的是可靠性。在这里你可以看到Pro模式的答案与O1相比的可靠性,这是一个更强的差距。再次强调,对于我们的Pro用户,我们听到了很多人对这一点的强烈需求。ChatGPT Pro每月200美元,今天正式发布。在这12天里,我们还有一些其他的东西要加入其中,我们相信你们也会非常喜欢。但无限模型使用和这个新的O1 Pro模式。
所以我想直接进入正题,我们将展示一些我们刚才提到的演示。 这些是帮助构建O1的同事们,在他们背后还有团队中的许多其他人。谢谢,Sam。
Hyung Won Chung: 大家好,我是Hyung Won Chung。
大家好,我是 Hyung Won Chung。
Jason Wei: 我是Jason Wei。 我是 Jason Wei。
Max Schwarzer: 我是Max Schwarzer。我们都是参与构建O1的研究科学家。O1非常独特,因为它是我们第一个在回应之前进行思考的模型,这意味着它的回答比你可能尝试过的其他模型更好、更详细、更准确。 O1今天将向所有Plus用户以及即将成为Pro用户的订阅者推出,取代O1预览版。
Hyung Won Chung: O1模型比我们在九月份推出的O1预览版更快、更智能。 发布后,许多人询问了多模态输入的问题,因此我们增加了这一功能。现在,今天可用的O1模型能够同时通过图像和文本进行推理。
Jason Wei: 正如Sam提到的,今天我们还推出了一项名为ChatGPT Pro的新级别。 ChatGPT Pro提供对我们最佳模型(如O1、4.0和高级语音)的无限制访问。ChatGPT Pro还具有一种特殊模式,称为O1 Pro模式。通过O1 Pro模式,您可以指示模型使用额外的计算能力来更深入地思考一些最具挑战性的问题。我们相信ChatGPT Pro的受众将是ChatGPT的资深用户,那些已经在数学、编程和写作等任务中将模型推向其能力极限的人。
萨姆·奥尔特曼: 看到人们如何推动O1预览版的使用,尤其是那些在技术领域工作的人,真是令人难以置信。 我们真的很兴奋能让他们进一步推动它。
Max Schwarzer 我们也相信O1将更适合日常使用案例,而不仅仅是为了解决非常困难的数学和编程问题。 具体来说,我们持续收到关于O1预览版的一个反馈是它太慢了。它需要10秒才能回应一个简单的问候,我们已经解决了这个问题。
萨姆·奥尔特曼: 那确实很令人沮丧。
Max Schwarzer: 说实话,这有点好笑。它真的花了很长时间。
萨姆·奥尔特曼: 它很在意。它真的花了很长时间来回应你。是的。
Max Schwarzer: 所以我们解决了这个问题。O1现在会思考得更加智能。如果你问它一个简单的问题,它会很快回答,而如果你问它一个非常难的问题,它会思考很长时间。 我们为这个模型运行了一套相当详细的人类评估,结果发现它比O1预览版少犯大约34%的主要错误,同时思考速度提高了50%。我们认为这对你们所有人来说都将是一个非常显著的差异。
所以我真的很喜欢和这些模型交谈。我是个历史迷,我会给你展示一个非常快速的演示,比如我可能会问这些模型的一个问题。所以在这里,左边是O1,右边是O1预览版。我正在问一个非常简单的历史问题。列出第二世纪的罗马皇帝。告诉我他们的在位时间和成就。 不难,但你知道,GPT-40实际上在这个问题上有时会出错。所以我问了O1这个问题,也问了O1预览版。我离线测试了几次,发现O1平均比O1预览版快60%左右。这可能会有点变化,因为现在我们正在将所有GPU从O1预览版切换到O1。所以实际上,O1思考了大约14秒。
萨姆·奥尔特曼: O1 预览,仍在进行中。
Jason Wei: 有很多罗马数字。
Max Schwarzer: 有很多罗马数字。是的,4.0 经常出错。很多人已经等了,比如,6 天,12 天,一个月。有时它会忘记他们。
萨姆·奥尔特曼: 你能从记忆中回忆起所有等待了 6 天的人吗?不能。
Max Schwarzer: 是的,所以这里我们开始。O1 模式思考了大约 14 秒。O1 预览模式思考了大约 33 秒。
萨姆·奥尔特曼: 一旦我们完成部署,这两者都会更快,但我们希望这个能立即上线。
Max Schwarzer: 因此,我们相信您会喜欢与这个模型互动。我们发现它提供了出色的响应,并且思考速度更快,从而为每个人带来了显著更好的用户体验。 另一个我们知道人们一直要求用于日常使用场景的功能是多模态输入和图像理解。现在,Hyung Won Chung将讨论这一点。
萨姆·奥尔特曼: 是的。 是的。
Hyung Won Chung: 为了说明多模态输入和推理,我创建了这个带有手绘图的小问题。 这就是它。很难看清,所以我已经拍了照片。让我们在笔记本电脑上看看这张照片。一旦你将图像上传到ChatGPT,你可以点击它查看放大版本。 这是一个空间数据中心的示意图。未来,我们可能希望在太空中训练AI模型。
萨姆·奥尔特曼: 我认为我们应该这么做,但功率数值看起来有点低。
Hyung Won Chung: 一吉赫兹。一吉赫兹。
萨姆·奥尔特曼: 好的。但总体思路,我认为。
Hyung Won Chung:在这个行业里,这是新手级别的数值。对,新手级别的数值。
萨姆·奥尔特曼: 新手级别的数值。好的。是的。
Hyung Won Chung: 所以我们这里有一个太阳,正在通过这个太阳能板吸收能量。然后这里有一个小型的数据中心。
萨姆·奥尔特曼: 那正是它们的样子。是的。
Hyung Won Chung: GPU机架。然后是水泵。这里有一个很好的水泵。在太空中操作的一个有趣之处是,在地球上,我们可以通过空气冷却、水冷却来冷却GPU。但在太空中,什么都没有。所以我们必须将这些热量辐射到深空。这就是为什么我们需要这个巨大的散热板。这个问题是关于找到运行这个一吉瓦数据中心所需的散热板面积的下限估计。
萨姆·奥尔特曼: 可能会非常大。是的。
Hyung Won Chung: 让我们看看它有多大。所以这就是问题所在。我将使用这个提示。是的,这基本上就是在要求那个。所以让我点击“开始”。模型会思考几秒钟。
Jason Wei: 顺便说一下,大多数人不知道。我和炯元已经合作很久了。 炯元实际上拥有热力学的博士学位,这与AI完全无关。而且你总是开玩笑说,直到今天你还没能在工作中用到你的博士研究。所以你可以相信炯元在这项分析上的能力。
Hyung Won Chung: 终于。 终于。谢谢你的铺垫。现在我真的必须做到完美。
Jason Wei: 好的。 好的。
Hyung Won Chung: 所以模型完成了思考。只用了10秒钟。这是一个简单的问题。让我们看看模型是如何做到的。 那么,输入功率。首先,这个1吉瓦的功率,只在论文中提到过。模型能够很好地捕捉到这一点。然后是辐射热传递。这就是我提到的事情。所以在太空中,没有其他因素。然后是一些简化的选择。
一个关键的事情是,我故意让这个问题未完全指定,这意味着关键参数是冷却面板的温度。我让它保持未指定状态,以便我们可以测试模型处理模糊性的能力等。模型能够识别出这是一个未指定但重要的参数。实际上,它选择了正确的温度范围,大约是室温。
然后,它继续进行分析。有很多事情。然后计算出了面积,即242万平方米。只是为了感受一下这个面积有多大,这大约是旧金山土地面积的2%。这非常大。
萨姆·奥尔特曼: 还不错。
Hyung Won Chung: 哦,好的。所以O1实际上非常强大,在MMMU和MathVista等标准基准测试中,O1具有最先进的性能。 现在,Jason将展示专业模式。
Jason Wei: 所以我想给大家演示一下ChatGPT O1专业模式。人们会发现O1专业模式在解决复杂的数学、科学或编程问题时最为有用。 这里有一个相当有挑战性的化学问题,O1专业模式通常会答错。我会让模型开始思考。我们从这些模型中学到的一件事是,对于非常具有挑战性的问题,模型可能需要思考几分钟。 对于这个问题,模型通常需要思考一到三分钟。在模型思考的过程中,我们需要提供一些娱乐。我会稍微描述一下这个问题,如果在我描述完之后模型还在思考,我已经准备了一个爸爸笑话来填补剩余的时间。
萨姆·奥尔特曼: 我希望它思考得久一点。
Jason Wei:这个问题需要一种符合非常特定标准的蛋白质。 有六个标准,每个标准都要求模型回忆化学领域的专业知识。这个问题的另一个重要方面是,没有任何一个标准直接揭示正确答案。因此,对于任何给定的标准,可能有几十种蛋白质可能符合,模型必须评估所有候选者以确定哪个符合所有标准。
你可以看到这次模型更快了,任务在53秒内完成。 通过点击,你可以查看模型用来得出答案的思考过程。它最初考虑了神经配体等候选者,但最终正确识别了视网膜蛋白。
总结一下,我们从Max那里了解到O1比O1预览版更智能、更快。 从Hyungwon那里,我们看到O1现在可以同时处理文本和图像。最后,使用ChatGPT专业模式,你可以用O1来推理最复杂的科学和数学问题。
Hyung Won Chung: 是的,ChatGPT Pro 级别还有更多内容即将推出。我们正在努力开发更多计算密集型任务,以支持那些希望进一步推动模型的用户完成更长、更大的任务。同时,我们仍在为 O1 模型添加工具,例如网页浏览、文件上传等功能。
Max Schwarzer: 我们也在努力将 O1 引入 API。我们将为开发者添加一些新功能,包括结构化输出、函数调用、开发者消息和 API 图像理解,我们相信您会非常喜欢这些功能。我们预计这将是一个对开发者非常有用的模型,并真正开启一个全新的代理构建领域。我们希望您能像我们一样喜欢它。
萨姆·奥尔特曼: 那真是太棒了。非常感谢。祝贺你和团队完成了这项工作。我们真的希望您能享受 O1 和Pro 模式或 Pro 级别。我们还有很多内容即将推出。明天我们将为开发者带来一些精彩内容,并继续前进。在我们结束之前,能听一下你的笑话吗?好的。
Jason Wei: 所以,我今天早上编了这个笑话。笑话是这样的。圣诞老人试图让他的大型语言模型解决一个数学问题,他非常努力地提示它,但就是不行。他最终是怎么解决的呢?
萨姆·奥尔特曼: 不知道。
Jason Wei: 他使用了驯鹿强化学习。
萨姆·奥尔特曼: 非常感谢。
往期推荐