OpenAI 改进了 Codex AI 系统,提供突破性的自然语言编码智能

753 阅读7分钟

“只要告诉它做什么,就可以用你的软件做越来越复杂的事情。”

计算机编程即将改变很多

OpenAI 改进了 Codex AI 系统,该系统为 VS Code/Visual Studio 有争议的 GitHub Copilot 项目提供支持,并通过 API 提供其突破性的自然语言编码智能,声称这是“未来的味道”。

那个未来涉及“程序员”在控制台中用自然语言说或输入,然后看到它立即转换为工作代码,可能是非常复杂的工作代码。它工作得很好,正如 OpenAI 团队在一个未经排练的演示中展示的那样,该演示使用普通的英语语言命令启动了一个功能齐全的游戏(人类躲避坠落的巨石)。另一个演示让 Codex 查询比特币的当前价格,并通过 Mailchimp API 将其通过电子邮件发送给与会者,所有这些都无需输入一行代码即可完成。

OpenAI 团队不知道 Codex 将如何响应演示中的每个口头命令,但它基本上通过了每个测试。一个有趣的轶事:Codex 可以为游戏想出自己的鼓励性文字(“你可以做到!”)并写五次“Hello World”,但是当被要求以同理心写 Hello World 时,它立即完全按照指示执行,写道:“Hello world with empathy”,这引起了一些笑声。显然,一些细微差别仍然无法编码。

否则,Codex 通过了所有测试并正确执行了要求,因为它改进了为 GitHub Copilot 提供支持的先前 AI 系统,这是一个 AI“配对程序员”,该系统最近作为 Visual Studio Code 的工具在预览中亮相,然后是 Visual工作室 IDE。

之前的 Codex 版本可以解决 27% 的基准问题,现在新模型可以解决 37%。Codex 所基于的原始 GPT-3 模型——不久前因其惊人的功能而受到称赞——无法解决任何问题。GitHub Copilot 的发布也再次引发了人们对 AI 编码取代专业开发人员的担忧。

大多数开发人员似乎都压抑了这种焦虑,他们表示在 GitHub Copilot 推出时 Codex 并没有太大的威胁,但现在他们可能会改变主意。

新的高级功能还可能引起自由软件基金会 (FSF) 等组织的进一步关注,该组织称 GitHub Copilot 是“不可接受和不公正的”,并呼吁征集论文以调查该项目的法律、道德和其他影响。

所有这一切都是偶然的,因为 OpenAI 创建了 Codex 作为一个通用的 AI 语言系统,并发现编码作为一个用例引发了极大的兴趣,事情从那里开始,联合创始人兼首席技术官 Greg Brockman 解释说 8 月 10 日的视频。

“所以一年前我们发布了 GPT-3,这是一种通用语言模型,”布罗克曼说。“它基本上可以完成你问它的任何语言任务。所以对我们来说有趣的是看到最能捕捉人们想象力的应用程序,最能激发人们灵感的应用程序是编程应用程序,因为我们没有“那个模型完全擅长编码。所以我们知道如果我们付出一些努力,我们可能会有所作为。” 

确实发生了一些事情,一天后,该视频的观看次数已超过 21,000 次,并产生了近 190 条评论(现在这两个数字依然在快速攀升)。“令人兴奋地见证人工智能的历史性进步!” 一个评论说,而另一位观众想知道 Codex 是否可以执行以下命令:“重写我的整个项目,使其速度提高 99%。” 现在可笑,这种事情很快就会发生。

“OpenAI Codex 是 GPT-3 的后代;它的训练数据包含自然语言和来自公开来源的数十亿行源代码,包括公共 GitHub 存储库中的代码,”OpenAI 在 8 月 10 日的博客文章中说。“OpenAI Codex 最擅长的是 Python,但它也精通 JavaScript、Go、Perl、PHP、Ruby、Swift 和 TypeScript,甚至 Shell 等十几种语言。相比之下,它拥有 14KB 的 Python 代码内存。 GPT-3 只有 4KB——因此它可以在执行任何任务时考虑 3 倍以上的上下文信息。”

由于 OpenAI Codex 是一种通用编程模型,基本上可以应用于任何具有不同结果的编程任务,因此该公司已将其用于转译、解释代码和重构代码。但 OpenAI 表示,它知道它在发现 Codex 的功能方面只触及了皮毛,因此它正在将其技术作为 API 开放,让社区进行实验并探索它的能力。

“我们现在正在通过我们的 API 在私人测试版中提供 OpenAI Codex,我们的目标是尽快安全地扩大规模。在初始阶段,OpenAI Codex 将免费提供。OpenAI 将继续建立在安全性的基础上我们为 GPT-3 奠定了基础——审查应用程序并逐步扩展它们,同时与开发人员密切合作以了解我们的技术在世界上的影响。”

这些技术在现实世界中的潜在影响是让许多人和组织(例如 FSF)全力以赴。

FSF 担心的不是《终结者》电影中类似天网的奇点将人类变成 AI 霸主的对象,而是更实际的考虑。

FSF 表示:“我们可以看到,Copilot 使用免费许可的软件对自由软件社区的很大一部分产生了许多影响。” “开发人员想知道在他们的软件上训练神经网络是否真的可以被视为合理使用。其他可能对使用 Copilot 感兴趣的人想知道从 GitHub 托管的存储库中复制的代码片段和其他元素是否会导致侵犯版权。甚至如果一切都可能在法律上是合规的,那么激进主义者想知道,一家专有软件公司在他们的工作中构建服务是否存在根本不公平的问题。

“对于所有这些问题,其中许多具有法律含义,乍一看之前可能没有在法庭上进行过测试,但没有多少简单的答案。” 因此,需要白皮书来探讨这些影响。

一篇介绍 OpenAI Codex 的学术论文“ Evaluating Large Language Models Trained on Code”承认了其中的许多问题。

“Codex 有可能以多种方式发挥作用,”该论文称。“例如,它可以帮助板载用户使用新的代码库,减少经验丰富的编码员的上下文切换,使非程序员能够编写规范并拥有 Codex 草案实施,并有助于教育和探索。然而,Codex 也提出了重大的安全挑战,确实如此并不总是生成符合用户意图的代码,并且有可能被滥用。”

上述开发人员存在的焦虑也在论文中得到了解决。在讨论对开发人员职业的潜在影响时,该论文指出:

与许多用资本投资代替劳动力投资(或提高劳动生产率)的工具一样......未来更复杂的代码生成工具可能会导致一些程序员或工程师角色的替代,并可能改变其性质,和电源动态涉及,编程工作。然而,它们可能只是让一些工程师的工作更有效率,或者,如果用于生成大量更草率的代码,它们可能会产生效率提高的错觉,同时将编写代码所花费的时间转移到更详细的代码审查和 QA 测试上.

因此,没有人知道 Codex 对科技世界和其他世界的最终影响,但可能性似乎无穷无尽。

例如,视频中的另一个演示让 Codex 通过 Word 的 JavaScript API 处理 Microsoft Word 应用程序中的文本。“我们将这里提出的任何请求发送到 API,它会在 Microsoft Word API 中生成实际代码,”Brockman 解释说。

OpenAI 的联合创始人兼首席科学家 Ilya Sutskever 回应说:“你在这里看到的是对未来的一种品味。随着模型变得非常好,随着神经网络非常擅长将指令转换为正确的 API 调用,它只需告诉它做什么,就可以用你的软件做越来越复杂的事情。”

原文:visualstudiomagazine.com/articles/20…