OpenAI向大众发布迄今为止最强大的人工智能工具周二，OpenAI宣布通过私人测试版的API发布OpenAICode

周二，OpenAI宣布通过私人测试版的API发布OpenAICodex。Codex是该公司的人工智能系统，将自然语言翻译成代码。它可以解释和执行用普通英语给出的命令--使其有可能为现有的应用程序建立一个自然语言界面。Codex旨在协助并加快专业人士和编码业余爱好者的编程工作。OpenAI的演示视频中，其创始人Ilya Sutskever和Greg Brockman展示了Codex如何建立简单的网站和初级游戏。例如，用户可以在软件中输入 "创建一个侧面有菜单、顶部有标题的网页 "等英文命令，Codex会将其翻译成代码。

我认为Codex接近于我们大多数人对计算机的真正需求--我们说我们想要什么，他们就做什么。

编程语言是计算机无法真正理解我们的一个伪命题，而人类和计算机则依靠一种通用语言来理解对方。

- Sam Altman (@sama)8月10日, 2021

关于Codex

Codex是OpenAI的Copilot的骨干，这是一个基于人工智能的工具，可以帮助程序员写出更好的代码。Copilot从正在处理的代码中获取上下文，并建议整个行和功能。OpenAI声称，最新版本的Codex 更加先进，可以创建并完成一大块代码。

Codex是OpenAI的语言生成器GPT-3的后代，由于其可观的训练数据，它能以一种独特的方式处理书面语。这些数据既包含自然语言，也包含来自公开来源的数十亿行源代码，包括公共GitHub存储库中的代码。 Codex通过API对Python有很高的熟练度，它可以处理十几种语言，包括JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript和Shell。此外，该软件可以考虑3倍于GPT3的上下文信息，它为Python代码增加了14KB的内存（相比之下，GPT3为4KB）。

"Codex在3亿个参数时解决了13.2%的评估任务，在120亿个参数时解决了28.8%"。

该软件的训练数据集是从GitHub上托管的5400万个公共软件库中创建的，包含价值159GB的1MB以下的不同Python文件。它还超越了GPT3 ，其对自然语言处理的理解得到加强，使其能够产生工作代码；即用户可以用英语向任何有API的软件发出命令。"OpenAI Codex是一个通用的编程模型，这意味着它基本上可以应用于任何编程任务，"OpenAI在一篇博文中说，"我们已经成功地将其用于转译、解释代码和重构代码。"

研究人员在HumanEval上测试了他们的模型，这是一个评估集，用于衡量从文档串合成程序的功能正确性。结果证明Codex比GPT-3和GPT-J更出色，GPT-3和GPT-J分别解决了0%和11.4%的问题，而Codex获得了28.8%。根据该团队的说法，是一种从模型中反复取样的策略导致了这种为具有挑战性的提示提供工作解决方案的效率。这种方法使他们能够在每个问题有100个样本的情况下解决70.2%的问题。

给Codex做一年级的数学测试：pic.twitter.com/PT7S0Pl7Sh

- Greg Brockman (@gdb)2021年8月10日

他们对Codex的性能水平的研究进一步证明了模型规模增加后的改进。例如，Codex在3亿个参数时解决了13.2%的评估任务，在120亿个参数时解决了28.8%的评估任务。OpenAI 发布的论文揭示了Codex的一些重大限制，包括偏见和样本的低效率。这包括语法错误的建议、未定义的代码和软件调用其代码库范围之外的函数&属性的能力。该软件也很难合成长的或更高层次的规范，并且可以建议表面上看起来正确但不能执行给定任务的解决方案。

Codex根据其在互联网上的训练数据生成其反应，从而在其解决方案中承担了人为的偏见。研究发现，Codex可以被提示在代码注释中产生种族主义的、诋毁性的和有害的输出。生成的代码可以有一个反映性别、种族和阶级定型观念的结构。例如，当给出def gender (x)或def race (x)这样的提示时，软件会生成性别二元论或有限的互斥种族类别。

虽然Codex有可能被滥用于网络犯罪，但在现阶段，这些模型并没有实质性地降低恶意软件开发的准入门槛。总的来说，这些限制要求进行强有力的监测和持续的研究，以保持对Codex等模型如何被使用和滥用的情况的认识。 OpenAI已经在他们的API上提供了Codex的私人测试版，最初是免费的，以扩大该软件的规模。

在这里观看演示。

The postOpenAI Releases Its Most Powerful AI Tool Yet To Massesappeared first onAnalytics India Magazine.