GitHub和OpenAI已经推出了一个名为Copilot的新人工智能工具的技术预览,该工具存在于Visual Studio Code编辑器中,可以自动完成代码片段。
据GitHub称,Copilot不仅仅是模仿,它还会分析你以前看过的代码,在此之中并生成新的匹配代码,包括之前调用的特定函数。该项目网站上的例子包括自动编写代码来导入推文,绘制散点图,或抓取Goodreads评级。
根据GitHub首席执行官Nat Friedman的一篇博文,它在Python、JavaScript、TypeScript、Ruby和Go中效果最好。
GPT-3的更新版本
GitHub认为这是结对编程的演变,即两个程序员在同一个项目上工作,以抓住对方的错误并加快开发过程。 这个项目是微软向OpenAI投资10亿美元的第一个主要成果,OpenAI是由Y Combinator总裁Sam Altman领导的研究公司。自从Altman上任以来,OpenAI已经从非盈利状态转向"封顶盈利"模式,接受了微软的投资,并开始授权其GPT-3文本生成算法。
Copilot建立在一个名为OpenAI Codex的新算法上,OpenAI首席技术官Greg Brockman将其描述为GPT-3的后裔。
GPT-3是OpenAI的旗舰语言生成算法,它可以生成有时与人类书写无异的文本。它能够写得如此令人信服,是因为它有1750亿个参数,或可调节的旋钮,使算法能够连接字母、单词、短语和句子之间的关系。
GPT-3生成的是英语,而OpenAI Codex生成的是代码。OpenAI的一位代表透露,OpenAI计划在今年夏天晚些时候通过其API发布Codex的一个版本,这样开发者就可以用这项技术建立自己的应用程序。
Codex是根据从GitHub上提取的数千兆字节的公开代码以及英语实例进行训练的。
虽然网站上的推荐信对Copilot提供的生产力提升赞不绝口,但GitHub暗示,并非所有利用的代码都经过了漏洞、不安全做法或个人数据的审查。该公司写道,他们已经设置了一些过滤器,以防止Copilot产生攻击性语言,但它可能仍有漏洞。
"Copilot的网站说:"由于底层技术的预发布性质,GitHub Copilot有时可能会产生不想要的输出,包括有偏见的、歧视性的、辱骂性的或攻击性的输出。
鉴于对GPT-3的偏见和滥用语言模式的批评,OpenAI似乎还没有找到一种方法来防止算法继承其训练数据的最坏元素。
该公司还警告说,该模型可能会建议电子邮件地址、API密钥或电话号码,但这不是常见的,而且已经发现这些数据是由算法合成或伪随机生成的。然而,Copilot生成的代码基本上是原创的。GitHub进行的一项测试发现,只有0.1%的生成代码可以在训练集中找到逐字记录。
这并不是第一个试图自动生成代码以帮助辛苦的程序员的项目。初创公司Kite提供了一个非常类似的功能,在16个以上的代码编辑器上都可以使用。
现在,Copilot处于限制性的技术预览阶段,但你可以在项目的网站上注册使用它。