GPT3 终极指南(二)
原文:
zh.annas-archive.org/md5/6de8906c86a2711a5a84c839bec7e073译者:飞龙
结论:民主化 AI 的获取途径
人工智能有着改善普通人生活的无数可能。民主化 AI 的获取将使这一变革性技术能够造福于每个人。
本书的作者们相信,在 AI 领域工作的企业和研究机构在使 AI 更加可访问方面扮演着重要角色——通过与更广泛的受众分享他们的研究和开发成果,就像 OpenAI 通过其公开可用的 API 形式分享 GPT-3 一样。将这样一个强大的工具以边际成本提供给重要领域的用户,对世界产生了长期积极的影响。
本书结尾,这一小节将讨论无代码和低代码编程如何利用 GPT-3 从想法到工作产品的转变。这是 GPT-3 和大型语言模型如何改变工作、经济和未来的一个很好的例子。然后,我们将提出一些您在开始 GPT-3 之旅时可以考虑的要点。
无代码?没有问题!
简而言之,无代码是一种编程计算机的方法——创建网站、移动应用、程序或脚本——使用简单的界面,而不是用编程语言编写。无代码运动,通常被誉为“编程的未来,”基于这样一个基本信念,即技术应该促进和促进创造,而不是作为那些想要开发软件的人的入门障碍。无代码运动的目标是使任何人都能够创建有效的程序和应用程序,而无需编程技能或专门设备。这一使命似乎与模型即服务的演进和整体向民主化 AI 的趋势相辅相成。
截至 2022 年初,无代码平台工具的行业标准是 Bubble,这是一种开创性的可视化编程语言和应用程序开发程序,使用户能够在不编写一行代码的情况下创建成熟的网页应用程序。它所带来的影响已经使一个全新的行业运转起来。用创始人乔希·哈斯的话说,Bubble 是“一个平台,用户只需简单地描述他们想要的内容和方式,就可以自动完成开发,无需任何代码。”哈斯在一次采访中解释说,他受到了“人们想要用技术创造的巨大需求,建立网站,构建 Web 应用程序,以及形式化工程人才资源之间的巨大不匹配”的启发。
平台,用户只需用简单的语言描述他们想要的内容和方式,就可以自动化开发,无需任何代码。”哈斯在一次采访中解释说,他受到了“人们想要用技术创造的巨大需求,建立网站,构建 Web 应用程序,以及形式化工程人才资源之间的巨大不匹配”的启发。
目前,构建、开发和维护企业级 Web 应用程序(如 Twitter、Facebook 或 Airbnb 等)需要具有广泛技术专长的人才。从初学者水平开始的独立开发者必须从零开始学习编码,然后才能构建任何东西。这需要时间和精力。“对于大多数人来说,这是一个耗时的过程,它构成了进入门槛,”哈斯说。
这意味着没有开发、软件工程或编码背景,但拥有出色应用点子并想将公司建立在其上的创业者,必须依赖于那些具有该专业知识的人,并说服他们去实现这一想法。哈斯指出,正如你可能期望的,“即使是一个好点子,也很难说服某人毫无证明的想法只是凭股权而工作。”
哈斯认为公司内部人才至关重要:尽管与独立承包商合作是可能的,但这需要大量来回沟通,并且常常会削弱产品质量和体验。哈斯成立 Bubble 的目标是降低技术创业者进入市场的门槛,并使技术技能的学习曲线尽可能迅速而顺畅。哈斯对无代码工具的激动之处在于“将普通个人变成程序员或软件开发人员的可能性。”事实上,惊人的 40%的 Bubble 用户没有编码背景。尽管哈斯承认“有编程经验确实有助于平滑学习曲线并缩短学习时间”,即使没有经验的用户也可以在几周内达到完全的 Bubble 熟练,并创建复杂的应用程序。
没有代码代表了编程演进的一大步:我们已经从低级编程语言(如汇编语言,您必须理解特定的机器语言来给出指令)发展到抽象的高级语言,如 Python 和 Java(其语法类似于英语)。低级语言提供了粒度和灵活性,但转向高级编程使得可以在几个月内大规模开发软件应用程序,而不是几年。无代码的支持者将这一点进一步,认为无代码创新可以将这段时间缩短更多,从几个月缩短到几天。“今天,甚至许多工程师正在使用 Bubble 来构建应用,因为它更快速、更直接,”哈斯说,他希望看到这一趋势持续下去。
这些致力于民主化人工智能的人们——其中很多人,需要明确指出的是,来自非技术背景——充满了开创性的想法:例如,创建一种人类与人工智能交互的通用语言。这样的语言将使得没有技术培训的人与人工智能交互和构建工具变得更加容易。我们已经可以看到这种有力的趋势在 OpenAI API Playground 接口中得到了体现,它使用自然语言,无需编程技能。我们相信,将这个想法与无代码应用结合起来可能会创造出一个革命性的结果。
Haas 同意:“我们视我们的工作为定义一种词汇,可以让你与计算机交流。” Bubble 初始的重点是开发一种语言,使人类能够与计算机交流有关需求、设计以及程序其他元素的语言。第二步将是教会计算机如何使用该语言与人类进行交互。Haas 说,“目前,你必须手动在 Bubble 中绘制和组装工作流程,才能构建出东西,但通过键入英文描述,它就能为你实现,这将是令人惊讶的。”
在目前的状态下,Bubble 是一个可构建完全功能的软件应用程序的可视化编程界面。Haas 预测,将其与 Codex(你在第五章中了解过)集成,将会产生一个能理解上下文并从简单的英文描述中构建应用程序的交互式无代码生态系统。Haas 说,“我认为这才是无代码最终发展的方向,但短期挑战是培训数据的可用性。我们已经看到 Codex 在 JavaScript 应用程序上工作,因为有大量的公共代码库,这些库补充了注释、笔记和其他所有训练 LLM 所需的东西。”
Codex 似乎已经在人工智能社区引起了相当大的轰动。截至目前,新项目包括 AI2SQL,这是一家初创公司,它可以帮助从普通英语中生成 SQL 查询,自动化一个原本耗时的过程,并且 Writepy,它使用 Codex 提供学习 Python 和使用英语分析数据的平台。
使用无代码,你可以通过可视化编程和拖放开发应用程序,界面平滑了学习曲线,减少了任何先决条件的需求。LLM 能够像人类一样理解上下文,因此可以仅凭人类的轻推就生成代码。我们现在正在看到将它们结合起来的“初始潜力”,Haas 说。“相当确定如果你五年后采访我,我们将在内部使用它们。两者之间的集成将使无代码更具表现力并且更易学。它将变得更智能,对用户正在尝试实现的目标具有同理心。”
在第五章中,你了解了 GitHub Copilot。这种代码生成具有庞大的训练数据集的优势,其中包括传统编程语言(如 Python 和 Javascript)的数十亿行代码。类似地,随着无代码开发的加速和越来越多的应用程序被创建,它们的代码将成为大型语言模型的训练数据的一部分。无代码应用逻辑的视觉组件之间的逻辑连接和生成的代码将作为模型训练过程的词汇表。然后可以将此词汇表馈送到 LLM 中,以生成具有高级文本描述的完全功能的应用程序。“这基本上是一个技术上可行的问题,只是时间的问题,”Haas 说。
访问和模型即服务
正如我们在本书中所描述的那样,获得 AI 的访问变得越来越容易。模型即服务是一个新兴领域,强大的 AI 模型(如 GPT-3)以托管服务的形式提供。任何人都可以通过简单的 API 使用该服务,而不必担心收集训练数据、训练模型、托管应用程序等等。
YouTube 明星 Kilcher 告诉我们,“我认为与这些模型或 AI 进行交互所需的知识水平将迅速降低。”他解释说,早期版本的工具(如 TensorFlow)几乎没有文档,而且“非常笨重”,因此,“我们现在对编码的舒适度令人惊讶。”他提到了像 Hugging Face Hub 和 Gradio 以及 OpenAI API 这样的工具,并指出这些工具提供了“关注分离:‘我不擅长运行模型。我只是让别人去做。’”但是,模型即服务也存在潜在的缺点:Kilcher 指出 API 和类似工具可能会造成“瓶颈”。
Kilcher 的同事 Awan 表示,他对模型即服务的“释放效果”感到兴奋。他指出,许多人在写作方面遇到困难,“无论是因为注意力不集中还是其他原因。但是他们是聪明的思考者,并将受益于使用‘可以帮助你将思想表达出来的 AI 工具’”。
Awan 期待模型的未来版本,特别是在“音乐、视频、图形设计师和产品设计师等媒介”中,他预测这些人将“从中受益,并以我们无法概念化的方式推动所有媒介前进”。
结论
GPT-3 标志着人工智能历史上的重要里程碑。它也是未来 LLM 趋势的一部分,将继续向前发展。提供 API 访问的革命性步骤创造了一种新的模型即服务的业务模式。
第二章介绍了 OpenAI Playground,并向您展示了如何开始使用它来完成几项标准的 NLP 任务。您还了解了不同变体的 GPT-3 以及如何在输出质量与定价之间取得平衡。
第三章通过一个使用 GPT-3 与流行编程语言在软件应用中的模板将这些概念联系在一起。您还学会了如何使用一个低代码 GPT-3 沙盒为您的用例即插即用地提供提示。
本书的下半部分介绍了各种用例,从初创公司到企业。我们还探讨了这项技术的挑战和局限性:如果不小心使用,人工智能工具可能会放大偏见,侵犯隐私,并助长低质量的数字内容和错误信息的传播。它们也可能影响环境。幸运的是,OpenAI 团队和其他研究人员正在努力创建和部署解决这些问题的解决方案。
AI 的民主化和无代码的兴起是 GPT-3 有潜力赋予普通人权力并使世界变得更美好的令人鼓舞的迹象。
一切都以尊敬的读者满意结束。我们希望您与我们分享 GPT-3 的乐趣一样多。我们也希望您会在使用 GPT-3 构建具有影响力和创新性的 NLP 产品的旅程中发现它的用处。我们祝您好运,大获成功!
[1] Andrej Karpathy 等人,《生成模型》博文,来源:openai.com/blog/generative-models/。[2] Malcolm Gladwell,《异类:成功的故事》(Little, Brown, 2008)。[3] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakon Uszkoreit, Llion Jones, Aidan Gomez, Lukasz Kaiser 和 Illia Polosukhin,“注意力机制就是一切”,《神经信息处理系统进展》30(2017)。[4] Jay Alammar,《插图Transformers》博文,来源:jalammar.github.io/illustrated-transformer/。[5] Jay Alammar,《插图Transformers》博文,来源:jalammar.github.io/illustrated-transformer/。[6] Andrew Mayne,《如何从 GPT-3 获得更好的问答》博文,来源:andrewmayneblog.wordpress.com/2022/01/22/how-to-get-better-qa-answers-from-gpt-3/。[7] Azure OpenAI 模型博文,来源:learn.microsoft.com/en-us/azure/cognitive-services/openai/concepts/models。[8] 对于超过 200 个文档,OpenAI 提供了一个beta API。[9] 定制 GPT-3 应用博文,来源:openai.com/blog/custom…]](xhtml-0-7.xhtml#aid_81) 用于“太长没读”的长期互联网缩写。[11] 简要解释,请参阅OpenAI 的这篇博文;深入了解,请参阅开发团队的研究论文。[12] 您可以在 Vimeo 上观看《德古拉》on Vimeo;Fable Studios 的一篇博文也提供了幕后概述。[13] Shubham Saboo,《企业中的 GPT-3——数据隐私成为问题了吗?》博文,来源:pub.towardsai.net/gpt-3-for-corporates-is-data-privacy-an-issue-92508aa30a00。[14] Nat Friedman,《介绍 GitHub Copilot:你的 AI 合作伙伴程序员》博文,来源:github.blog/2021-06-29-introducing-github-copilot-ai-pair-programmer/。[15] Harri Edwards,来源:github.com/features/copilot/。[16] 欧盟的通用数据保护条例要求公司不得隐藏在难以理解的条款和条件后面。它要求公司明确定义其数据隐私政策并使其易于访问。[17] Emily M. Bender, Angelina McMillan-Major, Timnit Gebru 和 Shmargaret Shmitchell,“关于随机鹦鹉的危险:语言模型可能太大了吗?”在《公平性、责任和透明度会议》(FAccT’21),2021 年 3 月 3 日至 10 日,虚拟活动,加拿大。doi.org/10.1145/3442188.3445922。这篇论文的后果迫使其中一位共同作者,备受赞誉的 AI 伦理研究员 Timnit Gebru,离开了 Google。[18] Samuel Gehman, Suchin Gururangan, Maarten Sap, Yejin Choi 和 Noah A. Smith,“RealToxicityPrompts:评估语言模型中的神经毒性退化”,ACL 文集,计算语言学协会发现:EMNLP 2020,aclanthology.org/2020.findin…]](xhtml-0-11.xhtml#aid_67) Abubakar Abid, Maheen Farooqi 和 James Zou,“大型语言模型中的持
线上人机交互:检测、估计和表征,《第十一届国际 AAAI 网络与社交媒体会议》,2017,aaai.org/ocs/index.php/ICWSM/ICWSM17/paper/view/15587。
[23] 本·布坎南、迈卡·马瑟、安德鲁·洛和凯特琳娜·塞多娃,《真相、谎言与自动化:语言模型如何改变虚假信息》,安全与新兴技术中心,2021,cset.georgetown.edu/wp-content/uploads/CSET-Truth-Lies-and-Automation.pdf,表 1。[24] 布坎南等,《真相、谎言和自动化》,第 6 页。[25] 布坎南等,《真相、谎言和自动化》,第 21 页。[26] 布坎南等,《真相、谎言和自动化》,第 44 页。[27] 布坎南等,《真相、谎言和自动化》,第 34 页。[28] 来源:帕特森、大卫、约瑟夫·冈萨雷斯、Quoc Le、陈良、Lluis-Miquel Munguia、丹尼尔·罗斯彻尔德、大卫·索、莫德·特克西耶和杰夫·迪恩。“碳排放与大型神经网络训练。”arXiv 预印本 arXiv:2104.10350(2021)。[29] 来源:webflow.com/no-code。