初创公司OpenAI的聊天机器人ChatGPT的惊人能力,引发了人们对人工智能的新兴趣和投资。但在上周末,OpenAI的首席执行官警告说,孕育该机器人的研究战略已经结束。目前还不清楚未来的进步究竟会来自哪里。
近年来,OpenAI通过采用现有的机器学习算法并将其扩大到以前无法想象的规模,在与语言相关的人工智能方面取得了一系列令人印象深刻的进展。GPT-4是这些项目中最新的一个,很可能是使用数万亿字的文本和数千个强大的计算机芯片进行训练。这一过程耗资超过1亿美元。
但该公司的首席执行官萨姆-奥特曼(Sam Altman)说,进一步的进展将不会来自于将模型做大。"我认为我们正处于时代的尽头,它将是这些,比如,巨大的,巨型的模型,"他在上周末在麻省理工学院举行的一次活动中对观众说。"我们将以其他方式使它们变得更好。"
奥特曼的声明表明,在开发和部署新的人工智能算法的竞赛中出现了意想不到的转折。自从OpenAI在11月推出ChatGPT以来,微软已经使用底层技术在其必应搜索引擎中添加了一个聊天机器人,而谷歌也推出了一个名为Bard的竞争对手的聊天机器人。许多人已经急于尝试使用新品种的聊天机器人来帮助完成工作或个人任务。
与此同时,包括Anthropic、AI21、Cohere和Character.AI在内的众多资金雄厚的初创公司正在投入巨大的资源来构建越来越大的算法,以努力追赶OpenAI的技术。ChatGPT的最初版本是基于GPT-3的轻微升级版,但用户现在也可以访问由能力更强的GPT-4驱动的版本。
奥特曼的声明表明,GPT-4可能是OpenAI将模型做大并向其提供更多数据的战略中出现的最后一个重大进展。他没有说什么样的研究策略或技术可能取代它。在描述GPT-4的论文中,OpenAI说它的估计表明,扩大模型规模的回报越来越少。奥特曼说,该公司能够建造多少个数据中心以及建造这些中心的速度也有物理限制。
曾在谷歌从事人工智能工作的Cohere公司联合创始人尼克-弗罗斯特(Nick Frosst)说,奥特曼的感觉是,扩大规模不会无限期地发挥作用。他也认为,作为GPT-4及其竞争对手的核心的机器学习模型类型,在变压器方面的进展超越了规模化。"他说:"有很多方法可以让变压器变得更好、更有用,而且很多方法不涉及向模型添加参数。Frosst说,新的人工智能模型设计或架构,以及基于人类反馈的进一步调整是许多研究人员已经在探索的有希望的方向。
获取WIRED的Fast Forward通讯,这是Will Knight每周从未来发回的消息,探索人工智能的进展和其他将改变我们生活的技术。
OpenAI有影响力的语言算法系列的每个版本都包括一个人工神经网络,该软件松散地受到了神经元工作方式的启发,它被训练来预测应该跟随给定文本字符串的单词。
这些语言模型中的第一个,即GPT-2,于2019年公布。在其最大的形式下,它有15亿个参数,这是衡量其粗糙的人工神经元之间可调整的连接数量。
,当时,与以前的系统相比,这是非常大的,部分原因是OpenAI的研究人员发现,扩大规模使模型更加协调一致。而该公司让GPT-2的继任者GPT-3在2020年宣布,仍然更大,有高达1750亿个参数。该系统生成诗歌、电子邮件和其他文本的广泛能力有助于说服其他公司和研究机构将他们自己的人工智能模型推到类似甚至更大的规模。
在ChatGPT于11月首次亮相后,回忆录制作者和技术专家们猜测,GPT-4到来时,将是一个令人眩晕的规模和复杂性的模型。然而,当OpenAI最终宣布新的人工智能模型时,该公司并没有透露它有多大--也许是因为尺寸不再是最重要的。在麻省理工学院的活动中,奥特曼被问及训练GPT-4是否花费了1亿美元;他回答说:"不止如此。"
尽管OpenAI对GPT-4的规模和内部运作保密,但它的一些智能很可能已经来自于对规模之外的关注。一种可能性是,它使用了一种名为强化学习与人类反馈的方法,这种方法被用来增强ChatGPT。它包括让人类判断模型答案的质量,以引导它提供更有可能被判定为高质量的回答。
GPT-4的卓越能力令一些专家感到震惊,并引发了关于人工智能是否有可能改变经济,但也可能传播虚假信息和消除就业的辩论。一些人工智能专家、包括埃隆-马斯克在内的科技企业家和科学家最近写了一封公开信,呼吁暂停开发比GPT-4更强大的东西,为期六个月。
上周在麻省理工学院,奥特曼证实他的公司目前没有在开发GPT-5。"这封信的早期版本声称OpenAI现在正在训练GPT-5,"他说。"我们没有,而且在一段时间内也不会。"