关于GPT-5我们可以期待什么?

307 阅读5分钟

​跟上人工智能和技术的快速发展似乎非常困难。每周或每月都会有新的东西出现,而你现在又在学习一些新东西了!

这次是关于GPT-5。

GPT-4于2023年3月发布,从那时起,所有人都在等待GPT-5的发布。Siqi Chen在3月27日发推文说,“gpt5计划于今年12月完成训练。”然而,OpenAI首席执行官Sam Altman在4月份的一次麻省理工学院活动中就GPT-5的问题发表讲话时澄清了这一说法,他表示“我们现在还没有计划,也不会有计划一段时间内发布GPT-5”。

所以,这就澄清了。然而,一些专家建议OpenAI在2023年第三季度或第四季度之间发布GPT-4.5,作为GPT-4和GPT-5之间的中间版本。当前的模型不断改进,这可能是GPT-4.5的潜在发布。许多人表示,GPT-4.5具备多模态能力,这在2023年3月的GPT-4开发者直播中已经得到了展示。

尽管对GPT-5有很高的期望,但GPT-4仍然需要解决一些问题。例如,GPT-4的推理时间非常长,且运行成本高昂。还有其他挑战,如访问GPT-4的API。

虽然还有工作要做,但我们可以说每个GPT版本都推动了人工智能技术的边界,以及其能力所在。人工智能爱好者们都很兴奋地期待着探索GPT-5的突破性特性。

那么我们可以期待GPT-5有哪些特性呢?让我们来看看。

减少虚构内容

这关乎信任,这也是大多数用户不相信AI模型的主要原因。例如,GPT-4在内部事实评估的九个类别中,得分比GPT-3.5高了40%,如下图所示。这意味着与GPT-3.5相比,GPT-4更不可能回应不允许的内容,而更有可能产生真实的回答。

随着新版本不断改进当前的挑战,据说GPT-5 

将减少虚构内容的比例降低到不到10%,使得LLM更加可信。

**
**

计算效率

如前所述,GPT-4的计算成本非常高,每个标记的成本为0.03美元。而GPT-3.5的成本为0.0002美元。这是一个很大的差距。GPT-4在一个万亿参数数据集和基础设施上进行训练,这反映在成本上。

而Google的PaLM 2模型只使用了3400亿个参数,并且具有高效的性能。如果OpenAI计划与Google的PaLM 2竞争,他们需要寻找降低成本和GPT-4参数大小的方法,同时保持性能。

还需要关注的是更好的推理时间,即深度学习模型预测新数据所需的时间。GPT-4中的更多功能和插件意味着计算效率更重要。开发人员已经向OpenAI抱怨,GPT-4的API经常停止响应,这迫使他们使用GPT-3.5。

考虑到所有这些因素,我们可以期待OpenAI通过发布更小、更便宜和更高效的GPT-5版本来克服这些挑战。

**
**

多感官

在GPT-4发布之前,许多人对其多模态能力感到非常兴奋。尽管它尚未添加到GPT-4中,但GPT-5可能成为焦点,并真正实现多模态能力。

我们不仅可以期待它处理图像和文本,还可以处理音频、视频、温度等其他类型的数据。Sam Altman在一次采访中表示:“当我们能够处理视频时,我非常兴奋,世界上有很多视频内容。有很多东西通过视频比通过文本更容易学习。”

增加可用于使对话更加动态和互动的数据类型。多模态能力将是通往人工通用智能(AGI)的最快捷方式。

**
**

长期记忆

GPT-4的最大标记长度为32,000个标记,这已经很令人印象深刻了。但是随着世界上一个又一个模型的发布,我们已经有了可以输出65,000个标记的Story Writer等模型。

为了与当前的竞争保持一致,我们可以期待GPT-5引入更长的上下文长度,使用户能够与能够记住他们个性和历史的AI伙伴交流多年。

**
**

改进的上下文理解

作为一个大型语言模型(LLM),我们首先可以期待的是对理解上下文的能力进行改进和增强。如果将这一点与上述关于

长期记忆的内容结合起来,GPT-5可能具有在长时间对话中保持上下文的潜力。作为用户,你将获得更贴合和有意义的响应,与你的需求一致。

随之而来的是对语言更高级的理解能力,其中自然语言的主要组成部分是情感。GPT-5在上下文理解方面的潜在能力可以使其更具共情能力,并产生适当的回复,继续参与对话。

**
**

总结一下

关于GPT-5的潜在能力还有更多可以发现的地方,在发布日期接近之前我们将无法获取更多信息。本文基于GPT-4和GPT-3.5所面临的当前挑战,以及OpenAI如何利用这些障碍来克服并发布高性能的GPT-5版本。

欢迎关注:【微信公号:H5开讲啦】

qrcode_for_gh_af6d0ab2a309_258.jpg