跟上人工智能和技术的快速发展似乎非常困难。每周或每月都会有新的东西出现，而你现在又在学习一些新东西了！

这次是关于GPT-5。

GPT-4于2023年3月发布，从那时起，所有人都在等待GPT-5的发布。Siqi Chen在3月27日发推文说，“gpt5计划于今年12月完成训练。”然而，OpenAI首席执行官Sam Altman在4月份的一次麻省理工学院活动中就GPT-5的问题发表讲话时澄清了这一说法，他表示“我们现在还没有计划，也不会有计划一段时间内发布GPT-5”。

所以，这就澄清了。然而，一些专家建议OpenAI在2023年第三季度或第四季度之间发布GPT-4.5，作为GPT-4和GPT-5之间的中间版本。当前的模型不断改进，这可能是GPT-4.5的潜在发布。许多人表示，GPT-4.5具备多模态能力，这在2023年3月的GPT-4开发者直播中已经得到了展示。

尽管对GPT-5有很高的期望，但GPT-4仍然需要解决一些问题。例如，GPT-4的推理时间非常长，且运行成本高昂。还有其他挑战，如访问GPT-4的API。

虽然还有工作要做，但我们可以说每个GPT版本都推动了人工智能技术的边界，以及其能力所在。人工智能爱好者们都很兴奋地期待着探索GPT-5的突破性特性。

那么我们可以期待GPT-5有哪些特性呢？让我们来看看。

减少虚构内容

这关乎信任，这也是大多数用户不相信AI模型的主要原因。例如，GPT-4在内部事实评估的九个类别中，得分比GPT-3.5高了40%，如下图所示。这意味着与GPT-3.5相比，GPT-4更不可能回应不允许的内容，而更有可能产生真实的回答。

随着新版本不断改进当前的挑战，据说GPT-5

将减少虚构内容的比例降低到不到10%，使得LLM更加可信。

**
**

计算效率

如前所述，GPT-4的计算成本非常高，每个标记的成本为0.03美元。而GPT-3.5的成本为0.0002美元。这是一个很大的差距。GPT-4在一个万亿参数数据集和基础设施上进行训练，这反映在成本上。

而Google的PaLM 2模型只使用了3400亿个参数，并且具有高效的性能。如果OpenAI计划与Google的PaLM 2竞争，他们需要寻找降低成本和GPT-4参数大小的方法，同时保持性能。

还需要关注的是更好的推理时间，即深度学习模型预测新数据所需的时间。GPT-4中的更多功能和插件意味着计算效率更重要。开发人员已经向OpenAI抱怨，GPT-4的API经常停止响应，这迫使他们使用GPT-3.5。

考虑到所有这些因素，我们可以期待OpenAI通过发布更小、更便宜和更高效的GPT-5版本来克服这些挑战。

**
**

多感官

在GPT-4发布之前，许多人对其多模态能力感到非常兴奋。尽管它尚未添加到GPT-4中，但GPT-5可能成为焦点，并真正实现多模态能力。

我们不仅可以期待它处理图像和文本，还可以处理音频、视频、温度等其他类型的数据。Sam Altman在一次采访中表示：“当我们能够处理视频时，我非常兴奋，世界上有很多视频内容。有很多东西通过视频比通过文本更容易学习。”

增加可用于使对话更加动态和互动的数据类型。多模态能力将是通往人工通用智能(AGI)的最快捷方式。

**
**

长期记忆

GPT-4的最大标记长度为32,000个标记，这已经很令人印象深刻了。但是随着世界上一个又一个模型的发布，我们已经有了可以输出65,000个标记的Story Writer等模型。

为了与当前的竞争保持一致，我们可以期待GPT-5引入更长的上下文长度，使用户能够与能够记住他们个性和历史的AI伙伴交流多年。

**
**

改进的上下文理解

作为一个大型语言模型（LLM），我们首先可以期待的是对理解上下文的能力进行改进和增强。如果将这一点与上述关于

长期记忆的内容结合起来，GPT-5可能具有在长时间对话中保持上下文的潜力。作为用户，你将获得更贴合和有意义的响应，与你的需求一致。

随之而来的是对语言更高级的理解能力，其中自然语言的主要组成部分是情感。GPT-5在上下文理解方面的潜在能力可以使其更具共情能力，并产生适当的回复，继续参与对话。

**
**

总结一下

关于GPT-5的潜在能力还有更多可以发现的地方，在发布日期接近之前我们将无法获取更多信息。本文基于GPT-4和GPT-3.5所面临的当前挑战，以及OpenAI如何利用这些障碍来克服并发布高性能的GPT-5版本。

欢迎关注：【微信公号：H5开讲啦】

关于GPT-5我们可以期待什么？

减少虚构内容

计算效率

多感官

长期记忆

改进的上下文理解

总结一下