GPT-5 来袭:预计的三大重大升级揭示下一代AI语言模型巅峰

178 阅读5分钟

GPT-5 会成为 AGI 的又一大飞跃吗?OpenAI 正在训练 GPT-4 的继任者 以下是我们目前所知道的。

  image.png

玛丽亚迪亚兹/ZDNET

尽管 OpenAI 最新推出的模型 GPT-4o 显著提高了大型语言模型 (LLM) 的赌注,但该初创公司已经在研发其下一个旗舰模型 GPT-5。

在春季发布 GPT-4o 活动之前,许多人希望该公司能推出备受期待的 GPT-5。为了遏制猜测,首席执行官 Sam Altman 在 X 上发帖称,“不是 GPT-5,不是搜索引擎。” 

image.png

现在,仅仅两周之后,该初创公司在一篇博客文章中宣布由 OpenAI 董事会成立了一个新安全委员会,以提出安全决策建议,并证实正在训练其下一个旗舰模型,很可能指的是 GPT-4 的继任者 GPT-5。

该公司在一篇博客文章中表示:“OpenAI 最近开始训练其下一个前沿模型,我们预计最终的系统将使我们在通往 AGI [通用人工智能] 的道路上迈向更高的水平。”

尽管 GPT-5 可能还需要数月甚至更长时间才能供客户使用(LLM 可能需要很长时间才能完成训练),但以下是对 OpenAI 下一代模型的一些期望,按从最不令人兴奋到最令人兴奋的顺序排列。 

更高的准确性****

根据过去的趋势,我们可以预期 GPT-5 的响应会更加准确,因为它将接受更多数据的训练。生成式人工智能模型依靠训练数据来提供答案。因此,模型接受的数据越多,模型生成连贯内容的能力就越强,从而带来更好的性能。

到目前为止,随着每个模型的发布,训练数据量都在增加。例如,有报告 表明 GPT-3.5 是在 1750 亿个参数上进行训练的,而 GPT-4 是在 1 万亿个参数上进行训练的。我们可能会看到 GPT-5 的训练数据量增长得更快。 

增强多模态性****

在预测 GPT-5 的功能时,我们可以看看自 GPT-3.5 以来每个主要旗舰模型之间的差异,包括 GPT-4 和 GPT-4o。随着每次飞跃,该模型变得更加智能,并取得了进步,包括价格、速度、上下文长度和模态。

GPT-3.5 只能输入和输出文本。使用 GPT-4 Turbo,用户可以输入文本和图像以获得文本输出。使用 GPT-4o,用户可以输入文本、音频、图像和视频的组合,并接收文本、音频和图像的任意组合输出。 

按照这种趋势,GPT-5 的下一步可能是输出视频的能力。今年 2 月,OpenAI 推出了其文本转视频模型Sora,该模型可能会被纳入 GPT-5 以输出视频。

自主行动的能力(AGI 预览)****

不可否认的是,聊天机器人是令人印象深刻的人工智能工具,能够帮助人们完成许多任务,包括生成代码、Excel 公式、 论文、简历、应用程序、图表、表格等。然而,人们越来越希望人工智能能够知道你想要做什么,并且只需要很少的指令就能做到——这是人工智能的原则,即通用人工智能(AGI)。 

GPT-5 不太可能完全具备 AGI 能力,但它可以能够使用自主代理通过推理需要做什么、规划如何做以及执行任务来实现最终目标。   

例如,在理想情况下,您可以请求 GPT-5 执行“帮我从麦当劳订购一个汉堡”之类的操作。然后,AI 模型可以使用代理完成一系列任务,包括打开麦当劳网站并输入您的订单、地址和付款方式。您只需要担心吃汉堡就行了。

Rabbit 正试图通过创建一种小工具来实现类似的目标,这种小工具可以使用代理来创造一种无摩擦的体验,让现实世界中的任务(例如预订 Uber 或订购食物)变得轻松无阻。尽管无法执行上述更高级的任务,但 Rabbit 的 R1 已多次售罄。

作为人工智能的下一个前沿,AGI 可以彻底升级我们从人工智能获得的帮助类型,并彻底改变我们对助手的看法。人工智能助手不再依赖我们来告诉我们天气如何,而是可以从头到尾帮助我们完成任务。尽管 GPT-5 可能还没有实现,但它将让我们一窥究竟,如果你问我,那是一件值得期待的事情。

智答专家:国内免费使用GPT-4.0的AI智能问答工具****

分享一个国内免费使用GPT-4.0的AI智能问答工具:智答专家。支持AI文本、作图、语音、Sora视频。无需魔法,亲测有效,访问链接:t.aizdzj.com/?p=MTAwNzE2…

智答专家是一款强大的AI智能问答工具,它基于GPT-4.0技术,为用户提供了一个国内免费使用的平台。无论是需要文本生成、图像制作、语音交互还是视频内容的创建,智答专家都能提供支持。这个工具的独特之处在于它集成了多种功能,用户可以在一个平台上完成多种类型的AI交互,极大地提高了工作效率和创造力。

与其他AI聊天机器人相比,智答专家具有以下优势:

多功能集成:  支持文本、图像、语音和视频的生成,满足不同场景的需求。

免费使用:  在国内用户可以直接访问并使用,无需任何额外费用。

用户体验:  界面友好,操作简单,即使是AI新手也能快速上手。

高效准确:  基于GPT-4.0的强大能力,智答专家能够提供高质量的回答和内容生成。

无论你是一名学生、教师、内容创作者还是企业用户,智答专家都能为你提供强大的AI支持,帮助你在各自的领域内实现更高效、更有创意的工作。不妨试试智答专家,探索AI带来的无限可能。

image.png